遇到问题:
暂无
学习内容
缺失值填充处理
houseprice['LotFrontage']=houseprice['LotFrontage'].fillna(0) 复制代码
将该列中的空值或者NA填充为0
all_data.product_type[all_data.product_type.isnull()]=all_data.product_type.dropna().mode().values 复制代码
如果该列是字符串的,就将该列中出现次数最多的字符串赋予空值,mode()函数就是取出现次数最多的元素。
houseprice['LotFrontage'].fillna(method='pad') 复制代码
使用前一个数值替代空值或者NA,就是NA前面最近的非空数值替换
houseprice['LotFrontage'].fillna(method='bfill',limit=1) 复制代码
使用后一个数值替代空值或者NA,limit=1就是限制如果几个连续的空值,只能最近的一个空值可以被填充。
houseprice['LotFrontage'].fillna(houseprice['LotFrontage'].mean()) 复制代码
使用平均值进行填充
houseprice['LotFrontage'].interpolate()复制代码
使用插值来估计NaN 如果index是数字,可以设置参数method='value' ,如果是时间,可以设置method='time'
houseprice= houseprice.fillna(houseprice.mean()) 复制代码
将缺失值全部用该列的平均值代替,这个时候一般已经提前将字符串特征转换成了数值。