Python数据处理问题:如何使用Pandas进行缺失值填充?
在Pandas中,处理缺失值通常有以下几种方法:
dropna(删除含有缺失值的行或列):
df = pd.DataFrame({
'A': [1, 2, np.nan], # 缺失值
'B': ['foo', 'bar', 'baz'], # 不同数据
'C': [5.0, 6.0, 7.0], # 有序数据
})
df = df.dropna() # 删除含有NaN的行
fillna(用指定值填充缺失值):
df = df.fillna(value=0) # 用0替换NaN
mean/median/mode(计算列的平均值、中位数或众数,并用该值填充缺失值):
mean_value = df['A'].mean() # 计算'A'列的平均值
df = df.fillna(value=mean_value) # 用平均值替换NaN
根据实际需求,选择合适的方法进行处理。
还没有评论,来说两句吧...