pandas DataFrame 删除 / 选取含有特定数值的行或列

男娘i 2023-02-27 12:07 10阅读 0赞

1. 删除 / 选取某列含有特殊数值的行

  1. import pandas as pd
  2. import numpy as np
  3. a=np.array([[1,2,3],[4,5,6],[7,8,9]])
  4. df1=pd.DataFrame(a,index=['row0','row1','row2'],columns=list('ABC'))
  5. print(df1)
  6. df2=df1.copy()
  7. #删除/选取某列含有特定数值的行
  8. #df1=df1[df1['A'].isin([1])]
  9. #df1[df1['A'].isin([1])] 选取df1中A列包含数字1的行
  10. df1=df1[~df1['A'].isin([1])]
  11. #通过~取反,选取不包含数字1的行
  12. print(df1)

运行结果:

70

2. 删除 / 选取某行含有特殊数值的列

  1. #删除/选取某行含有特定数值的列
  2. cols=[x for i,x in enumerate(df2.columns) if df2.iat[0,i]==3]
  3. #利用enumerate对row0进行遍历,将含有数字3的列放入cols中
  4. print(cols)
  5. #df2=df2[cols] 选取含有特定数值的列
  6. df2=df2.drop(cols,axis=1) #利用drop方法将含有特定数值的列删除
  7. print(df2)

运行结果:

70 1

3. 删除含有空值的行或列

实现思路:利用 pandas.DateFrame.fillna 对空值赋予特定值,再利用上文介绍的方法找到这些含有特定值的行或列去除即可。

  1. import pandas as pd
  2. import numpy as np
  3. df1 = pd.DataFrame(
  4. [
  5. [np.nan, 2, np.nan, 0],
  6. [3, 4, np.nan, 1],
  7. [np.nan, np.nan, np.nan, 5],
  8. [np.nan, 3, np.nan, 4]
  9. ],columns=list('ABCD'))
  10. print(df1)
  11. df2=df1.copy()
  12. df1['A']=df1['A'].fillna('null') #将df中A列所有空值赋值为'null'
  13. print(df1)
  14. df1=df1[~df1['A'].isin(['null'])]
  15. print(df1)
  16. #删除某行空值所在列
  17. df2[0:1]=df2[0:1].fillna('null')
  18. print(df2)
  19. cols=[x for i,x in enumerate(df2.columns) if df2.iat[0,i]=='null']
  20. print(cols)
  21. df2=df2.drop(cols,axis=1)
  22. print(df2)

运行结果:

70 2

发表评论

表情:
评论列表 (有 0 条评论,10人围观)

还没有评论,来说两句吧...

相关阅读