使用Pandas进行数据清洗与分析的示例

原创 àì夳堔傛蜴生んèń 2024-12-29 11:06 75阅读 0赞

首先,我们需要导入pandas库。以下是一个基本的数据清洗和分析示例:

  1. 导入pandas
  1. import pandas as pd
  1. 从源创建一个DataFrame(假设我们有一个CSV文件)
  1. data = {'Name': ['John', 'Jane', 'David'],
  2. 'Age': [25, 30, 35],
  3. 'City': ['New York', 'Chicago', 'San Francisco']}
  4. df = pd.DataFrame(data)
  1. 数据清洗(例如处理缺失值)
  1. # 检查是否有缺失值
  2. print(df.isnull().sum())
  3. # 假设Age列有两行缺失,我们可以使用平均值填充这些空值
  4. df['Age'].fillna(df['Age'].mean(), inplace=True)
  1. 数据分析(例如计算年龄的平均值)
  1. average_age = df['Age'].mean()
  2. print(f"Average Age: {average_age}")

以上就是一个基本的数据清洗和分析示例。根据实际数据,你可以进行更复杂的操作。

文章版权声明:注明蒲公英云原创文章,转载或复制请以超链接形式并注明出处。

发表评论

表情:
评论列表 (有 0 条评论,75人围观)

还没有评论,来说两句吧...

相关阅读