Python数据分析:pandas库数据导入、处理与分析示例

原创 左手的ㄟ右手 2025-01-15 06:48 89阅读 0赞

pandas是Python中一个强大的数据结构和数据分析库。下面将通过几个示例,展示如何导入数据、处理数据以及进行数据分析。

  1. 导入数据
  1. import pandas as pd
  2. # 从CSV文件中读取数据
  3. data = pd.read_csv('your_dataset.csv')
  4. print(data.head()) # 查看数据前几行
  1. 数据处理
  • 删除重复值:
  1. data.drop_duplicates(inplace=True)
  2. print(data.shape) # 检查数据的行数和列数
  • 缺失值处理(例如用平均值填充):
  1. mean_value = data.mean().iloc[0] # 获取第一列的平均值
  2. data.fillna(mean_value, inplace=True))
  3. print(data.isnull().sum()) # 检查数据中还剩下多少缺失值
  1. 数据分析
  • 描述性统计:
  1. descriptive_stats = data.describe()
  2. print(descriptive_stats) # 打印各列的统计信息
  • 分组和聚合:
  1. grouped_data = data.groupby('column_name') # 根据指定列进行分组
  2. agg_results = grouped_data.agg({'column_name': 'mean'}}) # 对分组后的数据按指定列进行求平均值的聚合操作
  3. print(agg_results) # 打印结果

以上就是使用pandas库进行数据分析的一些基本示例。根据实际需求,可以灵活运用这些功能。

文章版权声明:注明蒲公英云原创文章,转载或复制请以超链接形式并注明出处。

发表评论

表情:
评论列表 (有 0 条评论,89人围观)

还没有评论,来说两句吧...

相关阅读