Python数据分析:Pandas库使用,数据清洗、处理与分析示例。

原创 约定不等于承诺〃 2025-02-05 02:30 68阅读 0赞

Pandas是Python中最常用的数据分析库。它提供了大量的数据结构和工具,使得数据的存储、清洗、处理以及深入分析变得轻松高效。

下面是一个简单的例子,展示了如何使用Pandas进行数据清洗:

  1. import pandas as pd
  2. # 假设我们有一个包含重复数据的DataFrame
  3. data = {'Name': ['Alice', 'Bob', 'Alice', 'Charlie'],
  4. 'Age': [25, 30, 28, 40],
  5. 'City': ['New York', 'Chicago', 'Los Angeles', 'San Francisco']}
  6. df_initial = pd.DataFrame(data)
  7. # 数据清洗:删除重复数据
  8. df_cleaned = df_initial.drop_duplicates()
  9. print("Original DataFrame:")
  10. print(df_initial)
  11. print("\nCleaned DataFrame (no duplicates):")
  12. print(df_cleaned)

在这个例子中,我们首先创建了一个包含重复数据的DataFrame。然后,使用drop_duplicates()方法删除了重复的数据,得到了一个干净的DataFrame。

文章版权声明:注明蒲公英云原创文章,转载或复制请以超链接形式并注明出处。

发表评论

表情:
评论列表 (有 0 条评论,68人围观)

还没有评论,来说两句吧...

相关阅读