Python数据分析:Pandas库使用,数据清洗、处理与分析示例。
Pandas是Python中最常用的数据分析库。它提供了大量的数据结构和工具,使得数据的存储、清洗、处理以及深入分析变得轻松高效。
下面是一个简单的例子,展示了如何使用Pandas进行数据清洗:
import pandas as pd
# 假设我们有一个包含重复数据的DataFrame
data = {'Name': ['Alice', 'Bob', 'Alice', 'Charlie'],
'Age': [25, 30, 28, 40],
'City': ['New York', 'Chicago', 'Los Angeles', 'San Francisco']}
df_initial = pd.DataFrame(data)
# 数据清洗:删除重复数据
df_cleaned = df_initial.drop_duplicates()
print("Original DataFrame:")
print(df_initial)
print("\nCleaned DataFrame (no duplicates):")
print(df_cleaned)
在这个例子中,我们首先创建了一个包含重复数据的DataFrame。然后,使用drop_duplicates()
方法删除了重复的数据,得到了一个干净的DataFrame。
还没有评论,来说两句吧...