使用Pandas进行数据清洗与分析的示例
首先,我们需要导入pandas库。以下是一个基本的数据清洗和分析示例:
- 导入pandas
import pandas as pd
- 从源创建一个DataFrame(假设我们有一个CSV文件)
data = {'Name': ['John', 'Jane', 'David'],
'Age': [25, 30, 35],
'City': ['New York', 'Chicago', 'San Francisco']}
df = pd.DataFrame(data)
- 数据清洗(例如处理缺失值)
# 检查是否有缺失值
print(df.isnull().sum())
# 假设Age列有两行缺失,我们可以使用平均值填充这些空值
df['Age'].fillna(df['Age'].mean(), inplace=True)
- 数据分析(例如计算年龄的平均值)
average_age = df['Age'].mean()
print(f"Average Age: {average_age}")
以上就是一个基本的数据清洗和分析示例。根据实际数据,你可以进行更复杂的操作。
还没有评论,来说两句吧...