数据处理:Python pandas库基础操作
Pandas是Python中一个非常强大的数据处理库。它提供了一种简单、高效的方式来存储和处理表格型数据。
以下是一些基本的Pandas操作:
导入pandas:
import pandas as pd
创建DataFrame(表格):
```python一列数据
data = {‘Name’: [‘John’, ‘Jane’, ‘Doe’],
'Age': [25, 30, 35],
'City': ['New York', 'Los Angeles', 'Chicago']}
创建DataFrame,index默认为整数
df = pd.DataFrame(data)
print(df)
3. 查看数据的基本信息:
```python
# 查看列名
columns = df.columns.tolist()
print(columns)
# 查看总行数和总列数
row_count, col_count = df.shape
print("Row count: ", row_count)
print("Column count: ", col_count)
- 数据的筛选、排序和分组:
```python筛选数据:根据年龄条件筛选
age_filter = df[‘Age’] >= 30
filtered_df = df[age_filter]
print(filtered_df)
排序:按姓名降序排序
sorted_df = df.sort_values(by=’Name’, ascending=False))
print(sorted_df)
分组:按照城市分组并计算平均年龄
grouped_df = df.groupby(‘City’)[‘Age’].mean()
print(grouped_df)
```
以上就是Pandas库基础操作的简单介绍。实际使用中,你还可以根据需要进行更复杂的数据处理和分析。
还没有评论,来说两句吧...