数据处理:Python pandas库基础操作

原创 矫情吗;* 2025-01-24 05:06 49阅读 0赞

Pandas是Python中一个非常强大的数据处理库。它提供了一种简单、高效的方式来存储和处理表格型数据。

以下是一些基本的Pandas操作:

  1. 导入pandas:

    1. import pandas as pd
  2. 创建DataFrame(表格):
    ```python

    一列数据

    data = {‘Name’: [‘John’, ‘Jane’, ‘Doe’],

    1. 'Age': [25, 30, 35],
    2. 'City': ['New York', 'Los Angeles', 'Chicago']}

创建DataFrame,index默认为整数

df = pd.DataFrame(data)

print(df)

  1. 3. 查看数据的基本信息:
  2. ```python
  3. # 查看列名
  4. columns = df.columns.tolist()
  5. print(columns)
  6. # 查看总行数和总列数
  7. row_count, col_count = df.shape
  8. print("Row count: ", row_count)
  9. print("Column count: ", col_count)
  1. 数据的筛选、排序和分组:
    ```python

    筛选数据:根据年龄条件筛选

    age_filter = df[‘Age’] >= 30
    filtered_df = df[age_filter]
    print(filtered_df)

排序:按姓名降序排序

sorted_df = df.sort_values(by=’Name’, ascending=False))
print(sorted_df)

分组:按照城市分组并计算平均年龄

grouped_df = df.groupby(‘City’)[‘Age’].mean()
print(grouped_df)
```

以上就是Pandas库基础操作的简单介绍。实际使用中,你还可以根据需要进行更复杂的数据处理和分析。

文章版权声明:注明蒲公英云原创文章,转载或复制请以超链接形式并注明出处。

发表评论

表情:
评论列表 (有 0 条评论,49人围观)

还没有评论,来说两句吧...

相关阅读