Python数据分析项目讲解:分析世界五百强企业数据

ゝ一世哀愁。 2022-09-04 11:52 210阅读 0赞

前言

哪个国家的世界五百强企业数量最多?今天带你用python来处理数据,并实现数据可视化,解决对现有数据产生的疑问。

本次代码是在 Jupyter Notebook 里面编写的

先导入本次代码需要的模块

  1. import pandas as pd
  2. from pyecharts.charts import *
  3. from pyecharts import options as opts
  4. from pyecharts.commons.utils import JsCode
  5. from pyecharts.globals import ThemeType

Python从零基础入门到实战系统教程、源码、视频,想要数据集的同学也可以点这里

导入数据

  1. data = pd.read_excel('2021年世界五百强排行榜.xlsx')
  2. data.head(5)

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L20wXzQ4NDA1Nzgx_size_16_color_FFFFFF_t_70

统计世界500强企业各个国家之间的占比

  1. pie = Pie(init_opts=opts.InitOpts(theme='light',
  2. width='800px',
  3. height='700px'))
  4. data_x = data1['国家'].tolist()
  5. data_y = data1['排名'].tolist()
  6. pie.add("",
  7. [list(z) for z in zip(data_x, data_y)],
  8. radius=["35%", "55%"]
  9. )
  10. pie.set_series_opts(label_opts=opts.LabelOpts(position="insideLeft",
  11. font_size=12,
  12. color='rgba(0,0,0,0.5)',
  13. font_weight='bold',
  14. formatter='{b}:{d}%'),
  15. itemstyle_opts={ 'normal': {
  16. 'opacity': 1, # 透明度
  17. 'shadowColor': 'rgba(0, 0, 0, 0.2)', # 阴影颜色
  18. 'shadowBlur': 5, # 阴影大小
  19. 'shadowOffsetY': 5, # Y轴方向阴影偏移
  20. 'shadowOffsetX': 5, # x轴方向阴影偏移
  21. }
  22. }
  23. )
  24. pie.set_global_opts(legend_opts=opts.LegendOpts(is_show=True, pos_left='right', pos_top='center', orient='vertical'),
  25. title_opts=opts.TitleOpts(title="2021年世界各国500强企业占比", pos_top='center', pos_left='center',
  26. title_textstyle_opts=opts.TextStyleOpts(font_size=16)),
  27. visualmap_opts=opts.VisualMapOpts(
  28. min_=0,
  29. max_=200,
  30. ))
  31. pie.render_notebook()

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L20wXzQ4NDA1Nzgx_size_16_color_FFFFFF_t_70 1

将国家列设置为索引

  1. bar = Bar(init_opts=opts.InitOpts(theme=ThemeType.PURPLE_PASSION))
  2. bar.add_yaxis("世界500强企业数量", data1['排名'].tolist())
  3. bar.set_global_opts(title_opts=opts.TitleOpts(title="每日电量统计表"),toolbox_opts=opts.ToolboxOpts(),xaxis_opts=opts.AxisOpts(name_rotate=60,axislabel_opts={ "rotate":45}))
  4. bar.render_notebook()
  5. # 绘制直方图来显示
  6. # 线性渐变
  7. color_js = """new echarts.graphic.LinearGradient(0, 1, 0, 0, [{offset: 0, color: '#008B8B'}, {offset: 1, color: '#FF6347'}], false)"""
  8. bar = Bar(init_opts=opts.InitOpts(theme=ThemeType.DARK))
  9. bar.add_xaxis(data1.index.tolist())
  10. bar.add_yaxis("世界500强企业数量", data1['排名'].tolist(),itemstyle_opts=opts.ItemStyleOpts(color=JsCode(color_js)))
  11. bar.set_global_opts(title_opts=opts.TitleOpts(title="2021年各国世界500强企业统计",subtitle='',pos_left='center',pos_top='3%'),
  12. toolbox_opts=opts.ToolboxOpts(),
  13. xaxis_opts=opts.AxisOpts(name_rotate=60,axislabel_opts={ "rotate":45}),
  14. legend_opts=opts.LegendOpts(is_show=True,
  15. pos_left='80%',
  16. pos_bottom='90%'))
  17. bar.render_notebook()

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L20wXzQ4NDA1Nzgx_size_16_color_FFFFFF_t_70 2

筛选出中国的世界500强企业并进行数据可视化分析

  1. # m_df = df.groupby(['行业'])['存活天数'].mean().reset_index()
  2. data2.sort_values(by='排名',ascending=False, inplace=True)
  3. data_x = data2['字段2'].tolist()
  4. data_y = data2['排名'].tolist()
  5. bar = Bar(init_opts=opts.InitOpts(theme='light',
  6. width='1000px',
  7. height='900px'))
  8. bar.add_xaxis(data_x)
  9. bar.add_yaxis('平均存活天数', [int(i) for i in data_y])
  10. bar.set_series_opts(label_opts=opts.LabelOpts(position="insideLeft",
  11. font_size=12,
  12. font_weight='bold',
  13. formatter='{b}:{c}'))
  14. bar.set_global_opts(title_opts=opts.TitleOpts(title="2021年中国世界500强企业城市分布", pos_top='2%', pos_left='center',
  15. title_textstyle_opts=opts.TextStyleOpts(font_size=16)),
  16. legend_opts=opts.LegendOpts(is_show=False),
  17. xaxis_opts=opts.AxisOpts(is_show=False, is_scale=True),
  18. yaxis_opts=opts.AxisOpts(is_show=False),
  19. visualmap_opts=opts.VisualMapOpts(
  20. max_=3000,
  21. min_=1500,
  22. is_piecewise=False,
  23. dimension=0,
  24. range_color=['rgba(238,25,38,1)', 'rgba(289,112,147,0.4)'])
  25. )
  26. bar.reversal_axis()
  27. bar.render_notebook()

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L20wXzQ4NDA1Nzgx_size_16_color_FFFFFF_t_70 3

发表评论

表情:
评论列表 (有 0 条评论,210人围观)

还没有评论,来说两句吧...

相关阅读

    相关 python数据分析

    摘要   本案例将主要结合自动售货机的实际情况,对销售的历史数据进行处理,利用pyecharts库、Matplotlib库进行可视化分析,并对未来4周商品的销售额进行预测

    相关 python数据分析

    简介:本案例以互联网金融行业客户信息为数据,通过-means聚类,对用户划分成不同的群体。 1 RFM模型介绍 根据美国数据库营销研究所Arthur Hughes的研究