4.2 数据的描述性统计

妖狐艹你老母 2024-05-09 16:30 141阅读 0赞

1、总体规模的描述——总量指标

定义:反映在一定时间、空间条件下某种现象的总体规模、总水平或总成果的统计指标。

eg:营业额、利润等

2、总体规模的描述——相对指标

定义:两个有相互联系的指标数值之比

eg:目标完成率(实际完成/计划完成)、比值


3、集中趋势的描述——平均指标

affc8c3d6c254b9999333875f89e0068.png

3.1 众数

(1)定义:出现次数最多的变量值

(2)表示符号:Mo

(3)众数的不唯一性,可能有也可能没有

3.2 分位数" class="reference-link">6bf1134e257448d5a7cb01846ffc8fe1.png3.2 分位数

定义:是指根据对数据位置进行划分,处于某些特定位置上的数

3.2.1 中位数

定义:数据排序后,处于中间位置上的值

符号:Me

ee86861ae94e486caaf40a99f482d536.png

3.2.2 四分位数

定义:四分位数分为:下四分位数和上四分位数两种,指排序后处于25%和75%位置上的值

符号:下四分位数QL,上四分位数QU

abf82c27eeea417b8ce18dc94eee61cf.png

e79e9cfdcffc4d89b94d73d03dac919f.png

3.3 均值

3.3.1 算术平均数

定义:数据和与数据个数之比

表示符号:x̄

2a2c90343f2d48d98456a64865c821dc.png

3.3.2 几何平均数

定义:n个变量值乘积的n次方根 一般适用于算增长率、或者利率这些;

表示符号:G

43f673ab14154f8595c46d0977d3a7de.png

3.3.3 调和平均数 (用的比较少)

定义:变量值倒数的算术平均数的倒数

表示符号:H

a3798b5abd32452fb6834badcab4ba91.png


4、离散程度的描述——变异指标

定义:反映各变量值远离其中心值的程度,是数据分布的另一个重要特征。离散程度越大,均值代表的东西就越少。

4.1 极差

定义:一组数据的最大值与最小值之差。这组数据整体处在数轴的什么位置

表示符号:R

计算 : R=max(Xi)−min(Xi)

b7c3ded852284d5baf38e4e7b93ce8e1.png

4.2 平均差

定义 :所有样本值到均值的平均距离

表示符号:Md

计算

82b18702c3364d69ad43568335ede9fd.png

08336937535b484ca3fa8e328621e776.png

4.3 方差和标准差

ba54a86da9034e80a93fde5f8207e714.png

889e84efcdc34dbdad9d107292ef57df.png

4.4 离散系数

d8aa4b65d2594068b902888e5dd3b2e4.png

上图结果:离散系数相同

需要对比两件事物的离散程度,是利用变异系数进行对比。

312cb10733844365984e21922af7437b.png

4.5 标准化值

定义: 度量的样本值到均值之间的差值是标准差的多少倍,这个倍数即标准化值。

178d7cbbafb4410f98aec079c63837de.png

分子的作用:把原来的点平移到y轴,分母——让数据的分布情况产生伸缩

3e1341b67730489b92bb5167e2ff9c80.png

最后一行即是标准化值。

示例:-1.5 度量的:原始25这个数据距离均值34的差值是标准差的 -1.5倍

切比雪夫不等式

6e30c8c42bf1459ab75f5413004e4fae.png

8d92a02ed3d24cef888baabf2a4017cd.png


5、分布形态的描述——偏态与峰态

b4d1a69ea09248299d427cc7af3d72fc.png

bac155e82f404161bf59d5a5f1236635.png

看分布图的尾巴在哪,在右则叫右偏分布

f4fd9db2b3974104b7c461bf8ad2ca42.png

a688c28ed3bf4b3faa370ff7485bf1f6.png

5c4dd5651e26427a917199f1f99f0b56.png


6、描述性统计图表

6.1 直方图

38fc582f52b749fbb7b03a4e67f2bd93.png

6.2 散点图

23e4e8a188cc4368855e1f497ef5ece3.png

6.3 箱型图

a608840994834e29812d70e834380643.png

发表评论

表情:
评论列表 (有 0 条评论,141人围观)

还没有评论,来说两句吧...

相关阅读

    相关 4.2 数据描述性统计

    定义:反映在一定时间、空间条件下某种现象的总体规模、总水平或总成果的统计指标。eg:营业额、利润等2、定义:两个有相互联系的指标数值之比eg:目标完成率(实际完成/计划完...