4.4 推断统计
1. 经验法则:
X~正态分布
68%落在μ±σ范围内
95%落在μ±2σ范围内
99%落在μ±3σ范围内
2. 切比雪夫不等式
1. 75% 落在μ±2σ范围内
2. 89%落在μ±3σ范围内
3. 93%落在μ±4σ范围内
3. 参数估计:已知模型或假定系统的模型,估计总体参数
1. 估计量:关于样本的一个函数(如样本均值、样本比例、样本方差)
2. 估计值:带入数据,计算出数值
4. 确定需要估计的参数:
1. 总体均值:单个总体,或两个均值差
2. 总体比例:同上可单个,可两个
3. 总体方差:同上
总体均值估计:
1. 如果总体均值服从正态分布,则从总体抽样时也会是正态分布。
2. 总体不是正态时,可任意分布。中心极限定理:样本均值会随着样本量大趋近于正态分布。注意是 样本均值,从整体抽取多个样本后求均值。总体的均值μ,方差σ2。则样本均值为μ,方差σ2/n,标准差σ/√n
3. 两个样本均值的差也是正态分布
4. 两个样本的比例也是正态分布
5. 一个样本的方差 用卡方分布
6. 两个样本方差之比 用F分布
5. 估计量的评价标准:
1. 无偏性:研究总体均值,求样本均值,进行无数次样本均值估计,如果样本估计的均值 等于 总体均值,则称为无偏性
2. 有效性:方差越小,估计越有效
3. 一致性:样本容量增大,估计量值越来越接近总体参数
6. 点估计和区间估计
区间估计:
1. 置信水平:表示准确度有多高,一般取95%
2. 一般使用T估计
相关分析:
- XY在某种程度上相关
相关类型:
- 变量数量:1. 单相关 2. 复相关
- 表现形式:1. 线性相关 2. 非相关
- 变量关系方向:1. 正相关 2.负相关
- 产量相关程度:1. 完全相关 2. 不相关 3. 不完全相关
相关度量:协方差
- COV>0,XY正相关
- 反之亦然
- Cov=0,XY无关,图像是圆形
- 变量自己和自己的协方差,就是方差
- X,Y的相关系数Cor:协方差除标准差的乘积
- 相关系数绝对值越趋近1,则表明这两个关系更大,如果等于0,相关性很小
- 相关系数非常受到离群值影响
还没有评论,来说两句吧...