经验风险最小化和结构风险最小化

忘是亡心i 2022-12-18 11:59 353阅读 0赞

原文链接:https://blog.csdn.net/zhang_shuai12/article/details/53064697

在假设空间、损失函数以及训练集确定的情况下,经验风险函数就可以确定。假设给定一个数据集:
这里写图片描述
模型f(x)关于训练数据集的平均损失成为经验风险或经验损失:
这里写图片描述
经验风险是模型关于训练样本集的平均损失。
经验风险最小化(empirical risk minimization,ERM)的策略认为,经验风险最小的模型是最优的模型。根据这一策略,按照经验风险最小化求最优模型就是求解最优化问题:
这里写图片描述
当样本容量足够大时,经验风险最小化能保证有很好的学习效果,在现实中被广泛采用。例如,极大似然估计(MLE)就是经验风险最小化的一个例子。当模型是条件概率分布,损失函数是对数损失函数时,经验风险最小化就等于极大似然估计。
但是,当样本容量很小时,经验风险最小化学习的效果就未必很好,会产生过拟合现象。而结构风险最小化(structural risk minimization, SRM)是为了防止过拟合而提出的策略。**结构风险最小化等价于正则化。结构风险在经验风险的基础上加上表示模型复杂度的正则化项**。在假设空间、损失函数以及训练集确定的情况下,结构风险的定义是:
这里写图片描述
其中,J(f)为模型的复杂度,是定义在假设空间上的泛函。模型f越复杂,复杂度J(f)就越大。也就是说,复杂度表示了对复杂模型的惩罚。结构风险小的模型往往对训练数据和未知的测试数据都有较好的预测。比如,贝叶斯估计中的最大后验概率估计(MAP)就是结构风险最小化的例子。当模型是条件概率分布,损失函数是对数损失函数,模型复杂度由模型的先验概率表示时,结构风险最小化就等价于最大后验概率估计。
结构风险最小化的策略认为结构风险最小的模型是最优的模型。所以求解模型,就是求解最优化问题:
这里写图片描述

参考:统计学习方法 李航

发表评论

表情:
评论列表 (有 0 条评论,353人围观)

还没有评论,来说两句吧...

相关阅读

    相关 费用附加值

    费用最小化   1.提前进行成本预算     开发前要提前进行成本预算,对开发过程中的所有支出和成本提前进行预测,做好心理预期和财务准备。(例如:做好开发计划,列出

    相关 曼哈顿距离

    曼哈顿距离 曼哈顿距离和欧式距离一样是一种距离度量标准,不同的是它定义在L1范数下,也即用绝对值来衡量两点之间的距离。在一维空间下,曼哈顿距离定义如下: d ( x