欠拟合和过拟合

素颜马尾好姑娘i 2022-12-29 12:53 328阅读 0赞

欠拟合和过拟合

    • 定义
    • 原因以及解决办法

定义

  • 过拟合:训练集的误差小,但测试集的误差大

一个假设在训练数据上能够获得比其他假设更好的拟合, 但是在测试数据集上却不能很好地拟合数据,此时认为这个假设出现了过拟合的现象。(模型过于复杂)

  • 欠拟合:模型很简单的时候,两个误差都比较差

一个假设在训练数据上不能获得更好的拟合,并且在测试数据集上也不能很好地拟合数据,此时认为这个假设出现了欠拟合的现象。(模型过于简单)

原因以及解决办法

  • 欠拟合

    • 原因:模型过于简单。学习到数据的特征过少
    • 解决办法:使模型复杂一些,增加数据的特征信息
  • 过拟合

    • 原因:模型过于复杂。原始特征过多,存在一些嘈杂特征, 模型过于复杂是因为模型尝试去兼顾各个测试数据点。
    • 解决办法

      1. 重新清洗数据,不要学习到了无关数据。导致过拟合的一个原因也有可能是数据不纯导致的,如果出现了过拟合就需要我们重新清洗数据。
      2. 增加数据的训练量,更好的学习规律。还有一个原因就是我们用于训练的数据量太小导致的,训练数据占总数据的比例过小。
      3. 正则化。限制模型复杂度。
      4. 减少特征维度,防止维灾难

发表评论

表情:
评论列表 (有 0 条评论,328人围观)

还没有评论,来说两句吧...

相关阅读

    相关 的形象解释

    今天突然被以前同学人问到机器学习中的’过拟合‘和‘欠拟合’是什么意思呢? “过拟合就是训练的时候效果很好,损失函数值可以降得很低,但是到测试数据集的时候表现就不那么好了,原因

    相关 及其解决方法

    在我们机器学习或者训练深度神经网络的时候经常会出现欠拟合和过拟合这两个问题,但是,一开始我们的模型往往是欠拟合的,也正是因为如此才有了优化的空间,我们需要不断的调整算法来使得模

    相关

    开始我是很难弄懂什么是过拟合,什么是欠拟合以及造成两者的各自原因以及相应的解决办法,学习了一段时间机器学习和深度学习后,分享下自己的观点,方便初学者能很好很形象地理解上面的问题