机器学习中的有监督,半监督和无监督学习
今天终于解惑了困惑许久的机器学习中的各种监督学习问题,首先来谈一谈有监督学习是个什么鬼玩意。
有监督学习就是指我们拥有的数据中已经包括了我们想要预测的数据属性。也叫目标变量。
有监督学习又分为:
分类样本属于两个或多个类别,我们想通过根据数据中已经标明的数据,经过训练来预测没有标明分类的数据属于什么分类。比如经典的手写字识别,利用给出的训练数据集确定10个标签值,再输入预测数据时可预测输入数据属于哪个0-9类别。
回归如果希望的输出是一个或者多个连续的变量,那么称为回归。比如利用三文鱼的年龄和体重去预测其长度。
无监督学习简而言之无监督学习就是给出了训练的输入数据集,却没有相应的标签数据。所需要的标签数据是经过训练根据输入数据集自主总结出来的,不需要人工进行标签分类。这个称为聚类。也可以确定输入样本空间中的数据分布,被称为密度估计。
半监督学习半监督学习指的是既包含部分带标签的数据也有不带标签的数据,通过这些数据来进行学习。
直推学习:不带标签的数据是测试数据。很多人说用了测试数据是一种作弊行为,实则不然,因为这里只是用了测试数据的特征,而其标签我们是不知道的。
归纳学习:不带标签的数据不是测试数据。
半监督学习可能让各位看官看不懂。我也是理解有限。后期理解加会补上
还没有评论,来说两句吧...