《集体智慧编程》笔记(1 / 12):集体智慧导言
文章目录
- 什么是集体智慧
- 什么是机器学习
- 机器学习的局限性
- 真实生活中的例子
- 学习型算法的其他用途
- 小结
Netflix, Google都适用了先进算法,将来自不同人群的数据加以组合,进而得出新的结论,并创造新的商机。
更多类似例子:
- 约会网站希望帮助人们更快地找到他们的最佳拍档;
- 预测机票价格变化的公司如雨后春笋般不断涌现;
- 为了创造更有针对性的广告。
什么是集体智慧
集体智慧通常含义:为了创造新的想法,而将一群人的行为、偏好或思想组合在一起。
集体智慧出现早于Internet,可用调查问卷或普查完成最为基础的方法。
从一大群人中收集的答案可以使我们得出关于群组的统计结论:组中的个体成员将会被忽视。从独立的数据提供者那里得出新的结论,是集体智慧所真正关注的。
例如:金融市场众多参与者的交易行为预测
Internet出现之后,集体智慧有更多体现
- Wikipedia 在线百科全书由大量用户共同维护
- Google是根据其他网页对当前网页的引用数多少来评价网页等级的搜索引擎。这种评价等级的方法,搜集了数以千计的人对某一页面的评价信息。
目标:利用开放的API来搜集数据,同时还会讨论到各种机器学习算法和统计方法。将二者结合起来,可借助集体智慧的相关方法,对由自己编写的应用程序搜集得到的数据进行分析;同时,也可以从其他地方搜集数据,并对数据进行试验。
什么是机器学习
机器学习是人工智能领域中与算法相关的一个子域,它允许计算机不断地进行学习。
大多数情况下,这相当于将一组数据传递给算法,并由算法推断出这些数据的属性相关的信息——借助这些信息,算法就能够推测出未来有可能会出现的其他数据。
这种预测是完全有可能的,因为几乎所有的非随机数据中,都会包含这样或那样的“模式Patterns”,这些模式的存在使机器的得以据此进行归纳。
为实现归纳,机器会利用它所认定的出现于数据中的重要特征对数据进行“训练”,并借此得到一个模型
垃圾过滤算法——从一堆垃圾邮件中归纳总结出是某单词是垃圾邮件重要依据。下次收到邮件可根据结论判别邮件是否是垃圾邮件。
各种机器学习算法各有所长,适应不同类型的问题。
许多机器学习算法都很依仗数学和统计学。
统计学不是数学一个分支
机器学习的局限性
当对新的信息进行决策时,人们能够从中识别出相似的信息来,而机器学习方法却只能凭借已经见过的数据进行归纳,而且归纳的方式受到很大的限制,
例子:
- 将介绍到垃圾邮件过滤方法,是以单词或单词组合出现为依据,根本未给予考虑单词的含义及句子结构。这是因为后者要比前者复杂多得多。
- 机器学习算法都有过度归纳的可能性。垃圾邮件过滤方法将友人的一封邮件视为垃圾邮件。
真实生活中的例子
- 网页排名
- 推荐系统
- 市场预测
- 交友匹配
学习型算法的其他用途
- 生物工艺学 DNA序列,蛋白质结构,化合物筛选等海量数据,需进一步理解生物进程的模式。
- 金融欺诈侦测
- 机器视觉
- 产品市场化
- 供应链优化
- 股票市场分析
- 国家安全
小结
一旦掌握一些机器学习的算法,会发现他们的应用随处可见。
还没有评论,来说两句吧...