告别“人工智障”:苹果人工智能研究团队正在升级Siri
全文共1946字,预计学习时长5分钟
图源:unsplash
和所有大型科技公司一样,苹果迫切需要人工智能程序员。算法是一切的基础,从处理更明亮、更清晰的照片,到支持语音助手Siri,甚至可能会操纵苹果汽车。
2016年,苹果聘请卡内基梅隆大学(CarnegieMellon)的知名教授鲁斯兰·萨拉克哈蒂诺夫(Ruslan Salakhutdinov)指导人工技术部门的工作,而后又推出了研究博客以发表研究成果。对于向来守口如瓶的苹果公司来说,做出这些举动着实令人意外。
苹果公开部分研究成果,是因为人工智能领域的技术支柱仍然属于学术范畴,而能否发表最新研究成果是博士进入科技界的首要能力考量因素。
“你不能告诉员工,‘来我们这儿工作吧,但你不能告诉别人你在做什么,’这基本会毁了他们的职业生涯,”脸书首席科学家扬·勒库在2016年接受《商业内幕》采访时讲到。
四年后,苹果仍在其研究博客上发表文章,为公司研究人员的工作提供见解。没有人能保证此研究最终会落地为苹果产品,但研究显示苹果有此类想法,并正对它进行投资。
大部分论文都关于虚拟助手Siri,因为人们普遍认为Siri不如谷歌助手和Alexa。
苹果公司的研究人员正尝试让Siri能够更好地理解问题背后的意图,甚至试图使之能够解读人们发出指令时的情绪。其中一篇论文还谈到了“声学活动识别”,即倾听特定的噪音。在论文附带的一段视频中,一个HomePod听到厨房里发出的噪音后会问,“那是什么声音?”,研究人员回答:“微波炉。”
研究人员在多语言使用方面也对Siri进行了改进,苹果公司会制作自己的数据集来测试虚拟助手用26种不同语言回答问题的能力。另外还有一项较为简单的研究,即唤醒Siri后听从指令。
图源:avtechguide
虽然具体研究最近才开展,但对于那些关注苹果人工智能的人来说,这已经是老生常谈了。2017年,一名内部人士向我发送了在AI行业最大型的一次会议上苹果公司的演示幻灯片。幻灯片显示苹果的研究团队正在研究将人工智能应用于健康、Siri、图像处理、甚至自动驾驶汽车。
如今,你依然可以在该公司网站找到许多类似主题。而Siri仍然远远落后于谷歌助手和Alexa,甚至可能比三年前还要落后。
苹果正准备通过HomePod Mini扩大其HomePod智能扬声器产品线,因此投资语音助手和智能扬声器具有战略意义。谷歌和亚马逊凭借各自的智能音箱设备积累了巨大的市场份额,苹果正在迎头赶上。
以下是苹果人工智能团队研究的更多细节:
· 让Siri更智能
今年夏天,苹果公司发表了不少关于语音助手的论文。其中一个目标就是更好地理解用户意图,弄清楚用户想让Siri做什么。
苹果研究人员描述了一种方法,这种方法不仅思考用户的说话内容,还会结合语境,包括你用户位置、浏览历史、是否处于驾驶状态,以及之前的其他请求。另一项研究内容关于分析人声推断其情绪。
还有一家公司推出了新的数据集,让Siri在用不同的语言回答问题时更准确。这项研究的重点是26种语言,目的是为了更好地衡量语音助理在处理与英语相关的多语言的工作能力。
· 对于糖尿病胰岛素-葡萄糖值进行预测
今年8月,苹果公司发表了一篇论文,称其研究人员正在尝试通过结合人工智能算法和传统胰岛素预测模型,解决确定胰岛素正确剂量的问题。
该团队表示,虽然此问题尚未得到解决,但是他们引入了一种新的葡萄糖预测方法。总体来说,健康研究才具有更大的前景。有证据表明,苹果正在考虑如何让其产品为糖尿病患者服务。
图源:unsplash
· 基于AI的辅助工具
在10月份的一篇论文中,研究人员介绍了一种名为Rescribe的新工具,其可以简化为视频配音的过程。如论文中描述的那样,“内联”音频本质上描述的是视频的画外音,以方便无法看到视频的人。
Rescribe的目标是更有效地录制音频描述,而不是完成一些由音频工程师、旁白演员和制作人就可以胜任的简单工作。此项新工具应用广泛,可以把它添加到视频编辑软件中,观看公司内部电影和电视节目时也更加便捷。
不仅是Siri,苹果公司在人工智能方面还有很长的路要走。
一起分享AI学习与发展的干货
欢迎关注全平台AI垂类自媒体 “读芯术”
(添加小编微信:dxsxbb,加入读者圈,一起讨论最新鲜的人工智能科技哦~)
还没有评论,来说两句吧...