微信
投稿

百度的 AI 学会了举一反三 离强人工智能又近了一步

2017-03-31 14:54 来源:搜狐科技 作者:

不管终极目标能否实现,至少今天,在像人类一样学习的道路上,机器又往前迈了一步。

你一定知道,AI在下围棋上已经比人类厉害了。不过,绝大多数在完成特定任务上性能卓越的AI,实际上只是面向单一任务进行训练出来的而已,如果一个AI的任务是下棋,它就只会一步一步下棋,你要是突然问他“怎么下才能赢?”它根本不知道,八成会宕机。

这就是你暂时不需要担心AI终结人类的原因:它不会举一反三,没法解决一些在认知上跨度比较大的任务。举个例子,在《坦克大战》里,胜利的方式是尽量保存更多的砖块,吃掉增益,击毁所有的敌方坦克,一个正常的人类玩家可能玩上一两盘就明白了,而AI可能会把所有的砖块全都打掉,输掉成千上万盘游戏才能迎来第一盘胜利。

百度的 AI 学会了举一反三 离强人工智能又近了一步

人很容易理解“保存砖块只打坦克”这句话,但AI理解不了,它只会玩游戏,不会听话。

想要实现强人工智能,甚至通用人工智能,这个问题迟早有一天要解决。PingWest品玩发现,近日百度发布的一篇论文显示,该公司搭建了一个AI系统,组合了计算机视觉和自然语言处理两种技术,让AI学会了“举一反三”:在一个专门架设的游戏环境中,AI控制的角色可以理解并执行过去从未发出,也从未定义过的指令,且成功率达到了90%。

百度的 AI 学会了举一反三 离强人工智能又近了一步

研究团队由深度学习研究院杰出科学家徐伟带领,采用的是监督学习和强化学习所组合的深度学习技术。研究人员设计了很简单的游戏场景XWORLD,在一个8x8的游戏空间,AI控制一个主角,一些砖块和可以“吃”的水果,位置均随机。他们采用的训练房室很简单,1)直接给出一句自然语言指令,比如“请前往苹果的位置”,然后根据AI的行为奖罚;2)用自然语言向AI发问,比如“在北边的水果是什么?”根据答案正确与否奖罚。

至于地图什么情况、哪些是砖块哪些是水果、北是什么方向、苹果长啥样,AI则是采用计算机视觉来进行判断的。很快研究人员就发现,AI不需要以往那么多的训练次数,就可以实现举一反三,准确地执行一些从未听过的新指令,比如“请去到无花果的西边”、“你可以去苹果和香蕉的中间吗?”、“请移动到红色/绿色的苹果”,以及回答非指令问题,比如“靠南的水果是什么”(西瓜)。

百度的 AI 学会了举一反三 离强人工智能又近了一步

如果你已经学会了怎样用水果刀削苹果,那你几乎不需要指导也能用水果刀削梨和火龙果。其实这就是举一反三,因为通过将感官获得的资讯进行认知整合(特别是语言方面),从而实现知识和经验的迁移,对于人类而言是一件特别容易的事情。但在过去计算机一直无法实现,除非人类对“反三”中每一种可能出现的状况都预先编程。

在徐伟团队论文描述的实验中,AI系统能够从训练指令中学习语法,处理和回答新的指令、问题,意味着计算机终于首次在某种特定的环境下获得了举一反三的能力。机器学习中,这种能力的术语叫做“零样本学习”(zero-shot learning ability)。

对于这项技术,接下来百度还有新的打算。除了让AI在XWORLD环境里增加新的功能,理解更多、更复杂的指令之外,徐伟团队还打算将它迁移到虚拟的三维空间中进行训练,最终极目标则是在实际环境中,让人类教师用自然语言来训练机器人。

不管终极目标能否实现,至少今天,在像人类一样学习的道路上,机器又往前迈了一步。

免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

精彩评论

暂无评论...
验证码 换一张
取 消

热门作者

东方

简介: 天马行空的文字之旅。

邮箱: liutingting03@hczyw.com

简介: 保持期待,奔赴山海。

邮箱: zhuangjiaxin@hczyw.com

松月

简介: 脚踏实地,仰望星空。

邮箱: wuxiaqing@hczyw.com

合作咨询:15889679808               媒体咨询:13650668942

广州地址: 广州市越秀区东风东路745号紫园商务大厦19楼

深圳地址: 广东省深圳市龙华区五和大道星河WORDC座5F506

北京地址: 北京市朝阳区小关东里10号院润宇大厦2层

慧聪电子网微信公众号
慧聪电子网微信视频号

Copyright?2000-2020 hczyw.com. All Rights Reserved
慧聪电子网    粤ICP备2021157007号