2017年6月6日-7日,由艾瑞集团主办的2017艾瑞(北京)高峰会议在北京国贸三期大酒店举办。
本届艾瑞峰会汇聚互联网核心力量,以“创想·聚能”为主题点燃行业精英释放互联网原力,共同探讨互联网经济与社会变革。作为中国互联网行业极具影响力的品牌峰会,在这里除了感受行业尖端脑力的碰撞,也能随着艾瑞集团15年成长的经历,窥探理解中国互联网行业的脉搏。
以下是科大讯飞高级副总裁江涛发表题为“人工智能+共创新世界”的演讲实录。
科大讯飞高级副总裁江涛
江涛:感谢艾瑞咨询提供这样一个机会,让我们跟大家一起分享科大讯飞这几年在人工智能,从能听会说,到能理解会思考做的一些工作。
今天是高考,无数的学子,大家都牵挂着,科大讯飞属于我们国家科技部人工智能的旗舰项目。未来智能项目,它的目标机器能参加高考,能考上一本,今年也是这个项目的项目组小试牛刀,在数学这个科目上进行单科的试验,待会儿会讲到。讲我们机器人工智能之前,我们先回过头来跟大家分享一下,人工智能是怎么产生的?
我们把镜头可以拉回到两百万年前,当时人类的远古的祖先开始出来之后,有形成很多分支,比如说东亚直立人等等,这些分支都在各自领域,各自所在的地方缓慢的发展,进化速度其实是很慢的。但是在七万年前,这些分支中的一支,非洲的智能,好像突然开窍了。所谓的开窍就是真正的突然开始掌握人类的语言了,这个语言跟之前的动物的叫声有很大的不一样,不一样在什么地方呢?
人类的语言能够携带更多的信息量,可以更精确的描述很多东西,人类的语言可以实现团队成员之间的沟通,八卦不再是女生的专利,八卦对于团队的凝聚力是很有好处的,部落里面张三跟李四说,王五做什么事情不靠谱,这样李四不用跟王五接触,他也知道王五的一些信息,对于这个团体的协作是有好处的。当然更重要的是语言,可以携带信息,它可以使得无数的人在一个共同的看不见摸不着的共同的价值观,共同的理念下来工作。
比如说民族、宗教、国家、信仰等等,这些都是属于一种虚构的概念,在这个虚构的概念下,可以组织成千上万陌生人的协作,这就是为什么智能从那些远古人类种群中能够脱颖而出,先后灭掉你你安的特人,迅速占领地球,用了几万年时间,现在无论是黄种人、白种人还是黑人都是智能的伙伴。
我们回过头来,在人工智能领域,机器的智能应该怎么产生?讲到人工智能,这几年媒体都高度关注,老百姓很关注,未来机器会不会产生独立的意识,未来机器会不会威胁我们的生存,好莱坞电影在这方面描述的很成功了。
政府也很关注,人工智能的应用,会不会大幅度带来失业,带来社会问题,投资人也很焦虑,人工智能的公司怎么那样贵,到底靠谱不靠谱,其实从学术领域,人工智能主要是这两条技术路线,一类是强人工智能,它的主要最核心的推动力是什么?是脑科学家,神经科学家,生命科学家,研究大脑,人类大脑高级神经活动深层次的规律。
人是怎么产生创意、灵感、想象力的,我们的贪婪、恐惧、爱情、愤怒是怎么产生的?这些都在研究,确实人脑是一个极其复杂的机构,要把它研究清楚真的很难。这方面,欧盟有HBP人脑计划,我们中国有中国脑计划,一体两翼,一方面研究大脑高级神经活动的机理,另一方面研究,这方面怎么能够作出一个,用计算机的方法,能够反做一个大脑,并且治疗脑科的疾病等等,它解决的是真正人工智能中,从0到1的问题,就是人的智慧怎么产生的。但很遗憾的是,这条技术路线,现在还不好说,刚才讲的美国、欧盟都是几十亿的投入,中国脑计划投入也很大。
可喜的是,另外一条技术路线,就是弱人工智能的技术路线,过去几年取得突飞猛进的进展,这个路线加上充分利用机器学习和大数据方向不断的迭代,不断的应用中,取得各种各样的效果,这条技术路线,它解决的是从1到N的问题,更多的是机器把人类已经学好的知识和经验,在各种应用场景中,通过大数据持续迭代,持续的优化,这条技术路线,应该说是有着清晰的演进路线,未来五年,可以做到什么程度,十年做到什么程度,安全做到什么程度,都是看得清清楚楚的,这条路线,坦白的说,不涉及到创意、灵感、想象力,应该说很多科幻学家,或者说预言学家,把这两条路线搅在一起预测,到多少年以后怎么样,其实在弱人工智能这条技术路线上,它演进出来更是提升人类脑力劳动的生产率,它本身绝对不能威胁人类,未来机器怎么产生自主意识,这个都是不靠谱的。
这是刚才讲的,强人工智能领域,它研究的最底层的,就是要研究人脑是怎么运行的。人脑一千多亿的脑细胞神经元,每个神经元又有百万亿级的连接,这个人类大脑的运行机制,跟我们冯诺伊曼运算机制不一样,冯诺伊曼计算机存储,大量功耗消耗在主存储期的调用。人脑和运算过程是一体的,在几千亿各神经元,相互之间的连接,上百已次的连接,信息处理的过程和存储的过程是一体化的,所以它功耗特别小。我们现在大家所说的最多的人工只能,更多指弱人工智能,这个在1956年大的达德毛斯会议上,正式提出这个概念,像人一样感知、认知、决策、执行的一套系统。
运算智能大家比较熟悉的,最近重新又火一把,AlphaGo,它结合了感知智能的技术,对于整个围棋盘面,通过图像识别的感知,判断每一局的胜率,在这个基础上进行超大规模的运算。
感知智能方面,科大讯飞这么多年,在语音方面取得一个又一个的成果,感知智能方面,科大讯飞在语音合成方面,我们连续多年在全球顶级的比赛,拿到第一,也是全球在这个比赛中,唯一计算机说话超过普通话水平的系统。我们听一下计算机模仿奥巴马说话的水平怎么样。我们可以用系统训练出奥巴马的原型,这个原型可以说全世界任何一种语言,基本上让奥巴马的夫人听不出来是奥巴马本人说的还是机器说的。
语音识别方面,去年全球影响力最大的比赛,是CHiME Challenge,比的是多人说话的原场识别,单麦克风,双麦克风,六麦克风各种方案下,人和麦克风比较远的情况下,这个时候的识别准确率,科大讯飞在主要关键指标上都拿到全球第一,而且大幅度刷新这个比赛的历史纪录,与15年的全球第一,错误率下降50%。
2013年正式启动了科大讯飞的超脑项目,这个项目要解决的问题是什么呢?让计算机能听会说,进一步会理解会思考,不光是语音合成,语音识别这方面的问题。这个典型的项目,就是考试机器人。国家863科技部有一个项目,这个问题要解决的就是语音理解,逻辑推理,归纳总结。
全球在这个领域,竞争还是比较激烈的,美国是华盛顿大学图灵中心,他们在微软的联合创始人艾伦的支持下,正在研发这样的考试机器人,目标是美国的高中毕业生考试达到人类水平,日本启动比较早,定的目标比较高,2021年之后,他们考试机器人参加高考,考上东京大学,他们这个项目2010年开始启动,由日本国立情报研究所牵头的,他们2015年在日本的高考中,已经拿到500多分。整个题目的设计有很大的变化,他们有可能不参加,对于整个自主招生,这种考试来说,机器还比较难。有可能他们会退出这个比赛。人和人之间的自主命题的考试,机器要参加确实很难。
我们国家科技部的项目,讯飞是牵头单位,首席科学家就是讯飞的执行总裁胡玉,这两天的高考,在数学项目上,我们已经开始单科测试了,过两天新闻就会出来。大家可以进行关注。当然除了数学之外,数学是这么多科中最简单的,因为它有严格的逻辑体系,逻辑语言体系,比较难的包括语文、历史、地理这些科目,对于整个语言表达,知识推理,逻辑分析都有很高的要求。
这方面在机器现在考上一本还比较难,但是在一些领域已经开始认知智能的研究成果,开始应用了,比如说翻译领域,连续两年,全球机器翻译领域,科大讯飞代表中国,PK掉美国人和日本人拿到全球第一。科大讯飞做的翻译机一上市就脱销了。
另外认知智能还有一个成果,我们把它用在教育里面,可以替代老师批改作业,批改卷子,这个并不是说,让孩子在IT设备上答题,后来来评判,而是孩子不改变任何学习习惯,直接在纸笔上回答题目,无论是主观题还是客观题,机器都能读懂并且判卷。前年国家考试中心,第一次在安庆和合肥两个城市,六万多考生,老师打完分的卷子,由机器再打一次分,结果有四万多分是一样的,另外一万多分,有差别的。然后由专家组拿出来,互评一下,结果75%都是机器打的分准。从去年上半年起,国家考试中心,正是跟我们签订战略合作协议,研究人工智能在阅卷,在命题方面怎么副主任,怎么提升效率和公平。
另外一些成果,比如说机器自动构建知识图谱这个比赛叫KPP2016,它比的是机器在海量文献,海量文档中的知识发现能力,比如说原文有这样一道题,美国大选期间,特朗普炮轰杰布布什,伊拉克战争都是你哥哥的错。关键还有一点,你哥哥的错,机器要判断出,你哥哥是指小布什,这些都是很难的命题,科大讯飞很高兴的我们在比赛当中,拿到全球第一。另外机器的阅读理解能力,这是我们用的是Google做AlphaGo的测试题,机器去读海量的CNN的文章,读完正文以后,回答摘要的若干问题,判断机器对于文本的理解能力,在这方面我们超过了他们。
去年年底有一个比较有意思的比赛,叫做Winograd的比赛,它是北美的一个德高望重的专家的名字,这个测试方法用他的名字命名的,大家都知道图灵测试,问问题,通过问题判断,机器是否智能。图灵测试,大家公认比较容易作弊了。Winograd的测试方法不一样,爸爸没法举起他的儿子,因为他太重了。这个他是指谁,上下文可以理解归纳,业界普遍认为Winograd替代图灵测试的一个标准。科大讯飞在这个领域拿到全球第一,当时这个结果拿出来以后,MIT请我们主任去做报告。
人工智能的技术进展,怎么改变时间,怎么落地,不是飘在远端的东西。其实最重要的是三要素,除了核心算法以外,还有要有海量数据,各种应用扎进去,要能算出来。
比如在医学领域,你学的是赤脚医生,还是院士,最后机器训练出来的东西完全不一样。这个应该说科大讯飞在很多领域,把这些应用逐步落到实处。比如说教育里面,科大讯飞讲了,纸笔硬件技术,包装进来,平时作业的数据,通过替代老师批改卷子,批改作业,实现对孩子个性化的辅导。这个平台大量应用了,像北师大二附中,还有黄冈中学应用的比较好的成果了。60多所全国百强校,像人大附中,北师大附中,二附中这样的全国百强。我们科大讯飞,除了人工智能,我们做具体的教育医疗应用以外,我们语音合成,语音识别理解的能力,过去几年发展非常快,现在我们整个开放平台,现在每天的乞求数过30多亿次,累计终端数,超过10亿。
我今天主要介绍到这里,最后再讲几句,人工智能发展的一定会比各位想象的要快,中国和美国在这方面,已经走到世界的前列,去年科学杂志,有一篇文章,到了2045年,人工智能会对全球就业产生重大影响,包括中国、印度人口大国影响都非常大。我们相信人工智能大量提升全球在脑力劳动,或者白领的工作效率,人类在脑力劳动方面的生产率大大提高,这个时候人会解放出来,会做更创意灵感想象力的工作,未来人工智能会像水和电一样,成为我们生活中的一部分。我今天的分享就到这里。
精彩评论