做处理器的英伟达(NVIDIA),为什么要做DGX-1超级计算机?英伟达中国区销售总监何犹卿先生在“3E‘硬纪元’AI+产业应用创新峰会”上表示,深度学习技术是实现高级人工智能的核心,而超级计算机DGX-1所代表的高效率、高计算水平对于训练神经网络来提升深度学习水平是不可或缺的。
自DGX-1面世以来,它已经和不少领域的科研机构以及商业公司进行了合作,目前在医疗、安全、天气、无人驾驶等领域都有所建树。在何犹卿看来,这个人工智能助力人类工作、分析的时代,应该被称作“算法的时代”。
在“算法的时代”中,何犹卿也认识到了人工智能对未来行业规则的改变。一个例子就是在“共享经济”的的大背景下,汽车行业会有怎样的改变,无人驾驶又会给汽车行业带来怎样的冲击?何犹卿提醒大家,在大数据时代的数据海洋中,类似的趋势都是必须仔细关注,并加以详细分析的。
何犹卿先生的演讲全文如下:
我想主要讲一下“深度学习”这个技术。它是在实现高级人工智能的一个核心的一个东西,所以我今天会在这儿会做一个分享,前面已经包括图森,包括奇点汽车,把整个人工智能在很多产业当中的一些应用都做了一些描述,这块的话我会快速大概跟大家分享一下这个人工智能在很多方面的一个应用。
实际上,我们现在讲到这个人工智能有一个非常非常具体的东西,就说机器它如何区别视觉的能力,这是第一个;第二个是机器如何有听觉的能力;第三个是机器如何有理解跟推理的能力。从这三个方面来讲。
在很多的应用场合当中,包括做语音的这个助手,包括根据这个图片来做一些搜索,包括做一些精确的推荐,这个方面都已经大量的采用了一些人工智能的一些技术,那么真正来讲,目前人工智能已经进入到我们的生活的方方面面。
譬如机器可以帮我们来翻译,比如说是我的英文水平不太好,我要跟一个外国人在对话这个机器可以帮我来做到一个实时的翻译,中间来讲的话还有一个就说真正我们针对某一个具体的病人做一些监护的时候,机器也能帮我来做一些监护,包括病理的一些分析,包括甚至做一些预测。
针对盲人,我们通过一个眼镜有个摄像头,这个摄像头拍摄到外界的一些场景,他把转为一个语音来提示这个盲人,这样帮他来做一些辅助,另外给我们生活带来很多的方便,比如说现在我们在很多公共场所有的做的视频的监控,包括做一些识别,包括所谓先突发事件的一些分析。然后中间的这个部分我们在很多的场合,包括我们北京的龙泉寺已经有了机器人,可以帮助我们来做一些辅助的一些支持。
目前加州也有一家公司在用我们提供的人工智能技术帮助做农业,这是什么意思?在除草的机器上面,它会装摄像头,这个摄像头它会告诉这个机器什么是庄稼,什么是杂草,那么然后他该除去杂草,而留下庄稼。
从1995年开始,我们就进入了互联网商业元年,但是一直到后来2005年以后移动互联网又开始,真正到了15年年开始以后,往后再推,那我们在讲这个时代应该进入到一个人工智能的时代了,人工智能跟物联网的一个时代。
在这个领域当中我们现在很多,不管说是全球的巨型公司还是一些创业公司,都非常关注人工智能的一些应用,实际上来看的话,这个领域的一个市场的潜力会非常巨大。到2020年,我们在很多可能跟用户发生交互的这样的这个工作当中,有85%的设备都会嵌入人工智能来做一些应用,另外投入到人工智能技术跟研发方面的一些费用会达到470亿美金,另外我们可能会有20%的一些企业会用神经网络来辅助到它的一些工作。
人工智能是一个很大的一个范畴,实际上这已经不是一个很新鲜的概念,在过去也有很多的方式,比如说像机器学习的一些方式,来帮助我们来实现人工智能的一些应用,但是机器学习是一个很好的方式,但它目前来讲,它在整个准确度方面来说提升的不是太理想。关于机器学习,大家可能最熟悉一个例子:
我们在做邮件系统当中的防止一些垃圾邮件,我们人做了一些标记等等,这样来讲的话我们也有些体验,它有时候把我不该拦截的邮件都给拦截了,这是一个方面。
后来从2011年以后开始的话,包括很多院校研究机构,他们开始尝试用这个深度学习就是神经网络训练的这种方式,来从事人工智能的一个工作。它的一个出现带来一个很大的提升,就是把机器交汇到一个非常高的准确度,比如说95%以上。现在我们在做一些这个图片的识别、人脸识别这块已经超过人眼,我们能达到99%点几的这个准确率。
我们再看一下,真正深度学习作为一个很好的帮助,实现高准确用人工智能的一个手段,今天已经渗透到好多的行业,不管从互联网的一些服务,包括一些医药,包括一些传媒娱乐,包括一些数字安全跟城市安全的一些问题,包括我们前面两个专题再介绍到的汽车自动驾驶。深度学习的一个诞生的话,它是我们讲一个全新的计算模式,这点的话要跟大家稍微做一点阐述。
从过去来讲,我们理解到的一个计算都是一个非常精确的一个计算,因为我们有一个数学的公式,是可以描述1+1等于2,这样的一个描述。今天来讲,我们通过深入学习来讲,实际上是可以帮我们来计算一些我们无法用公式来做描述的这样的一些应用的一些范畴,譬如说下围棋确实没有一个准确的一个公式,或者说一个推理可以来描述这么一件事情,但是我们可以通过样本来训练来教会这个机器,他学会这个技能,因此来讲的话,深度学习是另外的新的一个业务模式,一个计算模式。
我们训练完这个模型之后,可以把软模型的拿出来,拿到一个示范到云端,在数据中心来云端来给大家来提供服务。这典型的一个案例:比如说我们现在在微信做语音的识别,我们说一段话,他能把这个的话翻译成文字,类似这样的一个应用的场景,然后另外就是我可以把的模型训练好的模型搬到一个嵌入式设备当中。那么这个嵌入式设备可以是个机器人,当然也可以是一个汽车,到了汽车就是我们谈到的自动驾驶。
为了给整个神经网络做一个训练,我们做了一台设备,叫做DGX-1。大家会问说做处理器,为什么要做一台系统,当然我们做这台系统是我们的一个考量,这个配置很常规,这里边主要在讲这个东西,主要是有八个高性能的一个gpu,再加上gpu之间的一个通信的一个链接。
我们为什么要做这台机器?你要知道,一旦我们在做机器的视觉识别的时候,我就会发现我有太多的东西要是教会这个机器来做识别。今天我们的人可以通过眼睛,我们可以识别边很多的东西,花草、物件、水果、动物等等非常多的东西,在深度学习的过程当中,需要我们在不同的业务中,去训练神经网络,去教会这个机器来做这个识别。
大家要知道这种训练量非常大,那因此如果说是我们能有一台设备非常高效的,非常快速的把我来实现某一类科目的训练,这样对一个整个人工智能走向应用层面,走向一个生产的环节会有巨大的一个帮助,这就是大概我们做的这台设备的一个初衷。
这么一个深度学习超级计算机,它可以相当于250台普通X86服务器的计算能力,也就是一个中等规模的一个数据中心的一个计算能力。同时的话,这里边我们在整个这个机器当中部署了非常多的工具,这个工具也包括了很多开源的神经网络,包括一些深度学习的框架训练框架等等。
为什么要做这个工作呢?我们做事有一个宗旨,就是要降低技术的一个门槛,快速把这个技术落地帮助到企业的一个生产跟运营,大家不用花太多的时间去优化去学习这些神经网络,我们就可以提供很多的工具帮助大家来快速的进入到我实质上的工作。
另外,在整个的平台上,我们也跟非常多的人工智能领域的一些领先者先驱,包括它做的框架,以及包括像纽约大学做的部分课题与项目等等,这样的一些科研机构跟公司去合作,把他们的开源的一些软件部署到系统当中,以方便大家来快速地来开展应用的开发。
整个DGX1在全球包括在一些科研机构已经得到很多的一些应用,我这里边随便举几个例子。
譬如纽约大学,他们承接了一个课题,如何用人工智能来分析一个棒球运动员,他在体育赛场的一些行为,并且给出来一些建议,如何帮助运动员来提升他的一个运动的一个技能。
还有伯克利大学做的项目,就是如何在设计一个机器人时,让这个机器人摔倒了再站起来。这个东西我们过去来讲是否能通过很多的物理的一些公式来做,那么今天他们尝试了一个新的方法,就是直接让机器人不断的去试错,是一直在试,直到它最后它找出来一个很有效的方式让自己站起来。
此外,美国能源部及很多科研机构也在用DGX-1的一个设备,他们用这个来分析一些癌症细胞,观察其演变过程,包括它的病理发生机制。还有美国一家高科技公司,他在用这个来帮助我们来创造一些新药物,大家知道我们要做一个新的药品,周期会非常长,因为我要弄清药理机制,一些化学成分怎么去影响到人的一些细胞。
实际上,深度学习人工智能应用它有一个比较非常好的一个好处,他可以把过去你在做任何药理方面的一些经验,它都可以去做分析做学习,学习完了以后之后,它反过来它可以帮助你来建议这样的一个西药的一个分子化学的一个结构,会不会影响到我们除了它去杀死一些细胞,会不会影响我们人的正常的一些细胞,他来做这方面的一些分析跟模拟。
这前面讲的一些科研机构,真正来讲,面对企业我们怎么来面对人工智能的一些应用,刚才我们在前面在讲05年开始到15年,这是一个互联网到移动互联网的时代,当然移动互联网带给大家非常多的数据,也就是我们现在讲到得非常多的大数据海量数据,因此也产生了“数据就是金矿”的说法。
我们用数据来帮助完成业务决策,帮助我的业务来做一些预测跟分析,今天到了15年以后,人们就开始用人工智能的一些技术来帮助我们企业的一些工作,到了这个时代,我们可不可以这样在讲,就说也进入到了一个“算法的时代”。
这是它的发展演变历程,从最开始业务的流程管理,上升到互联网,基于外部的一些服务,到了之后我们积累了很多一些数据,形成了一个数字经济,再往外围,我们未来会用人工智能的一些技术来改变传统行业,改变我们的工作。
譬如艾森哲,他用了人工智能的方法来分析IT网络的入侵病毒等等类似这样数字安全性的问题。另外美国一些在线零售商,也用AI做客服帮助来回答客户的一些咨询问题。
当然,AI也可以确保机器货物的分点跟包装,不要出现一些错误,根据一个订单的准确描述,比如一部手机,在加了一个什么壳等等。机器来帮我们来确保员工在做分拣的时候或者是说机器在做分拣的时候确保准确性,不要出现任何的偏差。
国内当然也有我们有一个合作伙伴叫深蓝科技,最近也比较热门,因为他们在做智能无人商店。在做无人商店时需要人工智能技术做很多这样的分析,譬如如何来分析用户的一个消费的行为,他到底是把东西拿走了还是又退回去了等等。那么它也跟我们在有些合作,用视觉分析的一些办法来确保整个销售的完成。实际上目前在国内包括阿里,包括娃哈哈还有很多,包括海底捞等等,很多的公司已经进入到这个领域来,开始来做这个无人值守商店。
大家可能会问为什么要做这种东西,实际上有几个方面的因素。一方面是说,他们认为一个最好的消费体验就是用户不用去在意怎么结算,这是人的一个心态,我拿着东西我就能走了,这是我们最自然的一个心态。
当然另外一个方面就是,人工是做不到7*24的,我们三班倒也好,还是雇很多人看店也好,人总有一个休息时间,这些都意味着成本。类似这种机器无人售货商店,对这个时间是无所谓的,7*24那怎么加倍都可以。
我们在讲到这样一些应用,下边我再花一点点时间讲,就说如何让人工智能技术能够尽快进入应用层面。
当然我们会面临很多的问题,包括我们有没有这方面的人才,我们有没有这方面的一些算法?我怎么来快速来实施一个训练,怎么来部署一个平台,在很多个方面都需要提供这样的一些帮助。
常规来讲,作为一个机器,视觉从图片的分类目标识别包括图片的一个分割,类似这样的一个技术我们都非常需要。而DGX1这样的设备当中提供了非常多的工具,比如如果利用可视化界面来实现整个神经网络训练的这样一个过程。
前面我已经讲了很多的框架,很多的SDK帮我来优化我所做的训练的时间,今天就说我们除了提供了一些设备,我们当然也提供了一些平台,包括用这个台式机或者用服务器数据中心来搭建训练环境。
另外,我们也会有一个供大家学习的地方,它叫深度学习学院。我们会面向公众也包括针对一些特定的企业,开设一些深度学习技术方面的课程培训,有的培训是免费的,有的培训是收费的,到时候大家可以关注一下。
当然了,从整体来说,AI还处于一个初始阶段,但我们在整个研究当中处于一个高度进化的过程。今天我们再看,在互联网领域有非常多的应用都开始运用了人工智能的这样的一个技术,甚至我们在很多的云端的一些服务中,AI人工智能也被作为一种服务,提供给大家。
人工智能已经渗透到了各个行业,这是我想说的一个方面。另外的话,深度学习是帮我们实现人工智能最有效的一个技术手段。第三个方面,如果说在开发我们人工智能应用方面,大家可以使用非常多的计算资源、工具SDK等等,我们可以帮助开发者推进整个AI产业的一个发展,我要说的就这么多,谢谢各位。
精彩评论