2015年,正是人工智能在中国刚刚热起来的时候。在这一年,百度智能驾驶的创始人余凯选择离开百度,找了一群业界大牛,包括百度IDL主任架构师黄畅、FacebookFair创始人杨铭、前诺基亚副总裁方懿、前华为芯片架构师周峰共同创办了地平线机器人,要做中国产的人工智能芯片。这个团队做出了很多世界级的研究成果,包括在2014年,作出世界第一款人脸检测芯片,被80%的数码相机的厂商,包括索尼、苹果等在采用。
人工智能已经成为未来5~10年最具颠覆性的产业机会,从PC互联网到移动互联网,先后成长起来了CSCO、雅虎、谷歌、Facebook、苹果这样的科技巨头。而人工智能时代,又有新的玩家可能会走上业界巅峰。
2015年,正是人工智能在中国刚刚热起来的时候。在这一年,百度智能驾驶的创始人余凯选择离开百度,找了一群业界大牛,包括百度IDL主任架构师黄畅、FacebookFair创始人杨铭、前诺基亚副总裁方懿、前华为芯片架构师周峰共同创办了地平线机器人,要做中国产的人工智能芯片。这个团队做出了很多世界级的研究成果,包括在2014年,作出世界第一款人脸检测芯片,被80%的数码相机的厂商,包括索尼、苹果等在采用。地平线机器人技术创始人余凯
余凯表示,地平线的团队很多来自互联网软件行业,以前是做深度学习和机器学习,但是软件到一定阶段硬件成为了瓶颈,于是自己来做硬件。
成立两年之后,余凯在今年年初的发布会上说出了地平线的目标:地平线将主攻ADAS和自动驾驶解决方案,同时要建设业界最大的驾驶数据库,预计到201年数据变现业务将会变成千万美金级别的生意。
在日前举行的青城山中国IC生态高峰论坛上,余凯阐述了他眼中的人工智能产业以及芯片的未来趋势。
人工智能芯片的工作原理?
科技行业的人都熟悉摩尔定律,但是我们今天要讲的是新摩尔定律。由于人工智能的应用、场景的驱动导致在软件架构方面会产生重构,使得应用到人工智能的处理器被重新定义。更强大的工艺和更先进的性能在人工智能芯片领域不再奏效,人工智能芯片需要许多特殊的计算模式,比如卷积计算、低规计算。
相比传统的数据中心,人工智能芯片最大的不同是模仿人脑。人的大脑的处理速度是很慢的,但是为什么可以一心二用,可以进行复杂的问题思考,可以针对不同的特殊问题做特殊处理呢?举一个例子:大脑对汉字的识别顺序是不敏感的,上图的字读到最后才知道这个顺序是乱的,为什么会这样?大脑对一些特殊的问题,做了特殊的加速。在空间上是并行处理,所以对这个顺序是不敏感的。由于人工智能芯片针对特定问题进行专门的算法及设计,使得芯片处理效率获得两到三个数量级的提升,这恰恰是最近几年芯片业的一个趋势。
从2011年开始,Google采用CPU来做人工智能算法,到2012年百度用GPU,2014年百度和微软用FPGA做深度神经网络的加速同时部署了上万台的服务器。2015年2016年地平线创立要做BPU,2016年谷歌说要做第一代TPU。从这里看到的趋势就是人工智能应用的牵引下,使得整个处理器不断的重构。从时间维度来看,我们看到PC到移动终端到IOT,对PC和移动的要求越来越高。所以处理器的趋势是从中心到边缘,以前很多人工智能的计算是在数据中心,以后大量的计算在边缘计算。所以未来业界的发展趋势是可以在移动终端进行本地的人工智能计算。而这些计算需要低延时、低功耗、低成本、数据安全性,相比传统的处理器要求更高。第三个趋势是边缘的竞赛是更高、更快、更强。比如特斯拉的车每辆车8~12个camera,探测距离和对像素解析越来越高,所以会不断从720P到1080P到4K视频,对于处理性能要求越来越高。
为何要使用专门的人工智能芯片?
“自动驾驶是一个比下围棋更复杂的过程,下围棋是只有两个人在博弈,而自动驾驶是你跟道路环境博弈,这里面的决策导致的计算复杂度,是超出我们的想象,”余凯表示。这张图是目前人工智能芯片的竞争格局。
英伟达是最先收益的公司,在2年内市值从100亿美金变成了900亿美金。相对而言英特尔的CPU对于人工智能应用的处理效率太低。而专用的芯片如谷歌的TPU以及地平线的BPU都具有很大的优势。可以看到Nvidia的处理能力是最高的,但是效率其实并不怎么样。现在整个业界都在往效率方面提高。这个领域我们的处理器包括google的TPU都做到了。
地平线的BPU逻辑是跟谷歌的TPU思路很像。与很多硬件公司不一样,地平线特别注重软件系统,地平线就构造了面向自动驾驶建设的软件平台Hugo,这是一个基于深度学习的系统。提供从感知一直到动态的决策,从端到端的深度学习,到后面面向增强学习的决策。
中国本土的人工智能芯片:盘古
这是地平线跟INTEL在今年CES上展示的基于处理器架构的FPGA平台,用8瓦功耗做到在复杂环境下超时帧的处理。目前没有一款其它的处理器能支持实时的计算。与IP提供商芯原一起合作,地平线推出的盘古处理器应用非常广泛。包括处理的Mobileeye的软件,跟Nivdia的芯片相比,盘古处理器可以针对中国的复杂路况进行处理。
相比英伟达的处理器可以做到30个人脸的实时的抓拍,地平线可以做到250个人脸,而功耗是其十分之一。这是地平线的第二代芯片,要做到像素级的识别。对遮挡和形变,各种不规则的形状和物体,都有非常准确的识别。
据介绍,盘古第三代的处理器不光是像素级的,而是动态、3维的场景。这个对于自动驾驶的路径规划是至关重要的。包括在高速公路上,包括可行驶区域,包括车道线和车辆,包括在晚上的场景精确识别汽车,包括各种不规则的形状的物体,都有非常准确的识别性。而这种超级复杂的情况里,大概用16毫秒就可以进行处理。
精彩评论