昨日,倍受瞩目的智能芯片引领者寒武纪科技在北京举办了成立以来的一场发布会。会上,寒武纪联合创始人,CEO陈天石隆重发布了该公司的下一代智能处理器IP产品,同时披露了未来的云端训练芯片和智能汽车芯片,层出不穷的惊喜吸引了行业的广泛关注。在会上,陈天石还就业界广泛关注的华为Krin970NPU的相关问题作出了公开回应。他表示,Kirin970的NPU技术正是来自于他们的1A处理器IP授权。
Kirin970人工智能技术的背后支持者
在今年九月的IFA上,华为终端总裁余承东披露了华为全新一代芯片旗舰Kirin970。这颗集成了55亿晶体管的SoC除了拥有强悍的CPU和GPU运算能力以外,还第一次引入了独立的AI加速器,这引发了大家的广泛关注。从华为方面的数据显示,这颗NPU核的处理能力甚至还超过苹果A11。于是围绕这个AI加速器的IP来源,引发了业界的猜测,作为传言主角的寒武纪之前未曾公开承认过。终于,在这次发布会上,陈天石公开表示,华为Kirin970NPU的IP授权来自于他们的1A处理器。
据介绍,这款寒武纪于2016年发布的处理是全球第一款商用深度学习处理器IP,这是一款针对低功耗嵌入式终端的本地智能处理而开发的产品。在1GHz主频下理论峰值性能为每秒5120亿次半精度浮点运算,对稀疏化神经网络的等效理论峰值高达每秒2万亿次浮点运算,同时支持八位定点运算和一位权重。在某些应用中,这颗处理器拥有比传统四核CPU高24倍的性能和50倍以上的能效,陈天石强调。
在实际的应用上,它不仅能支持CNN、DNN、RNN、LSTM、SOM等多样化的模型,还支持deconv、localconnection,depthwiseconv等多样化算子。另外,支持稀疏化网络、FP16、INT8运算和1bit权重为1A增色不少。陈天石表示,正是因为寒武纪从产品规划开始就做了以上兼容,才让这个产品即使跟现在的其他竞争对手相比,也毫不逊色。正是在这些强悍性能的支持下,华为Kirin970才能轻松支持视觉、语音、自然语言处理等多种智能任务,并在和苹果A11的竞争对比中毫不逊色。
“我们打败A11并不是靠野蛮地去堆运算器,先进的稀疏化技术才是我们的秘密武器”,陈天石强调。但这次打败苹果并不带代表什么,他补充说。
陈天石引用联发科创始人蔡文介的话表示:“这个行业就像一场拳击赛,赢了这一场还有下一场,下一场我们会继续推陈出新”。
多款处理器IP、云端芯片同台亮相,发力AI时代
在回顾了1A处理器带来的优越表现外,寒武纪还在这场发布会上带来了几款IP产品和云端芯片,全面发力AI时代。
首先带来的是寒武纪1H16处理器,据陈天石介绍,这是一个可以用于手机安防、摄像头、音箱、机器人等等广泛和智能处理有关领域的产品。产品拥有性能更好、能耗更低、功能更加完备的特点。但在问到具体细节的时候,陈天石强调,不能公开具体的技术数据,考虑到其合作伙伴,他们暂时不能公开具体的技术数据,但他们的芯片合作伙伴可以则通过与他们签署NDA方式,获取更多的技术细节。
另外,寒武纪还带来了是一款专门面向计算机视觉领域专用的处理器IP产品——寒武纪1H8处理器。寒武纪方面表示,希望这个产品能为计算机视觉领域领域提供成本更合理、价格更低廉的AI硬件方案。
陈天石告诉记者,寒武纪1H8和最早发布的寒武纪1A处理器产品相比,具有更低的功耗、更低的成本。其在视觉领域延续了出类拔萃的通用性、完备性,性能功耗比可以达到寒武纪1A处理器2.3倍。这就让其可以为计算机视觉领域提供非常广泛的支持,像拍照辅助、图片处理、安防监控等就是其典型应用。
“我们为这款产品提供1T/2T/4T/8T四种可选运算能力设置,期待在视觉方面与更多合作伙伴一起共创辉煌。我们坚信它未来在视觉市场一定会大放异彩”,陈天石强调。
除了这两个IP以外,寒武纪还披露了一款面向智能驾驶领域的处理器IP产品寒武纪1M。这个产品的性能将达到寒武纪1A的10倍以上,高度集成,具有更高的性能功耗比。而其目标是让中国的汽车全部都用上国产智能处理器,陈天石强调。
除了带来了面向终端的IP产品外,寒武纪还带来了寒武纪的云端智能芯片MLU(机器学习处理器)。陈天石表示,在未来18个月当中,他们将发布两款高性能的商用智能芯片MLU100和MU200,前者采用TSMC16nm工艺,同时支持推理和训练、偏重推理,可以应用于数据中心、中小型服务器;后者则是一款更偏重于训练的智能芯片,是面向企业级智能研发中心的。
陈天石表示,寒武纪团队对于全球学术界和工业界最大的贡献,到目前为止还是深度学习处理器,他们开创了深度学习处理器一个全新的方向,但他们不能吃老本,要立新功。寒武纪要做的就是通用的机器学习处理器。
“我们的技术,以前背后所做的一切,都是为了这两款云端智能芯片大规模商用做准备,敬请期待”,陈天石告诉记者。
打造广泛生态链谋求共赢,目标是三年让十亿终端用上寒武纪“芯”
和很多其他应用一样,拥有了高性能的硬件是AI发展的基础,但如果要发挥其威力,发展其市场,则需要软件、工具和生态多方面的紧密结合,只有这些方面都打通了,才能开启一个真正的AI时代,而寒武纪正在这方面做努力。
在发布会上,寒武纪带来了专为开发者打造的寒武纪人工智能软件平台“CambriconNeuWare”,它包含了开发、调试、调优三大部分,将全面支撑端云一体的智能处理。据了解,该软件开发平台构建于寒武纪发明的人工智能专用指令集支撑之上。这意味着,基于寒武纪软硬件平台,人工智能产业界将构建一个完整的、基于底层自主指令集的智能新生态,方便开发者进行跨平台应用迁移,并为端云一体的人工智能处理打下坚实基础。
陈天石表示,寒武纪的目标是打造各种工具链,让大家代码还可以像以前那样写,不改变代码习惯就使得大家能够在寒武纪处理器上能够非常便捷地编程。
寒武纪方面认为,指令集和软件开发平台其实一直是开发者做跨平台的应用移植的壁垒。为了让开发者、程序员快速高效开发和部署人工智能应用,端和云一定要做到软硬件兼容。这样做的好处是:第一,做应用迁移会非常方便,甚至不需要把这些应用做重新编译,就可以切换过去。第二,端云一体,更加方便端和云进行协作。我们可以去做更细粒度、自由度更大,对于任务、对于巨大负载的切分,整体端和云可以提供更强的综合智能处理能力。这也是寒武纪一直坚持端云一体发展战略的原因。
除了自身的努力外,与第三方合作伙伴的紧密合作也是寒武纪在过去几年取得骄人成绩的关键。
“过去,我们在国家企业信息技术上落后于国外同行,在生态上也是跟随者、参与者,这给我们带来了很多代价和教训。但在AI时代,这一切将会转变,因为我们的硬件和算法与国外同行都处于同一阶段”,陈天石告诉记者。
他表示,寒武纪将力争在3年后占有中国高性能智能芯片市场30%的份额,并使全世界10亿台以上的智能终端设备集成有寒武纪终端智能处理器,如果这两个目标实现,寒武纪将初步支撑起中国主导的国际智能产业生态。
编者后记
回顾寒武纪的发展历程,无论是从2008年中科院计算所成立10人学习团队,开始探索处理器与人工智能交叉领域算起,历经将人工智能应用于处理器设计验证,实现中国大陆在处理器架构顶尖会议HPCA上的首次突破;还是后来从人工智能应用于处理器架构优化,提升处理器性能和能效比,到研发全球首个深度学习处理器架构DianNao,获处理器架构顶尖学术会议ASPLOS2014的认可,再到研发全球首个多核深度学习处理器架构DaDianNao。以上辉煌见证了寒武纪在发展过程中的取得成绩,这是一代代寒武纪人艰苦奋斗的成果。
2015年,他们成功研制全球首个深度学习专用处理器寒武纪,并与2016年成立了寒武纪科技,自此拉开了一段新的历程。公司成立后,他们先后发布了全球首款商用深度学习处理器IP产品——寒武纪1A处理器和全球首款人工智能专用指令集CambriconISA。并在随后获得华为的认可,为华为的Kirin970证明。
在一步步的成长过程中,寒武纪科技获得了国内外的一致好评,一个智能芯片的独角兽也正在逐渐成长。展望未来,希望在寒武纪等厂商的领导下,中国智能芯片能在国际市场上闯出属于他们这个时代的辉煌。
精彩评论