2017年末,中国AI领域最热的是什么?芯片。
12月,千呼万唤始出来,成立两年的地平线发布了自己研发的AI芯片“旭日”和“征程”;ThinkForce甫一成立就融资4.5亿人民币;11月,比特大陆发布了号称“中国版TPU”的张量加速计算专用芯片BM1680;9月,寒武纪授权给华为海思的IP(可以集成在芯片中的模块)成就了全球首款手机AI芯片麒麟970;深鉴科技的FPGA板卡备受认可后,也公布了明年的“造芯”计划。
而NovuMind创始人吴韧说,等NovuMind的芯片明年正式亮相后,所有人都会被AI芯片的“全新可能”震惊。
从各种意义上看,AI芯片已进入“战国时代”。
很久没这么热闹了
2015年春,清华大学电子工程系的博士单羿问导师汪玉:要不要考虑创业,搞AI芯片?
在那之前3年,一位多伦多大学的研究员用GPU(图形处理器,显卡的核心部件)跑深度学习算法,赢了2012年ImageNet大赛。此后,全世界的人工智能实验室都注意到了GPU对深度学习效率的提升。汪玉也钻研了两三年,但当时他觉得尚未准备好创业。
觉得必须“做点事情”的单羿先加入了另一家AI芯片初创公司实践自己的想法。不久之后,汪玉感到创业条件逐渐成熟,召回了自己的爱徒。
汪玉的决断很及时:深鉴科技于2016年3月成立,仅一年半后,如果再加入这个赛道就晚了——玩家几近拥挤。
据CBInsights估算,进入新兴芯片初创公司的投资总额从2015年的8亿美元增长到了今年的16亿美元;创投库里,AI芯片公司从零星几家增长到20多家,还有十多家大大小小的公司传出要“做芯片”的风声。
光今年下半年,台积电的生产线上就有超过30款“AI芯片”排队等着流片。
自x86架构一统江湖,芯片领域已经很久没有这么热闹过了。
令人欣喜的是,在这一轮浪潮之中,中国芯片前所未有地靠近世界前沿。中国的初创公司不仅与欧美初创公司几乎处在同一起跑线上,甚至渴望与英伟达、英特尔这些巨头直接拼杀。
对数十年来一直落后的中国芯片产业来说,这是一次弯道超车的难得机遇,还是风口吹起的空泛泡沫?
AI芯片是人工智能的发动机
这一波人工智能的热潮,主要表现为深度学习的爆发。而深度学习的爆发,又离不开芯片提供的算力。可以说,AI芯片是人工智能的发动机。
中国人工智能泰斗张钹院士12月20日在地平线的芯片发布会上接过地平线创始人余凯的话筒:“人工智能能走到今天,计算机硬件做了不可磨灭的贡献。如果计算机不能提供像现在这样高速度、大存储量的能力,今天的人工智能不可能这样。”
除了提高算力,地平线资深IC工程师谭洪贺说,芯片发展的好处还在于降低了AI的应用成本,可以实现设备的小型化,能够真正推动AI技术的普及。
用CPU(中央处理器)跑深度学习不是不可以,但速度就像老爷车,而用GPU就如同坐上了高铁。GPU刚好适合超大规模数学运算,训练速度是碾压级的。有了算力的支撑,深度学习开始真正成为实用的算法,ImageNet上图像识别的准确率终于战胜了人眼,使得人工智能进入应用阶段。甚至很多人说:没有GPU,就没有这一波AI浪潮。
虽然业内没有一个明确说法,但一般认为AI芯片是“专门针对AI算法做特殊加速设计的芯片”。目前,按物理载体的不同,AI芯片主要分为四类:GPU、FPGA、ASIC,及“类脑芯片”。
AI芯片分类
在GPU上,英伟达公司目前是绝对霸主。有意思的是,GPU最初主要用于游戏图像渲染,让玩家能有流畅体验,却在深度学习上意外找到用武之地。
凭借GPU的优势,英伟达实现了股价逆袭:2015年,英伟达的市值是100亿美元,两年内暴涨10倍,今年夏天突破千亿美元。李开复曾笑谈:“真正懂科技的人,这几年谁手里没有一点英伟达的股票呢?”
而更为大众熟知的芯片巨头英特尔,传统优势在CPU领域,在AI热潮中失去先机,现在反倒处于竞争中的不利地位。
三十年河东,三十年河西。科技和商业既有深刻的规律,又有不可预测的偶然性。起起落落,没有谁能一直躺着赚钱。
巨头较量
没有谁能一直躺着赚钱。
体会过势能巨变的英伟达,一定明白一个道理:居安思危。而英特尔也知道:穷则思变。(当然,英特尔的CPU是一直挣钱的。)
较量首先发生在GPU战场。
今年11月,英特尔和另一芯片巨头AMD传出合作。未来AMD的独立GPU将会装进英特尔SoC。AMD的首席GPU架构师拉加·库德里也在近日加入英特尔,助其开发自有GPU。
英特尔和AMD曾在CPU上竞争多年,如今面对英伟达的强势却选择联手。吴蜀抗魏,胜算几何?
甲子光年接触的多位芯片专家都提到,芯片的研发有时间周期:你在跑,本来的优势者也在往前跑。
早在90年代,英伟达就已推出GPU,并积累了深厚的技术经验,发展出了囊括服务器、框架、平台的完整生态。
硅谷投资机构LuxCapital的合伙人ShahinFarshchi一边投着Nervana和Mythic两家芯片公司,一边却说:“如果你想搞出比英伟达好一点的芯片,那祝你幸福,他们会把你打成狗。”言下之意,你必须比它好得多得多。
但英伟达并不是高枕无忧,它正面临另一类巨头的挑战:谷歌、微软、以及刚刚宣布要造芯片的特斯拉(特斯拉从AMD挖走了传奇架构师吉姆·凯勒)。
谷歌发布的两代TPU——一种专门针对深度学习框架TensorFlow进行优化的AI芯片,经过AlphaGo的两次“围棋大战”已声名大噪。
英伟达应该感到庆幸,谷歌并不对外销售TPU。然而,谷歌作为这个领域的新玩家,第一次尝试开发一种能够替代GPU的产品就大获成功,还是足以让英伟达感受到危机。
巩固GPU优势的同时,英伟达也在自动驾驶等终端场景上发力,研发新的AI芯片。
尚未自己造出AI芯片的英特尔,则选择全球砸钱买买买:4亿美元买下Nervana、不明金额收购Movidius,这是前菜;167.5亿美元砸下Altera,153亿美元收购Mobileye,这显示了要大干一场的决心。
虽然落地应用比不上英伟达,但英特尔目前在AI芯片上的布局也已相对完善:同时投资了FPGA和神经网络芯片等通用芯片公司,和地平线等专用芯片公司。
而所有以上巨头,又都面临一批灵活、专注的竞争者:以AI芯片研发为核心业务的创业团队也盯上了这块蛋糕。
三千越甲可吞吴?
在AI芯片的新战场,接触的许多从业者表现出了“三千越甲可吞吴”的自信。他们认为,自己与巨头之间或可一战。
深鉴科技创始人之一汪玉教授说,深鉴会直接与英伟达进行竞争。深鉴现有的FPGA板卡可以帮助数据中心提高算力,能量效率高,在对延时和功耗敏感的场景下可以替换GPU。
因麒麟970名声大噪的寒武纪,将战略重点放在了云端服务器芯片上,也会与英伟达正面相遇。
但在芯片行业,“钱真的不是钱”。寒武纪在今年8月宣布A轮融资1亿美元,成为全球AI芯片首个独角兽,在一般创业公司看来已是财大气粗。
但要知道,英伟达做一款芯片的一次性研发投入就可能高达数亿美金,有巨大的成本壁垒。
也有新创公司,用特别的方式造血,底气十足,比如同样瞄准云端大芯片的比特大陆。
无心插柳柳成荫。比特大陆杀入AI芯片的过程有点像一个“翻版英伟达”。
这家成立于2013年的公司,原本是搞比特币矿机的,由于矿机对芯片的性能要求很高,比特大陆逐渐积累了芯片开发经验。在谷歌的TPU问世后,他们意识到自己的芯片能力也可以很好地应用在AI芯片上。
现在,比特大陆已经推出了第一款AI芯片BM1680。其产品战略总监汤炜伟说,为了适应算法的快速迭代,比特大陆每隔9个月就会推出新的AI芯片,而再过一两代,比特大陆有信心在深度学习推理上,超过GPU的实际性能:“它(GPU)要兼顾很多图形的操作,比如图像滤波、灰度调整,这些不是我们的重点。”
金沙江创投同时投资了地平线和深鉴科技。其合伙人张予彤说,从人才和组织管理上,她看好创业公司对巨头的“僭越”:“事情最后都看人,非连续性技术变革时,大公司会有业务掣肘。”巨头未必能招纳到最好的人才,还有大公司反应速度的问题,而优秀人才的能力、眼界、执行力以及小团队的快速反应都有助于实现“逆袭”。
知名财经自媒体“饭统戴老板”提供了一个有趣的角度:芯片设计主要是数理逻辑,中国人天生擅长数理逻辑。英伟达创始人黄仁勋、Marvell创始人戴伟立都是华人。现在的芯片创业团队,有大批在英伟达、英特尔、AMD以及高通等公司干了10年、20年的华人高级工程师。他们把中国芯片设计业的起点抬得很高。“从这个角度讲,就是天时地利人和,现在就是要靠时间,把这个东西追上去。”
新玩家的角力
更直接的竞争发生在创业公司之间。
他们对未来的预判不尽相同:有的要在云端做大芯片;有的面向应用端,开发特定场景的芯片;有的在两路同时发力。
谁才能跑出来,跑得远?
寒武纪是大芯片赛道上的主要玩家之一。这条路特别烧钱,但寒武纪副总裁钱诚说,这是寒武纪根据业界对人工智能的主流判断做出的选择:“人工智能必然会出现一种重量级的应用,硬件就必然要标准化、通用化。云端服务器芯片是做标准化、通用化智能芯片的第一步。”
可地平线创始人余凯的想法不同。他说,在AI芯片领域很难出现当年计算机领域x86那样占绝对优势的架构,因为人工智能的应用在各个场景里千差万别,更可能的情况是,在每一个细分领域会出现一个主导架构。
地平线走了另一个路线:做好终端芯片。
目前,地平线是第一家实现量产流片AI芯片以及应用方案的公司。周三刚发布的“征程”和“旭日”芯片就分别面向智能驾驶和智能摄像头应用端。地平线强调自己提供软硬一体解决方案的能力,在地平线看来,未来不会是一颗芯片打天下,必须量体裁衣。通过软硬件的深度结合,能带来1000倍的效率提升。
专注于语音识别及语言处理技术的人工智能服务商云知声也计划在明年推出自己的语音芯片,理由同样是效率提升。
云知声联合创始人李霄寒说,未来所有设备上可能都会有一个语音芯片,因为语音交互是人机交互最自然的方式。如果要保持在家庭空间体验的连续性,每个设备都要能进行人机交互,然后设备间再通过相互沟通来进行最终决策。
明年,NovuMind也将发布自己的视觉终端芯片。其创始人吴韧说,这款芯片的设计理念非常领先:“我是这个世界上最擅长异构计算的人之一,异构计算的思路就是非常专用的硬件,就是术业有专攻。这也是我们芯片设计的重要思路。”这款芯片将不考虑矩阵,只专注三维张量,通过极端定制化带来极端的性能优势。
深鉴则在云端和终端芯片上同时发力。2018年,它们将发布“观海”、“听涛”两款芯片,前者是云端后者是终端。汪玉向表达了他的期望:“我们希望所有带摄像头或者需要语音交互的地方,都有我们的产品存在。”
而对其他跃跃欲试的玩家来说,一个不好的消息是:现在入局可能晚了。
目前这批AI芯片创业者,都是既懂技术又对产业敏感的先觉者。留意一下不难发现,这批公司基本在2015年前后成立。这个时间对应着2012年GPU在深度学习上的大放异彩。
从那时起,算力的提升促进了算法的发展,算法的发展又对AI芯片提出了需求。在2012年最早注意到这个领域的团队,经过2年左右的研究准备,正好在2015年前后开始下场。
“你在跑,本来的优势者也在跑。”这句话适用于英伟达和英特尔的巨头之争,也适用于新创公司。因为芯片研发的周期很难缩短,同一细分领域的后发者难以获得优势。
一个孕妇十个月能生一个孩子,十个孕妇却不可能一个月生一个孩子。“芯片至少要一年半做出来,你至少一年半前要想好你的芯片怎么做。这个周期是永远存在的。不会因为你堆人堆东西就能缩短。”汪玉说。
周期无法缩短,和目前芯片制造厂商排期紧张有关。
余凯曾说,今年,在地平线的芯片送到生产线流片之前,他经历过非常艰难的时刻。当时,由于仿真验证做得还不够,有5%流片失败的风险。
流片一旦失败,公司要承受百万美金级的损失,更要命的是整个研发进展会延迟半年;如果不流片,错过了台积电的排期,就要等下个季度。
做抉择的那晚,在底特律出差的余凯夜里12点走出酒店,在冷风里走了一大圈。最后,他拍板,推迟流片。
还好,地平线很幸运,他们找到了另一家可以排期的厂商,最终流程只延迟了1个月。
国家机遇
此时此刻,中国也很幸运。
在AI芯片的热潮之前,中国芯片行业的状况是,需求很大,水平却落后国际:国产品牌芯片自供只有8%左右;自2013年起,我国芯片每年进口额达2000多亿美元,超过石油成为第一大进口商品。
产业的命运往往与国运相关,70年代,没赶上CPU的发展,在传统芯片设计和制造领域,一步落后,步步落后,眼看着世界领先的工艺已经进化到了7nm级别,我们还要从28nm从头追起。
但在AI芯片领域,中国终于与发达国家站在了同一起跑线上。
国际EDA工具和IP厂商Synopsys的AI芯片架构专家唐杉说,在AI加速芯片领域,即使是面对大巨头英伟达,中国初创公司也不是完全没有机会:“第一,目前的AI芯片主要针对神经网络和深度学习算法定制,所以芯片的硬件设计上比传统的CPU和GPU要简单,并非高不可攀;第二,国家对半导体产业的支持力度很大,AI芯片可能会成为一个新的战略方向;第三,国内在AI领域的进展很快,特别在应用方面,在很多领域甚至比美国做得还好,这能为AI芯片提供重要的市场基础。”
地平线创始人余凯的判断是,在AI芯片领域,中国弯道超车的概率很大。
寒武纪副总裁钱诚认为,我国在AI芯片领域至少占据“半壁江山”的地位。
而NovuMind创始人吴韧则半开玩笑地表示:“如果把我们公司算作中国公司,那就是中国厉害;如果算作美国公司,就美国厉害。”
笔者也听到了一些不同的声音。
亲历50年中国半导体产业发展历程的浙江大学著名学者莫大康告诉我们,十年之内,都不可能做出“速度提高1万倍、同时功耗降低1万倍”的真正的人工智能芯片。
另一位在国际芯片公司从业十年的专家认为,华为麒麟970一类的,把神经网络加速的硬件IP集成进移动SoC的模式会有机会,“但是初创公司独立芯片的市场前景我完全不看好。泡沫太多了。”
以下“用脚投票”的案例,更能直观说明谁在看好:
阿里巴巴一口气投资了寒武纪、耐能、深鉴、杭州中天微4家中国芯片公司,还在国外投资了BarefootNetworks。百度自己发布了XPU,还宣布将与AMD合作。地平线接受了英特尔的投资,深鉴背后的投资者还有三星、Xilinx(赛灵思)和联发科。
从招聘需求看,海康威视、云天励飞、科大讯飞也正在招募芯片人才,摩拳擦掌准备入局。
芯片战国时代拉开序幕。面对老牌霸主,新锐AI芯片公司尚显稚嫩,大多只成立了一两年,有的芯片刚刚推出,有的还在等待流片。
但这一次,中国没有错过出发时刻。既然已经站在了第一排,接下来就要看增长,拼斜率了。
在“拼斜率”这件事上,40年来,中国人一直做得很不错。
延伸阅读
武汉存储产业隐现“国家队效应”
武汉东湖高新区未来三路与高新大道交汇处,一个被称为“黄金大道”的T字形结构的芯屏组合的产业聚集区已悄然形成。而这其中的“1号工程”正是在中国存储器产业已掀起“巨浪”的长江存储科技责任有限公司(以下简称“长江存储”)。
2018年1月17日,阴冷两天的武汉再度放晴,而长江存储的一期工厂已经竣工,已然组建的研发团队正在东湖高新区(以下简称“高新区”)的另一处办公地址加紧推进研发工作。
“最初,武汉竞争长江存储项目的时候,国内与武汉竞争的省市并不多。”1月11日,武汉东湖国家自主创新示范区半导体产业办公室谢齐威感慨地说道,如今,国家大基金二期募资启动,诸多地区开始争抢申报相关项目,通过大基金和大项目拉动中国集成电路产业的局面终于被打开,而产业也将呈现出蓬勃发展的局面。
作为存储器领域唯一“国家队”代表的长江存储,正在按照自己的研发节奏逐步推进,而在高新区内,也正谋求形成由点到线再到面的存储器产业格局。“我们要将现在的几棵参天大树,培育成广茂森林。”谢齐威表示,也正是因为如此,东湖高新区已设立了半导体产业办公室。
“谋划”良久的巧合
在全国很多地区看来,长江存储落户武汉是一个偶然,但在很多产业专家和熟悉光谷的人眼中,这并不是一个巧合。
2001年,东湖高新区被原国家计委、科技部批准为国家光电子产业基地,即“武汉·中国光谷”,而当时高新区的产业以激光和光通信为典型代表。
时任高新区管委会主任的唐良智带队在全球范围内考察,欲开启高新区的“二次创业”之路,如何确立高新区在21世纪的发展思路?这是一个需要全盘思考的课题。
彼时的美国已进入移动互联时代,“这会代表中国未来的发展方向”,基于这种判断,高新区也计划朝此领域开拓,“移动互联有四个产业链,即芯片、面板、智能终端和通信,”湖北一位知情人士表示,当时高新区在这一产业是一穷二白,最终的思路是:每个链条引进一个龙头企业形成龙头效应,拉动产业发展,最终串起移动互联的产业链条。
在这种布局下,高新区引进台资企业富士康,后续成立武汉新芯。
“自己做存储器产业,我们没有团队。”上述人士说,2005年前后,经过谈判后高新区出资成立武汉新芯,引进中芯国际对前者进行托管。并明确武汉新芯以代码型闪存和图像传感器作为发展方向。
发展思路确定后,武汉新芯在2006年正式开工建设,经过了厂房建设、进设备、爬产能周期后,2008年,产品才正式上市。
但生不逢时,按照存储器行业的摩尔定律,此时的全球存储器行业进入低潮期,当时的武汉新芯也被市场环境拖累,难以开拓市场。
此时按集成电路产业的分类,全国的产业格局呈现“三超多强”。即北京、上海、深圳为“三超”,苏州、无锡、成都、西安、武汉为“多强”。上述人士回忆,当时北上深依托“中芯国际”和“海思”成为三强。而无锡、上海一带则有908、902工程作依托,成都有封测产业,西安还有三星的制造业基地,武汉则凭借着武汉新芯成为多强之一。
在国际竞争格局上,无论是内存还是闪存产品,基本均被韩国、日本、美国等国垄断。其中在DRAM领域,三星、海力士及美光(它于2012年兼并日本的尔必达)为行业龙头,在NAND领域,也由三星、东芝、新帝,海力士以及美光、英特尔共同掌握全球产品的话语权。
反观中国,企业在存储领域既没有技术优势,也没有生产规模,每年进口的芯片金额高达2500亿美元,在主流与DRAM和NANDFlash芯片的制造上是零。“在存储器产业中,韩美日厂商几乎垄断了全球存储器市场。”上述人士也表示无奈。
存储器行业内流传的让人印象深刻却又百般难受的段子是:在中国3C领域风光十足的国内智能终端厂商也受制于三星,“这些厂商领导人曾亲自前往韩国采购芯片,但最终只拿到少量订单,有的还拿不到订单。”上述人士回忆,中国存储器产业长期受制于人的局面一直无法得到改善。核心技术的落后成为产业发展的桎梏,无论是产业需求还是军事战略,存储器产品的国产化迫在眉睫。
大基金项目角逐始末
2014年,这种局面终于有了突破。
当年6月,《国家集成电路产业发展推进纲要》公布,中国计划彻底改善在半导体产业的被动局面。同年9月,国家大基金成立,首次以基金来推动半导体产业发展,其中存储器产业基地是大基金的一个重要投资方向,而培育至少一个拥有自主知识产权的存储器项目的目标也已经明确。
此时武汉新芯的局面虽未大幅改善,但湖北省和武汉市仍在坚持,这也为国家保留了一个自主知识产权发展存储器产业的“火种”。全国范围内,当时符合大基金投资存储器产业基地的省份也并不多。上述人士也表示,“最初,参与报名竞标大基金项目的省份并不多,湖北算是很积极的一个,但竞标的关键在于方案。”
为了争取这一项目,“湖北省、武汉市和高新区均成立专班,各级政府也将该项目列为一号工程,每日跟进项目进度。”作为其中的参与者之一,谢齐威也亲历了这一过程。
但方案的修改和调整则是一个高强度、周期长且反复的过程。
“2015年年中,全国多地也列入候选名单。”谢齐威说,2015年8月18日晚上6点左右,就这一项目的申报,湖北省召开省委常委会,其中有6个省委常委参会,这在湖北省的行政办公体系中十分少见。如此高级别的会议的结论是:必须以年产30万片产能的方式予以申报,“只有达到这个产能,才能具备参与全球竞争格局的基础”。此外,还确定“国家战略、湖北申报、武汉实施、高新区执行”的落实措施。
一个多小时的会议开完后,湖北省政府分管领导亲自带队赶赴北京,准备递交方案。“方案需要先报给部里,部里征集的集成电路专家组对方案进行审核,经通过后才能上报国务院审核。”谢齐威说,当时的专家组成员就有10人,在2天的时间里,申报团队跑了4个相关部委,此外,还逐一拜访了专家组成员。
高强度的上门拜访,让方案先后经历了30多轮的修改,到2015年年底,方案正式递交给国务院,而此时,其他省份陆续放弃了申报。前期工作的准备到位,让这一决策更加高效,到2016年2月,武汉的申报方案即正式获批。
此后的落实过程中,效率仍然十分重要。时隔4个月后,即2016年8月,国家大基金、紫光集团和湖北省政府担纲股东,就共同出资成立长江存储科技有限责任公司,作为国家存储器基地项目实施主体。
当前,国家大基金已启动二期募资,计划募集资金1500亿-2000亿元。其中,存储器产业仍然是一个重点的投资方向。“如今,全国各地对集成电路产业的投资热情明显提速。”谢齐威说,长江存储的成立已带动了全国集成电路产业的发展,也掀起了各地投资热潮,投资热潮的背后,则承载了国家集成电路产业“弯道超越”的期望。
精彩评论