日前,特斯拉发布了名为 D1 的定制 AI 芯片,用于训练其 Autopilot 自动驾驶系统背后的机器学习算法,号称性能上已经完全碾压英伟达GPU和谷歌TPU。斯坦福大学的 Gerdes 表示,特斯拉的战略是围绕其神经网络构建的。日前,特斯拉发布了名为 D1 的定制 AI 芯片,用于训练其 Autopilot 自动驾驶系统背后的机器学习算法,号称性能上已经完全碾压英伟达GPU和谷歌TPU。
在此次活动中,特斯拉首席执行官埃隆马斯克表示,从用于训练公司神经网络的计算机系统中榨取更多性能将是自动驾驶取得进展的关键。“如果一个模型需要几天的时间来训练而不是几个小时,那将是一件大事,”他说。
在 2019 年改用英伟达硬件后,特斯拉已经设计了可以在其汽车中解释传感器输入的芯片。
但是,自研训练 AI 算法所需的强大而复杂的芯片要昂贵得多且具有挑战性。
“如果你认为自动驾驶的解决方案是训练一个大型神经网络,那么接下来就是你需要的那种垂直整合的策略,”斯坦福大学汽车研究中心主任Chris Gerdes说。
斯坦福大学的 Gerdes 表示,特斯拉的战略是围绕其神经网络构建的。
弃用激光雷达,倒逼特斯拉自研芯片
与许多自动驾驶汽车公司不同,特斯拉不使用激光雷达,它依赖于通过使用神经网络算法解析来自其摄像机和雷达的输入来解释场景。
许多汽车公司使用神经网络来识别道路上的物体,但特斯拉更加依赖这项技术,一个被称为“transformer”的巨大神经网络一次接收来自八个摄像头的输入。
近年来,Transformer 模型在语言理解等领域取得了巨大进步;收益来自使模型更大、更需要数据。
这对计算的要求更高,因为该算法必须从相机馈送重建周围环境的地图,而不是依赖可以直接捕获该图片的传感器,训练最大的人工智能程序需要价值数百万美元的云计算能力。
但特斯拉也比其他汽车公司收集了更多的训练数据。路上行驶的超过 100 万辆特斯拉汽车中的每一辆都将来自其八个摄像头的视频反馈回公司。
特斯拉表示,它雇佣了 1000 名员工来标记这些图像——注意汽车、卡车、交通标志、车道标记和其他特征——以帮助训练大型变压器。
在 8 月的活动中,特斯拉还表示,它可以自动选择要优先标记哪些图像,以提高流程效率。
Gerdes 表示,特斯拉的方法的一个风险是,在某个时刻,添加更多数据可能不会使系统变得更好。“这只是更多数据的问题吗?” 他说。“或者神经网络的能力是否比您希望的水平低?”
无论哪种方式,回答这个问题都可能代价高昂。
大型、昂贵的 AI 模型的兴起不仅激发了一些大公司开发自己的芯片;它还催生了数十家资金充足的初创公司,致力于专门的硅芯片。
人工智能训练芯片市场目前由英伟达主导,英伟达最初是为游戏制造芯片。当公司的图形处理单元 (GPU) 比通用计算机核心的中央处理单元 (CPU) 更适合运行大型神经网络时,该公司转向提供 AI 芯片。
在巧妙的递归中,人工智能也在推动芯片设计的多样化。芯片设计通常需要深厚的技术专长和判断力,但机器学习已被证明可有效实现流程元素的自动化。谷歌、三星和其他公司正在制造部分由人工智能设计的芯片。
分析师坎特表示,特斯拉 D1 等专用芯片仍存在一些技术问题,包括它们连接在一起的效率如何,以及算法在不同芯片上的拆分和传播效果如何。“从某种意义上说,你是在为你的软件团队开一张大支票来兑现,”他说。
精彩评论