当地时间上周日,特斯拉在美国得州奥斯汀启动 Robotaxi 试点运营服务,首批投入 10 辆 Model Y 用于该服务,乘客需支付 4.2 美元的固定费用。这一事件被视为特斯拉自动驾驶技术商业化进程中的里程碑,标志着纯视觉方案从技术验证阶段向规模化应用迈出关键一步。
纯视觉方案的突破与争议
特斯拉 Robotaxi 基于 FSD(完全自动驾驶)系统,采用纯视觉方案,摒弃激光雷达等高成本传感器,其硬件成本和软件成本均显著低于 Waymo 车辆。特斯拉车辆搭载 8 个环绕摄像头(前视 3 个、侧前 2 个、侧后 2 个、后视 1 个),可覆盖 360 度视野。摄像头以每秒 36 帧的速率采集原始图像,通过时间序列(视频流)而非单帧图像构建环境模型,探测距离最远可达 250 米。
特斯拉采用纯视觉方案,源于对自身算法模型的信任。FSD 系统基于 HydraNet 多任务网络,早期版本采用 RegNet 主干网络和 BiFPN 多尺度特征融合技术,将感知任务解耦为独立子任务,共享特征提取层以节省算力。随着 BEV+Transformer 技术取得突破,FSD 系统借助 Transformer 的自注意力机制,将多摄像头的 2D 图像特征直接映射到车辆坐标系下的鸟瞰视角(BEV),有效解决了传统 IPM 的平面假设局限和多摄像头拼接难题。该技术通过学习不同摄像头的外参差异,将图像统一到虚拟标准相机坐标系,从而提升感知精度。
2024 年 2 月 20 日,特斯拉 FSD v12.2.1 开始陆续在美国推送。FSD V12 是特斯拉公司的最高级别自动驾驶产品,即完全自动驾驶能力(Full Self-Driving)的缩写。其主要功能涵盖导航辅助驾驶(NOA)、自动变道、自动泊车、智能召唤、交通信号识别、(基于导航路线的)城市道路自动转向等。FSD v12 将城区街道的智驾堆栈升级为单个端到端神经网络,取代了过往的 30 万 + 行代码。
不过,业界普遍认为纯视觉方案存在局限性。例如,在极端场景下处理能力不足,在暴雨、浓雾等恶劣天气条件下,纯视觉方案可能因摄像头视野受限而失效,因此试点服务明确避开此类天气状况;在复杂场景中容易出现误判,视频显示,部分车辆在遇到警车或无标线路口时出现急刹或逆行情况,美国国家公路交通安全管理局(NHTSA)已介入调查潜在安全缺陷。
Robotaxi 行驶表现仍有缺陷
初期投入的车队规模约为 10 至 20 辆 Model Y,且仅向受邀请的社交媒体名人开放体验,行驶范围也局限于无复杂路段的区域。然而,特斯拉 Robotaxi 上路后仍状况频发。
一位 Youtube 博主发布的视频显示,一辆 Robotaxi 在正常行驶过程中两次明显减速,显然是自动踩下了急刹车。当时,这辆 Robotaxi 前方并无障碍物,仅在右侧车道外停靠了警车,甚至其中一辆警车停在远处的隔离带外,与该 Robotaxi 相距甚远。
另一位博主在 X 平台发布的近 20 分钟 Robotaxi 体验视频中,尽管车辆行驶总体较为流畅,但有几秒钟时间,方向盘突然异常抖动,车辆短暂越过双黄线,驶入逆向车道,引发其他车辆鸣笛。不过,逆行状态仅持续几秒,车辆很快便回到正确车道。
所幸特斯拉似乎通过 OTA(空中下载技术)迅速修复了这些问题。但针对车辆跨越黄线一事,美国国家公路交通安全管理局(NHTSA)发言人表示,该机构 “已注意到上述事件,并正在与制造商联系,以收集更多信息”。
特斯拉被认为拥有数据护城河,目前该公司通过全球 400 万辆 “影子车队”(具备 FSD 硬件的量产车),每日采集 3.2 亿英里真实路况数据,训练成本近乎为零。不过,在开放路况下,仍存在一些未经测试的 “死角”,需在后续算法迭代中逐步覆盖。
尽管出现了诸多状况,Robotaxi 的前景依然被看好。据弗若斯特沙利文预测,Robotaxi 全球市场总规模将于 2030 年达到人民币 8349 亿元,2024 - 2030 年复合年增长率(CAGR)为 239%,2030 - 2035 年 CAGR 为 31%。中国有望成为最大的 Robotaxi 市场,预计将占 2030 年全球自动驾驶出行服务市场的约 58.5%。
精彩评论