在2025电动汽车百人会论坛上,元戎启行CEO周光明确指出,FSD V13在端到端智驾技术上领先国内高阶智驾系统一个代差,体现了其算法和模型的断代优势,国内智驾企业如元戎启行凭借本地化数据和量产能力正在迎头赶上。
我们需要从周老板为什么要说这话,特斯拉FSD与元戎启行VLA(视觉-语言-动作)模型的技术创新,分析其应用场景及对汽车行业的影响。
特斯拉FSD与元戎启行VLA
的技术创新亮点
● 特斯拉FSD V13代表了端到端自动驾驶技术的巅峰,核心创新在于基座模型算法的全面优化。
从FSD V12开始,特斯拉摒弃了传统模块化设计(感知、规划、控制分离),转而采用端到端神经网络,将原始传感器数据直接映射到驾驶决策。
这种方法通过单一模型实现从输入到输出的闭环处理,减少了人为规则的干预,提升了系统的泛化能力和复杂场景应对能力。
FSD V13依托特斯拉海量的全球路测数据和强大的算力支持,通过监督学习和强化学习训练出高度智能化的驾驶策略。例如,其能够无缝处理城市交叉口、无保护左转等高难度场景,并在动态交通环境中实现丝滑的路径规划。
周光评价其“代差领先”,主要源于模型规模和训练数据的深度积累,由于政策限制,特斯拉无法直接获取中国道路数据,只能通过接管率、违章记录等间接反馈调整模型,“被动式”训练方式相比其全球实时数据闭环,效率较低,可能影响本地化适配速度。
● 元戎启行作为国内智驾领域的先锋,推出了基于VLA(视觉-语言-动作)模型的端到端智驾方案,计划于2025年中量产上车。
VLA模型是对传统端到端技术的进一步演进,通过融合视觉感知(Vision)、语言理解(Language)和动作控制(Action),打造了一个多模态协同的通用智驾系统。
VLA引入语言模块,使系统能够理解道路标识、导航指令等文本信息,并同步生成驾驶动作。
技术实现上看,VLA模型基于多模态大模型架构,借鉴了LLM(大语言模型)的训练范式,通过视觉-语言预训练和端到端微调,实现了从感知到决策的统一建模,VLA能够识别车道线和交通指示牌,实时呈现文字信息给驾驶员,同时执行对应的变道或减速动作。
这种能力使其更接近“通才系统”,即在垂直领域内具备广泛的场景适应性。
周光将其与ChatGPT类比,强调VLA的目标是从“弱专家系统”进化到“强专家系统”,最终支持L5级全域自动驾驶。
VLA的另一亮点是灵活的传感器适配性。元戎启行同时支持纯视觉和激光雷达方案,尽管周光认为激光雷达的增益在成本与性能间存在边际递减效应,但其仍保留多模态选项以满足0.1%的极端场景需求,体现了工程上的实用主义,既追求高性价比,又兼顾安全性。
元戎启行的技术竞争力还体现在数据和量产能力上。作为最早布局“无图”方案的国内企业,元戎拥有丰富的中国本地化数据集,覆盖城市道路、高速公路及复杂天气条件。
这些数据为VLA模型的训练提供了坚实基础,尤其是在处理中国特有的交通场景(如电动车混行、行人密集路段)时表现出色。
相比之下,特斯拉FSD在中国的数据劣势限制了其本地化优化速度。
元戎启行已将端到端技术应用于长城魏牌蓝山智驾版和Smart精灵#5等车型,2025年计划推出超10款合作车型,覆盖SUV、MPV和越野车。
得益于其平台化策略,VLA模型适配多种芯片(如地平线征程系列、英伟达Thor),并通过模块化设计降低了车企的集成成本。这种高效的量产落地能力是元戎与特斯拉竞争的关键砝码。
技术创新对汽车行业的影响
及发展趋势
智驾从规则驱动向数据驱动的范式转变,对汽车行业产生了深远影响,端到端模型减少了传统模块间的误差传递,提升了系统一致性和响应速度,而VLA的多模态融合则为用户提供了更直观的交互体验。这种技术路径降低了开发复杂度,推动了智驾功能的普惠化。
元戎启行通过VLA支持低中高配车型的灵活适配,使高阶智驾不再局限于高端市场。博世中国区总裁吴永桥也认为智驾将成为标配,主机厂无需全栈自研,采购成熟供应商方案即可。这种分工模式将加速行业标准化进程,释放车企在其他领域的创新潜力。
特斯拉FSD的领先地位刺激了国内智驾企业的技术追赶。元戎启行凭借本地化数据和量产优势,正在缩小与特斯拉的差距。周光指出,FSD的代差主要体现在模型架构和训练数据的积累,而非硬件本身。
这意味着国内企业通过算法创新和数据优化,有望在特定场景下实现反超。例如,VLA模型在处理中国城市复杂的非标准化交通环境时,可能比FSD更具优势。
国产智驾生态的崛起增强了供应链自主性。元戎启行适配地平线、英伟达Thor等多平台芯片,降低了对外依赖,并通过与长城、精灵等车企的合作,构建了完整的量产闭环。
这种生态协同为中国智驾产业在全球竞争中提供了坚实支撑,也为出海战略(如日韩、欧洲市场测试)奠定了基础。
端到端智驾将在2025年迎来转折点,从技术验证迈向大规模商用,智驾系统将进一步向“通才系统”演进,结合多模态大模型和强化学习,具备超越人类的推理能力。例如,VLA通过语言模块理解导航指令,可能演变为车载AI助手,彻底重构人车关系。
硬件层面,算力将成为关键驱动力。元戎计划适配Thor芯片(200+ TOPS),以支持更复杂的时序推理和多任务处理。OTA升级也将成为标配,推动智驾功能的动态进化。
周老板认为,特斯拉FSD V13与元戎启行VLA代表了端到端智驾技术的两种路径:前者凭借全球数据和模型规模实现断代领先,后者依托本地化优势和量产能力快速追赶。FSD的基座模型算法展示了智驾的极致潜力,而VLA的多模态融合则为中国市场提供了更贴合实际的解决方案。