汽车电子展|“端到端”技术飞跃，引领新一轮智能驾驶产业革命

所谓“端到端”是指一端输入图像等环境数据信息，中间经历类似“黑箱”的多层神经网络模型，另一端直接输出转向、制动、加速等驾驶指令。与传统规则驱动的分模块架构相比，端到端的实现将带来一系列优势，因而被产业界视为有望成为未来高阶智能驾驶解决方案的一种技术方案。

汽车电子展了解到，目前端到端自动驾驶的定义可以简单分为狭义端到端和广义端到端。狭义端到端：传感器数据进入神经网络处理后，直接输出方向盘、油门、刹车等执行器的控制信号，该模式通过单一神经网络模型实现，是严格意义上的端到端。广义端到端：广义上的端到端具有两个特点：信息无损传递；可以实现数据驱动的整体优化。从广义角度理解端到端，可以看到目前主流的方案仍有差异。主要方案包括通过神经网络模型实现感知与决策规划，不包括控制模块；感知和决策规划使用神经网络，模块之间仍有人工设计的数据接口等方式。

模仿学习（Imitation Learning）和强化学习（Reinforcement Learning）是当前用于训练端到端神经网络的两种主要方法。模仿学习通过逆优先控制（Inverse Optimal Control）和行为克隆（Behavior Cloning）来实现，其核心理念是让智能体通过模仿专家的行为来学习较好的策略。而强化学习则是一种通过试错来学习的领域，其中奖励函数的设计是一个关键挑战。

汽车电子展了解到，从端到端的最终实现上，通过感知“端到端”，模块化“端到端”，再到OneModel/单一模型“端到端”是一种相对平滑的过渡形式。而当前感知“端到端”已经是主流的感知模型，展望后续技术发展，自动驾驶算法向“端到端”收敛，有望成为行业的一大趋势。
不同迭代阶段之间的区别：
感知“端到端”：当前的主流感知算法路线大多数都是用神经网络模型，通过基于多传感器融合的BEV(Bird Eye View，鸟瞰图视角)+Transformer基本实现了感知模块的端到端，感知输出检测结果的精度及稳定性相对之前的感知方案都有比较大的提升，但在决策规划控制模块仍然以rule-based为主。
模块化“端到端”：与感知“端到端”相比，感知端算法没有太大变化，决策规划控制模块有望通过深度学习实现，取代原有的rule-based方案，从这一阶段开始，端到端的雏形逐渐形成。并且感知与决策规划控制模块之间的数据传递有望由人为定义的结果抽象为特征向量，避免数据损耗与误差累计等问题，决策规划控制模块的综合模型基于特征向量输出运动规划的结果。
One Model/单一模型“端到端”：这一阶段不再有感知、决策规划等模块的明确划分。从原始信号输入到规划轨迹的输出直接采用单一深度神经网络实现。One Model可以基于强化学习（Reinforcement Learning，RL）或模仿学习（Imitation Learning，IL）的端到端模型，也可以通过世界模型这类生成式模型衍生。
受益于有效数据规模的提升，智能驾驶端到端模型有望成为高阶智能驾驶解决方案。从发展路线来看，2019年至今CARLA数据集不断丰富，基于数据集完成数据泛化、增强可解释性、数据融合、基于人类定义规则的预训练。2023年受益于数据量积累和底层数据类型的升级，充分满足大规模训练需求。通过数据规模提升和数据间关联性可读性的提升，2023年开始模块化的端到端规划模式加速，逐步成为代表智能驾驶未来发展的主要方向。端到端大模型在功能表现上有更高的上限，未来受益于数据规模持续扩张和评价体系的完善，智能驾驶端到端大模型有望加速落地。

汽车电子展了解到，传统自动驾驶系统已经发展得相当成熟，通常采用模块化串联的部署方式：其核心模块涵盖感知、定位、预测、决策和控制等，每个主要模块及其子模块都承担着特定的职责，且每个模块的输入通常来源于前一模块的输出。
模块化设计的优势在于能够将复杂的自动驾驶任务分解为更小、更易于管理的子任务，同时便于问题的追踪和定位；然而，随着自动驾驶技术向数据驱动的方向发展，模块化设计的某些局限性也逐渐显现，例如信息传递过程中可能出现的损耗、计算延迟以及累积误差等问题。

模块化自动驾驶的核心在于不同子模型在各个模块中的嵌套与协同工作。然而，随着Transformer架构等AI技术的发展，模型间的界限正逐渐变得模糊。原本独立的子任务模型正逐步被更大规模的神经网络模型所取代，特别是在感知模块，BEV结合Transformer方案的广泛应用预示着数据驱动的深度学习神经网络正日趋成熟。
从架构的角度来看，随着模型融合的趋势，自动驾驶系统的升级形态很可能是One Model，即一个狭义上的端到端神经网络模型。

文章来源：慧博财经--微信公众号