新浪科技讯 12月28日下午消息,近日,人工智能领域国际会议AAAI 2026公布了论文录用结果,由小鹏汽车和北京大学计算机学院多媒体信息处理全国重点实验室联合完成的论文《FastDriveVLA: Efficient End-to-End Driving via Plug-and-Play Reconstruction-based Token Pruning》成功入选。这篇论文最大的贡献在于,提出了一种专门为端到端自动驾驶VLA模型定制的、高效的视觉Token剪枝框架——FastDriveVLA。
据介绍,FastDriveVLA包含一个即插即用的视觉Token剪枝器ReconPruner。在车端模型的推理阶段, ReconPruner可直接嵌入自动驾驶VLA模型用于视觉Token的剪枝,即插即用,无需重新训练整个模型。为了辅助该剪枝器的训练,还专门构建了包含来自6个摄像头视角的24.1万个图像-掩码对的nuScenes-FG数据集。这一大规模的自动驾驶前景分割标注数据集,可广泛用于未来自动驾驶的研究。
最终,nuScenes自动驾驶数据集上的测试显示,采用这一剪枝框架,在不同剪枝率下均取得当前最优即SOTA效果:剪枝比例达25%视觉Token时,驾驶性能几乎不下降,其L2轨迹误差与碰撞率指标甚至超越未剪枝的基准模型;剪枝比例达50%Token时,在所有指标上表现更平衡;与此同时,VLA模型的推理效率得到了显著提升。
小鹏汽车联合北大提出的FastDriveVLA,建立了自动驾驶VLA模型的高效视觉Token剪枝的新范式,同时树立了车端大模型高效部署上车的新标杆。小鹏汽车董事长何小鹏在微博上对此表示,“很高兴我们在探索L4的路上又取得新的突破。我们会在物理AI领域继续发力,期待第二代VLA给鹏友们带来更棒的智驾体验。”



还没有评论,来说两句吧...