4月14日,小鹏汽车在香港举办AI技术分享会,首次披露正在研发720亿参数的超大规模自动驾驶大模型,即“小鹏世界基座模型”。未来,小鹏将通过云端蒸馏小模型的方式将基模部署到车端,给“AI汽车”配备全新的大脑。这款模型同时也将赋能小鹏的AI机器人、飞行汽车等。
小鹏汽车自动驾驶负责人李力耘介绍,小鹏基模是一个以大语言模型为骨干网络,使用海量优质驾驶数据训练的多模态大模型,具备视觉理解能力、链式推理能力和动作生成能力。通过强大的强化学习训练,基座模型不断自我进化,将逐步发展出媲美甚至超越人类的自动驾驶技术。
李力耘透露,为了研发基模,小鹏汽车早在去年就开始布局AI基础设施,现已建成国内汽车行业首个万卡智算集群,用以支持基座模型的预训练、后训练、模型蒸馏、车端模型训练等任务,小鹏汽车将这套从云到端的生产流程称之为“云端模型工厂”。目前,小鹏“云端模型工厂”拥有10 EFLOPS的算力,集群运行效率常年保持在90%以上,从云到端的全链路迭代周期可达平均5天一次。
早在2024年下半年,小鹏汽车已开始面向L4级别的自动驾驶研发全新的“AI大脑”,即小鹏世界基座模型。小鹏研发团队利用优质自动驾驶训练数据,先后开发了多个尺寸的基座模型,目前已经着手推进72B(72 Billion,即720亿)超大规模参数世界基座模型的研发,参数量是主流 VLA 模型的35 倍左右。
小鹏世界基座模型的一大优势是具备链式推理能力(CoT),在充分理解现实世界的基础上,能够像人类一样进行复杂的常识推理,并将推理结果转化为行动,例如输出方向盘、刹车等控制信号,实现和物理世界的交互。
未来,经由基座模型的赋能,智能驾驶系统有望从“模仿人类”进化到“超越人类”,最终能够处理全场景的自动驾驶问题,包括一些模型从来没在训练数据中遇到的问题。