选择城市
更多
点赞
评论
收藏
分享
问编辑
当前位置:
大模型技术如何重塑智能驾驶?
张宇喆
张宇喆
原创 · 0浏览·2025-09-23 21:51 · 北京
关注

[汽车之家 行业] 伴随L2级辅助驾驶的加速普及,智能驾驶技术迎来关键的窗口期。行业内既涌动着对技术突破的期待与积极探索,也存在对技术落地、安全应用等方面的审慎讨论。

为凝聚共识、共促发展,汽车之家于9月21日举办“汽车之家全球AI科技大会”,以“Hi Future”为主题,汇聚行业顶尖技术专家、车企领袖及生态伙伴,探索智能技术如何筑牢安全底线、重塑竞争边界。

在本届大会上,围绕《大模型技术如何重塑智能驾驶?》主题,同济大学汽车学院的朱西产教授主持了一场圆桌对话。

汽车之家

参与本场圆桌对话的嘉宾有广汽集团执委吴坚、重庆千里科技股份有限公司联席总裁王军、轻舟智航联合创始人、CEO于骞、Aibee创始人兼 CEO林元庆、地平线副总裁、战略部&智驾产品规划与市场部负责人吕鹏、科大讯飞智能汽车事业部副总裁李展眉、元戎启行副总裁、技术合伙人刘轩等7位来自主机厂、智能驾驶、智能座舱等领域的头部企业高层。

在朱西产看来,汽车产业智能化革命好像来的比电动化还要猛烈。

两年前,人们谈论的热点还是软件定义汽车、构建汽车的软件产业链。2024年,就开始出现“AI端到端”模型,并且很快从两段式端到端逐渐过渡到一段式端到端。如今,行业内讨论的已经是AI定义汽车大模型、视觉语言模型、WEWA等各种新概念。甚至,已经有车企宣布L3的智能驾驶能力已经上车。

朱西产认为,汽车没有实现L3自动驾驶之前,智能座舱做的再好,消费者也没时间享用。所以,行业当下的首要任务,还是要把智能驾驶从L2升到L3。然而,在人工智能快速发展的当下,围绕AI和大模型,智能辅助驾驶行业到底该如何发展?究竟是优先过渡到L3,还是直接跨入L4时代?

汽车之家

突破L3,难的不是技术

按照现在的自动驾驶分类标准,L2到L3是个最大的责任分水岭。

“作为主机厂,是最不愿意触碰L3的。”吴坚坦言,L2的责任主体是用户,L4的责任主体是企业,都十分明晰,然而L3的责任划分相对模糊。所以,对待L3,主机厂就会更为谨慎。

汽车之家

“我之前一直有个疑问,为什么满大街的L4运营车辆,L3的一辆都没有。难道L4的技术比L3更容易?”王军也有和吴坚类似的感受。

理论上,L4更难实现。然而,因为Robotaxi的责任就是由运营者承担,一切非常明晰,所以大家可以直接尝试这条路径。然而,L3阶段的责任划分目前仍需要讨论。显然,当下L3无法突破并不是因为技术问题。

汽车之家

然而,吴坚依然相信,L3时代会很快到来。因为当下L2是宽泛的L2,很多L2的能力已经达到了L3的技术要求。但是从技术到产品,仍需要整个行业的共同努力,包括供应商和政府。在他看来,L3在产品上的应用要从试点开始,逐步落地到整个市场。

于骞也认为,L3是行业发展到一定阶段后出现的必然形态。如今,欧洲已经出现了特定场景下的L3车型,他预计中国市场也将很快出现。

在《智能网联汽车组合辅助驾驶系统安全要求》强制性国标出现后,相关驾驶责任的归属将更加清晰。于骞认为,更清晰的责任划分,意味着消费者对于相关功能的信任度和认可度也将提升,最终推动商业化落地加速。但他也强调,即便L3开始商业化落地,也是先从泊车、高速等场景开始,不会影响交通发展。

汽车之家

持相同观点的还有李展眉。他强调,L2先过渡到L3的路线是一种必然趋势。因为从经济学角度看,生产力决定生产关系,生产关系反过来促进生产力的发展,就像染色体的基因判断一样螺旋上升。如果智能驾驶技术水平、产品水平已经达到L3,生产关系是一定要去适应它。如果不能适应,就会阻碍这个技术的发展。

王军表示,从解决方案的角度看来看,L2、L3、L4是一脉相承的。未来,千里科技还会将智能座舱和智能驾驶基于AI技术进行整合。

模型能力,高等级自动驾驶的挑战

如果进入L3阶段,车辆需要提前10s预判风险。然而,10s后的风险,根本不是当前深度学习模型能够读取出来的,因为很多危险物在很远的地方或者被遮挡。

在朱西产看来,如果不用生成式AI模型,不用Token建立关联关系,用现在的深度学习模型无法读出10s后的潜在风险。也就意味着,车辆如果没有生成式AI,是不可能具备人类驾驶员的防御性安全驾驶能力。

能否从L2走向L3,可能需要期待生成式AI的发展。

林元庆将语言模型看作是知识,能对物理世界、物理规律进行理解,类似高精地图是对物理世界的预先描绘。他认为,如果从长远看,只有借助摄像头或摄像头+雷达,物理世界大模型收集到的信息与人眼看到的信息相同,行业才能达到真正的“ChatGPT时刻”。据他预计,这个时间会很长,可能是2035年。

汽车之家

在林元庆看来,视觉感知存在数据量很大、信息量很小的问题,比如智驾6-7个摄像头,10分钟记录的数据就有1个GB,1分钟就100MB。作为对比,一套红楼梦的文本量也只有1.5MB。

大模型处理语言已经对算力有了非常大的需求,理解视频将需要大得多的算力。华为此前发表的2035年10大趋势中就预测,2035年对算力需求是现在的10万倍。ChatGPT将文本理解的问题基本解决,但仍未解决感知的问题。

据林元庆预计,届时,车端的算力需求或将达到5000TOPS~10000TOPS。

刘轩也认同大模型对车端算力需求量非常大的观点。在他看来,这也是不同企业的技术门槛所在,尤其是在控制模型参数量、防止过度膨胀的前提下,如何保证模型效果能够真正“上车实用”。

就在2025年8月,元戎启行刚刚发布自研的VLA模型(Vision-Language-Action)。如若设计不当,VLA模型的参数量可能膨胀至7B至10B,导致短期内无法量产部署。为了攻克相关技术难题,元戎启行选择让模型聚焦于驾驶本身,提取语言模型中最关键的理解与推理能力。

汽车之家

传统大语言模型确实具备广泛的知识体系,甚至在某些专业领域达到专家水平,但驾驶技能有其特殊性:一个驾驶行为稳健高效的司机,具备丰富的场景经验和风险预判意识。因此,在VLA模型中,元戎启行并不追求通用知识覆盖,而是专注于嵌入与驾驶高度相关的语义理解与思维链推理能力,也就是增强系统“像人一样思考”的能力。

据刘轩预测,当前可用的L2++系统运行VLA模型至少需要700 TOPS以上的算力,而面向L3的算力则至少要达到1500 TOPS以上。

这一算力需求的水平,让人们看到了L3落地的机会。目前,英伟达、高通、地平线等芯片厂商的方案,都已能够支持这一算力级别在车端的部署。

智能汽车,新的可能性

对比自动驾驶的L0-L5分级,李展眉认为,智能座舱的L4、L5时代有机会更快到来。因为智驾虽然需要的知识水平不高,但确实对安全性要求过高,因为人的生命不可能重复再来。但对于智能座舱的应用来说,容错性相对高一些。

汽车之家

智能座舱,在王军的心中也有着重要地位。他设想的未来里,消费者打到Robotaxi后,只需要说“我要赶飞机”五个字。座舱AI就可以在保证信息安全的前提下读取个人日历,知道消费者坐哪个航班,该去哪个机场,然后给出最优路线和速度方案,并激活自动驾驶。

自动驾驶时代,不止可以靠车端技术能力的提升。吴坚相信,V2X方案也一定能够在中国落地,因为我们确实是个强政府。在他看来,电动汽车能够在中国市场迎来快速发展,就是因为中国政府高效解决了补能问题。

虽然吴坚不赞同V2X一定比单车智能更安全、更先进的观点,但他强调,多加一双“眼睛”必然会给驾驶安全带来更多保障。

当然,V2X技术的发展,也面临一些现实问题。对于主机厂来说,很难有强意愿去建V2X的路端设备。因此,必须要有强政府去协调,提供场地、示范和未来的运营等服务,部署好V2X的设备和后台,然后与车企“数据共享”,将路端信息广泛提供车企。

主机厂可以先把V2X的信息用起来,从而更好地参与V2X行业的发展中。未来,当单车智能与V2X实现更好地结合,整个交通的安全和效率有机会实现质的提升。

伴随着智能辅助驾驶和自动驾驶技术的飞速发展,一些行业从业者看到了新的发展机会——机器人。

早期,机器人领域的入局者更多来自电机、机械类公司。近两年,越来越多来自智能驾驶赛道的玩家进入具身机器人领域,其中也包括地平线。

汽车之家

吕鹏表示,在支撑、架构、软件算法、云端基础设施等方面,智能驾驶和具身智能的底层算力平台有很多共性。如今,地平线不仅拥有自己的机器人业务,还在计算平台业务方面与多家机器人公司进行深入合作。

在地平线眼中,智能汽车本身就是一个大规模商业化落地的机器人。将智能汽车上很多能力进行外延,就可以更好地支撑具身机器人业务的发展。

作为中国头部辅助驾驶芯片供应商,地平线一直坚持做平台。虽然该公司仍坚持汽车这条主赛道,但仍会随着自身赛道的能力强化,而寻求延展出更多业务的可能性。

结语

目前,对于自动驾驶商业化落地是否需要经历L3时代,行业内仍存在一定的争议。但各位圆桌嘉宾似乎更认可L3商业化的意义。从他们的分享中,我们更清晰地看到通往L3自动驾驶的那条路径,也感受到了大家对于L3时代将于短期内到来的信心。

可以说,各位嘉宾不仅让我们对于未来的自动驾驶时代充满向往,也让我们看到了自动驾驶企业未来发展的无限可能性。电影里的未来场景,或许就是现实世界里不远的将来。

文章标签
点赞
评论
收藏
分享
举报/纠错
2025/9/24 04:15:57