三、AGI技术如何改变汽车行业
虽然汽车行业更像是传统制造业,和人工智能行业有所区别,但如今越来越多的前沿技术开始改变汽车行业,王晓刚认为,汽车行业同样需要原创精神。特斯拉发布了端到端自动驾驶,成为了整个行业的追逐目标,这一定是未来趋势,但其实也产生了另一种形式的同质化。
「绝影智能驾驶具有前瞻性」
汽车的智能化,其实有更多值得原创的方面,人工智能远不止端到端,GPT-4o多模态人机交互,在汽车环境中也能展示相关的技术场景。在座舱内,多模态交互会更加自然,应用人工智能,能进一步拓展人的能力,是智能汽车的发展方向之一。
「智能化是汽车行业的未来方向」
当然,无论是端到端自动驾驶,还是多模态人机互动,都需要控制维度、控制能力的提升,技术的融合,包括语音、文字、图像在内,来自不同信息源的数据深度处理,都会导致技术难度的大幅度增加。这也需要相关供应商能够和车企有深度合作,获取相关的数据,和车厂深度融合,共同推进产品的定义、用户体验的提升。
「将智舱和医疗相结合是一种新思路」
「智舱可以和更多应用相结合」
王晓刚认为,作为商汤的汽车事业独立品牌,商汤绝影在汽车的未来智能化发展中有着很强的潜力和竞争力。在AGI技术方面的原创性和AIDC人工智能计算中心,已经展现了商汤的综合实力。在此基础上,商汤绝影专注于智能汽车行业,把AGI相关技术和汽车行业相结合。
「专注于智能汽车业务的商汤绝影」
虽然一些老牌供应商已经在汽车领域深耕多年,但往往只聚焦于单一技术模块,不具备商汤的AGI能力。以多模态人机交互为例,每增加一种模态,就需要综合能力、研究能力及落地能力的大幅度提升,无论是图像、语音、文字还是3D信息,商汤都有着成熟的经验。
「商汤绝影在多模态人机交互领域有着成熟的经验」
Open AI虽然相关能力更强,但没有专注于汽车方向的团队,平台性的公司,在汽车领域的专注度往往不够。另外,手机和电脑应用,并不是真正的多模态,获取的信息很有限。相较而言,智能汽车是非常自然的多模态交互场景,汽车产量大,终端用户多,信息的形式多且数据量大,商汤绝影的团队正在这一领域深耕,用人工智能改变汽车行业,在汽车行业开发更先进的人工智能。
「商汤绝影在智能汽车领域具有多个优势」
四、选择纯视觉方案并不是因为成本
除了多模态人机交互,自动驾驶是智能汽车的另一个主要发展方向,为何未来属于视觉方案而不是激光雷达,王晓刚给出了具有行业高度的解释。
虽然,更多人关注到的是成本方面的降低,但这并不是影响特斯拉、商汤绝影等公司的决策的主要原因,信息量的差异以及对AGI技术的未来展望,让这些公司坚定不移地选择了纯视觉方案。
「视觉方案在未来有着更多可能性」
激光雷达在自动驾驶技术刚起步时更容易利用,但相较于人眼观察到的世界,会有很多信息损失。摄像头就像是人的双眼,采集到的信息更加丰富,天花板更高,伴随着AGI能力的逐步提升,端到端大模型的应用,从信息采集到做出决策都更像是一个真正的人类,视觉优势会更加明显。
五、面对端到端的全自动驾驶能力,商汤绝影与特斯拉的差距并不大
那么在智能化汽车方面,商汤绝影相较于行业头部的特斯拉,又有哪些优势和不足呢?
在人机交互方面,王晓刚对商汤绝影的信心十足。虽然特斯拉的机器人应用已初见雏形,但在车的场景中还未发力,闭环自研很难覆盖全部维度。在这方面,商汤绝影已经积累了大量的经验,和多家车企有着深度的合作。
「商汤绝影在人机交互方面已经积累了大量经验」
在自动驾驶方面,特斯拉和商汤绝影使用的都是基于端到端大模型的纯视觉方案,这类方案需要大量的数据和充足的算力,特斯拉和商汤都有着庞大的基础设施,近几年,特斯拉大规模购入高算力GPU,算力中心由10万块GPU组成,截止目前,商汤有4万5千块GPU,总算力已高达1.2万PFLOPS,是其他车企或汽车行业供应商难以匹敌的高度。
「商汤的AIDC人工智能计算中心能够提供充足的算力」
PFLOPS是"Peta Floating Point Operations Per Second"的缩写,表示每秒千万亿次浮点运算,如果用业内常用的TOPS表示,1 PFLOPS等同于1000 TOPS,1.2万PFLOPS也就等同于1200万TOPS,大约相当于240万台家用计算机的算力。
「人工智能的发展需要有充足的算力作为基础」
除了在算力方面的不断积累,在数据的获取和模型的训练上,商汤绝影也使用了和特斯拉相同的思路。特斯拉会使用采集到的真实场景数据构建虚拟世界,在虚拟世界中可以高频训练各类情况,增强对物体的感知判断,最终能够给出更高效的决策。2023年,商汤也开始合成视频对模型进行训练,不再需要消耗大量算力和人力从海量数据中提取有效数据。
「训练模型需要大量的有效数据」
当然,身为车企的特斯拉,已经售出超过600万辆车,有着海量的真实数据,能够闭环完成全过程,更加高效。商汤绝影主要依赖于车企合作,和特斯拉相比,效率和信息量有一定差距,分享多少信息给供应商,车企会有选择。但是,伴随着合作的扩展和加深,效率会进一步提升,车企也会开放更多的信息。
六、商汤绝影的未来发展
未来如何和车企进行合作,体现商汤绝影的价值,也是我们所关心的。
王晓刚表示,虽然商汤绝影已经有量产的经验,但还是需要更多的宣传和曝光——让车企知道商汤绝影是一家怎样的公司,商汤绝影的技术有什么价值。无论是特斯拉FSD入华,还是Chat GPT的演进,对整个行业来说都是正向的,和商汤绝影一起推动了市场对端到端、多模态等前沿人工智能技术的理解和认知。
「商汤绝影已经有智驾的量产经验」
和车企的合作方式,商汤绝影也在不断探索中,但始终会秉承着开放的态度。商汤绝影会一直专注在自己擅长的AGI领域,车企也能做自己擅长的,双方的合作开放且深度。从基础的模型和引擎,到模块、应用乃至完整的方案,商汤绝影都能够提供,同时也能协助车企提升平台化能力和效率。商汤绝影看重的是长期且优质的合作,在合作过程中,也能不断加强自身的核心发展项。
「商汤有着丰富的技术储备」
商汤绝影在国内算得上是一家稀缺的全栈技术领先供应商,他们拥有"算力+算法+量产经验"这三重全面能力。他们不只满足于赋能客户,更主张成为核心技术伙伴。依托商汤大装置深厚的算力储备、原生汽车垂类大模型、领先的软硬件架构以及全栈数据生产管线等实力,商汤绝影展现出强大的全栈综合能力,有可能推动智能汽车更快速地驶入AGI时代。值得一提的是,他们的目标非常明确——希望与汽车厂商建立起战略合作关系,而这恰好也是商汤绝影和王晓刚所期待的。
「商汤绝影期望与汽车厂商建立起战略合作关系」
商汤科技取“绝影”之名,这匹让人惊叹、一骑绝尘、迅疾如影的千里马,源自曹操的坐骑“绝影”。在《魏书》中记载其因流矢受伤,但依旧忠诚可靠,我想这也能象征商汤绝影强大的技术实力和可靠的原创品质。相信其能助力更多车企,实现全自动驾驶能力落地。截至2023年12月,商汤绝影已与本田、比亚迪、长城、广汽、红旗、极氪、哪吒、奇瑞、蔚来等超过30家国内外车企携手合作,覆盖超90款车型,累计交付195万辆智能汽车。而最新的端到端大模型,也计划于2025年落地。(访谈/李店斌 黄正桥 庞珅 文/庞珅 图/黄正桥)
在今年的北京车展上,商汤绝影展示了真端到端自动驾驶解决方案UniAD的视频,所有操作行云流水,仿佛真的有了人的智慧。但需要说明的是,视频中的只是测试车,大洋彼岸的特斯拉,在FSD V12版本已经使用了端到端架构,且已全面推送给车主。FSD入华的消息沸沸扬扬,很多人翘首期盼,但在中国的道路上,同样是端到端,同样是虚拟世界训练出的大模型,中国自己的AGI领头羊、拥有原创技术团队的商汤绝影更值得我们期待。
相关视频——