0

L3还没到，智己就能造L4的车了？

阅读时间大约6分钟（2306字）

2024-10-29 L3还没到，智己就能造L4的车了？

来源：智己汽车

智驾也要靠自觉。

文｜王磊刘雅杰

编辑｜秦章勇

默不作声的智己，开始在智驾上憋大招。

50多页的PPT，42分钟的讲解，全是硬核的智驾技术干货，就为了展现出一个主题，智己汽车和Momenta联合打造的智驾大模型IM AD 3.0，已经进化到下一个阶段——拥有人的直觉。

“直觉”这个词，也是贯穿整场发布会。

关于端到端，每家企业的研发路线都不尽相同，解释的话术也有所区别，IM AD 3.0的优势，则是用直觉来形容，其背后靠的则是一段式端到端直觉式智驾大模型。

这套大模型拥有类似人脑结构的思考方式，驾驶过程中会生成本能反应主导的直觉决策能力，也就是老司机的开车方式，所以智己毫不客气地表示自家智驾就是“十年老司机”。

除此之外，基于IM AD 3.0，智己还成为了国内首个，同时具备L2、L3、L4级智能驾驶量产能力的品牌。

开车靠“直觉”

智己CEO刘涛也顺势公布了L2到L4的时间表：

L2+级高阶辅助驾驶，已于本月在全国范围内开通全系车型“无图城市NOA”，可以做到“全国都好开、全场景都敢开”。

智己还启动了欧洲市场的L2+道路测试，目的是为了打造一个“全球都能开”的无图NOA。

L3级自动驾驶已进入量产倒计时，今年6月，智己入选国家首批智能网联汽车L3级自动驾驶准入和上路通行试点名单，预计将于2026年正式具备L3级自动驾驶方案的量产条件。

同样位于智驾第一梯队的问界、小鹏暂不在该名单中。

另外，智己预计将在年内获得首批“L4级无驾驶人道路测试牌照”，智己无人驾驶车将很快实现上路。

和大部分车企不同，智己并没有采用当下主流的“感知+规划”的分模块智驾结构，而是和Momenta将其整合进一个大模型，云端算力为2.5EFLOPS。

这样的好处显而易见，除了减少手写规则，有利于实现全局流程最优，其训练的上限也较高。

智己敢宣称自家“一段式端到端智驾大模型”断代领先，背后还有一个重要原因就是这款大模型具备人工智能生成的“直觉能力”，即也可以理解为智驾从“像人”进化到了“成为人”。

直觉是人类才有的特质，官方称IM AD3.0会以更接近人脑结构的思考方式，生成本能反应主导的直觉决策能力。

尤其是在前车突然刹停和人车混流的无保护左转场景的情况下，传统的智驾系统会像机器般执行原有指令“傻等”，但IM AD3.0会像老司机一样观察两侧路况，并伺机变道。

如果碰上车道有水坑的情况下，IM AD3.0也会做出绕行水坑，而不是继续执行车道保持，从水坑上驶过。

在训练这套智驾系统的过程中，智己还采用了“长短期记忆模式”架构。

简单来说，就是将智驾大模型的数据处理分为短期记忆和长期记忆两种模式。短期记忆可以实现以天为单位的迭代，快速验证优质数据；长期记忆则是周级迭代优质数据，对数据进行质量评估后，把优质数据输出，应用于端到端大模型。

“长短期记忆模式”其实就是在模仿人脑“直觉推理+逻辑分析”的问题处理方式，可以在模型训练成本节省10-100倍的同时，大幅提升迭代速度。

都得需要安全机制兜底

其实从智驾领域普遍的方案来看，分段式端到端是目前行业的主流方案。

分段式的大模型，感知端用一个模型，控制决策规划用一个模型，用两个模型来代替One Model，也是目前主流的端到端路线，像小鹏的XNGP、华为ADS3.0都是分段式端到端的方案。

而所谓一段式端到端大模型，就是取消了分模块智驾结构，将感知与规划整合进一个大模型，一个完整的神经网络减少了中间结构化感知结果的传递，从原始数据输入到规划路径输出，实现了信息无损传递，像车辆的颜色、司机的性别、车辆的状态等，体验更类人，性能上限更高。

所以不难看出，在智驾追求上，One Model大模型要比分段式大模型要好的多，因为信息的无损传递，上限也变得极高。

当然，从两段式端到端、模块化端到端到单一神经网络模型的One Model端到端的进程中，越往后，难度也越大。这也是为什么目前行业选择的主流方案是分段式端到端的原因。

就像不久前，极越汽车在其智驾发布会上说的那样“One Model的一段式端到端，好像可以用数据来解决所有问题。那为什么还是选择两段式端到端？”

因为出于安全因素的考虑。

虽然“One Model”的一段式模型，上限极高，但下限同样也很低。要知道通过一套神经网络模型来进行驾驶行为决策，这过程就像“黑盒”一样，很难控制系统输出的内容。

而且它也缺乏透明度，工程师很难修复系统中存在的决策漏洞，并不能保证绝对的安全，也就说，一段式方案面临更难的长尾问题。

但这也并不意味着，目前一段式端到端的方案就无法落地。

尽管AI模型存在不可控性，可能会做出一些违背物理规律的结论推导。所以这个时候，就不能仅靠“直觉”了，它还需要加入“逻辑”加以纠正。在一段式的前提下，加入“安全逻辑网络”来兜底，保证直觉决策的安全性。

这也对应智己汽车的方案，“一段式端到端+安全逻辑网络”，通俗的来说就是人脑的直觉推理+逻辑分析两个部分，正好对应智己给出的“长短记忆”两个系统结合。

而且智己汽车也不是第一个这么干的，在此之前，最先在智驾领域应用这种方案的是理想，其搭载的E2E（端到端大模型）+VLM（视觉语言模型）分成系统一和系统二，组成了“快慢”系统，两个系统相互配合，构成了人类认知和理解世界、做出决策的基础。

不难看出，两家在理念上极为类似，不过，在技术框架上有所区别。

理想的系统一是E2E端到端；系统二是VLM视觉语言模型，VLM在一些复杂场景下，会对E2E进行指导，像是一位陪驾的老司机，因为是一套视觉语言模型，所以运作频率相较于E2E是一套慢系统。

理想E2E端到端是系统一，作为主决策者，VLM视觉语言模型，当作系统2，可以理解为系统1的“冗余”，VLM在一些复杂场景下，会对E2E进行指导，像是一位陪驾的老司机，因为是一套视觉语言模型，所以运作频率相较于E2E是一套慢系统。

VLM视觉语言模型具备一些逻辑思考的能力，会在一些复杂情况下验证“端到端”的决策，最终实现车辆的兜底或控制。

而智己对应的方案“长短记忆“模式，长期记忆是通过E2E来完成，作为主决策者。

而智己上安全逻辑网络，就不是视觉语言模型了，而是一套由规则构成的逻辑算法，这套系统使用串行处理方式，对数据进行验证，实现算法迭代。

可以理解为对某个场景，某个功能模型的小版本演化，可以达到快速迭代试错目的，然后经过验证过的好的算法和数据，会在一段时间的积累后应用在“长期记忆”，即最终的端到端大模型上。

不难看出，虽然两家采用了不同的技术框架，但在理念上是殊途同归，而且都需要一套安全网络进行兜底。

所以再性感的智驾技术方案，没有足够的安全都是空中楼阁，技术路线或许没有标准答案，不断解决掉长尾问题，才是智驾的最优解。

1、猎云网原创文章未经授权转载必究，如需转载请联系官方微信号进行授权。

2、转载时须在文章头部明确注明出处、保留官方微信、作者和原文超链接。如转自猎云网（微信号：lieyunjingxuan

）字样。

3、猎云网报道中所涉及的融资金额均由创业公司提供，仅供参考，猎云网不对真实性背书。

4、联系猎云，请加微信号：jinjilei

相关阅读

{{item.post_title}}

{{item.time_ago}}

推荐阅读

{{item.post_title}}

超电实验室

让汽车和未来触手可及。微信公号ID：SuperEV-Lab

热门标签

热门文章

投资机构

北京允泰投资管理有限公司成立于2017年，是一家聚焦国家战略新兴产业，以科技创投和资产管理为主业的私募股权投资机构。公司目前涉及两大主营业务：私募股权投资、定增投资。公司长期坚持以科技创新型企业投资为目标，重点投资于成长期的具有核心竞争力的高科技、高成长企业，覆盖半导体芯片、新材料、智能制造、新能源、医疗大健康等领域。

专注技术创新，专注早期投资，行业前瞻，与创业企业一起成长。

华兴资本是领先的私募股权投资者，专注于中国高增长及前景广阔的新经济行业。

黑洞投资成立于2014年，是一家聚焦于多资产类别、多策略投资的平台型投资机构。投资方向为：地产+、互联网+、人工智能、新零售、文化传媒等领域，通过股权投资、战略投资/孵化等形式为新经济生态圈中的创业者提供强有力的支持，携手打造具有高度商业价值和社会价值的优质企业。

北京长安投资

北京长安投资集团有限公司成立于 2002 年 9 月，总部位于北京市西城区闹市口大街 1 号长安兴融中心，注册资本三亿元人民币。经过二十余年的发展，长安投资集团已经成长为集金融、地产和投资三大核心业务为一体，拥有雄厚资本和优良信誉的大型多元化投资集团。

国科嘉和（北京）投资管理有限公司是中国科学院控股有限公司（简称“国科控股”）直属一级企业，成立于2011年。国科嘉和由国科控股牵头发起，并联合多家国内大型企业集团，共同设立了2支人民币风险创业投资基金（VC基金）、2支人民币并购基金(PE基金）、1支产业专项基金以及1支美元风险投资基金，管理资金总额达数百亿，是国科控股直属唯一同时涵盖VC、PE的专业投资机构。

银盛泰资本

专注医疗大健康和科技领域拥有一流品牌的领先企业，覆盖初创期、成长期、成熟期、Pre-IPO各个阶段，挖掘海内外优质投资机会，成就基业长青的伟大公司！

领沨资本自2015年9月成立以来，致力于投资新金融基础设施领域的优质成长期企业，重点关注具有核心技术壁垒，且具有创造大规模商业及社会价值潜能的企业。领沨资本投资的细分领域依次为人工智能、区块链、金融云／大数据、网络安全及物联网在金融领域中的应用、信贷科技如供应链金融科技、保险科技、投资／财富科技、支付、信用评级与风险管理企业等。领沨资本管理人民币及美元基金，已成为亚太和大中华区最大、最强的金融科技专业基金之一。

钟鼎资本，成立于2010年，是一家专注“以供应链为核心能力提升产业效率”的生态型基金。聚焦的投资领域包括物流、供应链、零售&品牌、数据科技等，为国内物流供应链领域最有影响力的投资机构。

联想创投为联想集团CVC，专注于面向未来的科技产业投资，投资方向主要为：IoT、边缘计算、云、大数据、人工智能、垂直行业、消费升级等。已投资和孵化超过百家优秀企业，包括美团点评、宁德时代、蔚来、旷视科技、寒武纪、每日优鲜、SHAREit等。

天风证券私募基金子公司，专业从事股权投资和私募基金管理，致力于构建人人受益的产融生态，坚持与客户共存共荣，助力实体经济发展和产业升级。

北辰星资本

目前主要关注体育、文化、娱乐、教育等领域的中早期项目投资；已投资包括肆客体育、伐木累、淘手游、河马牙医、竞彩猫、去滑雪GOSKI、羽贝纳、趣动户外、DS足球、福建天信职业足球俱乐部等项目。2016年肆客体育、竞彩猫、去滑雪三个项目被懒熊体育评选为“年度十佳体育创业项目”，同年由北辰星主导发起的去玩体育产业基金（去玩资本）和红衫、IDG等知名机构一起被猎云网评选为“2016年十大体育产业投资机构”。

菁英汇资本

菁英汇资本是受天津市政府引导基金支持的创投机构，投过的知名案例如奇安信、国开新能源等。主要投资于网络安全、产业互联网、大数据、云计算、物联网、教育信息化等数字经济领域的项目。标签：软科技、企业服务，阶段A轮以后

成立于2015年，是一家以价值投资为宗旨的精品VC，创始团队来自中路资本、上海实业直投部、工商银行投行部、创赢金融等公司的核心成员，具有丰富的一二级市场和互联网、互联网+、消费、教育等领域的投资经验、行业研究经验及资本运作经验，过往案例包括Blued、团车网、波奇网、小卫科技、小鸟教育，赛优教育、丝域养发等。

德联资本成立于2011年，重点关注高端制造、前沿科技、医疗健康等领域中技术驱动型项目，已投资启明医疗、盟科医药、珞石机器人、华捷艾米、梅卡曼德、得一微电子、飞致云等数十家创业公司，覆盖机器人、智能制造、人工智能、大数据、企业服务、医疗健康等多个细分领域。

东沙湖基金小镇

江苏省首批省级特色小镇，致力于构建一个以私募基金为核心，实施“资本+科技”双轮驱动，服务于实体经济的多层次体系。

凯旋创投成立于2008年，中国本土专注于早期科技企业投资的双币私募投资机构。致力于长期投资国家战略新兴产业，包括物联网、高端制造、人工智能、先进医疗、高性能材料等领域，不断构建与完善科技及产业投资生态圈，为创业者提供丰富经验经验、全球视野及资源，并持续赋能。团队拥有丰富的技术行业经验和坚实的高科技产业背景，具备跨越周期的投资能力。

众海投资成立于2014年，由前阿里巴巴集团高管鲁众、黄海军共同创办。目前管理着 5 期人民币基金，持续专注于互联网/消费、高新科技和医疗大健康等领域，主要覆盖阶段为初创期与成长期。已投资超过50家优秀的中早期企业，包括乐乐茶、爱慕、宜明昂科、言几又、新中冠、格隆汇、聚土网等。致力于做成长企业的合伙人。

青锐创投创立于2015年，以大消费、互联网、科技等领域的天使到B轮投资为主。目前管理着总规模折合人民币10亿元的双币基金。

青山资本，中国一线天使投资机构，专注消费、TMT领域，主张独立思考、价值投资。致力成为创业者最早、最重要的支持者，与优秀年轻人一道，创造美好生活，重仓中国。

${{item.author_display_name}}$

{{item.author_display_name}}

{{item.author_user_occu}}

{{item.author_user_sign}}

{{item.post_title}}

{{item.time_ago}}

{{item.author_display_name}} {{cat.name}}

{{loadMoreText}}

×