特斯拉 自动驾驶 算力 特斯拉自动驾驶算力多少
全面重写Autopilot,特斯拉自动驾驶的升维革命
作者 / 陈念航
特斯拉 自动驾驶 算力 特斯拉自动驾驶算力多少
特斯拉 自动驾驶 算力 特斯拉自动驾驶算力多少
特斯拉 自动驾驶 算力 特斯拉自动驾驶算力多少
编辑 / 王德芙
出品 / 汽车之心
在刚过去的 8 月,马斯克在推特上公布了关于 Autopilot 以及 FSD 的两条重要消息:
AP 团队正对软件的底层代码进行重写和深度神经网络重构;全新的训练计算机?Dojo?正在开发中。
「重写 AP」,是今年马斯克在推特上不断提及的一项重要行动。
在回应推友提问时,马斯克会时不时披露 AP 将有的新功能,比如:
对路面上的隆起和坑洞(bumps&patholes)的识别;对环岛路况(roundabouts)的处理等等。
特斯拉对 AP 的全面重写,包括了对数据标注、训练、推理全流程的重构。
而基于新架构的 FSD 将不再是渐进式的优化,而是一次「量子式跃升」(马斯克原文是 quantum leap)。
马斯克在 7 月的世界人工智能大会上表示「有信心在今年完成开发 L5 级自动驾驶的基本功能」,马斯克能够实现他的承诺吗?
特斯拉为什么要在这个阶段对 AP 软件进行重写?重写 AP 到底要重写些什么呢?作为当下市面上量产最强的自动驾驶系统,AP 走向何方,FSD 何时到来?
1、特斯拉 AP 两大新进展
身兼特斯拉 AP 团队的负责人,马斯克经常充当着软件测试员的角色。
根据马斯克在推特上透露,他本人经常开着搭载 FSD 最新测试版本的特斯拉上下班,马斯克称在他使用系统的过程中,几乎不需要人工接管。
基于此,他乐观估计,最快在 6-10 周后(也就是10月-11月份),就可以向小规模地向用户推送 FSD 测试版本。
作为重写 AP 的一部分,马斯克还向外界介绍了其全新的用于神经网络(NN)训练的超级计算机 Dojo。
Dojo 在日语中意为「道场」,现在它成为了特斯拉训练数据的「道场」。
Dojo 将专门用于大规模的图像和视频数据处理,其浮点运算能力达到了 exaflop 级别,也就是每秒运算百亿亿次。正因此,马斯克称 Dojo 如野兽一般。
需要注意的是,Dojo 计算机将配合无监督学习算法(unsupervised learning),来减少特斯拉对于数据人工标注的工作量,这样来帮助其数据训练效率实现指数级提升。
马斯克还在推特上发布英雄帖,为自家的 AI 和芯片团队招人。
目前,Dojo 计算机仍在开发中,从 V1.0 开始,大约一年后才会有成果。
有了全新的 AP 软件架构以及强大的数据训练计算机 Dojo,难怪马斯克会对其 FSD 的落地进展如此自信。
但话说回来,特斯拉为什么要在这个阶段对 AP 软件进行重写?还是以这样一种推倒重来的方式。
2、为什么特斯拉要重写 AP?
现在的 AP 已经碰到了性能瓶颈,必须要进行升维革命,否则难有大的突破。
马斯克用了一个术语来表述这个问题,他认为过去 AP 被困在一个局部值(Local Maximum)里面,要向上突破已经非常困难了。
其中一个很关键的问题在于,原有 AP 软件架构下,其处理的数据都是不含有时间坐标的 2D 图像数据。
再想往上去处理 3D 甚至 4D(加上时间维度) 的数据,实现从图像级处理到视频级处理的跃迁, AP 固有的软件和训练网络难以胜任。
关于引入 4D 数据带来的影响,一位来自国内自动驾驶公司的工程师向汽车之心分析:
「因为有了时间维度,系统就能知道目标物的运动,对其行为进行预测,而且,系统处理目标物识别、分类以及场景的重构这类任务会更加轻松。
总之,加入时间维度,很大程度上是提高系统对整体场景的理解。」
AP 要再往前走,必须进行革命,所以特斯拉这才决定重写 AP。
另一方面,因为数据转变成 4D,信息量更丰富,整个数据的容量也会变大,这也给特斯拉 AP 现有的用于深度神经网络训练的基础设施带来了挑战,所以就有了 Dojo。
所以, AP 为了实现性能和功能上更大的突破,倒逼其对 AP 基础代码以及训练深度神经网络的基础设施进行重构。
这样工作量庞大的复杂工程也成为 FSD 迟迟推出不了落地版本的重要原因。
除了在车载软件和训练端变革,特斯拉在车载硬件端也做好了准备,就是其自研的 FSD 芯片。
FSD 已经在去年 4 月份开始量产并搭载在特斯拉的车端。
一位对熟悉特斯拉的业内人士表示:
「在 FSD 发布后的一段时间里,特斯拉 AP 团队仍是基于 HW 2.x 的硬件(英伟达 Drive PX 平台)进行功能开发,直到今年年初,特斯拉才开始全面转向基于 FSD 芯片的软件开发。」
相较于英伟达 Drive PX 平台,特斯拉 FSD 芯片在基础算力和深度神经网络推理效率方面都有革命性提升,而且在视觉处理性能上,FSD 相较于英伟达的芯片有更大的优势。
所以趁着这一次特斯拉重写 AP,整个系统需要处理的数据升维到了 4D,对计算硬件的要求指数级提高,FSD 的强大性能便终于有了广阔的用武之地。
引入 FSD 芯片的 AP 在性能上会有多大提升?
马斯克此前在接受 Youtube 视频博主采访时透露过:
「如果特斯拉全车的 8 颗摄像头以 36 帧/秒的速度运行(性能拉满),软件则会基于 FSD 芯片的算力同步进行 3D 标注(2D 图像+深度信息),这会使标注效率提升 3 倍,准确性也会大幅提升。」
特斯拉重写 AP,除了马斯克口中所说的要突破「Local Maximun」以及挖掘 FSD 芯片的极限性能这两方面的原因之外,还有一种可能性存在。
硅谷一位资深自动驾驶工程师告诉汽车之心:
「特斯拉现有的 AP 系统和后续要推出的 FSD 是两套开发的系统。
前者的架构是针对于 L2/L3 级自动驾驶,而 FSD 的目标从一开始就是 L4/L5 级自动驾驶。因此,两套系统在架构上有本质的异,两者着一个代际。」
后续,随着技术不断进步,FSD 也走向成熟,特斯拉决心把 FSD 和 AP 的框架进行整合。
但问题是,两个系统中有些模块可以融合,但是有些模块是融合不了的,毕竟一个为 L2 开发的系统很难直接演变成 L4 系统。
所以特斯拉 AP 团队要改写 AP 软件的框架和代码,以实现两个系统间的完美兼容,这样的话,后续才能以统一的版本推送给购买了全自动驾驶选装包的特斯拉车主。
实际上,我们也能从 AP 这些年的功能更新中发现一些蛛丝马迹。
2017 年 3 月,推送自动泊车和自动辅助变道功能;2018 年 10 月,推送自动辅助导航驾驶(NoA)功能;2019 年 9 月,推送智能召唤(Smart Summon);2020 年 4 月,推送识别交通信号灯和停车标志并作出反应(海外先行)。
AP 还在最新的迭代过程中更新了一些令人惊喜的小功能:
比如在城市工况施工区域,没有车道线的情况下,车身两侧皆为锥形桶,AP 能做到以锥形桶为依据实时绘制车道线。
AP 系统还能检测到小动物并及时进行避让,不过特斯拉是把小动物一律识别后才做出相应的作。
基本上,在特斯拉上标明的 FSD 完全自动驾驶功能,还剩下一项最难的、也最能代表 L4 级自动驾驶能力的更新:在城市街道中进行自动辅助驾驶。
为了实现这一难度的更新,特斯拉给出的解就是重写 AP。
基于以上分析,特斯拉重写 AP 的原因便包括突破「Local Maximun」、挖掘 FSD 芯片的极限性能以及将系统能力从 L2 进化至 L4。
4、特斯拉重写 AP,是重写什么?
先来看看特斯拉 AP 现在最新的 AI 软件堆栈是怎么样的:
层的是数据、GPU 集群以及 Dojo 计算集群,这一层主要进行数据采集、标注和训练,生成算法模型;往上走就是采用深度神经网络对模型进行分布式训练;再往上走就是用损失函数对模型进行评估;在评估层之上,是云端推理层和车端 FSD 芯片推理层,到这一层,意味着算法模型走完了大部分流程,然后就是部署到车端;在车端,特斯拉通过影子模式(Shadow Mode)将这些算法模型与人类驾驶行为进行比对,检测是否存在异常。
这样的从数据采集到算法部署的闭环,目的就是让系统性能不断迭代,更加。
在这个闭环当中,涉及到数据集、模型训练神经网络、云端和车端推理算法等等要素。
所以,当数据形式从二维的图像数据(2D)转换成四维的视频级数据(4D)后,相应的神经网络和推理算法都需要进行重写。
据马斯克透露,特斯拉 AP 新版本的深度神经网络会将包括感知、路径规划、目标识别等所有子神经网络综合于一体。
特斯拉 AI 高级总监 Andrej Karpathy 在此前的一次演讲中表示:
「我们无法让每一个任务都享有单独的神经网络运算,因为同时处理的任务数实在太多,我们只能把一些运算分摊到共享骨干网络上」。
Andrej Karpathy 将这一骨干网络称为?HydraNets(Hydra 意为九头蛇),意思就是有一个主干网络(Backbone),在这个网络上有多个不同的出口(Head)来做应用,然后输出各自的结果。
在特斯拉 AP 最新的 AI 软件堆栈中,有一个最值得关注的部分就是 Dojo 训练集群,这个集群可以处理海量的图像、视频数据。
引入这一训练计算机,一方面是为了满足特斯拉 AP 系统此后的 4D 视频数据处理需求。
另一方面,特斯拉在全球有超过 82 万辆搭载 HW 2.0/3.0 硬件的车辆每天在道路上行驶,可以采集海量的数据用于 AP 的训练,而如此海量的数据,必然需要具备强大计算性能计算机来进行处理。
Dojo 还有一个特别之处在于,它可以与无监督学习进行配合。
所谓无监督学习,就是无需人工对训练数据集进行标注,系统可以自行根据样本间的统计规律对样本集进行分析,常见任务如聚类等。
例如无监督学习在不给任何额外提示的情况下,仅依据一定数量的「狗」的特征,将「狗」的从大量的各种各样的中将区分出来。
有了无监督学习技术加持的 Dojo 计算机,便能以极低的成本对数据进行自动标注和训练,实现算法性能的指数级提高。
不过,用上了无监督学习技术的特斯拉,依然有一支大约 500 人规模的数据标注团队。
因为在一些初始神经网络模型的搭建过程中,采用人工标注的方式置信度更高。而且,特斯拉并未大规模采用无监督学习技术,现在都还处在尝鲜阶段。
那么,Dojo 计算机上搭载的会是谁家的芯片呢?
目前特斯拉自研的 FSD 芯片属于推理芯片,用于 Dojo 计算机的芯片属于训练芯片。
有业内人士向我们分析表示,Dojo 所采用的芯片应该是 FSD 芯片的扩展版本。
这也是为什么马斯克在为自家 AI 和芯片团队招人时,特意公布了其在研发的 Dojo 计算机的情况,大概率要招的人就是为了研发用于 Dojo 计算机的芯片。
5、特斯拉 FSD 走向何方
无论是大力投入资源重写 AP 基础代码和深度神经网络,还是广纳贤才开发性能强大的数据训练计算机 Dojo,都体现了特斯拉要先人一步搞定完全自动驾驶的决心。
特斯拉拥有庞大规模的数据采集车队,也聚集了 300 多位全球的自动驾驶和深度学习方面的软硬件研发人才,从数据到算法到商业化,特斯拉在自动驾驶领域有着其他厂商无法比拟的优势。
在这些优势的加持之下,特斯拉仍然迟迟无法量产真正意义上的完全自动驾驶功能,那些买了 FSD 选装包的特斯拉用户着急,马斯克则更急。
所有人都在期待着重写完成后的 AP 系统能真正进化至 FSD 版本,而这一切都要等到今年年底见真章。
在重写 AP 的同时,特斯拉也没有停止在硬件层面的持续研发。
据媒体,特斯拉正与博通合作研发新款?HW 4.0 自动驾驶芯片,其性能比 FSD 还要强大?3 倍,明年第四季度进行大规模量产,由台积电负责生产。
特斯拉在 AP 层面,是一个接一个的大动作,而这一切动作都有一个统一的目标:更的 AP、更强大的 FSD。
即使现在其表现还不尽如人意,但未来值得期待。
本文来源于汽车之家车家号作者,不代表汽车之家的观点立场。
特斯拉的辅助驾驶系统AutoPilot存在技术缺陷,问题到底出在哪里?
我觉得问题应该出在算法上面,特斯拉的辅助驾驶系统AutoPilot的算法还不够成熟,有一些ug存在。
我觉得问题主要出在传感器上,传感器反应不够灵敏,达不到标准。
有时候数据和系统的设置是不全面的,有时候没有办法及时的识别障碍物。
真黑科技!曝特斯拉新芯片 或为下代自动驾驶硬件准备
[汽车之家?新能源]? 日前,据媒体爆料,美国芯片设计企业博通与特斯拉共同开发了一款高效能运算芯片(HPC)。该芯片将会交由芯片代工厂台积电进行生产,采用7nm制程工艺以及系统级单晶元封装技术(SoW),预计今年第四季度开始投产,初期投产规模约2000片,2021年四季度才会大规模量产。
该消息一出,有业界人士分析该芯片的功能可能是为了替换特斯拉现有的完全自动驾驶芯片,从而带来更强算力以及更低功耗。也有说法是,该芯片可能充当特斯拉车型的下一代MCU,为用户的车机系统使用带来更好体验。
据了解,特斯拉完全自动驾驶芯片目前采用的是14nm制程工艺,代工方为韩国三星,它单颗芯片的算力可以达到72TOPS(每秒万亿次运算)。在特斯拉的完全自动驾驶计算机上,共有两颗这样的芯片,因此系统综合算力达到了144TOPS。如果引入新制程工艺以及封装技术的话,自动驾驶计算机的性能以及功耗将会有更好表现。关于特斯拉Autopilot的最新资讯,请持续关注汽车之家的后续。(消息来源:工商时报;文/汽车之家 胡永彬)
单颗算力200TOPS、7nm、车规级!寒武纪切入自动驾驶芯片
在刚刚结束的2021世界人工智能大会上,寒武纪创始人兼CEO陈天石透露正在设计一款算力超200TOPS智能驾驶芯片,该芯片继承寒武纪一体化、统一、成熟的软件工具链,采用7nm制程,拥有安全岛,符合车规级标准,其定位为“高等级自动驾驶芯片”。
寒武纪是目前上少数几家全面系统掌握了智能芯片及其基础系统软件研发和产品化核心技术的企业之一,能提供云边端一体、软硬件协同、训练推理融合、具备统一生态的系列化智能芯片产品和平台化基础系统软件。公司掌握的智能处理器指令集、智能处理器微架构、智能芯片编程语言、智能芯片高性能数学库等核心技术,具有壁垒高、研发难、应用广等特点,对集成电路行业与人工智能产业具有重要的技术价值、经济价值和生态价值。
目前,寒武纪已与智能产业的众多上下游企业建立了良好的合作关系,在未来,寒武纪将继续秉承开放共赢的姿态,与全球诸多合作伙伴一起共建智能新生态,用人工智能芯片技术的突破与创新,驱动人工智能计算力引擎。寒武纪凭借领先的核心技术,较早实现了多项技术的产品化,例如推出全球商用终端智能处理器IP产品寒武纪1A、高峰值云端智能芯片思元100等。
在2020年,寒武纪推出了思元290训练芯片和玄思1000智能加速器,补足人工智能训练产品线,标志着寒武纪已初步建立“云边端一体、软硬件协同、训练推理融合”的新生态。不久前,寒武纪在与投资者互动时表示,寒武纪目前尚未涉足车载智能芯片领域,向行歌 科技 增资并引入投资者综合考量了寒武纪中长期发展的战略需求。而陈天石此次透露的算力超200TOPS智能驾驶芯片或许就是寒武纪正式切入自动驾驶的开始。
200TOPS什么概念?
说起自动驾驶,大家首先想到的就是特拉斯,因为它是自动驾驶的头号选手。自动驾驶最核心的硬件就是自动驾驶的芯片,它是自动驾驶的心,自动驾驶芯片的特点就是高算力,它的单位是tops,1tops就等于每秒运行1万亿次。随着自动驾驶级别越来越高,自动驾驶的芯片的算力也越来越强!目前在售车型里,特拉斯的自动驾驶芯片算力最强,特斯拉HW3.0,单芯片算力72tops,目前特拉斯旗下所有车型均采用双芯片方案,算力高达144tops。
自动驾驶芯片算力盘点
随着各大厂商的越来越重视自动驾驶的研发,自动驾驶的芯片已经不再是特拉斯一家独大了,自动驾驶芯片也呈现百花齐放的景象。
英伟达
全球图形处理芯片的王者,在 汽车 自动驾驶芯片同样是王者。目前已经量产的英伟达Xier,单芯片算力30tops,首先搭载于小鹏P7身上。能实现L2-L3的自动驾驶。2021量产的英伟达Orin是Xier的升级版,采用台积电7nm制程,性能提升接近7倍,单芯片算力200tops,性能超越特拉斯HW3.0。
今年4月份,英伟达正式发布了最新一款智能 汽车 和自动驾驶 汽车 芯片组——DRIVE Atlan,单颗芯片的算力达到了1000TOPS,将应用于L4及L5级别自动驾驶。
不过该芯片最快将于2023年开始向 汽车 制造商和开发者提供样品,2025左右上市的车型才可能搭载。
Mobileye
属于英特尔旗下的芯片公司,目前量产的EyeQ4芯片,算力2.5tops,能实现L2级别的移动辅助驾驶,目前蔚来ES6和欧拉好猫等车型在用。2021年即将量产的是EyeQ5芯片,性能提升10倍,算力达到25tops,能实现L3级别的自动辅助驾驶,领克zero将采用EyeQ5H,采用的双芯片组合,算力达到50tops,值得期待。高通
在自动驾驶芯片领域,高通推出了Snapdragon Ride自动驾驶平台。支持L1-L5级别的自动驾驶,芯片总算力高达700tops,功耗仅为130W,比特斯拉的FSD芯片功耗还低。采用高通自动驾驶芯片的 汽车 最早要2023年才会推出市场,敬请期待吧。
华为
华为早在2018年10月就发布了升腾310,12nm制程,也是一颗自动驾驶AI芯片,其单芯片算力16tops,华为基于升腾310组合的多芯片方案MDC600,算力352tops,是目前国内算力最强大的自动驾驶芯片,支持L3-L4级别的自动驾驶。
地平线
国内人工智能芯片的佼佼者,今年5月,地平线第三代车规级产品,面向 L4 高等级自动驾驶的大算力征程 5 系列芯片一次性流片成功。作为业界款集成自动驾驶和智能交互于一体的全场景整车智能计算芯片,征程 5 系列单颗芯片 AI 算力可达 128 TOPS。此外,基于征程 5 系列芯片,地平线将推出 AI 算力高达 200 1000TOPS 的系列智能驾驶计算机,兼备业界 FPS(frame per second) 性能与功耗。
此外还有黑芝麻、零跑等国内厂商也都推出了自己的高算力自动驾驶芯片,这里就不一一介绍了。
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系 836084111@qq.com 删除。