• 【自动驾驶技术】自动驾驶汽车AI芯片汇总——地平线篇


    0. 前言

    按照国际惯例,首先声明:本文只是我自己学习的理解,虽然参考了他人的宝贵见解及成果,但是内容可能存在不准确的地方。如果发现文中错误,希望批评指正,共同进步。

    本篇文章是这个系列的第二篇,介绍地平线公司的车载SoC芯片,主要是征程®(Journey™)系列产品。

    自动驾驶汽车AI芯片系列目录:

    1. NVIDIA篇

    地平线机器人科技有限公司(Horizon Robotics)是一家中国的人工智能计算平台公司,专注于边缘人工智能芯片的研发,以及基于此的解决方案。征程系列芯片是由地平线自主研发的,主要面向汽车智能驾驶领域,包括辅助驾驶、自动驾驶等应用场景。

    这些芯片设计用于处理复杂的人工智能任务,具备高性能、低功耗的特点,代表了中国在车规级AI芯片领域的自主研发成果。尤其是在ZM关系日益复杂的今天,“自主研发”显得尤为重要!

    在本篇正式开始前,首先我要吐槽下地平线没有类似NVIDIA的developer zone,也找不到一些公开的技术手册。本文的信息大部分基于公开演讲提取、整理出来,部分插图质量会非常差,请谅解。

    1. BPU

    在开始介绍整体SoC产品之前我想先聊聊地平线的独门秘技——BPU(Brain Processing Unit):

    1.1 BPU介绍

    BPU是由地平线提出的一种专门为人工智能应用设计的处理器架构,特别聚焦于深度神经网络的高效计算。它是地平线在嵌入式人工智能领域的重要技术创新,旨在解决传统处理器在处理大规模并行计算任务时的效率问题,特别是在图像识别、语音处理、自然语言理解和控制等领域。

    1.2 BPU架构理念

    高度优化的AI计算引擎:BPU设计的核心是为深度学习算法量身定制,通过优化的硬件加速器实现卷积神经网络(CNN)、循环神经网络(RNN)、Transformer等复杂神经网络模型的快速计算。这使得在有限的功耗和成本下,能够达到更高的计算效率和性能。

    软硬件协同优化:地平线在开发BPU时强调软硬件的深度整合,确保算法、编译器和硬件架构三者之间的紧密配合。通过这种协同,BPU能够更好地适应不断发展的深度学习算法,实现算法效率和硬件效率的双重提升。

    1.3 BPU迭代发展

    高斯架构:第一代BPU架构,标志着地平线在嵌入式人工智能领域的重大突破。这一架构专注于提升深度学习算法在边缘设备上的运行效率(地平线一直很注重芯片能效比),以及视觉处理性能。

    伯努利架构:第二代BPU架构,应用于征程2和征程3等芯片中,以其性价比、灵活性和可靠性获得了广泛应用。

    贝叶斯架构:第三代BPU架构,用于征程5芯片,这是全球少数实现量产的大算力智能驾驶芯片之一,专为高等级智能驾驶设计,展现了强大的数据处理和实时决策能力。

    纳什架构:第四代BPU架构,进一步优化了深度学习加速计算,尤其擅长处理大规模参数的Transformer模型,强化了对自动驾驶场景的支持,提升了能效比和计算密度,征程6即采用了这一架构。

    2. 地平线征程系列产品

    2.1 征程2系列

    征程2系列是地平线推出的首款车规级AI芯片,搭载伯努利1.0 BPU,标志着中国在车载AI芯片领域的突破。适用于高级辅助驾驶(ADAS)、智能座舱等场景,支持基于深度学习的图像处理、识别等功能。

    2.2 征程3系列

    基于自研的BPU伯努利2.0架构,专为高级辅助驾驶设计,高效能且应用广泛。支持深度学习的图像检测、分类、像素级分割,以及视频编码,实现自动泊车辅助等功能。理想ONE 2021款搭载征程3芯片,实现了导航辅助驾驶功能。

    2.3 征程5系列

    提供强大的计算能力,足以满足未来几年内智能汽车行业的发展需求。支持更复杂的自动驾驶功能,如NOA(Navigate on Autopilot)功能,已在理想汽车的L系列车型中应用。除了理想汽车,还有其他多家汽车厂商合作,展示了其在高级别自动驾驶领域的实力。

    2.4 征程6系列

    于2024年4月刚刚正式发布,预计同年第四季度完成首批量产车型交付。旗舰产品算力高达560 TOPS,是业界首款覆盖从低到高全阶智能驾驶需求的车载智能计算方案。采用第四代BPU架构“纳什”,专为大规模参数的Transformer模型和高级智能驾驶优化。与比亚迪、理想汽车等十家主流车企达成合作,加速智能驾驶平权,引领未来出行。本文也将重点针对征程6系列产品进行说明。

    2.5 综合特点

    统一架构:征程系列采用统一的硬件架构、工具链和软件栈,便于开发和维护,支持跨代兼容。

    高效能低功耗:设计注重能效比,适合车载环境的严苛要求。

    广泛生态:构建了开放的生态系统,促进软硬件生态伙伴的合作,加速智能驾驶的商业化落地。

    3. 征程6介绍

    与以往征程系列前几代产品不同的是,征程6(我们业内称为J6,“钩6”)并不是一款芯片,而是根据算力大小,分成了J6B/J6L/J6E/J6M/J6H/J6P 6款!

    3.1 J6P芯片参数

    CPU:18核心的ARM Cortex-A78AE,算力是410K DMIPS

    BPU:如上文介绍,采用了纳什架构第四代BPU,560TOPS算力(注意上图左下角的一行小字:560TOPS算力是等效1/2稀疏网络下的算力,必须严谨!)

    算法支持:对Transformer算法的支持效率在业内领先,同时支持大规模交互式博弈等前沿算法,表明其在处理复杂AI任务上的优越性能。

    功能安全:通过ISO 26262 ASIL-D功能安全流程认证,主动安全AEB ASIL-B产品级功能安全认证

    关于J6的GPU和MCU目前没有获取相关参数,公开后我会再补充。

    3.2 四芯合一的芯片架构

    J6芯片所实现的“四芯合一”是指将以下四种关键处理单元集成在同一颗系统级芯片SoC上:

    1. CPU(Central Processing Unit):负责通用计算任务,处理非特定的计算工作负载,是芯片的控制中心,执行操作系统的指令和应用程序的逻辑控制。

    2. BPU(Brain Processing Unit):地平线自主研发的神经网络处理单元,专门针对人工智能算法和深度学习任务进行了优化,如图像识别、自然语言处理等,是实现智能驾驶核心算法的关键。

    3. GPU(Graphics Processing Unit):图形处理器,除了传统意义上的图形渲染,现代GPU也广泛用于并行计算,特别是在机器视觉、环境感知等需要大量并行处理的场景中。

    4. MCU(Microcontroller Unit):微控制器单元,常用于实现嵌入式控制功能,具有功能全、体积小、集成度高等特点。在J6中,MCU被集成用以处理功能安全相关的任务,确保系统的可靠性。

    这种高集成度的设计不仅提升了系统性能,还显著提高了性价比,降低了部署难度,使得单颗征程6芯片就能够支持包括感知、规划决策、控制、座舱感知等在内的全栈计算任务,适用于多种智能驾驶应用场景。

    这种多合一实际上就是SIP(System in Package),SIP技术是一种先进的半导体封装技术,它允许将多种功能芯片、元器件(如处理器、存储器、传感器、RF组件等)以及被动元件(如电阻、电容)集成在一个封装内部,形成一个具有完整或部分系统功能的封装模块。与传统的单一封装只包含一个主要芯片(如SoC)不同,SIP技术通过并排排列、堆叠或采用3D封装等方法,将多个独立的芯片和组件紧密集成,从而实现了更高的集成度和更小的封装尺寸。

    总结:本文介绍了地平线公司自动驾驶SoC芯片,尤其是征程系列J6芯片。但是由于地平线的公开信息实在较少,本文仅能基于较少已有信息进行说明,后续如有进一步的公开信息,我会再补充本文内容。

  • 相关阅读:
    【CFD小工坊】学习二维浅水方程基础理论,从零开始编译计算水力学代码
    cannot access ‘/docker-entrypoint-initdb.d/‘: Operation not permitted
    vue用vite配置代理解决跨域问题(target、rewrite和changeOrigin的使用场景)
    外贸案例分享:我是这样“教”客户做事的!
    微内核操作系统
    冒泡排序实现
    减小windows或linux虚拟机导出ova体积大小
    【Ubuntu】100 系统字体安装和更改
    软件测试面试百问:如何测试App性能?
    视频批注软件哪个好用 分秒帧在线批注怎么用
  • 原文地址:https://blog.csdn.net/m0_49963403/article/details/139373284