1、NPU能提高AI算法运行效率
根据观研报告网发布的《中国NPU行业现状深度分析与投资前景研究报告(2025-2032)》显示,NPU即神经网络处理单元,采用专门优化的神经网络计算架构,来处理特定的任务,主要被用于加速计算。通过对NPU硬件层面优化,能高效处理神经网络算法中矩阵乘法、卷积等数学运算。相较于GPU和CPU,NPU在AI计算上性能和能效有了明显提升,用来提高AI算法运行效率。
NPU与GPU区别
特性 |
NPU |
GPU |
设计初衷 |
专用于神经网络计算 |
最初用于图形渲染,现广泛用于通用计算 |
计算能力 |
高效的神经网络推理 |
强大的并行计算能力,主要用于云端 |
灵活性 |
专用硬件,较低的灵活性 |
通用性高,可以编程实现各种计算任务 |
能效比 |
高 |
相对较低 |
典型应用 |
深度学习推理,边缘计算,实时处理 |
图形渲染,深度学习训练和推理,科学计算 |
资料来源:观研天下整理
2、AI算力提升带来NPU行业需求端爆发
NPU专用于AI运算,核心是矩阵乘法运算,CNN是主要算法之一,本质上由大量的乘法累加计算组成。随新AI应用、模型与需求的发展,NPU有望快速上量。根据数据,2020-2024年我国AI算力规模由134.2 EFLOPS增长至725.3 EFLOPS,CAGR为52.5%。
数据来源:观研天下整理
同时,在智能手机上运行端侧生成式AI的AI算力门槛约为30TOPS,旗舰智能机在2021-2022年逐步达到这一标准、且仍在进步,预计2025年将达到60TOPS以上。而生成式AI应用的繁荣,将驱动所需算力的实质性增长。根据相关资料,每天基于生成式AI的搜索查询超过100亿次,其中移动端占比超过60%;智能手机基于精准的端侧用户画像,与大模型结合,伴随对话功能的不断改进,将逐步成为真正的个人助手。
手机厂商内嵌AI大模型概况
手机厂商 |
大模型研发 |
应用进展 |
|
苹果 |
与中国多厂商测试大模型 |
iOS18发布Apple Intelligence大模型(端侧30亿),并积极与OPENAI和谷歌接触 |
宣布年内国行机引入通义大模型 |
华为 |
HarmonyOS4接入盘古大模型 |
HarmonyOSNEXT搭载盘古大模型5.0(端侧15-70亿) |
小艺接入DeepSeek |
三星 |
自研大模型Gauss |
GalaxyZ系列首次引入谷歌GeminiNano大模型(端侧约30亿) |
推出自有生成式多模态AI模型Gauss2;Bixby接入智谱智能AI |
OPPO |
ColorOS14搭载AndesGPT大模型 |
大模型升级为AndesGPT-2.0(端侧70亿) |
宣布折叠旗舰OPPO Find N5接入DeepSeek-R1 |
vivo |
OriginOS4搭载蓝心大模型 |
OriginOS5搭载全新蓝心大模型矩阵(最高端侧跑通130亿参数) |
OriginOS官宣将深度融合满血版DeepSeek |
荣耀 |
逐步开始引入 |
MagicOS9.0支持30亿参数的端侧大语言模型 |
YOYO智能体商店上线DeepSeek-R1尝鲜版 |
资料来源:观研天下整理
3、智驾渗透率提升,驱动更高算力需求,我国NPU行业需求将持续释放
而在智能驾驶方面,以高通智驾系统为例,其感知软件栈和驾驶策略软件栈需始终于本地运行,所以智驾对时延的要求极其严苛,云端无法针对此类工作负载发挥任何作用。高通在2024年末发布的座舱与智驾芯片,应用增强的Hexagon NPU,较此前一代AI算力有大幅提升,且后期可继续通过外挂NPU的方式继续扩展算力。
高通车载NPU芯片参数
类别 |
型号 |
发布年份 |
制程 |
核心数 |
场景 |
座舱 |
骁龙Cockpit Elite(8397) |
2024 |
4nm |
- |
配对Ride Elite |
骁龙SA8295 |
2023 |
5nm |
8 |
/ |
|
骁龙SA8155 |
2021 |
7nm |
8 |
/ |
|
智驾 |
骁龙RideElite(8797)(舱驾一体) |
2024 |
4nm |
- |
针对L2+L3 |
骁龙8650 |
2023 |
4nm |
8 |
已应用于零跑、大疆车载“成行平台”,本田、通用、大众、宝马等预计25-26年逐步搭载。 |
|
骁龙8540 |
2023 |
5nm |
16 |
未量产 |
资料来源:观研天下整理
由此可见,随着智驾解决方案支持GenAI模型,汽车对端侧算力的要求将进一步提升,并且伴随越来越多车企布局智能驾驶市场,我国NPU行业在该领域的需求将持续释放。
各车企智能驾驶布局情况一览
车企 |
产品 |
是否依赖高精地图 |
感知算法/大模型 |
端到端规划 |
城市NOA开城进展(需陆续OTA) |
特斯拉 |
FSD12 |
无需高精地图 |
首个端到端自动驾驶系统 |
(已推送北美所有内部员工)FSDV12可用于北美全地区道路 |
/ |
蔚来 |
NAD |
不依赖高精地图 |
BEV Transformer大模型:0ccupany占用网络 |
实现数据驱动(端到端前置能力)的规划网络 |
覆盖726城 |
理想 |
ADMax3.0 |
不依赖高精地图 |
BEV大模型:0ccupancy占用网络 |
规划算法逐步切换为时空联合规划算法;模块化架构提升为大模型为主的端到端架构 |
覆盖全国 |
小鹏 |
XNGP |
不依赖高精地图 |
基于BEV Transformer的Xnet(24年Xnet2.0具备0ccupancy) |
2024年XNGP+有望实现端到端 |
覆盖全国 |
华为 |
ADS2.0 |
不依赖高精地图 |
Bev Transformer大模型:基于0ccupancy的GOD2.0 |
- |
覆盖全国 |
资料来源:观研天下整理
4、机器人产业进入快速发展期,市场需求驱动NPU行业爆发
NPU在机器人使用广泛,有加速计算、降低系统功耗、实现实时交互和决策等优势。在机器人进行深度学习任务,如语音识别、图像分类、目标跟踪时,NPU能显著加快计算速度,比传统CPU和GPU更高效地处理大量数据。进入2025年,国内多家人形机器人企业相继宣布各自的量产消息,市场需求驱动NPU行业爆发。2025年1月17日,乐聚(深圳)机器人技术有限公司在北汽越野车公司举行了乐聚第100台全尺寸人形机器人交付仪式。该公司表示,乐聚人形机器人已迈入批量交付新阶段。未来如果技术加速突破、成本快速下降,我国人形机器人规模展望千亿元甚至万亿元市场,预计2030年有望达约8700亿元。
数据来源:观研天下整理(WYD)

【版权提示】观研报告网倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至kf@chinabaogao.com,我们将及时沟通与处理。