本文来解读华为的《昇腾计算产业发展白皮书》,跟踪一下国内AI行业的宏观动态。
1.AI发展趋势和挑战
1.1.AI发展趋势
白皮书首先阐述了AI发展趋势:
- AI已成为推动社会发展的关键引擎:
- AI在诸多特定领域超过人类能力。如:计算机视觉、语音识别、自然语言处理领域。
- AI将助力各产业实现智能化转型升级。根据弗若斯特沙利文数据,2019年中国AI市场规模为598.6亿元,2020~2024年复合增长率达34.8%。
- AI处于爆发式创新的前夜:
- 联接、AI、云、计算、行业应用等多种先进技术和机会将会互相催化、有机融合。
1.2.AI产业挑战
白皮书再阐述了AI产业的挑战:
- 计算系统要满足AI场景的复杂巨大、多样性的计算需求。
- 算力增速快:2012~2018年,算力需求增加30万倍,远超摩尔定律。大语言模型时代,算力需求从TFLOPS级别,增至PFLOPS级别,甚至EFLOPS级别。
- 计算架构设计面临挑战:大规模算力需求,对计算系统的计算性能、通信性能、可扩展性是巨大的挑战。
- 全方位面临挑战:基础软件、编程模型、编程语言、编译器、工具链、大规模运行时、调度系统、平台软件、通信组件、加速组件、加速引擎、AI框架、行业软件,都需要适配大规模算力需求。
- 参考:https://openai.com/research/ai-and-compute
- 从算法到产品化落地面临8大鸿沟:
- 模型获取鸿沟:针对行业数据,选择、测试合适地模型,需要巨大的时间成本和算力成本。
- 数据准备鸿沟:构建能够真实反映实际业务数据分布的数据集,面临较大挑战。
- 模型训练鸿沟:超参数调优等模型训练环节,对大量传统行业开发者挡在AI门外。
- 准确度验证鸿沟:模型泛化能力的验证,是阻碍算法快速落地的因素之一。
- 应用开发鸿沟:AI需要接受包含行业知识的各种输入数据,对AI应用开发系统产生整合要求,开发效率是重要影响因素之一。
- NPU性能鸿沟:AI算力真正转化为行业生产率,实际的运行性能将决定系统最终的性价比和业务执行能力。
- 业务流程监控鸿沟:确保AI系统在业务环境的持续准确运行,是行业应用的重中之重。AI算法需要具备持续更新、增量学习的能力。
- 适配开发鸿沟:面对不同业务场景,需要以服务化和API形式封装AI算法,封装AI服务、部署AI服务于复杂的计算系统上,都将面临挑战。
可信AI:
- AI具有自我演化潜力:人类对于AI核心运行机制、AI隐式编程、学习能力,依然没有彻底研究清楚。
- 可信AI是大规模商用的基础:保护隐私、避免偏见、防止滥用、可靠边界、可解释、鲁棒性、防攻击等方面,都是AI能够真正大规模应用的挑战。
人才需求:
- AI人才缺口巨大:中国AI人才缺口500万,供求比1:10。
- 与美国差距巨大:中国的AI人才数量仅为美国四分之一。
- 新一代AI发展规划:国务院《新一代AI发展规划》发布,明确指出建立AI高端人才队伍是AI发展重中之重。
2.昇腾计算产业
2.1.昇腾计算产业体系和定位
- 昇腾计算产业覆盖全产业链,全生态链,包括:昇腾处理器、硬件、CANN(Compute Architecture for Neural Networks,异构计算架构)、AI计算框架、应用使能、开发工具链、运维工具、行业应用及服务。
- 昇腾计算硬件体系包括:
- 基于达芬奇内核的昇腾系列芯片,提供多样化AI算力。
- 基于昇腾系列芯片的硬件产品,如嵌入式模组、板卡、小站、服务器、集群等。
- 昇腾计算软件体系包括:
- 异构计算架构CANN,对标CUDA。
- AI计算框架MindSpore,对标Pytorch。
- 工具链:运行时、加速库、编译器、调试调优工具、开发工具链MindStudio及运维工具。
- 昇腾应用使能:基于MindX支撑的ModelArts、HiAI等。
2.2.昇腾计算产业价值
- 硬件开放、软件开元、使能合作伙伴是华为构建昇腾生态的方式。
- 华为聚焦AI芯片、基础软件的创新与研发。
- 自有硬件+伙伴硬件,为客户提供多样化算力选择。
- 昇腾通过模组、板卡、小站、服务器、集群等产品形态,打造"端、边、云"的全场景AI基础设施解决方案。
- 昇腾计算产业的三个愿景:
- 用得起
- 用得好
- 用得放心:特指某国的芯片封锁吧。。。
3.昇腾计算技术体系
3.1.昇腾计算架构
下图展开了昇腾计算架构细节,从架构中可以看出:
- 昇腾计算架构支持端边云全场景。
- 超强算力:Atlas训练卡提供320 TFLOPS FP16高算力,Atlas集群提供1024P FLOPS算力。
- 全站开放,模块间具备相互协同能力、各层之间支持独立演进。
- MindX将设备资源、算力资源抽象并管理,应用软件无需了解底层硬件的复杂配置和调度。
3.2.硬件体系
- 昇腾系列处理器:NPU针对矩阵运算进行专门优化设计,华为达芬奇架构面向AI计算设计的架构,独创161616的3D Cube设计。
- 模组和板卡:Atlas 200加速模块、Atlas 300推理卡、Atlas 900。
- 小站:基于昇腾系列处理器的边缘计算盒子。
- 服务器:Atlas 800、Atlas500。
- 集群:Atlas 900。
3.3.基础软件
- 异构计算架构:
- CANN支持10种设备形态、EMUI、Android、openEuler、UOS、Ubuntu、Debian、Suse等14种操作系统和AI计算框架。
- CANN是一个开发体系,包含了编程语言、编译器等编程模型。
- CANN包含4层:
- Driver实现硬件和操作系统的适配。
- Runtime、DVPP、HCCL提供内存管理、算力分配、资源调度。其中,HCCL,Huawei Collective Communication Library,华为集合通信库,提供板间和框间通信能力。
- 图引擎实现了大计算图拆分、图融合,最大化芯片算力利用率。
- AscendCL提供插件适配、开放图融合接口、支持自定义算子融合、提供Ascend IR中间表达接口、支持自定义模型、开放预置算子库。
- CANN提供两种算子开发方式,
- 一种是TBE-DSL(Tensor Boost Engine-Domain Specific Language),实现数据切分和调度。
- 一种是TBE-TIK(Tensor Iterator Kernel),通过指令级编程,实现数据编排、计算表达。
开发工具链MindStudio,提供工程管理、编译、调试、运行、性能分析等全流程开发。
AI计算框架MindSpore,提供动静态图转换、自动并行、端边云协同能力。
应用使能的核心是MindX DL和MindX Edge,封装了底层硬件、算子的协同调度能力。
- MindX DL架构图:
- MindX Edge架构图:
4.行业实践
白皮书在本章节阐述了基于昇腾计算,构建的各行各业的解决方案:
- AI计算中心
- 互联网
- 制造
- 机器人
- 能源
- 金融
- 平安城市
- 电信
- 交通
- 医疗
这里展开3个行业解决方案:
- 计算中心解决方案:从解决方案看,昇腾计算覆盖了AI芯片、AI驱动,是AI最核心的基础设施,完全国产化,很牛。
- 工业解决方案:针对半导体晶圆质检,基于昇腾强大算力,实现工业领域的目标定位、测量、质检等能力。这一点真正突破了AI在工业领域落地的,很牛。
- 交通解决方案:
- 高速自由流收费稽核
- 交通视频云
5.产业生态
在产业政策方面:
- 昇腾与各地政府共建昇腾生态创新中心
- 通过行业联盟聚拢厂家、ISV、用户,建立各行业标杆。
在开发者方面:
- 90%的开发者聚焦于基于AI算法的应用软件开发。
- 10%的开发者聚焦AI算法、AI驱动的开发。
在高校培养方面:
- 昇腾与高校共建AI人才培养基地,与各高校推出昇腾计算体系课程与教材。
在合作伙伴方面:
- 昇腾推出覆盖软件开发商、硬件开发商、云服务供应商、设备制造商等各类合作伙伴计划,华为为合作伙伴提供了资金+市场。
6.未来展望:昇腾推动AI成为通用目的技术
引用白皮书中的一段话:把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界。
昇腾计算产业的愿景是作为中国的AI基石,AI的基础设施,成为通用目的技术。
7.总结
当我第一次看到昇腾的AI芯片层,CANN对标CUDA,无比惊讶、激动、自豪,这可是对标英伟达的大事,技术难度、商业难度都不可想象。
昇腾计算已雏形初见,这可不是短期突击出来的。不得不说,华为在AI领域的持续投资令人钦佩!