本文来解读华为的《昇腾计算产业发展白皮书》,跟踪一下国内AI行业的宏观动态。

image-20230912224057905

1.AI发展趋势和挑战

1.1.AI发展趋势

白皮书首先阐述了AI发展趋势:

  • AI已成为推动社会发展的关键引擎
    • AI在诸多特定领域超过人类能力。如:计算机视觉、语音识别、自然语言处理领域。
    • AI将助力各产业实现智能化转型升级。根据弗若斯特沙利文数据,2019年中国AI市场规模为598.6亿元,2020~2024年复合增长率达34.8%。
  • AI处于爆发式创新的前夜
    • 联接、AI、云、计算、行业应用等多种先进技术和机会将会互相催化、有机融合。

1.2.AI产业挑战

白皮书再阐述了AI产业的挑战:

  • 计算系统要满足AI场景的复杂巨大、多样性的计算需求
    • 算力增速快:2012~2018年,算力需求增加30万倍,远超摩尔定律。大语言模型时代,算力需求从TFLOPS级别,增至PFLOPS级别,甚至EFLOPS级别。
    • 计算架构设计面临挑战:大规模算力需求,对计算系统的计算性能、通信性能、可扩展性是巨大的挑战。
    • 全方位面临挑战:基础软件、编程模型、编程语言、编译器、工具链、大规模运行时、调度系统、平台软件、通信组件、加速组件、加速引擎、AI框架、行业软件,都需要适配大规模算力需求。
    • 参考:https://openai.com/research/ai-and-compute

ai-and-compute-all

  • 从算法到产品化落地面临8大鸿沟:
    • 模型获取鸿沟:针对行业数据,选择、测试合适地模型,需要巨大的时间成本和算力成本。
    • 数据准备鸿沟:构建能够真实反映实际业务数据分布的数据集,面临较大挑战。
    • 模型训练鸿沟:超参数调优等模型训练环节,对大量传统行业开发者挡在AI门外。
    • 准确度验证鸿沟:模型泛化能力的验证,是阻碍算法快速落地的因素之一。
    • 应用开发鸿沟:AI需要接受包含行业知识的各种输入数据,对AI应用开发系统产生整合要求,开发效率是重要影响因素之一。
    • NPU性能鸿沟:AI算力真正转化为行业生产率,实际的运行性能将决定系统最终的性价比和业务执行能力。
    • 业务流程监控鸿沟:确保AI系统在业务环境的持续准确运行,是行业应用的重中之重。AI算法需要具备持续更新、增量学习的能力
    • 适配开发鸿沟:面对不同业务场景,需要以服务化和API形式封装AI算法,封装AI服务、部署AI服务于复杂的计算系统上,都将面临挑战。

image-20230912232100695

  • 可信AI

    • AI具有自我演化潜力:人类对于AI核心运行机制、AI隐式编程、学习能力,依然没有彻底研究清楚。
    • 可信AI是大规模商用的基础:保护隐私、避免偏见、防止滥用、可靠边界、可解释、鲁棒性、防攻击等方面,都是AI能够真正大规模应用的挑战。
  • 人才需求

    • AI人才缺口巨大:中国AI人才缺口500万,供求比1:10。
    • 与美国差距巨大:中国的AI人才数量仅为美国四分之一。
    • 新一代AI发展规划:国务院《新一代AI发展规划》发布,明确指出建立AI高端人才队伍是AI发展重中之重。

2.昇腾计算产业

2.1.昇腾计算产业体系和定位

  • 昇腾计算产业覆盖全产业链,全生态链,包括:昇腾处理器、硬件、CANN(Compute Architecture for Neural Networks,异构计算架构)、AI计算框架、应用使能、开发工具链、运维工具、行业应用及服务。
  • 昇腾计算硬件体系包括:
    • 基于达芬奇内核的昇腾系列芯片,提供多样化AI算力。
    • 基于昇腾系列芯片的硬件产品,如嵌入式模组、板卡、小站、服务器、集群等。
  • 昇腾计算软件体系包括:
    • 异构计算架构CANN,对标CUDA。
    • AI计算框架MindSpore,对标Pytorch。
    • 工具链:运行时、加速库、编译器、调试调优工具、开发工具链MindStudio及运维工具。
  • 昇腾应用使能:基于MindX支撑的ModelArts、HiAI等。

image-20230912234104109

2.2.昇腾计算产业价值

  • 硬件开放、软件开元、使能合作伙伴是华为构建昇腾生态的方式。
  • 华为聚焦AI芯片、基础软件的创新与研发。
  • 自有硬件+伙伴硬件,为客户提供多样化算力选择。
  • 昇腾通过模组、板卡、小站、服务器、集群等产品形态,打造"端、边、云"的全场景AI基础设施解决方案
  • 昇腾计算产业的三个愿景:
    • 用得起
    • 用得好
    • 用得放心:特指某国的芯片封锁吧。。。

3.昇腾计算技术体系

3.1.昇腾计算架构

下图展开了昇腾计算架构细节,从架构中可以看出:

  • 昇腾计算架构支持端边云全场景。
  • 超强算力:Atlas训练卡提供320 TFLOPS FP16高算力,Atlas集群提供1024P FLOPS算力。
  • 全站开放,模块间具备相互协同能力、各层之间支持独立演进。
  • MindX将设备资源、算力资源抽象并管理,应用软件无需了解底层硬件的复杂配置和调度。

image-20230912235737889

3.2.硬件体系

  • 昇腾系列处理器:NPU针对矩阵运算进行专门优化设计,华为达芬奇架构面向AI计算设计的架构,独创161616的3D Cube设计。
  • 模组和板卡:Atlas 200加速模块、Atlas 300推理卡、Atlas 900。
  • 小站:基于昇腾系列处理器的边缘计算盒子。
  • 服务器:Atlas 800、Atlas500。
  • 集群:Atlas 900。

3.3.基础软件

  • 异构计算架构
    • CANN支持10种设备形态、EMUI、Android、openEuler、UOS、Ubuntu、Debian、Suse等14种操作系统和AI计算框架。
    • CANN是一个开发体系,包含了编程语言、编译器等编程模型。
    • CANN包含4层:
      • Driver实现硬件和操作系统的适配。
      • Runtime、DVPP、HCCL提供内存管理、算力分配、资源调度。其中,HCCL,Huawei Collective Communication Library,华为集合通信库,提供板间和框间通信能力。
      • 图引擎实现了大计算图拆分、图融合,最大化芯片算力利用率。
      • AscendCL提供插件适配、开放图融合接口、支持自定义算子融合、提供Ascend IR中间表达接口、支持自定义模型、开放预置算子库。
    • CANN提供两种算子开发方式,
      • 一种是TBE-DSL(Tensor Boost Engine-Domain Specific Language),实现数据切分和调度。
      • 一种是TBE-TIK(Tensor Iterator Kernel),通过指令级编程,实现数据编排、计算表达。

image-20230913000935774

  • 开发工具链MindStudio,提供工程管理、编译、调试、运行、性能分析等全流程开发。

  • AI计算框架MindSpore,提供动静态图转换、自动并行、端边云协同能力。

  • 应用使能的核心是MindX DL和MindX Edge,封装了底层硬件、算子的协同调度能力。

    • MindX DL架构图:
    • image-20230913001119293
    • MindX Edge架构图:
    • image-20230913001132605

4.行业实践

白皮书在本章节阐述了基于昇腾计算,构建的各行各业的解决方案:

  • AI计算中心
  • 互联网
  • 制造
  • 机器人
  • 能源
  • 金融
  • 平安城市
  • 电信
  • 交通
  • 医疗

这里展开3个行业解决方案:

  • 计算中心解决方案:从解决方案看,昇腾计算覆盖了AI芯片、AI驱动,是AI最核心的基础设施,完全国产化,很牛。
    • image-20230913004001231
  • 工业解决方案:针对半导体晶圆质检,基于昇腾强大算力,实现工业领域的目标定位、测量、质检等能力。这一点真正突破了AI在工业领域落地的,很牛。
    • image-20230913004208756
  • 交通解决方案:
    • 高速自由流收费稽核
    • 交通视频云

5.产业生态

在产业政策方面:

  • 昇腾与各地政府共建昇腾生态创新中心
  • 通过行业联盟聚拢厂家、ISV、用户,建立各行业标杆。

在开发者方面:

  • 90%的开发者聚焦于基于AI算法的应用软件开发。
  • 10%的开发者聚焦AI算法、AI驱动的开发。

image-20230913004825461

在高校培养方面:

  • 昇腾与高校共建AI人才培养基地,与各高校推出昇腾计算体系课程与教材。

image-20230913005027655

在合作伙伴方面:

  • 昇腾推出覆盖软件开发商、硬件开发商、云服务供应商、设备制造商等各类合作伙伴计划,华为为合作伙伴提供了资金+市场。

image-20230913005123533

6.未来展望:昇腾推动AI成为通用目的技术

引用白皮书中的一段话:把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界

昇腾计算产业的愿景是作为中国的AI基石,AI的基础设施,成为通用目的技术。

7.总结

当我第一次看到昇腾的AI芯片层,CANN对标CUDA,无比惊讶、激动、自豪,这可是对标英伟达的大事,技术难度、商业难度都不可想象。

昇腾计算已雏形初见,这可不是短期突击出来的。不得不说,华为在AI领域的持续投资令人钦佩!