1 AI 芯片——人工智能的基石
1.1 AI 大模型推动算力需求爆发
AI 已经进入了“大模型”时代。自 2018 年 GPT-1.0 模型首次发布以来,OpenAI 不断迭代模型,最近发布了 GPT-4.0 模型,它拥有更大的参数量、更长的迭代时 间和更高的准确性。随着人工智能的快速发展,算力的提升也被加速推动。人工 智能非常依赖于相关基础设施,包括计算、储存和网络等。随着数据不断增长和 算法复杂度提高,人工智能对计算力提出了更高的要求。全球人工智能算力基础 设施产业正在加速发展,为人工智能技术在更广泛场景中落地创造可能。
释放算力的价值对国家整体经济发展将发挥推动作用。计算力指数每提高 1 点,数字经济和 GDP 将分别增长 3.5‰和 1.8‰。可见,国家计算力指数越高, 对经济的拉动作用越强。在业界,人工智能的应用产生了很多需求,其中最直接 的赛道是企业数字化转型。据 IDC 统计,全球范围内,企业在人工智能(AI)市 场的技术投资从 2019 年的 612.4 亿美元增长至 2021 年的 924.0 亿美元,预计到 2022 年(同比)将增长 26.6%至 1,170.0 亿美元,并有望到 2025 年突破 2,000 亿美元,增幅高于企业数字化转型(DX)支出整体增幅。
中国的智能算力规模正在快速增长。算力是实现人工智能产业化的核心力量, 其发展对人工智能技术的进步和行业应用起着决定性作用。随着人工智能向多场 景化、规模化、融合化等高应用阶段发展,数据体量呈现出急剧增长态势,算法模型的参数量也呈指数级增加,以加速计算为核心的算力中心规模将不断扩大。在科技兴国政策驱动下,人工智能在提升中国核心竞争力的重要支撑作用得以确 立。结合新基建、数字经济等利好政策,中国人工智能市场稳中有进,凸显在数 字经济时代中技术的力量。据 IDC 预测,到 2022 年,中国的智能算力规模将达 到 268.0 EFLOPS,超过通用算力规模。预计到 2026 年,智能算力规模将进入 ZFLOPS 级别,达到 1,271.4 EFLOPS。在 2021-2026 年期间,中国的智能算力规 模年复合增长率预计将达到 52.3%,而同期通用算力规模的年复合增长率为 18.5%。根据《IDC 中国服务器市场季度跟踪报告》及 CPU 双精度(FP64)运算能 力数据,测算了中国通用算力规模。2021 年中国通用算力规模达 47.7EFLOPS, 预计到 2026 年通用算力规模将达到 111.3 EFLOPS。2021-2026 年期间,预计中 国智能算力规模年复合增长率达 52.3%,同期通用算力规模年复合增长率为 18.5%。
中国人工智能的发展正在向城市覆盖面更广泛的地区扩展。未来预计将涌现 出更多具有城市特色的人工智能示范区,为产业发展树立标杆。根据 2022 年中 国人工智能城市排行榜显示,北京排名第一,杭州、深圳、上海和广州分别位居 第二到第五名,这些城市均为发展较好、经济水平高的一、二线城市,而天津、 成都和南京等城市则进入了前十名。不同地区都在提升城市算力基础设施水平的 同时,也推动产业智能化的发展以适应自身的发展需求。
1.2 高算力需求催生 AI 芯片兴起
面向人工智能领域的芯片均被称为 AI 芯片。广义而言,AI 芯片指的是专门 用于处理人工智能应用中大量计算任务的模块,除了以 GPU、FPGA、ASIC 为代表 的 AI 加速芯片,还有比较前沿性的研究,例如:类脑芯片、可重构通用 AI 芯片 等。狭义的 AI 芯片指的是针对人工智能算法做了特殊加速设计的芯片。“无芯片 不 AI”,以 AI 芯片为载体实现的算力是人工智能发展水平的重要衡量标准,发展 更注重超速运算能力的 AI 芯片成为推动人工智能产业爆发的关键核心要素之一, 其快速发展对人工智能技术的进步和行业应用起到了决定性的作用。
AI 芯片的兴起源于 AI 对算力的高需求。算力是实现 AI 产业化的核心力量, 随着人工智能应用场景的不断拓展和数据规模的急剧增长,算法模型的参数量呈 指数级增加,特别是深度学习成为当前 AI 研究和运用的主流方式,加速计算成 为不可或缺的需求。虽然 CPU 可以拿来执行 AI 算法,但因为内部有大量其他逻 辑,而这些逻辑对于目前的 AI 算法来说是完全用不上的,所以,使用 CPU 并不 能达到最优的性价比。因此,AI 芯片应运而生,它们被设计出来适配海量并行计 算能力,进而可以加速 AI 计算。
AI 芯片的维度。以部署位置(云端、终端)和承担任务(训练、推理)为横 纵坐标,可以清晰的划分出 AI 芯片的市场领域。根据部署的位置不同,AI 芯片可以分为:云 AI 芯片、端 AI 芯片。云端即数 据中心,在深度学习的训练阶段需要极大的数据量和大运算量,单一处理器无法 独立完成,因此训练环节只能在云端实现。云 AI 芯片的特点是性能强大、能够 同时支持大量运算、并且能够灵活地支持图片、语音、视频等不同 AI 应用。基于云 AI 芯片的技术,能够让各种智能设备和云端服务器进行快速的连接,并且 连接能够保持最大的稳定。终端即手机、安防摄像头、汽车、智能家居设备、各 种 IoT 设备等执行边缘计算的智能设备。终端的数量庞大,而且需求差异较大。端 AI 芯片的特点是体积小、耗电少,而且性能不需要特别强大,通常只需要支 持一两种 AI 能力。
根据承担任务的不同,AI 芯片可以分成:训练芯片、推理芯片。训练芯片主 要用于构建神经网络模型,即用大量标记过的数据来“训练”相应的系统,使之可 以适应特定的功能。训练需要极高的计算性能,需要较高的精度,需要能处理海 量的数据,需要有一定的通用性,以便完成各种各样的学习任务。对于训练芯片 来说,更注重绝对的计算能力;推理芯片主要用于利用神经网络模型进行推理预 测,指利用训练好的模型,使用新数据推理出各种结论。即借助现有神经网络模 型进行运算, 利用新的输入数据来一次性获得正确结论的过程。推断芯片更注 重综合指标,需要全面考虑单位能耗算力、时延、成本等等。以部署位置(云端、 终端)和承担任务(训练、推理)为横纵坐标,可以清晰的划分出 AI 芯片的市 场领域。
1.3 GPU 为当前 AI 芯片领导者
在短期中,GPU 仍延续 AI 芯片的领导地位,FPGA 增长较快。GPU 短期将延 续 AI 芯片的领导地位。目前 GPU 是市场上用于 AI 计算最成熟应用最广泛的通用型芯片,在算法技术和应用层次尚浅时期,GPU 由于其强大的计算能力、较低的 研发成本和通用性将继续占领 AI 芯片的主要市场份额。在长期中,三大技术路线互补,会长期并存。GPU 因为高性能计算能力较 强,在设计方面通用性强,可以高效完成不同调用需求,适合主攻高级复杂算法 和通用型人工智能平台;FPGA 受益于独一无二的灵活优势,适用于变化多的垂直 细分行业,开发周期远小于设计一款通用芯片;ASIC 芯片则是全定制芯片,长远 看适用于人工智能,因为算法复杂度越强,越需要一套专用的芯片架构与之对应。在未来,当人工智能技术、平台和终端的发展达到足够成熟度,人工智能应用的 普及程使得专用芯片能够达到量产水平,此时 ASIC 芯片的发展将更上一层楼。
第一波人工智能浪潮是基于 ASIC(专用集成电路)架构。在算法稳定的 情况下,专用芯片的性能和功耗优势显而易见,能够满足企业对极致算力和能效 的需求。然而,下游 AI 算法的演进速度远远超过了人们的想象。专用芯片在特 定场景下能够实现更高的算力和能效,但难以适应算法种类快速增加和迭代速度 的情况。因此,通用性更强的 GPGPU(通用图形处理器)长期是 AI 芯片的首选。
第二波浪潮中主流技术路径是 GPGPU(通用 GPU)。国内初创公司集中于 2017 年-2020 年期间启动自研 GPGPU 芯片的研发。由于 GPGPU 难解高功耗与低算 力利用率问题,ASIC 和 GPGPU 在应对生成式 AI 及大模型正对算力基础设施提出 的新要求时都显得有些捉襟见肘。
第三波浪潮的基础是存算一体等新兴技术。不同于 ASIC 与 GPGPU,这些 新兴技术路线跳出了冯·诺依曼架构体系,理论上拥有得天独厚的高能效比优势, 又能绕过先进制程封锁,兼顾更强通用性与更高性价比,算力发展空间巨大。随 着新型存储器件走向量产,存算一体 AI 芯片已经挺进 AI 大算力芯片落地竞赛。
全球人工智能芯片市场高速增长。由 IDC 预计,到 2025 年人工智能芯片市 场规模将达 726 亿美元。人工智能芯片搭载率(attach rate)将持续增高,目 前每台人工智能服务器上普遍多配置 2 个 GPU,未来 18 个月,GPU、ASIC 和 FPGA 的搭载率均会上升。IDC 数据显示,2022 年加速服务器市场规模达到 67 亿美元,同比增长 24%。其中 GPU 服务器依然是主导地位,占据 89%的市场份额,达到 60 亿美元。同时 NPU、ASIC 和FPGA等非 GPU加速服务器以同比 12%的增速占有了 11%的市场份额, 达到 7 亿美元。
虽然 NPU、ASIC、FPGA 在市场上的占比相对较低,分别为 9.6%、1.0%、0.4%, 但它们在特定领域的应用和发展潜力不可忽视。随着人工智能技术的不断深入和 应用场景的多样化,AI 芯片市场的竞争和格局也将会不断发生变化。
中国市场呈现出显著的增长趋势。根据市场规模分析,随着越来越多企业将 人工智能应用于终端产品,人工智能芯片的需求快速增长。AI 芯片广泛应用于云 计算、数据中心、边缘计算、消费电子、智能制造、智能驾驶、智能金融及智能 教育等领域。近年来,我国的 AI 芯片行业备受关注,不断涌现出新的生产设计 商,市场规模也不断扩大。据数据显示,2021 年我国 AI 芯片市场规模达到 427 亿元,同比增长 124%。预计到 2023 年,市场规模将进一步扩大至 1206 亿元。
2 突围国外巨头围猎,国产替代初迎曙光
2.1 国内外 AI 芯片差距较大,科技巨头展开布局
决定计算能力的关键是芯片。中美两国人工智能领域的竞争,算法主要看设 计团队的智慧和灵感,双方没什么差距;大数据资源中国占据绝对优势;大数据 分析技术双方相近;但决定人工智能产品表现的关键要素还包括“算力”,通俗 描述就是“运算能力、计算能力”。计算能力是计算机的核心能力,这也是中美 两国在超级计算机领域竞争多年的原因之一。
在 AI 芯片领域,国外芯片巨头占据了大部分市场份额。全球范围内主要布 局人工智能芯片的厂商有 Intel、NVIDIA、Qualcomm、Google 等。无论是在人才 聚集、公司合并等方面,都具有领先优势。特别是美国的巨头企业,凭借着多年 在芯片领域的领先地位,迅速切入 AI 领域并积极布局,目前已经成为该产业的 引领者。此外,在 GPU 和 FPGA 方面,它们更是处于完全垄断地位。
我国 AI 芯片产业起步较晚,技术上与世界先进水平也还存在着较大的差距。国内 AI 芯片市场也较为分散,集中度低。随着数字经济的兴起,人工智能已经 深入渗透到各个行业,特别是在互联网等科技公司中更为普及。这些公司对于计 算机软件技术和存储设备的要求极高,因此对于底层技术的布局和提升更为重视, 尤其是在人工智能芯片领域。国内各科技巨头都在这个领域展开布局。例如,百度于 2011 年成立了昆仑 芯,开始探索芯片领域;阿里巴巴在 2018 年成立了平头哥,专注于 AI 芯片市场。华为一直在人工智能芯片领域进行布局,早在 2017 年就推出了基于神经网络处 理器的 Ascend 芯片,主要面向人工智能推理场景。2019 年,华为又推出了面向 全场景的 Ascend AI 处理器,具有更高的性能和更广泛的适用性,可应用于智能 手机、云计算、自动驾驶等多个领域。此外,华为还推出了 Atlas AI 计算平台, 提供完整的 AI 计算框架,以支持用户进行高效的 AI 开发。华为在人工智能芯片 领域的不断投入和创新,使其成为全球领先的人工智能技术供应商之一。国内 AI 芯片厂商以中小公司为主,多集中于设备端 AI ASIC 的开发,并已有所建树。其 中寒武纪成为全球 AI 芯片领域第一个独角兽初创公司,其 NPU IP 已被应用于全 球首款手机 AI 芯片——麒麟 970。
全球 GPU 领域处于寡头垄断的局面。近年来 GPU 市场由英特尔、英伟达和 AMD 三分天下,其中英特尔的市场占比份额在 60%以上,其次是英伟达和 AMD。英 特尔的身位领先主要得益于在家用机的集成 GPU 芯片市场的绝对主导地位,而在 AI 及高性能计算方面,则英伟达凭借其自身 CUDA 生态占据绝对主导地位。从细 分市场来看,英伟达和 AMD 在独立 GPU 芯片市场基本包揽全场,英特尔占比极 小。
国产 GPU 在性能方面与国际领先水平的差距在加速缩小。在图形渲染 GPU 方 面,景嘉微的 JM9 系列图形处理芯片将支持 OpenGL 4.0、HDMI 2.0 等接口,以及 H.265/4K 60-fps 视频解码。其核心频率至少为 1.5GHz,配备 8GB 显存,浮点 性能约 1.5 TFlops,与英伟达 GeForce GTX 1050 相近。虽然景嘉微的产品与国 际尖端 GPU 存在着极大的差距,但作为一颗由中国企业完全独立研发、采用正向 设计、具有自主知识产权的 GPU,已经有长足的进步。
GPGPU 方面,国内外厂商仍存在较大差距。制程方面,目前 Nvidia 已率 先到达 4nm,国内厂商多集中在 7nm;算力方面,国内厂商大多不支持双精度(FP64) 计算,在单精度(FP32)及定点计算(INT8)方面与国外中端产品持平;生态方 面,与 Nvidia CUDA 的成熟生态相比,差距较为明显。海光 DCU 系列产品以 GPGPU 架构为基础,兼容通用的“类 CUDA”环境以及国际主流商业计算软件和人工智能软 件,对标目前国际主流 NVIDIA A100 产品,海光 DCU 单芯片产品基本能达到其 70%的性能水平,但是公司 DCU 产品的片间互联性能还有较大的提升空间。
FPGA 发展机遇大。与其他 AI 芯片相比,FPGA 芯片开发门槛较高,前期需要 投入大量资源,存在壁垒。全球 FPGA 芯片市场主要由赛灵思和 Altera 针锋相 对,共占据 77%的份额,其中赛灵思以 52%的份额领先。剩下的约 10%的市占率则 由 Lattice 和 Microsemi 瓜分,呈现“两大两小”的格局。中国 FPGA 厂商仍处 于起步阶段,但是随着 5G、AI 产业化带来的巨大需求,国内 FPGA 企业技术有望 不断实现突破,迎来快速成长。
ASIC 国产替代正当时。ASIC 市场未形成垄断,国产厂商仍存在可观的机会 抢占市场。
2.2 人才+资本双驱动,AI 芯片国产化有望加速
美国“卡脖子”加速 AI 芯片国产化。美国从 2018 年开始的反华贸易战和科 技封锁战,以及三年疫情的叠加影响,对我们高科技产业的发展造成了一定的影 响。美国陆续收紧中国获得国际先进芯片的能力,不仅限制中国进口尖端芯片, 还限制中国获得最新的芯片生产工具。同时,在芯片设计制造领域,中国也缺乏 设计软件,先进制程及设备与世界领先水平之间有差距,非常依赖进口。中国在 FPGA、GPU 领域缺乏有竞争力的原创产品,只是基于 FPGA/GPU 做进一步开发,这 主要与我国在芯片领域一直缺乏关键核心自主技术有关,FPGA/GPU 的技术壁垒 已很高,很难有所突破。为了打破以美国为首的国家的技术封锁和制裁,中国对 AI 芯片领域的资源投入不断走高。
人才缺口仍然较大,国家对于教育资源的投入也不断增加。中央及各地方政 府出台了多个人才培养与引进相关政策;在 2018-2021 年,超过 300 所高校开设 了人工智能专业;部分企业也开始与高校进行合作,以产学研合作教学模式共同 培养综合能力突出的优质人才。但是目前来看,相关企业在人才招聘中仍然遇到 阻碍,其中人才缺乏、成本高是主要的问题。根据工信部人才交流中心发布的数 据显示,人工智能不同技术方向岗位的人才供需比均低于 0.4,其中人工智能芯 片岗位人才供需比为 0.32,机器学习、自然语言处理等技术人才供需仅 0.2。当 前,中国数字化的变革方向驱动了底层技术的逐渐提升,国际影响力也在逐年上 涨,同时,在大数据、芯片设计及应用落地方面,逐步建立起了优势地位。产业 发展也吸引更多海外人才回国创业、就业。
中国人工智能芯片市场在政策的引导支持下持续快速发展。芯片产业是信息 产业的核心部件与基石。当前,我国芯片高度依赖进口非常不利于国家安全与行 业发展。因此,近年来国家高度关注人工智能 芯片产业的发展,发布一系列产 业支持政策,为人工智能芯片行业建立了优良的政策环境,促进行业的发展。2021 年,《“十四五”规划纲要和 2035 年远景目标纲要》指出,“十四五”期间,我国新 一代人工智能产业将聚焦高端芯片等关键领域。从 国家战略高度为人工智能芯 片行业建立了优良的政策环境。各地方也根据各自的背景与条件,发布促进和扶 持人工智能产业发展的方案方针。截止 2021 年 9 月,包括北京、天津、上海、 江苏、福建等 20 余省、市、地区发布人工智能相关政策,进一步支持引导人工 智能及芯片产业发展。
资本持续进入 AI 芯片市场,单笔投资投资规模在不断走高。截止 2022 年 1 月,2021 年中国人工智能芯片相关领域融资事件共计 92 起,总金额约 300 亿人 民币。企业方面,中国的科技巨头如百度、阿里巴巴、华为等都在人工智能芯片 领域进行了大量的投资。此外,还涌现出了许多专注于人工智能芯片研发的创业 公司,如寒武纪、Horizon Robotics、Cambricon 等。这些创业公司大多得到了 风险投资机构的支持,如 IDG、高瓴资本、启明创投等。中国的人工智能芯片市 场投资情况非常活跃,政府、企业和风投机构都在加大对人工智能芯片领域的投 入。这也进一步促进了中国人工智能产业的发展和创新。
3 国内 AI 芯片上市公司开启国产替代征程
3.1 海光信息:国产 CPU+DCU 龙头
海光信息主要从事高端 CPU、DCU 等计算芯片产品和系统产品服务。公司成 立于 2014 年,总部设于天津,于 2022 年 8 月在科创板上市。公司核心技术储 备较为雄厚,已经掌握了如高端处理器核心微结构设计、高端处理器 SoC 架构 设计、处理器安全、处理器验证等关键技术。同时,海光信息也建立了完善的高 端处理器研发环境和流程,产品性能逐代提升,综合竞争力较强。
海光 CPU 产品性能在国产 CPU 中较为领先。海光 CPU 系列产品是在 x86 指令 集的基础上建立的,性能优异,生态成熟,安全可靠,得到了下游用户的一致认 可,已经广泛应用于电信、金融、互联网、教育、交通等重要行业。目前,海光CPU 系列产品海光一号、海光二号、海光三号已经实现商业化应用,海光四号、 海光五号处于研发阶段。公司于 2020 年发布的海光 7285CPU 拥有 32 核心、64 线 程、2.0GHz 主频,保证了运算速度;128PCIe 通道保证了带宽,在系统交互方面 具备优势;DDR4 相比 DDR3 在提高传输速度的同时降低功耗。
持续加大研发投入,产品线不断丰富。海光信息秉承“销售一代、验证一代、 研发一代”的产品研发策略,已经建立完善的高端处理器的研发环境和流程,产 品性能逐代提升,功能不断丰富。2022 年,海光信息研发费用为 14.14 亿元,营 收占比高达 27.59%。
3.2 寒武纪:ASIC 路线先行者
寒武纪成立于 2016 年 3 月,致力于打造人工智能领域的核心处理器芯片, 让机器更好地理解和服务人类。寒武纪聚焦云边端一体的智能生态,进行应用于 各类云服务器、边缘计算设备、终端设备中人工智能核心芯片的研发、设计和销 售,为客户提供丰富的芯片产品与系统软件解决方案。寒武纪的主要产品包括终 端智能处理器 IP、云端智能芯片及加速卡、边缘智能芯片及加速卡、配套的基础 系统软件平台等。
产品布局全面覆盖云端、边缘端和终端场景。22 年寒武纪的云端产品线思 元 290、思元 370 等产品成功导入了阿里云等多家头部客户。云端训练新品思元 590 芯片快速迭代中,该芯片浮点运算能力较上一代 290 产品有较大提升,云端 产品线有望更进一步。在上游,寒武纪与 EDA 厂商、晶圆供应商、封测厂商等保 持良好的沟通与互动,保证寒武纪能持续获取最新的技术和最好的服务支持;在 下游,寒武纪与应用生态合作伙伴协同合作,形成一系列解决方案,更好地解决 行业用户的需求,积极实现新客户的拓展。目前公司产品广泛服务于知名芯片设 计公司、服务器厂商和产业公司,辐射互联网、云计算、能源、教育、金融、电 信、交通、医疗等行业的智能化升级。
智能芯片支撑多应用场景。寒武纪面向云端、边缘端、终端推出了三个系列 不同品类的通用型智能芯片与处理器产品,分别为终端智能处理器 IP、云端智能 芯片及加速卡、边缘智能芯片及加速卡。
3.3 景嘉微:军用为基,民用突破
长沙景嘉微电子股份有限公司成立于 2006 年 4 月,业务聚焦于图形显控, 小型专用化雷达领域的核心模块及系统级产品,主要从事高可靠电子产品的研发、 生产和销售。图形显控是公司现有核心业务,也是传统优势业务,小型专用化雷 达和芯片是未来大力发展的业务方向。
公司在军品市场具有较大的竞争优势。公司的军工业务主要分为图形显控领 域产品和小型专用化雷达领域产品。军工行业是行业壁垒较高,先发优势比较明 显的行业。在图形显控模块领域,公司依托自身强大的自主研发力量率先研制出 使中国摆脱外商依赖的 M9 GPU 芯片,此后又研制出基于 M9、M72 和 M96 的系列 开发平台和系列产品线,极大提高了自身在市场上的核心竞争力。在 GPU 研发的 先发优势带动下,其图形显控模块目前在国内机载航电系统图形显控领域占据大 部分市场份额,具有较为强大的竞争优势。
GPU 向信创及民用市场渗透,打破国外芯片的市场垄断。景嘉微研制出的 M9 芯片驱动程序摆脱了机载航电系统对外商的依赖,并且通过 JM5400 为代表的的 图形芯片打破国外芯片在我国军用 GPU 领域的垄断,实现巨农 GPU 国产化。除了 上述军用领域的产品,景嘉微以 JM5400 研发成功为起点,不断研发更为先进且 适用更为广泛的一系列 GPU 芯片。
民用领域不断突破。子公司景美集成是国内首家成功研制国产 GPU 芯片并实 现大规模工程应用的企业。近期,景美 JM9 系列 GPU 与欧拉开源操作系统完成相 互兼容性测试认证,与浩辰 CAD Linux 版 V2023 软件完成产品兼容互认证,意味 着景美 JM9 系列 GPU 的国产适配生态版图进一步扩大。截至目前,景美系列芯片 已完成与飞腾、龙芯、海光、兆芯、鲲鹏、麒麟等国内主要 CPU 和操作系统厂商 的适配工作,支持昆仑、百敖等国产固件,与国内众多主流计算机整机厂商建立 了合作关系。
4 创业公司纷纷入局,与多方建立合作
4.1 沐曦科技
沐曦于 2020 年 9 月成立于上海,致力于为异构计算提供全栈 GPU 芯片及解 决方案,可广泛应用于人工智能、智慧城市、数据中心、云计算、自动驾驶、数 字孪生、元宇宙等前沿领域,为数字经济发展提供强大的算力支撑。打造全栈 GPU 芯片产品,知识产权完全自主。沐曦推出 MXN 系列 GPU(曦思) 用于 AI 推理,MXC 系列 GPU(曦云)用于 AI 训练及通用计算,以及 MXG 系列 GPU (曦彩)用于图形渲染,满足数据中心对“高能效”和“高通用性”的算力需求。沐曦 产品均采用完全自主研发的 GPU IP,拥有完全自主知识产权的指令集和架构,配 以兼容主流 GPU 生态的完整软件栈(MXMACA),具备高能效和高通用性的天然优 势。
4.2 燧原科技
燧原科技正式注册成立于 2018 年,专注人工智能领域云端算力产品,致力 为人工智能产业发展交付普惠的基础设施解决方案,提供全栈自研、具备完全自 主知识产权的通用人工智能训练和推理产品。燧原科技的产品被广泛应用于互联 网、金融、交通、能源及新基建等多个行业和场景。对于不同的使用场景,燧原科技拥有多个与之对应的产品线。云燧 T2X、T1X 系列是人工智能训练加速卡,具有强大性能和可拓展性,面向数据中心的多种场 景;云燧 i2X,i1X 系列则是人工智能推理加速卡,其模型覆盖面广,可广泛应 用于计算机视觉、语音识别与合成、自然语言处理等场景。
4.3 壁仞科技
壁仞科技创立于 2019 年,在 GPU、DSA(专用加速器)和计算机体系结构等 领域具有深厚的技术积累和独到的行业洞见。壁仞科技致力于开发原创性的通用 计算体系,建立高效的软硬件平台,同时在智能计算领域提供一体化的解决方案。从发展路径上,壁仞科技将首先聚焦云端通用智能计算,逐步在人工智能训练和 推理、图形渲染等多个领域赶超现有解决方案,实现国产高端通用智能计算芯片 的突破。
壁仞科技的主要产品是 BR100 系列通用 GPU 芯片。BR100 针对人工智能(AI) 训练、推理,及科学计算等更广泛的通用计算场景开发,主要部署在大型数据中 心,依托“壁立仞”原创架构,可提供高能效、高通用性的加速计算算力。BR100 系 列基于壁仞科技自主原创的芯片架构开发,并结合了包括 Chiplet(芯粒技术) 等在内的多项业内前沿芯片设计、制造与封装技术,并有先进的工艺、接口系统 和互联系统,广泛应用于自然语言处理、图像识别、语音识别等。
4.4 摩尔线程
摩尔线程成立于 2020 年,是一家以全功能 GPU 芯片设计为主的集成电路高 科技公司。其致力于创新面向元计算应用的新一代 GPU,构建融合视觉计算、3D 图形计算、科学计算及人工智能计算的综合计算平台,建立基于云原生 GPU 计算 的生态系统。摩尔线程专注于研发设计全功能 GPU 芯片及相关产品,支持 3D 图形渲染、 AI 训练与推理加速、超高清视频编解码、物理仿真与科学计算等多种组合工作负 载,兼顾算力与算效,能够为中国科技生态合作伙伴提供强大的计算加速能力, 广泛赋能数字经济多个领域。
精彩评论