万物智联时代，RISC-V+AI能否震撼CUDA生态壁垒？-EDN 电子技术设计

 国产AI芯片公司，包括国际上的一些AI芯片公司一般会采用“打不过就加入”的思路，即采用兼容CUDA软件生态，特别是走GPGPU路线的做法；另外一些AI芯片公司走的则是非CUDA路线，整体上呈现“小、散、弱”的局面。

近年来，国产AI芯片公司获得了高速发展，在芯片性能、生态等方面获得了巨大的进步。但同时，我们也要很深刻或者很清醒的认识到，国产AI芯片不仅在硬件算力端，而且在软件生态，特别是面对英伟达CUDA这样一个巨大的生态下，都受到很大的挑战，该怎样进行应对成为了行业十分关注的热点。mWZednc

CUDA生态是2006年英伟达推向市场，经过多年的生态发展，已经拥有450万开发者。这些“CUDA开发者”指的是用CUDA语言和使用CUDA接口的开发者，是一个非常庞大的软件生态大军。mWZednc

北京大学讲席教授、RISC-V国际基金会人工智能与机器学习专委会主席谢涛认为，国产AI芯片公司，包括国际上的一些AI芯片公司一般会采用“打不过就加入”的思路，即采用兼容CUDA软件生态，特别是走GPGPU路线的做法；另外一些AI芯片公司走的则是非CUDA路线，整体上呈现“小、散、弱”的局面。mWZednc

mWZednc

北京大学讲席教授、RISC-V国际基金会人工智能与机器学习专委会主席谢涛mWZednc

“这样的一条道路虽然能够解燃眉之急，但长远来看它还是受制于人。包括：1. 指令集不统一，硬件架构分散；2. 软件栈不统一，用户学习成本高；3. 算子覆盖度低，用户迁移成本高；4. 企业各自为战，没有足够的生态竞争力。”谢涛为此提出，可否借鉴安卓震撼iOS生态的模式来震撼CUDA生态？RISC-V能否成为团结大家一起开源开放去共建生态的一个很有效、而且重要的抓手？mWZednc

孙凝晖在信息技术新体系的思考（中国科学院院刊2022.37）中列举了创新的三种模式：mWZednc

A体系（高铁模式）：我国信息化的主流平台被x86、ARM生态所占领，还光、海思等国产处理器的道路强调‘全兼容’——离了你，我不行；
B体系（北斗模式）：强调全自主，以龙芯和申威为代表，因为不跟市场主流兼容，所以生态弱——离了你、我勉强行；
C体系（5G模式）：走全开放的道路，全世界一起来建生态，谁也不控制谁，谁也不能卡谁。比如：RISC-V——你中有我、我中有你。

谢涛认为，在CUDA相关的AI软件生态下，其实也有“AB体系”可以选择：mWZednc

A体系：加入CUDA阵营（壁仞/阿里平头哥等），研发永远处于“跟随”状态，被人牵着鼻子走、难以绕过大量专利，只能靠开源的编译器规避诉讼虽然容易获得客户，但是反而加强了CUDA生态。英伟达每发布新一代版本CUDA的时候，会加进去会很好发挥新一代英伟达芯片特性特点的API，通过这个手段每次发布新的CUDA版本都能托其它的芯片公司几年。这也是一个可能的风险，哪一天开源编译器也不能用、不能变异非英伟达的AI芯片，这个时候对采用这个路线的企业来说就是一个很大的冲击了。mWZednc

B体系：自定义编程语言（华为昇腾/寒武纪等）。成本高昂：各公司需维护一整套软件工程团队，积累数十年研发投入；人才稀缺：系统软件、编程语言、编译器人才稀缺；力量分散：各公司各自为战，难以形成有效合力与CUDA抗衡。mWZednc

目前RISC-V AI芯片存在两种主要模式：1. Integrated模式（紧耦合）适合低功耗领域（RISC-V+AI），以CPU主干为骨架，集成在CPU内部，共享PC、寄存器堆等流水线单元，只是在执行单元部分增加了矩阵或向量单元。2. Attached模式（松耦合）适合大算力领域（AI+RISC-V），外挂在CPU上的，会有自己独立的流水线、寄存器堆、缓存等。它是“协处理器”，它可以接收来自一个或多个CPU的指令，异步地执行不同CPU提交过来的任务。mWZednc

在谢涛看来，如果基于RISC-V构建AI算力，其优势将主要体现在以下四方面：mWZednc

开放与灵活性。AI工作负载变化快，需要特定的优化才能达到最佳性能；RISC-V开放免费的特性为芯片设计者提供了极大的灵活性，可以根据具体需求定制AI加速器。
高度可扩展性。RISC-V的指令集精简且高度扩展，设计者可以根据需要添加自定义指令集扩展，以增强AI计算的性能和效率。例如：可以增加向量扩展或其他专用于AI的指令集，从而提升计算速度和能效。
功耗和效率优势。RISC-V架构通过简洁设计和定制化扩展，可实现高效的能量使用；RISC-V架构能够通过小型且高效的处理单元，减少等待数据传输的时间，提升整体计算效率。
生态系统和社区支持。RISC-V生态的多样性和开放性吸引。

生态碎片化、资源投入严重不足、缺少组织统筹、产学研协同不紧，是我国RISC-V+AI生态面临的机遇与挑战。应对挑战的整体思路来自三方面：mWZednc

自下而上。以RISC-V指令集扩展（推动成RISC-V国际基金会标准）+开源系统软件栈为公共开源根去利用国际开放/开源社区去长叶（基于开源根的商业软件/芯片），形成“根技术开源”与“叶技术竞争”的技术生态布局。
从端到云。聚焦边缘/中断侧（多样性、碎片化且大数量算力场景，比如：智能终端、AIPC等）来推动软件生态的发展与应用，以带动云上的软件生态。
工具创新。依托日益强大的RISC-V软硬件生态去聚焦全球开源工具创新。

而具体的破局思路，则是以国际标准+开源社区两抓手。具体而言，首先，要以推动RISC-V国际标准为抓手到国际借力。也就是把握“根技术”，从我国领军企业共识出发，快速布局新时代的新市场（智能终端、AIPC等），以推动国际基金会标准来依托上游国际开源社区来贡献系统软件栈。mWZednc

其次，以共建国际开源软件生态为抓手到国际借力。就是团结企业一起探索、探讨，也要定出Triton，比CUDA要更高层，团结大家一起以“粗烟囱”的方式和GPGPU齐头并进。另外就是英特尔主推的SYCL，它也是一个行业依托国际方兴未艾、能够很有生命力、发展很快的软件生态之一。在这个场景下，北京开源芯片研究院今年成立了多个指令标准集工作组，并在今年发起了“甲辰计划”，呼吁生态链企业携手共建软硬件生态，目前有超过40家的开源社区企业加入。mWZednc

“现在万物智联时代，大家在‘端’上可以作为出发点，最后再通过‘农村包围城市’的方式在‘云’上和英伟达进行抗衡。我们现在做的，并不是像英伟达那样搞450万大军的人海战术，而是要聚焦在系统软件栈、编译等领域，组织全球力量一起去发展和建设。”谢涛强调称。mWZednc

责编：Demi

本文为电子技术设计原创文章，未经授权禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

阅读全文，请先

邵乐峰

暂无简介...

进入专栏

产业前沿制造/工艺/封装 EDA/IP/IC设计人工智能

上一篇： 第四届滴水湖中国RISC-V产业论坛开幕，产业协同见证多个里程碑式发展 下一篇： 奕斯伟：40TOPS双DIE互联SoC瞄准AI PC赛道

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

使用MSO 5/6内置AWG进行功率半导体器件的双脉冲测试在本文中，宽禁带功率器件供应商Qorvo与Tektronix合作，基于实际的SiC被测器件 (DUT)，描述了实用的解决方案···
嵌入式Rust：我们如今身处何方？ Rust对于一般应用开发来说很有意义，但对于嵌入式软件团队来说真的有意义吗？Rust如今的情况如何，它是否就是大家所鼓吹的最美好的解决方案？
631.2亿美元的市场，创新制造工艺将为柔性电子带来什么？柔性电子设备的新型制造技术正在迅速涌现。有些人可能想知道它们是否比传统方法更好，以及它们什么时候会商业化，它们会影响电子设计工程师未来的创新吗？
NFC防伪技术：削弱假货对奢侈品行业的影响打击假冒伪劣最终需要奢侈品行业改进其产品认证方法。但是，随着越来越多的假冒产品不断涌入市场，奢侈品品牌该如何保护自己的知识产权和实体产品呢？
为什么紫外线固化对于高质量电子产品至关重要？粘合剂粘接是电子产品制造中一个小而关键的部分。紫外线固化可提高该工艺的效率、耐用性和可靠性。
深入拆解一个Godox相机闪光灯发射器，富士专用在2024年三月份，著名的二手影像设备零售商KEH就举行了一次定期的“库存清理”活动，这次活动对其部分仓库库存提供15%的折扣。其中吸引我注意的是一个“Godox X1T-F TTL无线闪光灯触发发射器···
通嘉PD快充适配器高效能及小型化之氮化镓集成方案随着消费者对便携性和高效充电的需求增加，手机厂商和充电器品牌纷纷推出小型化PD快充产品，以满足市场需求···
横向对比考毕兹振荡器和克拉泼振荡器我们之前在“一起来简单聊聊考毕兹振荡器”和“再来谈谈克拉泼振荡器，和考毕兹振荡器有何不同？”中分别研究过这两个振荡器。而对这两个振荡器进行横向对比也是十分有必要的···
拆解一个Geek Bar Pulse电子烟，拆到最后竟然还能亮？电子烟(又称“vape”)的使用量在迅速增长，无论是新用户还是现有的香烟、雪茄、烟斗和嚼烟用户都在使用···
基于SiC的高电压电池断开开关的设计注意事项在本文中，我们将讨论在选择功率半导体技术和定义高电压、高电流电池断开开关的半导体封装时的一些设计注意事项，以及表征系统的寄生电感和过流保护限值的重要性···
来看看在这个电源，能通过单个PWM输出进行计算机编程可变稳压电源是电子实验室工作台上的一种便捷工具，能产生极性相反的相等电压输出的对称型电源更是如此···
IGBT 模块在颇具挑战性的逆变器应用中提供更高能效太阳能、风能、波浪能等新型可再生能源受到广泛欢迎，正逐渐成为主流。只有完全使用可再生能源的应用，才能被视为真正的“清洁”应用···

机器人所需要的传感器有哪些？随着机器人技术的迭代升级，传感器的重要性将持续提升，其功能性、精度和适配性也将得到显著改进，作为机器人不可
2024年墨西哥市场分析，中国品牌崛起 2024年，墨西哥汽车市场以近10%的增长率展现了强劲的复苏势头，中国品牌的崛起为市场注入了新活力，当然现在的政
2025，大众汽车集团在中国如何转型？ 2024 年，大众汽车集团（中国）在复杂多变的市场环境中成功达成销量目标，向客户交付超过 290 万辆汽车，新能源汽车领
国产射频芯片公司汇总对于射频芯片这项卡脖子技术，国内很多公司在这方面努力，而且也做出了不错的成绩。一些射频芯片公司无论从研发
拆解报告：松下电器1200W电吹风松下EH-NW90电吹风内置10万转高速无刷电机，并具备三档风速和四档风温可选。电吹风内置纳诺怡技术，为秀发提供
拆解报告：白牌电动工具电池多功能放电转换器这款白牌多功能放电转换器适配得伟电动工具电池使用，将电动工具电池和放电转换器组装起来，即可组成移动电源和
拆解报告：MOMA猛玛LARK M2无线麦克风 MOMA猛玛LARK M2无线麦克风在外观方面，采用了极富创新的设计，提供了轻盈舒适的佩戴使用体验。发射器采用了夹
阿根廷2024年：销量下滑，北汽增长240.1%。 2024年阿根廷汽车市场在整体销量下滑的背景下，依然展现出多元化的发展趋势···
2025年第3周：全球最快四足机器人发布 2025年将成为机器人产业的关键时间点，业内预期27年人形机器人出货量可达50~100万台。从技术进步到供应链成熟
欧洲2024年汽车市场：微弱复苏和电动化加速并存 2024年，欧盟新车注册量小幅增长0.8%，达到约1060万辆，欧盟+英国+北欧国家的销量为1296.4万台，同比增长0.9%，整个欧
射频微波领域有哪些高质量期刊？今天我们结合网络上的资料一起整理一份射频微波领域的期刊列表，以便同学们投稿时可以选择···
拆解报告：Portal智能屏幕24W电源适配器 Portal智能屏幕电源适配器采用黑色直板机身，外观整洁，配有2米长黑色输出线。适配器采用美规固定插脚，支持100-2

性能飞跃！升级电流传感器NSM201x-P系列赋能汽车三电和光伏逆变器纳芯微推出全新车规级集成电流路径霍尔传感器NSM201x-P系列。该系列产品是对纳芯微已量产的NSM201x系列的完
意法半导体推出STSPIN32G0新列电机驱动器，满足工业自动化和家电市意法半导体STSPIN32系列集成化电机驱动器新增八款产品，满足电动工具、家用电器、工业自动化等应用的低成本、
Melexis推出性能先进的温度传感器，以红外技术创新实现电磁炉智能全球微电子工程公司Melexis宣布，推出专为电磁炉设计的非接触式红外温度传感器芯片MLX90617···
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC模块基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
为汽车安全保驾护航，纳芯微推出基于AMR技术的ABS轮速传感器纳芯微宣布推出全新基于AMR（各向异性磁阻技术）的轮速传感器NSM41xx系列。该系列产品通过集成先进的磁性传感敏
Microchip推出全新Switchtec™ PCIe® 4.0 16通道交换机系列 PCI100x系列器件可为任何需要加速或专用计算的应用提供高性能和成本效益···
RK3576有多强？实测三屏八摄像头轻松搞定-米尔米尔基于他们推出的MYD-LR3576开发板开发了一个3屏异显，8路摄像头输入的DEMO，实测下来，RK3576轻松搞定了该任
SynQor®推荐先进的军用级三相输入UPS（UPS-1500-S-1U-T） SynQor的三相输入UPS电源能使单相负载在电源端呈现出符合MIL-STD-1399-300B标准的清洁、表现良好且几乎零反
村田开发超小尺寸、超低功耗的Type 2GQ GNSS模块，以匠心品质助在几年前，定位系统充斥于生活方方面面的情节还仅见于各式的科幻影片，而今具备这一功能的产品已经以各种形态步
瑞萨推出性能卓越的新型MOSFET 瑞萨全新晶圆技术可以帮助MOSFET实现导通电阻降低30%、栅漏电荷减少40%、封装尺寸缩小50%的目标···
加特兰集成 Cadence Tensilica ConnX 220 DSP 全面升级汽 ConnX 220 DSP 集成至基于下一代 Andes SoC 的加特兰雷达解决方案后，将带来显著优势，包括提高灵活性、

热门评论
最新评论

换一换

杂志声明

万物智联时代，RISC-V+AI能否震撼CUDA生态壁垒？