国产算力崛起！DeepSeek适配国产芯片引领AI算力多样化新时代

2026-04-27 20:10:30未知作者:徽声在线

《徽声在线》4月27日消息（记者黄心怡）近期，DeepSeek-V4预览版正式发布并同步开源，该版本涵盖了DeepSeek-V4-Pro和DeepSeek-V4-Flash两大模型。

与以往主要依托英伟达CUDA框架运行的模型不同，DeepSeek-V4此次创新地将细粒度专家并行（EP）方案在英伟达GPU和华为昇腾NPU上均完成了验证。据业内预测，随着今年下半年昇腾950超节点的大规模上市，DeepSeek-V4 Pro的价格有望迎来大幅下调。

《徽声在线》记者从权威渠道获悉，目前华为昇腾超节点全系列产品已全面支持DeepSeek V4系列模型，实现了DeepSeek V4-Pro仅需20ms、DeepSeek V4-Flash仅需10ms的低时延推理。此外，沐曦、寒武纪、摩尔线程、天数智芯等众多国产芯片厂商也纷纷宣布支持DeepSeek-V4新模型，共同推动国产AI算力的发展。

值得一提的是，中国信息通信研究院携手人工智能软硬件协同创新与适配验证中心，正式启动了DeepSeek V4国产化适配测试工作。该测试将全面覆盖芯片、服务器、一体机、集群、开发框架及工具链、智算设施及平台等人工智能软硬件产品及系统，确保DeepSeek V4在国产环境下的稳定运行。

多位业内专家在接受《徽声在线》记者采访时表示，DeepSeek成功适配国产芯片，标志着AI算力底座正朝着多样化路径迈进。当前，国内互联网行业和云厂商等也在积极部署不同类型的AI算力，这意味着更多AI芯片厂商将有机会在这一领域发挥重要作用。

▍AI算力底座多样化趋势加速

沐曦股份与FlagOS强强联手，已率先完成对DeepSeek最新开源的DeepSeek-V4-Flash模型的Day 0适配。同时，沐曦股份还联合上海人工智能实验室KernelSwift智能算子迁移系统，再次率先完成DeepSeek-V4核心算子的Day 0适配，展现了其在国产AI算力领域的领先地位。

沐曦股份联合创始人杨建在接受《徽声在线》记者采访时表示，DeepSeek新模型的发布，为国产GPU提供了成为机器创造知识时代生产力工具和资料的机会。目前，不仅是Deepseek V4，Minimax2.7、阶跃星辰step3.5、kimi-2.6、智谱GLM5.1、mimo-V2等众多模型都可以基于国产GPU算力实现高性价比的推理任务。

《徽声在线》记者还了解到，由智源研究院牵头研发的众智FlagOS，已完成DeepSeek-V4-Flash在8款以上AI芯片上的全量适配与推理部署，包括海光、沐曦、华为昇腾、摩尔线程（FP8）、昆仑芯、平头哥真武、天数智芯等国产芯片。同时，FlagOS正在推进DeepSeek-V4-Pro模型在多个芯片上的迁移适配工作，后续将开源相关成果。

IDC中国研究经理索引认为，DeepSeek全面适配昇腾芯片，不仅推动了AI算力底座的多样化发展，也对整个AI产业产生了积极的推动作用。这是AI产业发展的必然趋势，也是国产算力崛起的重要标志。

CIC灼识咨询董事总经理陈一心表示，DeepSeek的成功证明了基于国产算力同样能够运行世界级的大模型。此次适配昇腾950PR，是对国产高端芯片在复杂推理场景下性能的一次重要公开检验，将为后续更多模型和应用的迁移提供信心和范本。

陈一心进一步指出，大模型的繁荣高度依赖于“硬件-软件-框架-应用”的完整生态。DeepSeek的适配行动，实质上是将庞大的开发者生态和模型应用生态向国产算力平台牵引。这将有助于吸引更多开发者和企业基于昇腾平台进行创新，逐步打破对英伟达CUDA生态的单一依赖，推动中国“国产算力+国产大模型”闭环生态的成熟。

当前，券商机构对国产算力产业链的发展前景持乐观态度。山西证券指出，DeepSeekV4等国产大模型有望原生适配国产算力，实现供需两旺。随着更多国产GPU/ASIC标的登陆资本市场，国产算力芯片的供给能力将大幅增强。建议关注超节点交换芯片、IODchiplet、国产高速网卡三大算力通信方向，以把握国产算力发展的机遇。

中信证券研报也指出，随着Agent&多模态等应用的爆发，Token调用量将呈现井喷式增长，进而导致国内算力需求激增。国产大模型在推理端的积极适配，将为国产算力厂商带来加速放量的机遇。预计2026年国产算力芯片出货量将至少实现翻倍以上增长，为算力设计公司、先进制程、先进封装、先进存储以及配套产业链带来强劲的增长动能。

▍国产算力成为AI云的重要支撑

随着DeepSeek-V4预览版的上线，百度云、阿里云、华为云等国内主流云厂商纷纷提供API服务，以满足市场对国产AI算力的需求。

百度智能云旗下百度千帆平台Day0适配提供API服务，用户可通过百度千帆控制台或API直接调用DeepSeek-V4-Pro，DeepSeek-V4-Flash也即将全量开放。阿里云百炼平台则首发上线了DeepSeek-V4-pro和DeepSeek-V4-flash两款模型，百炼Token Plan近期也将支持调用该模型。华为云MaaS模型即服务平台则为开发者提供了免部署、一键调用DeepSeek-V4-FlashAPI的Tokens服务。

此外，国内AI云服务商PPIO也第一时间全量首批上线了DeepSeek-V4，成为业内最快上线该模型的AI云平台之一。

记者还了解到，阿里、字节跳动等头部云厂商已开始部署相关国产算力。陈一心在接受《徽声在线》记者采访时表示，推理侧国产算力已经相对成熟，训练侧也在快速追赶。头部云厂商正从“试点”转向“大规模商用”，国产算力正成为AI云的核心底座之一。

索引介绍，互联网行业从几年前就开始尝试部署不同类型的AI算力，已从过去较为单一的布局转变为更为均衡的算力部署。不仅芯片类型更加多样，在架构层面也在不断尝试创新，例如超节点/超集群产品的部署。这一趋势在未来几年预计将持续保持，更加开放的架构也意味着更多AI芯片厂商将有机会在这一领域发挥重要作用。

▍单位算力成本下降，总算力支出或持续增长

新模型发布后，DeepSeek对API进行了降价调整，以进一步降低用户的使用成本。

DeepSeek全系列API服务中，输入缓存命中的价格已降至原有价格的十分之一。Pro模型在2026年5月5日前还叠加了2.5折的限时优惠。经过此番降价和限时优惠后，DeepSeek-V4-Pro模型输入（缓存命中）的价格已降低至0.025元/百万Tokens，DeepSeek-V4-Flash输入（缓存命中）的价格则降低至0.02元/百万Tokens。

DeepSeek此前还表示，受限于高端算力，目前V4-Pro模型的服务吞吐仍有限。预计下半年昇腾950超节点批量上市后，Pro价格将迎来大幅下调，进一步降低用户的使用成本。

陈一心认为，DeepSeek等模型通过算法创新本身就降低了60%的训练成本。而国产芯片厂商通过与DeepSeek的深度适配和联合优化，进一步提升了在特定芯片上的推理效率。这种“算法+硬件”的协同优化直接压低了单次API调用的计算成本，为模型供应商降价提供了空间。

索引则表示，虽然单位算力的成本呈下降趋势，无论是本地部署还是从云上获取Token。但事实证明，算力成本的降低并不会减少算力支出。较低的单位成本正在扩大AI采用率以及工作负载规模，从而进一步增加算力基础设施的需求，形成由人工智能驱动的宏观经济良性循环。

点击展开全文