国产算力崛起!DeepSeek适配国产芯片引领AI算力多样化新时代

2026-04-27 20:10:30未知 作者:徽声在线

《徽声在线》4月27日消息(记者 黄心怡)近期,DeepSeek-V4预览版正式发布并同步开源,该版本涵盖了DeepSeek-V4-Pro和DeepSeek-V4-Flash两大模型。

与以往主要依托英伟达CUDA框架运行的模型不同,DeepSeek-V4此次创新地将细粒度专家并行(EP)方案在英伟达GPU和华为昇腾NPU上均完成了验证。据业内预测,随着今年下半年昇腾950超节点的大规模上市,DeepSeek-V4 Pro的价格有望迎来大幅下调。

《徽声在线》记者从权威渠道获悉,目前华为昇腾超节点全系列产品已全面支持DeepSeek V4系列模型,实现了DeepSeek V4-Pro仅需20ms、DeepSeek V4-Flash仅需10ms的低时延推理。此外,沐曦、寒武纪、摩尔线程、天数智芯等众多国产芯片厂商也纷纷宣布支持DeepSeek-V4新模型,共同推动国产AI算力的发展。

值得一提的是,中国信息通信研究院携手人工智能软硬件协同创新与适配验证中心,正式启动了DeepSeek V4国产化适配测试工作。该测试将全面覆盖芯片、服务器、一体机、集群、开发框架及工具链、智算设施及平台等人工智能软硬件产品及系统,确保DeepSeek V4在国产环境下的稳定运行。

多位业内专家在接受《徽声在线》记者采访时表示,DeepSeek成功适配国产芯片,标志着AI算力底座正朝着多样化路径迈进。当前,国内互联网行业和云厂商等也在积极部署不同类型的AI算力,这意味着更多AI芯片厂商将有机会在这一领域发挥重要作用。

▍AI算力底座多样化趋势加速

沐曦股份与FlagOS强强联手,已率先完成对DeepSeek最新开源的DeepSeek-V4-Flash模型的Day 0适配。同时,沐曦股份还联合上海人工智能实验室KernelSwift智能算子迁移系统,再次率先完成DeepSeek-V4核心算子的Day 0适配,展现了其在国产AI算力领域的领先地位。

沐曦股份联合创始人杨建在接受《徽声在线》记者采访时表示,DeepSeek新模型的发布,为国产GPU提供了成为机器创造知识时代生产力工具和资料的机会。目前,不仅是Deepseek V4,Minimax2.7、阶跃星辰step3.5、kimi-2.6、智谱GLM5.1、mimo-V2等众多模型都可以基于国产GPU算力实现高性价比的推理任务。

《徽声在线》记者还了解到,由智源研究院牵头研发的众智FlagOS,已完成DeepSeek-V4-Flash在8款以上AI芯片上的全量适配与推理部署,包括海光、沐曦、华为昇腾、摩尔线程(FP8)、昆仑芯、平头哥真武、天数智芯等国产芯片。同时,FlagOS正在推进DeepSeek-V4-Pro模型在多个芯片上的迁移适配工作,后续将开源相关成果。

IDC中国研究经理索引认为,DeepSeek全面适配昇腾芯片,不仅推动了AI算力底座的多样化发展,也对整个AI产业产生了积极的推动作用。这是AI产业发展的必然趋势,也是国产算力崛起的重要标志。

CIC灼识咨询董事总经理陈一心表示,DeepSeek的成功证明了基于国产算力同样能够运行世界级的大模型。此次适配昇腾950PR,是对国产高端芯片在复杂推理场景下性能的一次重要公开检验,将为后续更多模型和应用的迁移提供信心和范本。

陈一心进一步指出,大模型的繁荣高度依赖于“硬件-软件-框架-应用”的完整生态。DeepSeek的适配行动,实质上是将庞大的开发者生态和模型应用生态向国产算力平台牵引。这将有助于吸引更多开发者和企业基于昇腾平台进行创新,逐步打破对英伟达CUDA生态的单一依赖,推动中国“国产算力+国产大模型”闭环生态的成熟。

当前,券商机构对国产算力产业链的发展前景持乐观态度。山西证券指出,DeepSeekV4等国产大模型有望原生适配国产算力,实现供需两旺。随着更多国产GPU/ASIC标的登陆资本市场,国产算力芯片的供给能力将大幅增强。建议关注超节点交换芯片、IODchiplet、国产高速网卡三大算力通信方向,以把握国产算力发展的机遇。

中信证券研报也指出,随着Agent&多模态等应用的爆发,Token调用量将呈现井喷式增长,进而导致国内算力需求激增。国产大模型在推理端的积极适配,将为国产算力厂商带来加速放量的机遇。预计2026年国产算力芯片出货量将至少实现翻倍以上增长,为算力设计公司、先进制程、先进封装、先进存储以及配套产业链带来强劲的增长动能。

▍国产算力成为AI云的重要支撑

随着DeepSeek-V4预览版的上线,百度云、阿里云、华为云等国内主流云厂商纷纷提供API服务,以满足市场对国产AI算力的需求。

百度智能云旗下百度千帆平台Day0适配提供API服务,用户可通过百度千帆控制台或API直接调用DeepSeek-V4-Pro,DeepSeek-V4-Flash也即将全量开放。阿里云百炼平台则首发上线了DeepSeek-V4-pro和DeepSeek-V4-flash两款模型,百炼Token Plan近期也将支持调用该模型。华为云MaaS模型即服务平台则为开发者提供了免部署、一键调用DeepSeek-V4-FlashAPI的Tokens服务。

此外,国内AI云服务商PPIO也第一时间全量首批上线了DeepSeek-V4,成为业内最快上线该模型的AI云平台之一。

记者还了解到,阿里、字节跳动等头部云厂商已开始部署相关国产算力。陈一心在接受《徽声在线》记者采访时表示,推理侧国产算力已经相对成熟,训练侧也在快速追赶。头部云厂商正从“试点”转向“大规模商用”,国产算力正成为AI云的核心底座之一。

索引介绍,互联网行业从几年前就开始尝试部署不同类型的AI算力,已从过去较为单一的布局转变为更为均衡的算力部署。不仅芯片类型更加多样,在架构层面也在不断尝试创新,例如超节点/超集群产品的部署。这一趋势在未来几年预计将持续保持,更加开放的架构也意味着更多AI芯片厂商将有机会在这一领域发挥重要作用。

▍单位算力成本下降,总算力支出或持续增长

新模型发布后,DeepSeek对API进行了降价调整,以进一步降低用户的使用成本。

DeepSeek全系列API服务中,输入缓存命中的价格已降至原有价格的十分之一。Pro模型在2026年5月5日前还叠加了2.5折的限时优惠。经过此番降价和限时优惠后,DeepSeek-V4-Pro模型输入(缓存命中)的价格已降低至0.025元/百万Tokens,DeepSeek-V4-Flash输入(缓存命中)的价格则降低至0.02元/百万Tokens。

DeepSeek此前还表示,受限于高端算力,目前V4-Pro模型的服务吞吐仍有限。预计下半年昇腾950超节点批量上市后,Pro价格将迎来大幅下调,进一步降低用户的使用成本。

陈一心认为,DeepSeek等模型通过算法创新本身就降低了60%的训练成本。而国产芯片厂商通过与DeepSeek的深度适配和联合优化,进一步提升了在特定芯片上的推理效率。这种“算法+硬件”的协同优化直接压低了单次API调用的计算成本,为模型供应商降价提供了空间。

索引则表示,虽然单位算力的成本呈下降趋势,无论是本地部署还是从云上获取Token。但事实证明,算力成本的降低并不会减少算力支出。较低的单位成本正在扩大AI采用率以及工作负载规模,从而进一步增加算力基础设施的需求,形成由人工智能驱动的宏观经济良性循环。

点击展开全文
你关注的
【出海聚焦】石油危机凸显中国电动车优势,性价比之外更有硬实力【出海聚焦】石油危机凸显中国电动车优势,性价比之外更有硬实力 AI玩具赛道迎重大变革:模型“套壳”问题有望短期解决,智能体研发加速推进AI玩具赛道迎重大变革:模型“套壳”问题有望短期解决,智能体研发加速推进 深圳低空经济全域竞速:百企试飞、基金赋能、标准引领深圳低空经济全域竞速:百企试飞、基金赋能、标准引领
相关文章
启境GT7满载华为乾崑技术,高端智能新能源市场新标杆启境GT7满载华为乾崑技术,高端智能新能源市场新标杆 车展聚焦·大咖访谈丨奥迪石柏涛:双品牌并行,携手华为、Momenta深耕中国市场车展聚焦·大咖访谈丨奥迪石柏涛:双品牌并行,携手华为、Momenta深耕中国市场 无方向盘、无踏板新纪元!特斯拉Cybercab量产启航,马斯克预警初期产能爬坡无方向盘、无踏板新纪元!特斯拉Cybercab量产启航,马斯克预警初期产能爬坡 车展技术革命丨地平线余凯:智驾渗透率超50%将引爆万亿市场,错位竞争构筑技术护城河车展技术革命丨地平线余凯:智驾渗透率超50%将引爆万亿市场,错位竞争构筑技术护城河 中央网信办通报33款App个人信息收集使用违规问题中央网信办通报33款App个人信息收集使用违规问题 余承东亲曝尊界200万级豪华新车,6月底发布引爆市场,江淮汽车应声涨停余承东亲曝尊界200万级豪华新车,6月底发布引爆市场,江淮汽车应声涨停