腾讯AI战略转型：从参数竞赛到实用落地

2026-04-28 23:05:54未知作者:徽声在线

出品｜徽声在线黄青春频道

作者｜商业消费领域资深主笔黄青春

题图｜视觉中国授权素材

当姚顺雨接掌腾讯混元大模型项目后，业界都在期待这位技术大咖能带来颠覆性创新。然而4月23日发布的混元Hy3 preview语言模型，却在同期发布的DeepSeek-V4等新模型浪潮中显得声量不足，这场技术首秀引发了行业对腾讯AI战略的深度思考。

作为姚顺雨主导混元技术体系重建后的首个成果，Hy3 preview的开源发布标志着腾讯在AI领域开启新篇章。这位清华姚班出身、曾任OpenAI核心研究员的技术领袖，不仅重构了研发架构，更推动成立十年的AI Lab进行组织架构调整，打破了部门间的技术壁垒。

市场原本期待腾讯能推出具有革命性的新模型，但Hy3 preview的市场反响未达预期。同期发布的GPT-5.5、小米Mimo等竞品，特别是次日登场的DeepSeek-V4，都在技术参数和行业关注度上形成压制。这种局面甚至催生了"腾讯该关停混元转而收购DeepSeek"的调侃言论。

对此腾讯内部人士向徽声在线透露：Hy3 preview并非传统意义上的迭代升级，而是技术体系的全面重建。团队从研发初期就明确不追求短期技术参数突破，而是专注于构建与腾讯业务深度耦合的AI基础设施。

"DeepSeek-V4选择暂时放弃商业化路径，全力突破技术边界；而混元从立项之初就明确要服务腾讯生态，强调场景化落地能力。当前AI竞争已进入下半场，模型能力、生态资源和工程化能力必须形成协同效应，这恰恰是腾讯的核心优势所在。"该人士强调。

腾讯AI战略遭遇预期落差

从前期造势到正式发布，Hy3 preview的市场表现与外界期待形成显著反差。自姚顺雨加盟腾讯以来，公司给予其前所未有的战略地位：同时担任CEO办公室首席AI科学家、AI Infra部和大语言模型部负责人，直接向总裁刘炽平和技术工程事业群总裁卢山双线汇报。

这种人事安排在腾讯发展史上极为罕见，既彰显了AI战略的核心地位，也向市场传递出All in AI的强烈信号。3月18日财报电话会上，刘炽平更透露混元旗舰模型Hy3.0已进入内部测试阶段，其能力提升幅度将超过历代版本迭代。

2026年二季度全球大模型市场迎来发布潮：Anthropic发布Claude Opus 4.7、阿里推出Qwen3.6-Max-Preview、Kimi开源K2.6、小米官宣Mimo全系列。在GPT-5.5与DeepSeek V4同台竞技的背景下，市场自然期待腾讯能拿出改变行业格局的重磅产品。

然而Hy3 preview的发布却引发争议。虽然按时交付，但技术突破幅度未达预期：

首先，腾讯高管承诺的4月核心版本最终以预览版形式发布，市场认为这暴露出执行效率问题。对此内部人士解释：Hy3预览版是技术重建的起点，正式版和更高级版本仍在同步研发。该版本仅用三个月就完成交付，远快于行业6-12个月的平均周期。

其次，在行业普遍追求1T参数的背景下，Hy3 preview的295B总参数和21B激活参数显得不够惊艳。实测数据显示，其综合能力达到国内一线水平，但极限推理能力弱于GLM-5、Gemini 3.1等顶级模型，代码能力相当于四个月前的GLM-4.7水平。

不过若抛开市场的高预期滤镜，Hy3 preview在技术与落地层面已实现重大突破：推理效率提升40%，首token延迟降低54%，端到端时长缩短47%，成本大幅下降。这些核心指标的优化直接关系到用户体验和商业化可行性。

在复杂推理能力方面，Hy3 preview在FrontierScience-Olympiad取得70.0分，IMO Answer Bench达到84.3分，整体表现超过GLM-5，接近Gemini 3.1 Pro与GPT-5.4。代码与智能体能力提升尤为显著：SWE-Bench Verified通过率74.4%，Terminal-Bench 2.0得分54.4%，Agent综合评测平均分从35分跃升至56分。

这些进步源于Hy3 preview采用的Co-Design研发路线，即模型设计与产品需求深度协同。发布时已接入腾讯云、元宝、IMA、CodeBuddy等十余条核心产品线，并在多个场景取得量化成果：

办公场景中，腾讯文档AI PPT生成成功率提升20%，耗时缩短20%；WorkBuddy在用户盲评中胜率达56%，能稳定处理文档处理、数据分析等复杂任务。社交场景里，元宝APP通过深度协同优化，提升了意图理解和文本创作能力。游戏场景方面，《和平精英》接入AI NPC后，累计体验用户突破1.1亿。

目前QQ浏览器、腾讯新闻等数十款产品正在接入过程中，Hy3 preview已真正融入腾讯业务生态，而非停留在实验室阶段。

务实路线引发行业争议

"Hy3 preview是混元重建的第一步。"姚顺雨在发布推文中这样定位。尽管首秀声量不足，但这款模型背后体现的战略转型更具深远意义。腾讯混元团队向徽声在线表示，此次技术重建涉及基础设施重建和训练范式更换，难度堪比从零开发大模型。

数据审核就是典型案例：姚顺雨亲自牵头，在三个月内完成对历史SFT数据的全面去重和精细化管控。虽然模型效果取得阶段性进步，但仍存在工具调用错误恢复能力不足等问题。团队希望通过开源和发布收集真实反馈，助力正式版提升实用性。

姚顺雨上任后推行的首要变革，是否定"唯榜单论"的研发逻辑。他在内部会议上指出，过度追求榜单成绩导致训练数据污染，影响真实场景表现。为此他确立三大原则：能力体系化、评测真实性和性价比追求。

具体而言：

能力体系化：拒绝偏科发展，代码智能体等场景需实现推理、长文、指令等多能力协同
评测真实性：跳出公开榜单，通过自建题目、人工评测等方式验证真实战斗力
性价比追求：通过架构优化降低成本，让智能技术更具商业可行性

基于这些原则，Hy3 preview跳出传统评测体系，自建50余个基准测试集。腾讯专门开发的CL-bench、Hy-SWE Max等评测工具，核心目标就是验证模型在真实业务场景中的可用性，而非实验室数据。

以备受争议的295B参数为例，这恰恰体现了姚顺雨"实用优先"的战略选择。在行业普遍通过扩大参数提升能力的背景下，Hy3 preview反而减少参数规模，将资源集中在数据质量提升和底座重构上。

这种反常规路线基于三大判断：

能力边界：300B参数量级已能充分释放复杂推理等核心能力
成本控制：300B级模型可实现单机部署，1T级模型的多机通信会显著增加成本
落地可行性：工程手段可弥补能力差距，300B级模型更利于私有化部署

沿着这条路线，Hy3 preview在定价上展现诚意：腾讯云API定价在0-16K上下文范围内，输入最低1.2元/百万tokens，个人版套餐最低28元/月，在同级别模型中具有显著价格优势。

然而市场期待的是腾讯能推出"碾压同行"的顶级旗舰，这种战略选择与市场预期的错位，正是引发争议的核心原因。但腾讯的生态优势和工程化能力，仍是其在AI赛道的重要底牌。

在生态层面，腾讯拥有微信14.18亿月活用户和QQ、游戏、办公等全场景矩阵，这些真实应用场景产生的用户反馈和业务数据，是模型迭代的关键资源。商业化层面，AI正成为腾讯业务增长的新引擎：

2025年腾讯广告收入同比增长19%至1449.73亿元，AI改写了广告底层逻辑
游戏业务收入同比增长22%达2416亿元，超40款游戏落地AI应用
腾讯云首次实现规模化盈利，大模型相关产品收入近两年增长50倍

从结果看，姚顺雨用三个月完成技术重建并实现全业务场景落地，使腾讯混元重返国内第一梯队。其制定的"不偏科、不刷榜、重性价比、深贴场景"路线，正契合AI行业从参数竞争向实用落地的转型趋势。正如姚顺雨所言，大模型竞争下半场将聚焦任务定义、系统构建和真实问题解决能力，而这正是腾讯生态优势的用武之地。

随着AI技术进入深水区，腾讯的生态资源、工程化能力和商业化体系，或将在新一轮竞争中释放巨大潜能。

# 徽声在线商业消费主笔黄青春、黄青春频道出品人，关注文娱社交、游戏影音等多个领域，行业人士交流加微信：724051399，新闻线索亦可邮件至[email protected]

本文来自徽声在线，原文链接：https://www.huxiu.com/article/4853487.html?f=wyxwapp

点击展开全文