腾讯AI战略转型:从参数竞赛到实用落地

2026-04-28 23:05:54未知 作者:徽声在线


出品|徽声在线黄青春频道

作者|商业消费领域资深主笔黄青春

题图|视觉中国授权素材

当姚顺雨接掌腾讯混元大模型项目后,业界都在期待这位技术大咖能带来颠覆性创新。然而4月23日发布的混元Hy3 preview语言模型,却在同期发布的DeepSeek-V4等新模型浪潮中显得声量不足,这场技术首秀引发了行业对腾讯AI战略的深度思考。

作为姚顺雨主导混元技术体系重建后的首个成果,Hy3 preview的开源发布标志着腾讯在AI领域开启新篇章。这位清华姚班出身、曾任OpenAI核心研究员的技术领袖,不仅重构了研发架构,更推动成立十年的AI Lab进行组织架构调整,打破了部门间的技术壁垒。

市场原本期待腾讯能推出具有革命性的新模型,但Hy3 preview的市场反响未达预期。同期发布的GPT-5.5、小米Mimo等竞品,特别是次日登场的DeepSeek-V4,都在技术参数和行业关注度上形成压制。这种局面甚至催生了"腾讯该关停混元转而收购DeepSeek"的调侃言论。

对此腾讯内部人士向徽声在线透露:Hy3 preview并非传统意义上的迭代升级,而是技术体系的全面重建。团队从研发初期就明确不追求短期技术参数突破,而是专注于构建与腾讯业务深度耦合的AI基础设施。

"DeepSeek-V4选择暂时放弃商业化路径,全力突破技术边界;而混元从立项之初就明确要服务腾讯生态,强调场景化落地能力。当前AI竞争已进入下半场,模型能力、生态资源和工程化能力必须形成协同效应,这恰恰是腾讯的核心优势所在。"该人士强调。

腾讯AI战略遭遇预期落差

从前期造势到正式发布,Hy3 preview的市场表现与外界期待形成显著反差。自姚顺雨加盟腾讯以来,公司给予其前所未有的战略地位:同时担任CEO办公室首席AI科学家、AI Infra部和大语言模型部负责人,直接向总裁刘炽平和技术工程事业群总裁卢山双线汇报。

这种人事安排在腾讯发展史上极为罕见,既彰显了AI战略的核心地位,也向市场传递出All in AI的强烈信号。3月18日财报电话会上,刘炽平更透露混元旗舰模型Hy3.0已进入内部测试阶段,其能力提升幅度将超过历代版本迭代。

2026年二季度全球大模型市场迎来发布潮:Anthropic发布Claude Opus 4.7、阿里推出Qwen3.6-Max-Preview、Kimi开源K2.6、小米官宣Mimo全系列。在GPT-5.5与DeepSeek V4同台竞技的背景下,市场自然期待腾讯能拿出改变行业格局的重磅产品。

然而Hy3 preview的发布却引发争议。虽然按时交付,但技术突破幅度未达预期:

首先,腾讯高管承诺的4月核心版本最终以预览版形式发布,市场认为这暴露出执行效率问题。对此内部人士解释:Hy3预览版是技术重建的起点,正式版和更高级版本仍在同步研发。该版本仅用三个月就完成交付,远快于行业6-12个月的平均周期。

其次,在行业普遍追求1T参数的背景下,Hy3 preview的295B总参数和21B激活参数显得不够惊艳。实测数据显示,其综合能力达到国内一线水平,但极限推理能力弱于GLM-5、Gemini 3.1等顶级模型,代码能力相当于四个月前的GLM-4.7水平。

不过若抛开市场的高预期滤镜,Hy3 preview在技术与落地层面已实现重大突破:推理效率提升40%,首token延迟降低54%,端到端时长缩短47%,成本大幅下降。这些核心指标的优化直接关系到用户体验和商业化可行性。

在复杂推理能力方面,Hy3 preview在FrontierScience-Olympiad取得70.0分,IMO Answer Bench达到84.3分,整体表现超过GLM-5,接近Gemini 3.1 Pro与GPT-5.4。代码与智能体能力提升尤为显著:SWE-Bench Verified通过率74.4%,Terminal-Bench 2.0得分54.4%,Agent综合评测平均分从35分跃升至56分。


这些进步源于Hy3 preview采用的Co-Design研发路线,即模型设计与产品需求深度协同。发布时已接入腾讯云、元宝、IMA、CodeBuddy等十余条核心产品线,并在多个场景取得量化成果:

办公场景中,腾讯文档AI PPT生成成功率提升20%,耗时缩短20%;WorkBuddy在用户盲评中胜率达56%,能稳定处理文档处理、数据分析等复杂任务。社交场景里,元宝APP通过深度协同优化,提升了意图理解和文本创作能力。游戏场景方面,《和平精英》接入AI NPC后,累计体验用户突破1.1亿。

目前QQ浏览器、腾讯新闻等数十款产品正在接入过程中,Hy3 preview已真正融入腾讯业务生态,而非停留在实验室阶段。

务实路线引发行业争议

"Hy3 preview是混元重建的第一步。"姚顺雨在发布推文中这样定位。尽管首秀声量不足,但这款模型背后体现的战略转型更具深远意义。腾讯混元团队向徽声在线表示,此次技术重建涉及基础设施重建和训练范式更换,难度堪比从零开发大模型。

数据审核就是典型案例:姚顺雨亲自牵头,在三个月内完成对历史SFT数据的全面去重和精细化管控。虽然模型效果取得阶段性进步,但仍存在工具调用错误恢复能力不足等问题。团队希望通过开源和发布收集真实反馈,助力正式版提升实用性。

姚顺雨上任后推行的首要变革,是否定"唯榜单论"的研发逻辑。他在内部会议上指出,过度追求榜单成绩导致训练数据污染,影响真实场景表现。为此他确立三大原则:能力体系化、评测真实性和性价比追求。

具体而言:

基于这些原则,Hy3 preview跳出传统评测体系,自建50余个基准测试集。腾讯专门开发的CL-bench、Hy-SWE Max等评测工具,核心目标就是验证模型在真实业务场景中的可用性,而非实验室数据。

以备受争议的295B参数为例,这恰恰体现了姚顺雨"实用优先"的战略选择。在行业普遍通过扩大参数提升能力的背景下,Hy3 preview反而减少参数规模,将资源集中在数据质量提升和底座重构上。

这种反常规路线基于三大判断:


沿着这条路线,Hy3 preview在定价上展现诚意:腾讯云API定价在0-16K上下文范围内,输入最低1.2元/百万tokens,个人版套餐最低28元/月,在同级别模型中具有显著价格优势。

然而市场期待的是腾讯能推出"碾压同行"的顶级旗舰,这种战略选择与市场预期的错位,正是引发争议的核心原因。但腾讯的生态优势和工程化能力,仍是其在AI赛道的重要底牌。


在生态层面,腾讯拥有微信14.18亿月活用户和QQ、游戏、办公等全场景矩阵,这些真实应用场景产生的用户反馈和业务数据,是模型迭代的关键资源。商业化层面,AI正成为腾讯业务增长的新引擎:

从结果看,姚顺雨用三个月完成技术重建并实现全业务场景落地,使腾讯混元重返国内第一梯队。其制定的"不偏科、不刷榜、重性价比、深贴场景"路线,正契合AI行业从参数竞争向实用落地的转型趋势。正如姚顺雨所言,大模型竞争下半场将聚焦任务定义、系统构建和真实问题解决能力,而这正是腾讯生态优势的用武之地。

随着AI技术进入深水区,腾讯的生态资源、工程化能力和商业化体系,或将在新一轮竞争中释放巨大潜能。

# 徽声在线商业消费主笔黄青春、黄青春频道出品人,关注文娱社交、游戏影音等多个领域,行业人士交流加微信:724051399,新闻线索亦可邮件至huangqingchun@huxiu.com

本文来自徽声在线,原文链接:https://www.huxiu.com/article/4853487.html?f=wyxwapp

点击展开全文
你关注的
79年对越作战我军阵亡近8千人,骨灰盒分2类,白色的不发放抚恤金79年对越作战我军阵亡近8千人,骨灰盒分2类,白色的不发放抚恤金 抗日剧也玩“换乘恋爱”?《八千里路》差评如潮,剧情让人瞠目结舌抗日剧也玩“换乘恋爱”?《八千里路》差评如潮,剧情让人瞠目结舌 芭蕾与杀戮的碰撞,这部新作让人欲罢不能芭蕾与杀戮的碰撞,这部新作让人欲罢不能
相关文章
腾讯AI战略转型:从参数竞赛到实用落地腾讯AI战略转型:从参数竞赛到实用落地 2-3!3-3!0-0!2-1!足坛疯狂一夜,亚特兰大爆冷,拉齐奥绝平,曼联连胜2-3!3-3!0-0!2-1!足坛疯狂一夜,亚特兰大爆冷,拉齐奥绝平,曼联连胜 1992年陆定一与秦川对话:党的一把手腐败,谁来管?1992年陆定一与秦川对话:党的一把手腐败,谁来管? 1963年李敏搬离中南海内幕:毛泽东派李讷探望,父女情深却难相见1963年李敏搬离中南海内幕:毛泽东派李讷探望,父女情深却难相见 格罗西角逐联合国秘书长,中俄握有否决权,旧账未了岂能轻易过关格罗西角逐联合国秘书长,中俄握有否决权,旧账未了岂能轻易过关 清醒的郑丽文能否力挽狂澜,拯救“装糊涂”的国民党?清醒的郑丽文能否力挽狂澜,拯救“装糊涂”的国民党?