腾讯AI战略转型:从参数竞赛到实用落地
2026-04-28 23:05:54未知 作者:徽声在线
出品|徽声在线黄青春频道
作者|商业消费领域资深主笔黄青春
题图|视觉中国授权素材
当姚顺雨接掌腾讯混元大模型项目后,业界都在期待这位技术大咖能带来颠覆性创新。然而4月23日发布的混元Hy3 preview语言模型,却在同期发布的DeepSeek-V4等新模型浪潮中显得声量不足,这场技术首秀引发了行业对腾讯AI战略的深度思考。
作为姚顺雨主导混元技术体系重建后的首个成果,Hy3 preview的开源发布标志着腾讯在AI领域开启新篇章。这位清华姚班出身、曾任OpenAI核心研究员的技术领袖,不仅重构了研发架构,更推动成立十年的AI Lab进行组织架构调整,打破了部门间的技术壁垒。
市场原本期待腾讯能推出具有革命性的新模型,但Hy3 preview的市场反响未达预期。同期发布的GPT-5.5、小米Mimo等竞品,特别是次日登场的DeepSeek-V4,都在技术参数和行业关注度上形成压制。这种局面甚至催生了"腾讯该关停混元转而收购DeepSeek"的调侃言论。
对此腾讯内部人士向徽声在线透露:Hy3 preview并非传统意义上的迭代升级,而是技术体系的全面重建。团队从研发初期就明确不追求短期技术参数突破,而是专注于构建与腾讯业务深度耦合的AI基础设施。
"DeepSeek-V4选择暂时放弃商业化路径,全力突破技术边界;而混元从立项之初就明确要服务腾讯生态,强调场景化落地能力。当前AI竞争已进入下半场,模型能力、生态资源和工程化能力必须形成协同效应,这恰恰是腾讯的核心优势所在。"该人士强调。
腾讯AI战略遭遇预期落差
从前期造势到正式发布,Hy3 preview的市场表现与外界期待形成显著反差。自姚顺雨加盟腾讯以来,公司给予其前所未有的战略地位:同时担任CEO办公室首席AI科学家、AI Infra部和大语言模型部负责人,直接向总裁刘炽平和技术工程事业群总裁卢山双线汇报。
这种人事安排在腾讯发展史上极为罕见,既彰显了AI战略的核心地位,也向市场传递出All in AI的强烈信号。3月18日财报电话会上,刘炽平更透露混元旗舰模型Hy3.0已进入内部测试阶段,其能力提升幅度将超过历代版本迭代。
2026年二季度全球大模型市场迎来发布潮:Anthropic发布Claude Opus 4.7、阿里推出Qwen3.6-Max-Preview、Kimi开源K2.6、小米官宣Mimo全系列。在GPT-5.5与DeepSeek V4同台竞技的背景下,市场自然期待腾讯能拿出改变行业格局的重磅产品。
然而Hy3 preview的发布却引发争议。虽然按时交付,但技术突破幅度未达预期:
首先,腾讯高管承诺的4月核心版本最终以预览版形式发布,市场认为这暴露出执行效率问题。对此内部人士解释:Hy3预览版是技术重建的起点,正式版和更高级版本仍在同步研发。该版本仅用三个月就完成交付,远快于行业6-12个月的平均周期。
其次,在行业普遍追求1T参数的背景下,Hy3 preview的295B总参数和21B激活参数显得不够惊艳。实测数据显示,其综合能力达到国内一线水平,但极限推理能力弱于GLM-5、Gemini 3.1等顶级模型,代码能力相当于四个月前的GLM-4.7水平。
不过若抛开市场的高预期滤镜,Hy3 preview在技术与落地层面已实现重大突破:推理效率提升40%,首token延迟降低54%,端到端时长缩短47%,成本大幅下降。这些核心指标的优化直接关系到用户体验和商业化可行性。
在复杂推理能力方面,Hy3 preview在FrontierScience-Olympiad取得70.0分,IMO Answer Bench达到84.3分,整体表现超过GLM-5,接近Gemini 3.1 Pro与GPT-5.4。代码与智能体能力提升尤为显著:SWE-Bench Verified通过率74.4%,Terminal-Bench 2.0得分54.4%,Agent综合评测平均分从35分跃升至56分。
这些进步源于Hy3 preview采用的Co-Design研发路线,即模型设计与产品需求深度协同。发布时已接入腾讯云、元宝、IMA、CodeBuddy等十余条核心产品线,并在多个场景取得量化成果:
办公场景中,腾讯文档AI PPT生成成功率提升20%,耗时缩短20%;WorkBuddy在用户盲评中胜率达56%,能稳定处理文档处理、数据分析等复杂任务。社交场景里,元宝APP通过深度协同优化,提升了意图理解和文本创作能力。游戏场景方面,《和平精英》接入AI NPC后,累计体验用户突破1.1亿。
目前QQ浏览器、腾讯新闻等数十款产品正在接入过程中,Hy3 preview已真正融入腾讯业务生态,而非停留在实验室阶段。
务实路线引发行业争议
"Hy3 preview是混元重建的第一步。"姚顺雨在发布推文中这样定位。尽管首秀声量不足,但这款模型背后体现的战略转型更具深远意义。腾讯混元团队向徽声在线表示,此次技术重建涉及基础设施重建和训练范式更换,难度堪比从零开发大模型。
数据审核就是典型案例:姚顺雨亲自牵头,在三个月内完成对历史SFT数据的全面去重和精细化管控。虽然模型效果取得阶段性进步,但仍存在工具调用错误恢复能力不足等问题。团队希望通过开源和发布收集真实反馈,助力正式版提升实用性。
姚顺雨上任后推行的首要变革,是否定"唯榜单论"的研发逻辑。他在内部会议上指出,过度追求榜单成绩导致训练数据污染,影响真实场景表现。为此他确立三大原则:能力体系化、评测真实性和性价比追求。
具体而言:
能力体系化:拒绝偏科发展,代码智能体等场景需实现推理、长文、指令等多能力协同
评测真实性:跳出公开榜单,通过自建题目、人工评测等方式验证真实战斗力
性价比追求:通过架构优化降低成本,让智能技术更具商业可行性
基于这些原则,Hy3 preview跳出传统评测体系,自建50余个基准测试集。腾讯专门开发的CL-bench、Hy-SWE Max等评测工具,核心目标就是验证模型在真实业务场景中的可用性,而非实验室数据。
以备受争议的295B参数为例,这恰恰体现了姚顺雨"实用优先"的战略选择。在行业普遍通过扩大参数提升能力的背景下,Hy3 preview反而减少参数规模,将资源集中在数据质量提升和底座重构上。
这种反常规路线基于三大判断:
能力边界:300B参数量级已能充分释放复杂推理等核心能力
成本控制:300B级模型可实现单机部署,1T级模型的多机通信会显著增加成本
落地可行性:工程手段可弥补能力差距,300B级模型更利于私有化部署
沿着这条路线,Hy3 preview在定价上展现诚意:腾讯云API定价在0-16K上下文范围内,输入最低1.2元/百万tokens,个人版套餐最低28元/月,在同级别模型中具有显著价格优势。
然而市场期待的是腾讯能推出"碾压同行"的顶级旗舰,这种战略选择与市场预期的错位,正是引发争议的核心原因。但腾讯的生态优势和工程化能力,仍是其在AI赛道的重要底牌。
在生态层面,腾讯拥有微信14.18亿月活用户和QQ、游戏、办公等全场景矩阵,这些真实应用场景产生的用户反馈和业务数据,是模型迭代的关键资源。商业化层面,AI正成为腾讯业务增长的新引擎:
2025年腾讯广告收入同比增长19%至1449.73亿元,AI改写了广告底层逻辑
游戏业务收入同比增长22%达2416亿元,超40款游戏落地AI应用
腾讯云首次实现规模化盈利,大模型相关产品收入近两年增长50倍
从结果看,姚顺雨用三个月完成技术重建并实现全业务场景落地,使腾讯混元重返国内第一梯队。其制定的"不偏科、不刷榜、重性价比、深贴场景"路线,正契合AI行业从参数竞争向实用落地的转型趋势。正如姚顺雨所言,大模型竞争下半场将聚焦任务定义、系统构建和真实问题解决能力,而这正是腾讯生态优势的用武之地。
随着AI技术进入深水区,腾讯的生态资源、工程化能力和商业化体系,或将在新一轮竞争中释放巨大潜能。
# 徽声在线商业消费主笔黄青春、黄青春频道出品人,关注文娱社交、游戏影音等多个领域,行业人士交流加微信:724051399,新闻线索亦可邮件至huangqingchun@huxiu.com
本文来自徽声在线,原文链接:https://www.huxiu.com/article/4853487.html?f=wyxwapp