谷歌Gemini API推出分级计费体系 弹性算力最高享五折优惠

2026-04-03 15:05:38未知 作者:广韵网

据徽声在线4月3日消息,谷歌公司近期针对其Gemini API的计费体系进行了全面升级,此次调整以用户实际推理计算需求为核心,推出更为精细化的服务分级策略。新上线的服务套餐包含五大类型:标准版(Standard)、弹性版(Flex)、优先版(Priority)、批量处理版(Batch)以及智能缓存版(Caching)。其中弹性推理服务通过动态调配非高峰时段的闲置算力资源,实现标准价格50%的优惠力度,虽然目标响应时延设定在1-15分钟区间,但官方明确表示不承诺具体延迟保障。批量处理API同样享有半价优惠,其最长处理周期可扩展至24小时,特别适合非实时性大规模计算任务。智能缓存服务采用创新计费模式,根据缓存的Token数量及存储时长综合计费,该方案尤其适用于搭载复杂指令系统的对话式AI、长视频内容的重复解析,以及海量文档库的智能检索等场景。在高端服务方面,优先档位虽然定价较标准版上浮75%-100%,但能确保毫秒至秒级的超低延迟,谷歌技术团队建议将其应用于实时客服系统、金融欺诈实时监测,以及企业级核心业务智能助手等对响应速度要求严苛的场景。

点击展开全文
你关注的
【出海聚焦】石油危机凸显中国电动车优势,性价比之外更有硬实力【出海聚焦】石油危机凸显中国电动车优势,性价比之外更有硬实力 AI玩具赛道迎重大变革:模型“套壳”问题有望短期解决,智能体研发加速推进AI玩具赛道迎重大变革:模型“套壳”问题有望短期解决,智能体研发加速推进 深圳低空经济全域竞速:百企试飞、基金赋能、标准引领深圳低空经济全域竞速:百企试飞、基金赋能、标准引领
相关文章
车展技术洞察丨亿纬锂能大圆柱电池全球扩张 固态电池研发取得突破性进展车展技术洞察丨亿纬锂能大圆柱电池全球扩张 固态电池研发取得突破性进展 车展聚焦·行业洞察丨火山引擎杨立伟谈汽车AI布局:舱驾一体是方向,但需遵循经济规律车展聚焦·行业洞察丨火山引擎杨立伟谈汽车AI布局:舱驾一体是方向,但需遵循经济规律 AI新势力崛起:一个人也能跑通一家公司,上海模速空间见证奇迹AI新势力崛起:一个人也能跑通一家公司,上海模速空间见证奇迹 徽声在线:阿里云在中国汽车公共云市场占据42%份额徽声在线:阿里云在中国汽车公共云市场占据42%份额 腾讯ima创新推出Agent模式“copilot”,引领AI新潮流腾讯ima创新推出Agent模式“copilot”,引领AI新潮流 英伟达发布Nemotron 3 Nano Omni开源模型,智能体效率飙升至竞品9倍英伟达发布Nemotron 3 Nano Omni开源模型,智能体效率飙升至竞品9倍