算力告急!微软等云巨头被指对中小客户“区别对待”
2026-04-25 04:08:29未知 作者:徽声在线
徽声在线4月24日讯(编辑 史正丞改写)在AI技术飞速进步并掀起全球创业热潮的当下,一些在美国崭露头角的初创公司正遭遇一个棘手难题:从微软等云服务巨头那里获取算力变得异常艰难。除了算力租赁价格飙升、需要长时间排队等候外,部分中小客户甚至难以获得云服务商销售人员的回应。
最新消息显示,与2023年AI应用初步兴起时的算力紧张状况相比,如今对AI编程工具和智能体应用的需求呈现爆发式增长。这使得云服务商不得不将主要精力放在满足头部AI开发者(如Anthropic)的需求上,同时对中小客户的GPU资源供应进行严格限制。
算力价格飙升,销售代表“玩失踪”
旧金山初创公司Krea的遭遇颇具代表性。Krea专注于AI图像生成应用的开发,成立四年来已成功从a16z、贝恩资本等知名风险投资机构融资8300万美元。
Krea的联合创始人兼首席执行官维克托·佩雷斯向媒体透露,六个月前,在多家云服务商的激烈竞争下,公司以每块芯片每小时2.8美元的价格租用了数百块英伟达Blackwell芯片。然而,在过去一个月里,当公司试图租用更多AI服务器用于模型训练时,却遭遇了云服务商销售代表的“冷处理”,甚至电话都不接了。
佩雷斯表示,好不容易得到回复后,却被告知算力价格已大幅上涨,且合作条件包括签订至少三年的长期合约。
即便在这样的条件下,当公司开始评估服务器报价时,短短几天内这些资源就被其他客户抢订一空。
最终,Krea以承诺额外增加数百块Blackwell芯片并签订一年合约的条件,获得了每小时每块芯片3.7美元的租赁价格,较半年前上涨了32%。尽管如此,与其他供应商的报价相比,这个价格仍然相对较低。
佩雷斯忧心忡忡地表示:“我们最担忧的是无法获取足够的算力资源来运行平台和训练模型。即便算力价格有所上涨,也不会对我们的生存构成致命威胁。”
引发这场“算力争夺战”的另一个重要因素是,许多在“ChatGPT时代”成立的初创公司,此前签订的两年或三年期云服务合同即将到期。云服务商趁机寻求涨价,或将算力重新分配给Anthropic、OpenAI等对算力需求巨大且支付能力强的“超级大户”。
云服务商Lightning AI的首席执行官Will Falcon透露,公司在线的GPU数量约为40,000块,但潜在租赁订单积压的需求却高达约400,000块。
Falcon指出,这导致算力价格在过去六个月内上涨超过25%,从每块芯片每小时约1.60美元涨至超过2美元,某些情况下甚至更高。需要说明的是,Lightning AI主要使用的是英伟达上一代Hopper架构产品。
微软的“用或失去”政策加剧算力紧张
对于那些仍能从微软等云服务商租到算力的公司而言,现在也面临着更为严苛的政策限制。
据匿名微软员工透露,由于大型客户以及微软内部团队的需求激增,微软云计算部门Azure已开始限制向中小客户出租服务器的数量。该员工表示,一些中小客户目前租用额外GPU时,需要排队等待数月时间,且还要面临被“挑挑拣拣”的境地。
例如,微软近几个月开始要求希望租用英伟达Blackwell芯片的客户承诺至少打包1000块芯片,且租期至少为一年,这样的合约最低也要数千万美元。现在,从Azure租用少量上一代英伟达芯片的客户,也得至少等待数周乃至数月时间。
关键在于,等待时间的长短取决于客户与微软的“关系”亲疏。
Azure采用分级制度对客户进行优先排序。获得优先访问权的一级客户大约有1000家,是Azure最大的收入来源;二级客户开支较小,但仍足以让微软为其指定专门的销售代表进行管理;三级客户则是由微软的转售合作伙伴负责维护关系的较小企业。
如果客户不承诺预订大量GPU,而是选择按需付费(pay-as-you-go)的方式租用芯片,往往需要等待较长时间才能获得算力资源。
一位微软员工表示,即便微软按这种方式向客户提供GPU容量,仍会持续跟踪其使用情况。服务器哪怕只闲置几个小时,就有可能被收回访问权限。
此外,微软还在收回部分通过初创企业扶持计划获得GPU使用权限的企业的算力资源。该计划原本向初创公司提供免费的云服务器额度,但微软已告知相关初创企业,如果未能充分利用这些GPU,就可能失去使用权限。
自购芯片成初创公司新选择
面对从云服务商获取算力的重重困难,一些初创公司开始考虑自己购买英伟达芯片。
油气企业AI智能体初创公司Collide的创始人Collin McLelland表示,由于等待租用大型云服务商的排队时间过长以及使用限制让他感到不胜其烦,他正考虑花费大约50万美元购买英伟达的GPU进行自主运行。
Collide计划等GPU到货后,直接向数据中心运营商或云服务提供商租用机房空间进行托管部署。
McLelland认为,虽然短期来看,自购并部署GPU的成本明显高于向云服务商租赁,但为了避免算力租赁的不确定性和等待延迟,这一投入是值得的。从长期来看,自购GPU的总成本预计反而低于持续租赁。
他坦言:“如果在需要算力的时候却没有可用资源,对我们来说风险极大。很多人只是害怕接触硬件而已。我以前买过油井,所以对这些并不陌生。”