小米 MiMo 官方今日正式宣布,将对整个模型价格体系进行一次永久性的全面翻新。自北京时间5月27日0:00起,小米 MiMo-V2.5 系列 API 实行永久降价,新定价相比原始 API 定价最高降幅可达 99%,且不再区分上下文窗口长度。本次调价全球同步生效,标志着小米在AI基础设施普惠化上迈出了关键一步。

此次调价并非简单的折扣,而是对计费逻辑的彻底重构。在具体的定价策略上,小米展现了极强的诚意与竞争力。以 MiMo-V2.5-Pro 为例,调价后输入价格仅为 0.025元/百万Tokens,相比此前 256k 上下文窗口的定价降幅高达 98%,相比 1M 长上下文窗口更是直降 99%。即便是未命中缓存的输入与输出环节,降幅也分别达到了 86% 和 71%。更值得关注的是,新计费体系彻底打破了行业内普遍存在的“上下文窗口长度”限制。以往开发者在使用超长文本或多轮对话时往往需要承担高昂的溢价,而此次调整后,无论输入长度如何,都将执行统一的超低费率。这一举措极大地简化了开发者的成本核算,让AI能力的调用变得更加透明、可控。
除了 API 的直接降价,小米还同步优化了 Token Plan 计费体系。在新的计费规则下,同等价格对应的 Token 用量将提升至原来的 5-8 倍。官方表示,这一调整旨在让计费规则更加“所见即所得”,清晰易懂。为了保障用户权益,所有已订阅 Token Plan 且当前仍在有效期的用户(包括参与“百万亿 Token 创造者激励计划”及 Apache 软件基金会专属福利的用户),其 Credits 额度将于北京时间 5 月 27 日 0:00 全量重置,并直接按新计费规则执行。这意味着,老用户不仅享受到了降价红利,手中的 Token 资产价值也获得了实质性的翻倍。此外,针对 Token Plan 已过期的历史付费用户,官方也预告将在未来一周内公布专属的惊喜好礼。
此次“骨折式”降价的背后,是小米在底层推理技术上的持续精进。通过支持 SWA 等前沿技术,小米技术团队成功将 KV Cache 的数据搬运量降低至优化前的近 1/7,并将可缓存 Token 数量提升至近 5 倍,同时通过优化专家并行方案大幅提升了集群吞吐能力。正是这些技术层面的降本增效,为此次价格体系的重构提供了坚实的底层支撑。


