小米MiMo-V2.5系列API永久降价：最高降幅99%，全球同步生效

小米 MiMo 官方今日正式宣布，将对整个模型价格体系进行一次永久性的全面翻新。自北京时间5月27日0:00起，小米 MiMo-V2.5 系列 API 实行永久降价，新定价相比原始 API 定价最高降幅可达 99%，且不再区分上下文窗口长度。本次调价全球同步生效，标志着小米在AI基础设施普惠化上迈出了关键一步。

此次调价并非简单的折扣，而是对计费逻辑的彻底重构。在具体的定价策略上，小米展现了极强的诚意与竞争力。以 MiMo-V2.5-Pro 为例，调价后输入价格仅为 0.025元/百万Tokens，相比此前 256k 上下文窗口的定价降幅高达 98%，相比 1M 长上下文窗口更是直降 99%。即便是未命中缓存的输入与输出环节，降幅也分别达到了 86% 和 71%。更值得关注的是，新计费体系彻底打破了行业内普遍存在的“上下文窗口长度”限制。以往开发者在使用超长文本或多轮对话时往往需要承担高昂的溢价，而此次调整后，无论输入长度如何，都将执行统一的超低费率。这一举措极大地简化了开发者的成本核算，让AI能力的调用变得更加透明、可控。

除了 API 的直接降价，小米还同步优化了 Token Plan 计费体系。在新的计费规则下，同等价格对应的 Token 用量将提升至原来的 5-8 倍。官方表示，这一调整旨在让计费规则更加“所见即所得”，清晰易懂。为了保障用户权益，所有已订阅 Token Plan 且当前仍在有效期的用户（包括参与“百万亿 Token 创造者激励计划”及 Apache 软件基金会专属福利的用户），其 Credits 额度将于北京时间 5 月 27 日 0:00 全量重置，并直接按新计费规则执行。这意味着，老用户不仅享受到了降价红利，手中的 Token 资产价值也获得了实质性的翻倍。此外，针对 Token Plan 已过期的历史付费用户，官方也预告将在未来一周内公布专属的惊喜好礼。

此次“骨折式”降价的背后，是小米在底层推理技术上的持续精进。通过支持 SWA 等前沿技术，小米技术团队成功将 KV Cache 的数据搬运量降低至优化前的近 1/7，并将可缓存 Token 数量提升至近 5 倍，同时通过优化专家并行方案大幅提升了集群吞吐能力。正是这些技术层面的降本增效，为此次价格体系的重构提供了坚实的底层支撑。