

5月27日凌晨,小米MiMo-V2.5系列宣布降价99%。与此同时,小米Token Plan计费体系同步优化,定价不变,可用量提升至原来的5至8倍。对于降价原因,时隔20小时后,小米MiMo大模型负责人罗福莉发长文,解释MiMo API 降价背后的原因。罗福莉表示,此次降价力度达99...
5月27日凌晨,小米MiMo-V2.5系列宣布降价99%。与此同时,小米Token Plan计费体系同步优化,定价不变,可用量提升至原来的5至8倍。对于降价原因,时隔20小时后,小米MiMo大模型负责人罗福莉发长文,解释MiMo API 降价背后的原因。罗福莉表示,此次降价力度达99...
与此同时,小米Token Plan计费体系同步优化,定价不变,可用量提升至原来的5至8倍。
对于降价原因,时隔20小时后,小米MiMo大模型负责人罗福莉发长文,解释MiMo API 降价背后的原因。
罗福莉表示,此次降价力度达99%,主要针对缓存命中的输入场景。目前我们的推理框架完成升级,支持 SWA 分层 KV 缓存优化,实测缓存令牌容量翻了5倍,直接把缓存成本砍掉 80%。再加上模型多模块缓存读取的叠加优化,整体还能再往下压。
她提到,MiMo 定价时预留了 2 到 3 倍的利润空间。如今 API 价格大幅下调,即便引擎跑至接近满负荷,依旧能基本实现收支平衡。
“此前我们也提醒过同行,别一味跟风打价格战。多数模型和推理方案根本撑不住低价,很容易陷入亏损。如果业内都能做出更省算力、优化缓存的架构,搭配成熟的推理基建降本,整个行业才能进入良性发展。”
总结来说,罗福莉说的意思就是:小米MiMo算力优化的好、性能强,你们可别再乱跟降价了。#人工智能# #小红书热点观察团# #小红书科技观察团# #小红书科技AMA# #今日热点# #小米# #罗福莉# #科技资讯早知道# #AI工具# #科技#