一个月前,小米大模型负责人罗福莉公开炮轰行业"Token价格战是陷阱",呼吁全行业不要盲目降价。一个月后,小米自己降了99%。雷军转发微博,强调"永久降价"。用户打开后台一看:39块钱的套餐,一个小时烧光。这不是降价,是换了个姿势收割。
99%的降幅,藏了一个前提条件
5月27日凌晨,小米MiMo-V2.5系列API永久降价。官方数据很漂亮:缓存命中输入价格0.025元/百万tokens,相比原价降幅99%。
但99%这个数字,有一个几乎没人注意的定语——缓存命中。
没命中缓存呢?输入3元,输出6元。从0.025到3,差了120倍。
什么叫缓存命中?你的请求内容必须和之前的请求高度重复,系统直接返回缓存结果,不走模型推理。写代码、做对话、跑Agent——这些高频场景,缓存命中率远没有官方演示的那么高。
雷军在微博说"不再区分上下文窗口",听起来像是普惠。实际上,取消窗口分档计价的另一面是:不管你用多少上下文,都按统一价扣费。短文本用户本来享受低档价格,现在反而可能多花。
用户后台:两天烧掉六成
官方宣传页写的是:39元Lite套餐在95%缓存命中场景下,可跑5亿+Token。
用户的真实体验是什么?
“39块的套餐只有6000万token,按照使用速度1个小时就用完了,根本不够用!”
“前天晚上刚开通的Token Plan standard套餐,今天一看已经用了60%。两天,直接干掉六成。也没跑什么大任务,就是正常写写东西、聊聊天、写了个小项目。照这速度整个套餐撑不过一周。”
重度用户三天见底。白嫖虽香,但得省着点用。
问题出在哪?官方算的是95%缓存命中率下的理论值。用户日常使用,缓存命中率可能只有30%-50%。一旦未命中,价格直接跳到3元/百万tokens,Token消耗速度比你以为的快3-5倍。
社区有人总结:“降价99%,质量能跟上吗,有点慌,怕踩坑。”
另一个人说得更直白:“感觉价格是下降了,但使用起来的感受是没有区别的,依然很贵,依然不耐用。”
罗福莉的"真香定律"
4月7日,小米MiMo大模型负责人罗福莉在社交平台X上发了一篇长文,核心观点:
- 低价Token加开放第三方Agent框架,容易让平台陷入成本失控
- 全球算力供给跟不上Agent带来的Token需求增长
- 盲目价格战会损害用户体验
- 建议LLM公司不要盲目压低价格
当时她还介绍了MiMo于4月3日推出的Token Plan,定价远高于现在的水平。
51天后,罗福莉亲手推翻了自己说的话。
发生了什么?4月24日,DeepSeek V4预览版发布。4月25日,V4-Pro开启2.5折优惠。4月26日,缓存命中价格暴降至首发价的十分之一。5月22日,临时折扣变成永久降价,V4-Pro永久降至原价的四分之一,缓存命中输入价从0.1元降到0.025元。
小米MiMo-V2.5-Pro火速跟进,价格直接对齐DeepSeek V4-Pro:缓存命中0.025元,未命中3元,输出6元。一模一样。
罗福莉现在改口说"推理框架优化后成本可控"。技术上确实做了优化——基于SGLang HiCache支持SWA(滑动窗口注意力),KV Cache搬运量降至1/7。但问题是:51天前你不知道自己能优化吗?还是说,DeepSeek不降价,你就"优化"不出来?
说白了,不是成本降了才降价,是DeepSeek降了才跟着降。
财报压顶,不降不行
把时间线拉长看,小米这次降价不是技术驱动,是财务驱动。
5月26日,小米发布2026年一季度财报:
- 总收入991.42亿元,同比下降10.9%
- 经调整净利润60.72亿元,同比下降43.1%
- 期间利润47.35亿元,同比下降56.5%
三组数字,全部下滑。营收利润双降,这在小米历史上不算常见。
更扎眼的是汽车业务:一季度净亏损31亿元。去年同期才亏5亿左右,翻了数倍。毛利率20.1%——比特斯拉还高——但依然每卖一辆SU7亏3.8万元。
研发投入一季度90亿元,宣布未来三年在AI领域投入600亿。
左手亏车,右手烧AI,中间手机出货量还在降。高盛已经下调小米2026年至2028年的总收入预期。
雷军需要一个新故事。 MiMo降价99%,就是这个故事的开头——哪怕用户发现故事和现实之间隔着一道缓存命中的墙。
“第二次被骗"的集体记忆
社区里最扎心的评论不是骂降价不够狠,而是这句:“上当了,被骗了,第二次被骗了。”
为什么是"第二次”?
因为4月3日Token Plan刚上线时,就被吐槽"定价偏高,便宜的套餐Token数量不足"。当时罗福莉的回应是"价格战是陷阱",言下之意是我们不打价格战,我们做品质。
一个月后,不仅打了,还打得比谁都狠。
这种"先高后低"“先说不降再大降"的操作模式,小米在手机和互联网服务上用了无数次。会员积分、限时福利、首发优惠——套路已经刻进DNA了。用户不是傻子,被骗一次会记仇,被骗两次会形成条件反射。
所以哪怕这次是真降价、永久降价,用户的第一反应不是"太好了”,而是"又来了"。
信任一旦透支,真话也像假的。
管理层的战略焦虑
把MiMo降价、财报下滑、汽车亏损、AI豪赌四件事串在一起看,小米管理层的问题不是某个决策错了,而是全面铺开、处处承压。
手机:高端化推高出货均价,但出货量下降,零部件涨价侵蚀利润。IoT:补贴退坡叠加高基数,收入下滑。汽车:毛利率看着漂亮,但规模不够摊薄研发和产能投入,每辆车还在倒贴。AI:600亿三年投入,短期看不到回报。
四条战线同时烧钱,没有一条能独立造血。
雷军的赌徒心态很清楚:用AI故事撑估值,用汽车故事撑未来,用降价抢开发者生态。但问题是,这三个故事互相打架——AI降价压缩收入,汽车亏损吞噬利润,手机竞争力被分散的资源拖累。
摩根大通早就预警"估值透支风险"。53亿美元融资用的是"先旧后新"模式——雷军先向机构转让旧股,公司再发新股补回。这套操作的本质是:在股价还没崩之前,先把钱圈进来。
价格战的终局不是谁便宜,而是谁活着
小米对齐DeepSeek的价格,看起来是"硬刚",实际上是被牵着鼻子走。
DeepSeek有幻方量化的算力底座,成本结构天然低于纯模型公司。小米靠什么降成本?靠SGLang优化、靠KV Cache压缩——这些是工程手段,不是结构性优势。今天能降99%,明天别人再降,你跟不跟?
价格战的终局从来不是"谁更便宜",而是"谁亏得起更久"。DeepSeek背后是量化基金的利润输血,小米背后是一季度利润腰斩的财报。
罗福莉一个月前说的那句话,现在回看反而成了最清醒的判断:盲目价格战会损害用户体验。 只不过说这话的人,自己先打了自己的脸。
小米需要想清楚一个问题:你到底是一家AI公司,还是一家用AI装点门面的硬件公司?如果是前者,降价是战略;如果是后者,降价只是遮羞布。
你怎么看小米这波操作?是真良心还是换套路?评论区聊聊。
参考来源
- 小米MiMo-V2.5系列API永久降价 — IT之家
- 小米集团2026年一季报解读 — 雪球
- 小米一季度营收承压、利润收缩 — 新浪财经
- 小米Token降价99%,罗福莉为何打破自己立的规矩 — 网易
- 2026年中国大模型API成本深度对比 — Apifox
{
"comments": [
{
"user": "韭菜保护协会",
"time": "2026-05-30T08:15:00Z",
"content": "99%降幅,前提是你得命中缓存。没命中?3块钱一百万token,跟之前有什么区别?这不就是把打折标签换了张皮嘛",
"likes": 186,
"replies": [
{
"user": "散户小明",
"time": "2026-05-30T08:22:00Z",
"content": "我试了一下,写个代码助手,缓存命中率也就40%左右,算下来根本没便宜多少",
"likes": 73
},
{
"user": "用脚投票",
"time": "2026-05-30T08:35:00Z",
"content": "95%缓存命中率?这是拿Hello World测出来的吧",
"likes": 121
}
]
},
{
"user": "行业研究员老陈",
"time": "2026-05-30T08:40:00Z",
"content": "罗福莉4月说价格战是陷阱,5月自己跳进去了。这脸打得,我在隔壁办公室都听见响了",
"likes": 152,
"replies": [
{
"user": "半导体厂打工人",
"time": "2026-05-30T08:55:00Z",
"content": "DeepSeek降了她不降,开发者全跑了,到时候连打脸的机会都没有",
"likes": 89
}
]
},
{
"user": "消费品投资人",
"time": "2026-05-30T09:10:00Z",
"content": "一季度利润腰斩,汽车每辆亏3.8万,AI三年烧600亿。雷军这是同时开三条战线,哪条都没打明白",
"likes": 98,
"replies": [
{
"user": "财务分析爱好者",
"time": "2026-05-30T09:25:00Z",
"content": "汽车毛利率20%看着漂亮,但规模太小摊不平研发成本。等产能爬上来,价格战又把毛利打下去了",
"likes": 67
}
]
},
{
"user": "ST观察员",
"time": "2026-05-30T09:30:00Z",
"content": "第二次被骗那个评论太真实了。4月刚上线就被吐槽贵,当时还嘴硬说价格战是陷阱。现在呢?自己变成陷阱本身了",
"likes": 134,
"replies": []
},
{
"user": "吃瓜不吐皮",
"time": "2026-05-30T09:45:00Z",
"content": "先旧后新融资53亿美元,雷军先卖旧股再让公司发新股。说白了就是趁股价还没崩先套现,这操作我怎么在A股见过",
"likes": 108,
"replies": [
{
"user": "并购律师小张",
"time": "2026-05-30T10:00:00Z",
"content": "先旧后新在港股是常规操作,但结合利润腰斩的时间点看,确实有锁定高位的意味",
"likes": 45
}
]
},
{
"user": "法务小姐姐",
"time": "2026-05-30T10:15:00Z",
"content": "最搞笑的是Token Plan套餐,39块钱的Lite号称能跑5亿token,实际用户反馈一小时就用完了。这宣传和实际差了多少倍?",
"likes": 76,
"replies": [
{
"user": "00后穿搭博主",
"time": "2026-05-30T10:30:00Z",
"content": "我Standard套餐两天用了六成,就写写东西聊聊天。这Token是金子做的吗",
"likes": 93
}
]
}
]
}
评论区 --