小米降价99%,为什么用户说「第二次被骗」

一个月前,小米大模型负责人罗福莉公开炮轰行业"Token价格战是陷阱",呼吁全行业不要盲目降价。一个月后,小米自己降了99%。雷军转发微博,强调"永久降价"。用户打开后台一看:39块钱的套餐,一个小时烧光。这不是降价,是换了个姿势收割。

99%的降幅,藏了一个前提条件

5月27日凌晨,小米MiMo-V2.5系列API永久降价。官方数据很漂亮:缓存命中输入价格0.025元/百万tokens,相比原价降幅99%。

但99%这个数字,有一个几乎没人注意的定语——缓存命中

没命中缓存呢?输入3元,输出6元。从0.025到3,差了120倍。

什么叫缓存命中?你的请求内容必须和之前的请求高度重复,系统直接返回缓存结果,不走模型推理。写代码、做对话、跑Agent——这些高频场景,缓存命中率远没有官方演示的那么高。

雷军在微博说"不再区分上下文窗口",听起来像是普惠。实际上,取消窗口分档计价的另一面是:不管你用多少上下文,都按统一价扣费。短文本用户本来享受低档价格,现在反而可能多花。

用户后台:两天烧掉六成

官方宣传页写的是:39元Lite套餐在95%缓存命中场景下,可跑5亿+Token。

用户的真实体验是什么?

“39块的套餐只有6000万token,按照使用速度1个小时就用完了,根本不够用!”

“前天晚上刚开通的Token Plan standard套餐,今天一看已经用了60%。两天,直接干掉六成。也没跑什么大任务,就是正常写写东西、聊聊天、写了个小项目。照这速度整个套餐撑不过一周。”

重度用户三天见底。白嫖虽香,但得省着点用。

问题出在哪?官方算的是95%缓存命中率下的理论值。用户日常使用,缓存命中率可能只有30%-50%。一旦未命中,价格直接跳到3元/百万tokens,Token消耗速度比你以为的快3-5倍。

社区有人总结:“降价99%,质量能跟上吗,有点慌,怕踩坑。”

另一个人说得更直白:“感觉价格是下降了,但使用起来的感受是没有区别的,依然很贵,依然不耐用。”

罗福莉的"真香定律"

4月7日,小米MiMo大模型负责人罗福莉在社交平台X上发了一篇长文,核心观点:

  • 低价Token加开放第三方Agent框架,容易让平台陷入成本失控
  • 全球算力供给跟不上Agent带来的Token需求增长
  • 盲目价格战会损害用户体验
  • 建议LLM公司不要盲目压低价格

当时她还介绍了MiMo于4月3日推出的Token Plan,定价远高于现在的水平。

51天后,罗福莉亲手推翻了自己说的话。

发生了什么?4月24日,DeepSeek V4预览版发布。4月25日,V4-Pro开启2.5折优惠。4月26日,缓存命中价格暴降至首发价的十分之一。5月22日,临时折扣变成永久降价,V4-Pro永久降至原价的四分之一,缓存命中输入价从0.1元降到0.025元。

小米MiMo-V2.5-Pro火速跟进,价格直接对齐DeepSeek V4-Pro:缓存命中0.025元,未命中3元,输出6元。一模一样。

罗福莉现在改口说"推理框架优化后成本可控"。技术上确实做了优化——基于SGLang HiCache支持SWA(滑动窗口注意力),KV Cache搬运量降至1/7。但问题是:51天前你不知道自己能优化吗?还是说,DeepSeek不降价,你就"优化"不出来?

说白了,不是成本降了才降价,是DeepSeek降了才跟着降。

财报压顶,不降不行

把时间线拉长看,小米这次降价不是技术驱动,是财务驱动。

5月26日,小米发布2026年一季度财报:

  • 总收入991.42亿元,同比下降10.9%
  • 经调整净利润60.72亿元,同比下降43.1%
  • 期间利润47.35亿元,同比下降56.5%

三组数字,全部下滑。营收利润双降,这在小米历史上不算常见。

更扎眼的是汽车业务:一季度净亏损31亿元。去年同期才亏5亿左右,翻了数倍。毛利率20.1%——比特斯拉还高——但依然每卖一辆SU7亏3.8万元。

研发投入一季度90亿元,宣布未来三年在AI领域投入600亿。

左手亏车,右手烧AI,中间手机出货量还在降。高盛已经下调小米2026年至2028年的总收入预期。

雷军需要一个新故事。 MiMo降价99%,就是这个故事的开头——哪怕用户发现故事和现实之间隔着一道缓存命中的墙。

“第二次被骗"的集体记忆

社区里最扎心的评论不是骂降价不够狠,而是这句:“上当了,被骗了,第二次被骗了。”

为什么是"第二次”?

因为4月3日Token Plan刚上线时,就被吐槽"定价偏高,便宜的套餐Token数量不足"。当时罗福莉的回应是"价格战是陷阱",言下之意是我们不打价格战,我们做品质。

一个月后,不仅打了,还打得比谁都狠。

这种"先高后低"“先说不降再大降"的操作模式,小米在手机和互联网服务上用了无数次。会员积分、限时福利、首发优惠——套路已经刻进DNA了。用户不是傻子,被骗一次会记仇,被骗两次会形成条件反射。

所以哪怕这次是真降价、永久降价,用户的第一反应不是"太好了”,而是"又来了"。

信任一旦透支,真话也像假的。

管理层的战略焦虑

把MiMo降价、财报下滑、汽车亏损、AI豪赌四件事串在一起看,小米管理层的问题不是某个决策错了,而是全面铺开、处处承压

手机:高端化推高出货均价,但出货量下降,零部件涨价侵蚀利润。IoT:补贴退坡叠加高基数,收入下滑。汽车:毛利率看着漂亮,但规模不够摊薄研发和产能投入,每辆车还在倒贴。AI:600亿三年投入,短期看不到回报。

四条战线同时烧钱,没有一条能独立造血。

雷军的赌徒心态很清楚:用AI故事撑估值,用汽车故事撑未来,用降价抢开发者生态。但问题是,这三个故事互相打架——AI降价压缩收入,汽车亏损吞噬利润,手机竞争力被分散的资源拖累。

摩根大通早就预警"估值透支风险"。53亿美元融资用的是"先旧后新"模式——雷军先向机构转让旧股,公司再发新股补回。这套操作的本质是:在股价还没崩之前,先把钱圈进来。

价格战的终局不是谁便宜,而是谁活着

小米对齐DeepSeek的价格,看起来是"硬刚",实际上是被牵着鼻子走。

DeepSeek有幻方量化的算力底座,成本结构天然低于纯模型公司。小米靠什么降成本?靠SGLang优化、靠KV Cache压缩——这些是工程手段,不是结构性优势。今天能降99%,明天别人再降,你跟不跟?

价格战的终局从来不是"谁更便宜",而是"谁亏得起更久"。DeepSeek背后是量化基金的利润输血,小米背后是一季度利润腰斩的财报。

罗福莉一个月前说的那句话,现在回看反而成了最清醒的判断:盲目价格战会损害用户体验。 只不过说这话的人,自己先打了自己的脸。

小米需要想清楚一个问题:你到底是一家AI公司,还是一家用AI装点门面的硬件公司?如果是前者,降价是战略;如果是后者,降价只是遮羞布。


你怎么看小米这波操作?是真良心还是换套路?评论区聊聊。

参考来源

  1. 小米MiMo-V2.5系列API永久降价 — IT之家
  2. 小米集团2026年一季报解读 — 雪球
  3. 小米一季度营收承压、利润收缩 — 新浪财经
  4. 小米Token降价99%,罗福莉为何打破自己立的规矩 — 网易
  5. 2026年中国大模型API成本深度对比 — Apifox
{
  "comments": [
    {
      "user": "韭菜保护协会",
      "time": "2026-05-30T08:15:00Z",
      "content": "99%降幅,前提是你得命中缓存。没命中?3块钱一百万token,跟之前有什么区别?这不就是把打折标签换了张皮嘛",
      "likes": 186,
      "replies": [
        {
          "user": "散户小明",
          "time": "2026-05-30T08:22:00Z",
          "content": "我试了一下,写个代码助手,缓存命中率也就40%左右,算下来根本没便宜多少",
          "likes": 73
        },
        {
          "user": "用脚投票",
          "time": "2026-05-30T08:35:00Z",
          "content": "95%缓存命中率?这是拿Hello World测出来的吧",
          "likes": 121
        }
      ]
    },
    {
      "user": "行业研究员老陈",
      "time": "2026-05-30T08:40:00Z",
      "content": "罗福莉4月说价格战是陷阱,5月自己跳进去了。这脸打得,我在隔壁办公室都听见响了",
      "likes": 152,
      "replies": [
        {
          "user": "半导体厂打工人",
          "time": "2026-05-30T08:55:00Z",
          "content": "DeepSeek降了她不降,开发者全跑了,到时候连打脸的机会都没有",
          "likes": 89
        }
      ]
    },
    {
      "user": "消费品投资人",
      "time": "2026-05-30T09:10:00Z",
      "content": "一季度利润腰斩,汽车每辆亏3.8万,AI三年烧600亿。雷军这是同时开三条战线,哪条都没打明白",
      "likes": 98,
      "replies": [
        {
          "user": "财务分析爱好者",
          "time": "2026-05-30T09:25:00Z",
          "content": "汽车毛利率20%看着漂亮,但规模太小摊不平研发成本。等产能爬上来,价格战又把毛利打下去了",
          "likes": 67
        }
      ]
    },
    {
      "user": "ST观察员",
      "time": "2026-05-30T09:30:00Z",
      "content": "第二次被骗那个评论太真实了。4月刚上线就被吐槽贵,当时还嘴硬说价格战是陷阱。现在呢?自己变成陷阱本身了",
      "likes": 134,
      "replies": []
    },
    {
      "user": "吃瓜不吐皮",
      "time": "2026-05-30T09:45:00Z",
      "content": "先旧后新融资53亿美元,雷军先卖旧股再让公司发新股。说白了就是趁股价还没崩先套现,这操作我怎么在A股见过",
      "likes": 108,
      "replies": [
        {
          "user": "并购律师小张",
          "time": "2026-05-30T10:00:00Z",
          "content": "先旧后新在港股是常规操作,但结合利润腰斩的时间点看,确实有锁定高位的意味",
          "likes": 45
        }
      ]
    },
    {
      "user": "法务小姐姐",
      "time": "2026-05-30T10:15:00Z",
      "content": "最搞笑的是Token Plan套餐,39块钱的Lite号称能跑5亿token,实际用户反馈一小时就用完了。这宣传和实际差了多少倍?",
      "likes": 76,
      "replies": [
        {
          "user": "00后穿搭博主",
          "time": "2026-05-30T10:30:00Z",
          "content": "我Standard套餐两天用了六成,就写写东西聊聊天。这Token是金子做的吗",
          "likes": 93
        }
      ]
    }
  ]
}
累计浏览 --

评论区 --