<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Token Plan on 星期五财论</title><link>https://www.fridaycl.art/tags/token-plan/</link><description>Recent content in Token Plan on 星期五财论</description><generator>Hugo -- gohugo.io</generator><language>zh-cn</language><lastBuildDate>Sat, 30 May 2026 07:34:46 +0800</lastBuildDate><atom:link href="https://www.fridaycl.art/tags/token-plan/index.xml" rel="self" type="application/rss+xml"/><item><title>小米降价99%，为什么用户说「第二次被骗」</title><link>https://www.fridaycl.art/posts/xiaomijiangjiade20260530/</link><pubDate>Sat, 30 May 2026 07:34:46 +0800</pubDate><guid>https://www.fridaycl.art/posts/xiaomijiangjiade20260530/</guid><description>一个月前，小米大模型负责人罗福莉公开炮轰行业&amp;quot;Token价格战是陷阱&amp;quot;，呼吁全行业不要盲目降价。一个月后，小米自己降了99%。雷军转发微博，强调&amp;quot;永久降价&amp;quot;。用户打开后台一看：39块钱的套餐，一个小时烧光。这不是降价，是换了个姿势收割。
99%的降幅，藏了一个前提条件 5月27日凌晨，小米MiMo-V2.5系列API永久降价。官方数据很漂亮：缓存命中输入价格0.025元/百万tokens，相比原价降幅99%。
但99%这个数字，有一个几乎没人注意的定语——缓存命中。
没命中缓存呢？输入3元，输出6元。从0.025到3，差了120倍。
什么叫缓存命中？你的请求内容必须和之前的请求高度重复，系统直接返回缓存结果，不走模型推理。写代码、做对话、跑Agent——这些高频场景，缓存命中率远没有官方演示的那么高。
雷军在微博说&amp;quot;不再区分上下文窗口&amp;quot;，听起来像是普惠。实际上，取消窗口分档计价的另一面是：不管你用多少上下文，都按统一价扣费。短文本用户本来享受低档价格，现在反而可能多花。
用户后台：两天烧掉六成 官方宣传页写的是：39元Lite套餐在95%缓存命中场景下，可跑5亿+Token。
用户的真实体验是什么？
&amp;ldquo;39块的套餐只有6000万token，按照使用速度1个小时就用完了，根本不够用！&amp;rdquo;
&amp;ldquo;前天晚上刚开通的Token Plan standard套餐，今天一看已经用了60%。两天，直接干掉六成。也没跑什么大任务，就是正常写写东西、聊聊天、写了个小项目。照这速度整个套餐撑不过一周。&amp;rdquo;
重度用户三天见底。白嫖虽香，但得省着点用。
问题出在哪？官方算的是95%缓存命中率下的理论值。用户日常使用，缓存命中率可能只有30%-50%。一旦未命中，价格直接跳到3元/百万tokens，Token消耗速度比你以为的快3-5倍。
社区有人总结：&amp;ldquo;降价99%，质量能跟上吗，有点慌，怕踩坑。&amp;rdquo;
另一个人说得更直白：&amp;ldquo;感觉价格是下降了，但使用起来的感受是没有区别的，依然很贵，依然不耐用。&amp;rdquo;
罗福莉的&amp;quot;真香定律&amp;quot; 4月7日，小米MiMo大模型负责人罗福莉在社交平台X上发了一篇长文，核心观点：
低价Token加开放第三方Agent框架，容易让平台陷入成本失控 全球算力供给跟不上Agent带来的Token需求增长 盲目价格战会损害用户体验 建议LLM公司不要盲目压低价格 当时她还介绍了MiMo于4月3日推出的Token Plan，定价远高于现在的水平。
51天后，罗福莉亲手推翻了自己说的话。
发生了什么？4月24日，DeepSeek V4预览版发布。4月25日，V4-Pro开启2.5折优惠。4月26日，缓存命中价格暴降至首发价的十分之一。5月22日，临时折扣变成永久降价，V4-Pro永久降至原价的四分之一，缓存命中输入价从0.1元降到0.025元。
小米MiMo-V2.5-Pro火速跟进，价格直接对齐DeepSeek V4-Pro：缓存命中0.025元，未命中3元，输出6元。一模一样。
罗福莉现在改口说&amp;quot;推理框架优化后成本可控&amp;quot;。技术上确实做了优化——基于SGLang HiCache支持SWA（滑动窗口注意力），KV Cache搬运量降至1/7。但问题是：51天前你不知道自己能优化吗？还是说，DeepSeek不降价，你就&amp;quot;优化&amp;quot;不出来？
说白了，不是成本降了才降价，是DeepSeek降了才跟着降。
财报压顶，不降不行 把时间线拉长看，小米这次降价不是技术驱动，是财务驱动。
5月26日，小米发布2026年一季度财报：
总收入991.42亿元，同比下降10.9% 经调整净利润60.72亿元，同比下降43.1% 期间利润47.35亿元，同比下降56.5% 三组数字，全部下滑。营收利润双降，这在小米历史上不算常见。
更扎眼的是汽车业务：一季度净亏损31亿元。去年同期才亏5亿左右，翻了数倍。毛利率20.1%——比特斯拉还高——但依然每卖一辆SU7亏3.8万元。
研发投入一季度90亿元，宣布未来三年在AI领域投入600亿。
左手亏车，右手烧AI，中间手机出货量还在降。高盛已经下调小米2026年至2028年的总收入预期。
雷军需要一个新故事。 MiMo降价99%，就是这个故事的开头——哪怕用户发现故事和现实之间隔着一道缓存命中的墙。
&amp;ldquo;第二次被骗&amp;quot;的集体记忆 社区里最扎心的评论不是骂降价不够狠，而是这句：&amp;ldquo;上当了，被骗了，第二次被骗了。&amp;rdquo;
为什么是&amp;quot;第二次&amp;rdquo;？
因为4月3日Token Plan刚上线时，就被吐槽&amp;quot;定价偏高，便宜的套餐Token数量不足&amp;quot;。当时罗福莉的回应是&amp;quot;价格战是陷阱&amp;quot;，言下之意是我们不打价格战，我们做品质。
一个月后，不仅打了，还打得比谁都狠。
这种&amp;quot;先高后低&amp;quot;&amp;ldquo;先说不降再大降&amp;quot;的操作模式，小米在手机和互联网服务上用了无数次。会员积分、限时福利、首发优惠——套路已经刻进DNA了。用户不是傻子，被骗一次会记仇，被骗两次会形成条件反射。
所以哪怕这次是真降价、永久降价，用户的第一反应不是&amp;quot;太好了&amp;rdquo;，而是&amp;quot;又来了&amp;quot;。
信任一旦透支，真话也像假的。
管理层的战略焦虑 把MiMo降价、财报下滑、汽车亏损、AI豪赌四件事串在一起看，小米管理层的问题不是某个决策错了，而是全面铺开、处处承压。
手机：高端化推高出货均价，但出货量下降，零部件涨价侵蚀利润。IoT：补贴退坡叠加高基数，收入下滑。汽车：毛利率看着漂亮，但规模不够摊薄研发和产能投入，每辆车还在倒贴。AI：600亿三年投入，短期看不到回报。
四条战线同时烧钱，没有一条能独立造血。
雷军的赌徒心态很清楚：用AI故事撑估值，用汽车故事撑未来，用降价抢开发者生态。但问题是，这三个故事互相打架——AI降价压缩收入，汽车亏损吞噬利润，手机竞争力被分散的资源拖累。
摩根大通早就预警&amp;quot;估值透支风险&amp;quot;。53亿美元融资用的是&amp;quot;先旧后新&amp;quot;模式——雷军先向机构转让旧股，公司再发新股补回。这套操作的本质是：在股价还没崩之前，先把钱圈进来。
价格战的终局不是谁便宜，而是谁活着 小米对齐DeepSeek的价格，看起来是&amp;quot;硬刚&amp;quot;，实际上是被牵着鼻子走。
DeepSeek有幻方量化的算力底座，成本结构天然低于纯模型公司。小米靠什么降成本？靠SGLang优化、靠KV Cache压缩——这些是工程手段，不是结构性优势。今天能降99%，明天别人再降，你跟不跟？
价格战的终局从来不是&amp;quot;谁更便宜&amp;quot;，而是&amp;quot;谁亏得起更久&amp;quot;。DeepSeek背后是量化基金的利润输血，小米背后是一季度利润腰斩的财报。
罗福莉一个月前说的那句话，现在回看反而成了最清醒的判断：盲目价格战会损害用户体验。 只不过说这话的人，自己先打了自己的脸。
小米需要想清楚一个问题：你到底是一家AI公司，还是一家用AI装点门面的硬件公司？如果是前者，降价是战略；如果是后者，降价只是遮羞布。</description></item></channel></rss>