Token Plan on 星期五财论

Token Plan on 星期五财论https://www.fridaycl.art/tags/token-plan/Recent content in Token Plan on 星期五财论Hugo -- gohugo.iozh-cnSat, 30 May 2026 07:34:46 +0800小米降价99%，为什么用户说「第二次被骗」https://www.fridaycl.art/posts/xiaomijiangjiade20260530/Sat, 30 May 2026 07:34:46 +0800https://www.fridaycl.art/posts/xiaomijiangjiade20260530/一个月前，小米大模型负责人罗福莉公开炮轰行业"Token价格战是陷阱"，呼吁全行业不要盲目降价。一个月后，小米自己降了99%。雷军转发微博，强调"永久降价"。用户打开后台一看：39块钱的套餐，一个小时烧光。这不是降价，是换了个姿势收割。 99%的降幅，藏了一个前提条件 5月27日凌晨，小米MiMo-V2.5系列API永久降价。官方数据很漂亮：缓存命中输入价格0.025元/百万tokens，相比原价降幅99%。但99%这个数字，有一个几乎没人注意的定语——缓存命中。没命中缓存呢？输入3元，输出6元。从0.025到3，差了120倍。什么叫缓存命中？你的请求内容必须和之前的请求高度重复，系统直接返回缓存结果，不走模型推理。写代码、做对话、跑Agent——这些高频场景，缓存命中率远没有官方演示的那么高。雷军在微博说"不再区分上下文窗口"，听起来像是普惠。实际上，取消窗口分档计价的另一面是：不管你用多少上下文，都按统一价扣费。短文本用户本来享受低档价格，现在反而可能多花。用户后台：两天烧掉六成官方宣传页写的是：39元Lite套餐在95%缓存命中场景下，可跑5亿+Token。用户的真实体验是什么？ “39块的套餐只有6000万token，按照使用速度1个小时就用完了，根本不够用！” “前天晚上刚开通的Token Plan standard套餐，今天一看已经用了60%。两天，直接干掉六成。也没跑什么大任务，就是正常写写东西、聊聊天、写了个小项目。照这速度整个套餐撑不过一周。” 重度用户三天见底。白嫖虽香，但得省着点用。问题出在哪？官方算的是95%缓存命中率下的理论值。用户日常使用，缓存命中率可能只有30%-50%。一旦未命中，价格直接跳到3元/百万tokens，Token消耗速度比你以为的快3-5倍。社区有人总结：“降价99%，质量能跟上吗，有点慌，怕踩坑。” 另一个人说得更直白：“感觉价格是下降了，但使用起来的感受是没有区别的，依然很贵，依然不耐用。” 罗福莉的"真香定律" 4月7日，小米MiMo大模型负责人罗福莉在社交平台X上发了一篇长文，核心观点：低价Token加开放第三方Agent框架，容易让平台陷入成本失控全球算力供给跟不上Agent带来的Token需求增长盲目价格战会损害用户体验建议LLM公司不要盲目压低价格当时她还介绍了MiMo于4月3日推出的Token Plan，定价远高于现在的水平。 51天后，罗福莉亲手推翻了自己说的话。发生了什么？4月24日，DeepSeek V4预览版发布。4月25日，V4-Pro开启2.5折优惠。4月26日，缓存命中价格暴降至首发价的十分之一。5月22日，临时折扣变成永久降价，V4-Pro永久降至原价的四分之一，缓存命中输入价从0.1元降到0.025元。小米MiMo-V2.5-Pro火速跟进，价格直接对齐DeepSeek V4-Pro：缓存命中0.025元，未命中3元，输出6元。一模一样。罗福莉现在改口说"推理框架优化后成本可控"。技术上确实做了优化——基于SGLang HiCache支持SWA（滑动窗口注意力），KV Cache搬运量降至1/7。但问题是：51天前你不知道自己能优化吗？还是说，DeepSeek不降价，你就"优化"不出来？说白了，不是成本降了才降价，是DeepSeek降了才跟着降。财报压顶，不降不行把时间线拉长看，小米这次降价不是技术驱动，是财务驱动。 5月26日，小米发布2026年一季度财报：总收入991.42亿元，同比下降10.9% 经调整净利润60.72亿元，同比下降43.1% 期间利润47.35亿元，同比下降56.5% 三组数字，全部下滑。营收利润双降，这在小米历史上不算常见。更扎眼的是汽车业务：一季度净亏损31亿元。去年同期才亏5亿左右，翻了数倍。毛利率20.1%——比特斯拉还高——但依然每卖一辆SU7亏3.8万元。研发投入一季度90亿元，宣布未来三年在AI领域投入600亿。左手亏车，右手烧AI，中间手机出货量还在降。高盛已经下调小米2026年至2028年的总收入预期。雷军需要一个新故事。 MiMo降价99%，就是这个故事的开头——哪怕用户发现故事和现实之间隔着一道缓存命中的墙。 “第二次被骗"的集体记忆社区里最扎心的评论不是骂降价不够狠，而是这句：“上当了，被骗了，第二次被骗了。” 为什么是"第二次”？因为4月3日Token Plan刚上线时，就被吐槽"定价偏高，便宜的套餐Token数量不足"。当时罗福莉的回应是"价格战是陷阱"，言下之意是我们不打价格战，我们做品质。一个月后，不仅打了，还打得比谁都狠。这种"先高后低"“先说不降再大降"的操作模式，小米在手机和互联网服务上用了无数次。会员积分、限时福利、首发优惠——套路已经刻进DNA了。用户不是傻子，被骗一次会记仇，被骗两次会形成条件反射。所以哪怕这次是真降价、永久降价，用户的第一反应不是"太好了”，而是"又来了"。信任一旦透支，真话也像假的。管理层的战略焦虑把MiMo降价、财报下滑、汽车亏损、AI豪赌四件事串在一起看，小米管理层的问题不是某个决策错了，而是全面铺开、处处承压。手机：高端化推高出货均价，但出货量下降，零部件涨价侵蚀利润。IoT：补贴退坡叠加高基数，收入下滑。汽车：毛利率看着漂亮，但规模不够摊薄研发和产能投入，每辆车还在倒贴。AI：600亿三年投入，短期看不到回报。四条战线同时烧钱，没有一条能独立造血。雷军的赌徒心态很清楚：用AI故事撑估值，用汽车故事撑未来，用降价抢开发者生态。但问题是，这三个故事互相打架——AI降价压缩收入，汽车亏损吞噬利润，手机竞争力被分散的资源拖累。摩根大通早就预警"估值透支风险"。53亿美元融资用的是"先旧后新"模式——雷军先向机构转让旧股，公司再发新股补回。这套操作的本质是：在股价还没崩之前，先把钱圈进来。价格战的终局不是谁便宜，而是谁活着小米对齐DeepSeek的价格，看起来是"硬刚"，实际上是被牵着鼻子走。 DeepSeek有幻方量化的算力底座，成本结构天然低于纯模型公司。小米靠什么降成本？靠SGLang优化、靠KV Cache压缩——这些是工程手段，不是结构性优势。今天能降99%，明天别人再降，你跟不跟？价格战的终局从来不是"谁更便宜"，而是"谁亏得起更久"。DeepSeek背后是量化基金的利润输血，小米背后是一季度利润腰斩的财报。罗福莉一个月前说的那句话，现在回看反而成了最清醒的判断：盲目价格战会损害用户体验。只不过说这话的人，自己先打了自己的脸。小米需要想清楚一个问题：你到底是一家AI公司，还是一家用AI装点门面的硬件公司？如果是前者，降价是战略；如果是后者，降价只是遮羞布。