← 返回信息流
创投信息36氪 快讯·4 天前

小米MiMo-V2.5实现五大核心突破,降价后仍保持收支平衡

原标题:小米技术:MiMo-V2.5实现五大核心突破,降价后仍能实现收支平衡

速览

小米MiMo大模型团队公开MiMo-V2.5系列大模型API永久降价背后的技术路径。该模型通过KVCache双池、GCache分布式缓存等五大核心突破,在降价后仍能维持收支平衡。此外,其“百万亿Token创造者激励计划”累计发放超100万亿免费Token,折合人民币超6500万元。

AI 深度解读

背景

近期,科技圈与汽车圈同时传来重磅消息。一方面,小米MiMo大模型团队在官方技术博客首次完整公开了其最新大模型API永久降价背后的技术路径,展示了在成本控制与性能优化上的重大突破;另一方面,丰田汽车正式确认中止高档品牌雷克萨斯纯电动轿车“LF-ZC”量产车型的开发,标志着传统车企在电动化转型中面临的市场挑战与战略调整。此外,上海某大模型龙头企业启动A股上市的消息,也进一步凸显了人工智能领域资本市场的活跃态势。

核心内容

小米MiMo-V2.5大模型技术突破与降本策略

小米MiMo大模型团队发布文章,详细解读了MiMo-V2.5系列大模型API实现永久降价但仍能维持收支平衡的技术底层逻辑。文章指出,这一成果得益于五大核心技术的突破:

  1. KVCache双池+SWA-aware前缀树:通过优化键值缓存(KVCache)的管理机制,结合滑动窗口注意力(SWA)感知的前缀树结构,提升了内存使用效率。
  2. GCache分布式缓存:引入全局分布式缓存系统,进一步减少重复计算和存储开销。
  3. KVCache亲和调度:优化调度算法,使KVCache的分配更贴合硬件特性,降低延迟并提高吞吐量。
  4. Decode阶段MTP加速:在解码(Decode)阶段采用多令牌预测(Multi-Token Prediction, MTP)技术,显著加速推理过程。
  5. 多模态推理优化:针对多模态任务进行专项优化,提升处理复杂输入时的效率。

基于上述技术突破,小米在降低API价格的同时,成功控制了运营成本,实现了收支平衡。此外,小米于4月28日推出了“百万亿Token创造者激励计划”,旨在鼓励开发者生态建设。该计划推出后反响热烈,总申请人数超过54万人,累计发放了100万亿免费Token,折合人民币价值超过6500万元。

丰田中止雷克萨斯LF-ZC量产开发

针对近日流传的丰田将中止雷克萨斯“LF-ZC”纯电动轿车量产车型开发的消息,丰田方面予以确认。丰田解释称,此次调整是“考虑到市场需求的变化,对公司整体车辆开发项目进行调整的一部分”。丰田强调,这仅涉及部分车辆开发规划的调整,并不代表公司放弃纯电动汽车(BEV)的战略方向。

其他行业动态

  • 上海大模型龙头启动A股上市:上海某大模型领域的领军企业已正式启动A股上市程序,显示出一级市场向二级市场转化的活跃趋势。
  • 苹果硬件市场动态:Mac mini出现售罄现象,而部分型号MacBook因特定原因(文中提及“断头”,可能指代特定配置或型号的市场表现)成为AI应用的新宠,反映出硬件市场对AI算力的需求变化。

关键要点

  • 技术驱动降本:小米MiMo-V2.5通过KVCache双池、SWA-aware前缀树、GCache分布式缓存、KVCache亲和调度及Decode阶段MTP加速等五大核心技术,实现了API降价后的收支平衡。
  • 开发者激励力度大:小米“百万亿Token创造者激励计划”申请人数超54万,发放免费Token折合人民币超6500万元,显示出对开发者生态的高度重视。
  • 丰田战略微调而非放弃:丰田中止雷克萨斯LF-ZC量产开发是基于市场需求变化的局部调整,并未改变其推进纯电动汽车(BEV)的整体战略。
  • AI硬件需求分化:Mac mini热销与特定MacBook成为AI新宠,反映了市场对高性价比AI算力硬件的需求增长。
  • 资本市场热度不减:上海大模型企业启动A股上市,表明人工智能领域依然是资本市场的焦点。

意义与影响

小米MiMo-V2.5的技术突破不仅展示了其在AI基础设施优化方面的深厚积累,也为行业提供了通过技术创新实现商业可持续性的范例。在AI大模型竞争日益激烈的背景下,如何在保证性能的同时降低推理成本,是各大厂商面临的关键挑战。小米的成功经验可能促使更多企业关注底层架构优化,从而推动整个行业的服务价格下降,加速AI应用的普及。

丰田中止LF-ZC开发则反映了传统车企在电动化转型中的谨慎态度。面对市场需求的不确定性,车企倾向于动态调整产品规划,以规避风险。这一举动也提醒行业参与者,纯电动汽车市场并非坦途,技术、成本与市场接受度的平衡至关重要。

此外,上海大模型企业启动A股上市,以及苹果硬件市场的动态,共同描绘了AI技术从算法层面向硬件层、资本层面渗透的全景图。这表明,AI已不再仅仅是软件层面的创新,而是深刻影响着产业链上下游,包括芯片、服务器、终端设备以及资本市场估值体系。未来,随着AI技术的进一步成熟和应用场景的拓展,相关领域的竞争与合作将更加紧密,技术创新与商业模式的结合将成为决定企业成败的关键因素。

查看原文 →36kr.com