小米公开MiMo大模型推理全链路优化技术细节

互联网 0 10
互联网资讯
本条新闻为单纯事实消息的时事新闻,转载自北京商报,版权归源站所有,如有侵权,烦请联系我们

北京商报讯(记者 陶凤 王天逸)5月30日,小米官方披露MiMo-V2.5大模型推理系统全链路优化技术细节。此前5月27日,小米MiMo-V2.5系列API宣布永久降价,最高降幅达99%。据介绍,小米针对Hybrid SWA+MoE+多模态架构重构完整推理栈,将KVCache存储压缩至同类方案约1/7,大幅降低长序列推理成本,在不削弱模型本身能力的前提下,实现同硬件下更高吞吐量、更低延迟,以此支撑终端定价下调。公司称,该方案也是业内首个覆盖该复合架构的大规模工程落地成果。

点赞 0 收藏(0)  分享
0个评论
  • 消灭零评论