小米系全线大涨 AI大模型竞争白热化

一则消息突然引爆市场。今日,小米集团股价一度大涨超过5%,金山云涨幅更是超过了18%。小米大模型微信公众号宣布,小米开源了首个专为推理设计的大模型"Xiaomi MiMo",该模型从预训练到后训练全面提升了推理能力。

小米系全线大涨

当前,AI大模型的竞争再度进入白热化阶段。4月29日,阿里巴巴通义千问发布了新版Qwen 3系列模型。同一天,马斯克也宣布将在下周向SuperGrok订阅者发布Grok 3.5的早期测试版。

小米系全线大涨 AI大模型竞争白热化

券商机构分析指出,国内外大模型能力差距正在缩小,国产算力芯片持续进步,国内头部互联网厂商加大资本支出,为国内AI的发展奠定了基础。随着国内外巨头大模型的不断迭代,消费者端或有望迎来杀手级应用。

4月30日,小米系股票全线拉升,小米集团盘中一度上涨超过5%,金山云涨幅超过18%,金山软件最高涨超6%。港股云计算板块同样表现强劲,金蝶国际、中国软件国际和阿里巴巴-W等公司股价均有不同程度的上涨。

据"小米大模型"公众号消息,MiMo在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,以7B参数规模超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。官方称,在相同强化学习训练数据情况下,MiMo-7B在数学与代码领域的表现显著领先。目前,MiMo-7B全系列模型已在HuggingFace平台开源,并发布了详细技术报告。

小米技术团队表示,MiMo的核心突破在于预训练与后训练阶段的协同优化。在预训练阶段,通过挖掘高质量推理语料并合成约2000亿tokens专项数据,采用三阶段渐进训练策略,累计训练量达25万亿tokens。后训练阶段则引入创新强化学习技术,包括自研算法和策略,有效提升模型在复杂任务中的稳定性。技术团队还开发了"Seamless Rollout"系统,使训练效率大幅提升。

发表评论

0 评论