小米推出開源 LLM MiMo-7B，媲美 o1-mini

分類: 軟體 新品報導 4/30/2025 編輯部

小米集團 30日宣布，推出全新開源的人工智慧模型 MiMo-7B系列。這款只有70億參數的小型模型，在推理能力上表現驚人，不僅超越了更大的 320億（32B）參數模型，甚至媲美 OpenAI的閉源推理模型 o1-mini。

過去人工智慧界普遍認為，數學和程式推理能力通常要靠非常大型的模型才能有好效果，但小米團隊透過特別的預訓練和後續強化學習訓練方式，成功證明小模型也能擁有強大的推理表現。為提升推理表現，研究團隊採用三階段資料混合策略，大量增加推理相關的訓練資料，並開發特殊的獎勵機制和重新採樣策略，解決強化學習中的獎勵不足問題。此外，小米還開發了一套名為「無縫滾動引擎」（Seamless Rollout）的訓練工具，能大幅降低GPU的閒置時間，讓模型訓練速度提升超過2倍，驗證速度也提升近兩倍，顯著提高模型開發效率。

同時，MiMo-7B系列還特別加入了多 Token預測作為額外的訓練目標，進一步加速推理速度與準確性。研究團隊表示，模型訓練共使用約25兆個（25T）token的龐大資料量，並精選13萬道數學及程式碼推理問題進行強化學習訓練，每道題目都經過嚴格驗證和篩選，確保訓練品質。

小米表示，這次研究成果已經完全開源，提供基礎模型、微調模型和訓練過程的完整檢查點，希望能幫助全球的研究者一起開發更有效率、更厲害的人工智慧模型，未來有望在教育、軟體開發、自動化測試等各種智慧應用領域發揮重要的影響。

開源模型可到下列網址下載: https://huggingface.co/XiaomiMiMo/MiMo-7B-Base

最新文章

熱門文章

哈燒王 Hot3C