小米(01810)今天(30日)宣布,推出首個「為推理而生」的開源大模型Xiaomi MiMo,聯動預訓練到後訓練,全面提升推理能力。小米股價造好,曾升5.37%至50元,隨後升幅收窄,半日報49.7元,升4.74%。
內媒報道,MiMo為全新成立不久的小米大模型Core團隊初步嘗試。該模型着重於提升推理能力,以70億參數規模,在數學推理和代碼競賽評量中超越OpenAI的o1-mini,以及阿里巴巴(09988)Qwen-32B-Preview等模型。
人工智能(AI)技術不斷推陳出新,阿里巴巴昨日(29日)亦推出新一代通義千問模型Qwen 3,聲稱在代碼、數學、通用能力等基準測試中,與DeepSeek-R1、o3-mini、Grok-3和Gemini-2.5-Pro等頂級模型相比極具競爭力,並支持119種語言和方言。
阿里發布Qwen 3後,全球首富馬斯克隨即宣布,旗下xAI將在下周發布Grok 3.5的早期測試版,讓SuperGrok訂戶率先試用。
另外,百度(09888)上周發布文心大模型4.5 Turbo和X1 Turbo。其中X1 Turbo具備更先進的思維鏈整體效果領先DeepSeek-R1、V3最新版;每百萬token輸入價格1元人民幣(下同),輸出價格4元,僅為DeepSeek-R1的25%。