馬斯克旗下人工智能公司xAI近日推出全新大模型Grok 4.1,以"雙商在線(xiàn)"為賣(mài)點(diǎn),直接對(duì)標(biāo)尚未正式發(fā)布的GPT-5.1。這款模型分為T(mén)hinking(推理版)和標(biāo)準(zhǔn)版兩個(gè)版本,現(xiàn)已在Grok官網(wǎng)、X平臺(tái)及移動(dòng)端應(yīng)用全面開(kāi)放免費(fèi)體驗(yàn)。
在權(quán)威評(píng)測(cè)平臺(tái)LMArena的最新榜單中,Grok 4.1 Thinking以1483分登頂全球大模型排行榜,較第二名Gemini 2.5 Pro高出31分。其標(biāo)準(zhǔn)版同樣表現(xiàn)強(qiáng)勁,直接占據(jù)榜單次席。更引人注目的是情商測(cè)試EQ-Bench3的結(jié)果:Thinking版以1586分刷新紀(jì)錄,標(biāo)準(zhǔn)版緊隨其后,國(guó)產(chǎn)模型Kimi K2位列第三。
實(shí)測(cè)體驗(yàn)顯示,新模型在交互方式上發(fā)生顯著變化。相比前代產(chǎn)品,Grok 4.1展現(xiàn)出更強(qiáng)的共情能力,回復(fù)結(jié)尾會(huì)主動(dòng)添加愛(ài)心符號(hào),被用戶(hù)形容為"更有耐心的傾聽(tīng)者"。其創(chuàng)意寫(xiě)作能力提升尤為突出,評(píng)分較前代激增600分,文本生成更具畫(huà)面感和敘事性。同時(shí),模型幻覺(jué)率從12.09%大幅降至4.22%,信息準(zhǔn)確性顯著改善。
技術(shù)突破源于強(qiáng)化學(xué)習(xí)框架的全面升級(jí)。xAI后訓(xùn)練負(fù)責(zé)人Dustin Tran透露,團(tuán)隊(duì)在支撐前代模型的基礎(chǔ)設(shè)施上,通過(guò)優(yōu)化模型風(fēng)格特征和個(gè)性表達(dá),開(kāi)發(fā)出利用智能體推理模型作為獎(jiǎng)勵(lì)機(jī)制的新方法。這種自主評(píng)估體系使大規(guī)模迭代響應(yīng)成為可能,強(qiáng)化學(xué)習(xí)規(guī)模較前代擴(kuò)大10倍。
團(tuán)隊(duì)構(gòu)成成為另一關(guān)注焦點(diǎn)。近期流傳的xAI合影顯示,核心研發(fā)團(tuán)隊(duì)以亞裔面孔為主,有消息稱(chēng)原Grok團(tuán)隊(duì)白人成員已全部離職。這種人員調(diào)整被外界解讀為馬斯克的人才戰(zhàn)略轉(zhuǎn)型,但公司尚未對(duì)此作出正式回應(yīng)。
關(guān)于備受期待的Grok 5,馬斯克在最新訪談中透露,這款預(yù)計(jì)參數(shù)規(guī)模達(dá)6萬(wàn)億的模型將推遲至明年發(fā)布。他解釋稱(chēng),作為邁向通用人工智能的關(guān)鍵里程碑,Grok 5需要前所未有的計(jì)算資源支持,目前仍在進(jìn)行極其嚴(yán)格的測(cè)試驗(yàn)證。這與此前報(bào)道中提到的資源限制和測(cè)試難度問(wèn)題形成呼應(yīng)。
行業(yè)觀察人士指出,Grok 4.1的發(fā)布既是技術(shù)迭代的成果展示,也暗含馬斯克構(gòu)建AI生態(tài)的深層布局。不過(guò)隨著谷歌Gemini 3.0等競(jìng)品即將入場(chǎng),大模型領(lǐng)域的競(jìng)爭(zhēng)格局仍存在變數(shù)。這場(chǎng)由科技巨頭主導(dǎo)的AI競(jìng)賽,正在持續(xù)改寫(xiě)人工智能技術(shù)的發(fā)展軌跡。



















