在线亚洲国产一区二区三区-日韩亚洲欧洲人妻三区中文字幕-国产精品一区二区男女羞羞无遮挡-日韩特黄免费在线观看-视频一区二区三区免费在线视频-天天在线天天看成人免费视频-人人妻天天爽夜夜爽视频-国产极品久久久久久久久久-老司机午夜福利视频一区

資訊在沃

馬斯克xAI新模型Grok 4.2公測:能力毀譽參半,每周迭代能否逆襲?

   發(fā)布時間:2026-02-19 15:17 作者:顧雨柔

在經(jīng)歷高層人事變動與多次跳票后,馬斯克旗下xAI公司推出的Grok 4.2大模型終于以公測Beta版形式上線。這款參數(shù)規(guī)模為500B的模型在發(fā)布后迅速引發(fā)兩極分化評價,既有用戶盛贊其多模態(tài)能力,也有人質疑其性能與宣傳存在差距。

馬斯克在社交平臺X上展開密集公關行動,連續(xù)轉發(fā)十余條夸贊Grok 4.2的推文,并親自發(fā)文強調:"公測將持續(xù)至下個月,正式版將比Grok 4快得多、聰明得多。目前已知存在許多bug,團隊正在每日修復。"他特別指出,新模型具備每周自我迭代能力,未來將形成常態(tài)化更新機制。

這款被馬斯克稱為"無偏見模型"的產(chǎn)品,實際測試中卻暴露出顯著傾向性。有開發(fā)者通過特定測試發(fā)現(xiàn),Grok 4.2的回答風格與馬斯克本人高度契合,引發(fā)關于模型中立性的討論。更引發(fā)爭議的是,在處理高難度邏輯推理任務時,500B參數(shù)規(guī)模被指難以支撐復雜計算需求,部分場景表現(xiàn)甚至不及參數(shù)規(guī)模更大的競品。

技術層面仍存在諸多謎團。xAI至今未公布完整技術報告,僅在排行榜展示部分評測數(shù)據(jù)。據(jù)AI工程師Mark Krechman透露,當前版本屬于"輕量級"測試版,中大型版本仍在開發(fā)中,該說法已獲馬斯克轉發(fā)確認。值得關注的是,新模型引入的實時反饋優(yōu)化機制,使其具備類似人類的實踐學習能力。

在具體應用場景測試中,Grok 4.2展現(xiàn)出特殊優(yōu)勢。面對國內AI圈流行的"50米外洗車店"邏輯謎題,該模型給出符合預期的解決方案。更引發(fā)關注的是其通過"Caitlyn Jenner測試"的表現(xiàn)——當被問及跨性別者稱謂問題時,Grok 4.2給出符合語境的回答,而ChatGPT和Gemini此前在該測試中均出現(xiàn)爭議性回應。

伴隨公測啟動,xAI同步推出Grok imagine視頻生成模板,目前僅限iOS用戶使用。這款新工具的推出,顯示出xAI在多模態(tài)領域的持續(xù)布局。盡管馬斯克對Grok 4.2充滿信心,但市場觀察人士指出,在OpenAI、Anthropic等競爭對手持續(xù)發(fā)力的背景下,xAI仍需解決模型性能、開發(fā)透明度等關鍵問題。

 
 
更多>同類內容
全站最新
熱門內容