免费动漫成人av在线观看,成人国产精品一区二区网站公司,99久久精品无免国产免费75

馬斯克xAI新模型Grok 4.2公測：能力毀譽參半，每周迭代能否逆襲？

發(fā)布時間：2026-02-19 15:17 來源：天脈網(wǎng) 作者：顧雨柔

在經(jīng)歷高層人事變動與多次跳票后，馬斯克旗下xAI公司推出的Grok 4.2大模型終于以公測Beta版形式上線。這款參數(shù)規(guī)模為500B的模型在發(fā)布后迅速引發(fā)兩極分化評價，既有用戶盛贊其多模態(tài)能力，也有人質疑其性能與宣傳存在差距。

馬斯克在社交平臺X上展開密集公關行動，連續(xù)轉發(fā)十余條夸贊Grok 4.2的推文，并親自發(fā)文強調："公測將持續(xù)至下個月，正式版將比Grok 4快得多、聰明得多。目前已知存在許多bug，團隊正在每日修復。"他特別指出，新模型具備每周自我迭代能力，未來將形成常態(tài)化更新機制。

這款被馬斯克稱為"無偏見模型"的產(chǎn)品，實際測試中卻暴露出顯著傾向性。有開發(fā)者通過特定測試發(fā)現(xiàn)，Grok 4.2的回答風格與馬斯克本人高度契合，引發(fā)關于模型中立性的討論。更引發(fā)爭議的是，在處理高難度邏輯推理任務時，500B參數(shù)規(guī)模被指難以支撐復雜計算需求，部分場景表現(xiàn)甚至不及參數(shù)規(guī)模更大的競品。

技術層面仍存在諸多謎團。xAI至今未公布完整技術報告，僅在排行榜展示部分評測數(shù)據(jù)。據(jù)AI工程師Mark Krechman透露，當前版本屬于"輕量級"測試版，中大型版本仍在開發(fā)中，該說法已獲馬斯克轉發(fā)確認。值得關注的是，新模型引入的實時反饋優(yōu)化機制，使其具備類似人類的實踐學習能力。

在具體應用場景測試中，Grok 4.2展現(xiàn)出特殊優(yōu)勢。面對國內AI圈流行的"50米外洗車店"邏輯謎題，該模型給出符合預期的解決方案。更引發(fā)關注的是其通過"Caitlyn Jenner測試"的表現(xiàn)——當被問及跨性別者稱謂問題時，Grok 4.2給出符合語境的回答，而ChatGPT和Gemini此前在該測試中均出現(xiàn)爭議性回應。

伴隨公測啟動，xAI同步推出Grok imagine視頻生成模板，目前僅限iOS用戶使用。這款新工具的推出，顯示出xAI在多模態(tài)領域的持續(xù)布局。盡管馬斯克對Grok 4.2充滿信心，但市場觀察人士指出，在OpenAI、Anthropic等競爭對手持續(xù)發(fā)力的背景下，xAI仍需解決模型性能、開發(fā)透明度等關鍵問題。

更多>同類內容

馬斯克xAI新模型Grok 4.2公測：能力毀譽參半，每周迭代能否逆襲？

馬斯克xAI新模型Grok 4.2公測：能力毀譽參半，每周迭代能否逆襲？