在线亚洲国产一区二区三区-日韩亚洲欧洲人妻三区中文字幕-国产精品一区二区男女羞羞无遮挡-日韩特黄免费在线观看-视频一区二区三区免费在线视频-天天在线天天看成人免费视频-人人妻天天爽夜夜爽视频-国产极品久久久久久久久久-老司机午夜福利视频一区

資訊在沃

馬斯克xAI新模型Grok 4.2公測,通過趣味測試,回答風格似“老馬”親臨

   發(fā)布時間:2026-02-18 18:38 作者:顧雨柔

馬斯克旗下xAI公司推出的Grok 4.2公測Beta版在爭議聲中悄然上線。這款參數(shù)規(guī)模僅500B的模型,與當前動輒數(shù)萬億參數(shù)的行業(yè)主流形成鮮明對比,其市場表現(xiàn)呈現(xiàn)出兩極分化的態(tài)勢——部分用戶盛贊其創(chuàng)新功能,另一派則直言性能不及預期。

面對質疑聲浪,馬斯克在社交平臺展開密集公關行動。他不僅連續(xù)轉發(fā)十余條夸贊推文,更親自下場承諾:"公測將持續(xù)至下月,正式版將比Grok 4快得多、聰明得多。"據(jù)其透露,模型具備每周自我迭代的獨特能力,未來將形成固定更新節(jié)奏。這一表態(tài)與xAI聯(lián)合創(chuàng)始人近期離職引發(fā)的動蕩形成微妙對比,此前外界甚至猜測項目可能難產(chǎn)。

技術特性方面,Grok 4.2首次引入實時反饋優(yōu)化機制。與傳統(tǒng)靜態(tài)更新模式不同,新模型能根據(jù)用戶交互數(shù)據(jù)持續(xù)調(diào)整性能。在弱智吧風格測試題"50米外洗車店該開車還是步行"中,該模型展現(xiàn)出邏輯推理能力,順利通過考驗。不過官方至今未公布完整技術報告,僅在排行榜釋放有限評測數(shù)據(jù),導致討論多集中于使用體驗而非技術細節(jié)。

用戶反饋呈現(xiàn)明顯分化。批評者指出,在處理復雜邏輯問題時,500B參數(shù)規(guī)模明顯力不從心,懷疑所謂"橫掃榜單"成績來自特定實驗環(huán)境優(yōu)化。更有開發(fā)者測算其使用成本高于競品模型。支持陣營則強調(diào)代碼生成速度和多模態(tài)處理能力,特別提及該模型通過"Caitlyn Jenner測試"——這道曾讓ChatGPT和Gemini折戟的性別認知題,成為Grok 4.2的亮點戰(zhàn)績。

爭議焦點還涉及模型偏見問題。盡管馬斯克宣稱Grok 4.2保持中立,但測試顯示其回答傾向與創(chuàng)始人觀點高度吻合。對此馬斯克回應稱:"這還是個寶寶模型",并預告中大型版本即將推出。AI工程師Mark Krechman的爆料得到本人轉發(fā)確認——當前版本實為"精簡版",完整功能尚未釋放。

在模型發(fā)布同期,xAI還推出Grok imagine視頻生成模板,目前僅限iOS用戶體驗。這款馬年主題創(chuàng)作工具,為爭議中的產(chǎn)品矩陣增添新變量。隨著公測推進,每周迭代機制能否兌現(xiàn)承諾,將成為決定Grok 4.2命運的關鍵因素。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容