久久人人爽人人爽人人片av高请,人妻少妇精品无码专区芭乐视网

馬斯克xAI新模型Grok 4.2公測，通過趣味測試，回答風格似“老馬”親臨

發(fā)布時間：2026-02-18 18:38 來源：天脈網(wǎng) 作者：顧雨柔

馬斯克旗下xAI公司推出的Grok 4.2公測Beta版在爭議聲中悄然上線。這款參數(shù)規(guī)模僅500B的模型，與當前動輒數(shù)萬億參數(shù)的行業(yè)主流形成鮮明對比，其市場表現(xiàn)呈現(xiàn)出兩極分化的態(tài)勢——部分用戶盛贊其創(chuàng)新功能，另一派則直言性能不及預期。

面對質疑聲浪，馬斯克在社交平臺展開密集公關行動。他不僅連續(xù)轉發(fā)十余條夸贊推文，更親自下場承諾："公測將持續(xù)至下月，正式版將比Grok 4快得多、聰明得多。"據(jù)其透露，模型具備每周自我迭代的獨特能力，未來將形成固定更新節(jié)奏。這一表態(tài)與xAI聯(lián)合創(chuàng)始人近期離職引發(fā)的動蕩形成微妙對比，此前外界甚至猜測項目可能難產(chǎn)。

技術特性方面，Grok 4.2首次引入實時反饋優(yōu)化機制。與傳統(tǒng)靜態(tài)更新模式不同，新模型能根據(jù)用戶交互數(shù)據(jù)持續(xù)調(diào)整性能。在弱智吧風格測試題"50米外洗車店該開車還是步行"中，該模型展現(xiàn)出邏輯推理能力，順利通過考驗。不過官方至今未公布完整技術報告，僅在排行榜釋放有限評測數(shù)據(jù)，導致討論多集中于使用體驗而非技術細節(jié)。

用戶反饋呈現(xiàn)明顯分化。批評者指出，在處理復雜邏輯問題時，500B參數(shù)規(guī)模明顯力不從心，懷疑所謂"橫掃榜單"成績來自特定實驗環(huán)境優(yōu)化。更有開發(fā)者測算其使用成本高于競品模型。支持陣營則強調(diào)代碼生成速度和多模態(tài)處理能力，特別提及該模型通過"Caitlyn Jenner測試"——這道曾讓ChatGPT和Gemini折戟的性別認知題，成為Grok 4.2的亮點戰(zhàn)績。

爭議焦點還涉及模型偏見問題。盡管馬斯克宣稱Grok 4.2保持中立，但測試顯示其回答傾向與創(chuàng)始人觀點高度吻合。對此馬斯克回應稱："這還是個寶寶模型"，并預告中大型版本即將推出。AI工程師Mark Krechman的爆料得到本人轉發(fā)確認——當前版本實為"精簡版"，完整功能尚未釋放。

在模型發(fā)布同期，xAI還推出Grok imagine視頻生成模板，目前僅限iOS用戶體驗。這款馬年主題創(chuàng)作工具，為爭議中的產(chǎn)品矩陣增添新變量。隨著公測推進，每周迭代機制能否兌現(xiàn)承諾，將成為決定Grok 4.2命運的關鍵因素。

更多>同類內(nèi)容

馬斯克xAI新模型Grok 4.2公測，通過趣味測試，回答風格似“老馬”親臨

馬斯克xAI新模型Grok 4.2公測，通過趣味測試，回答風格似“老馬”親臨