在线亚洲国产一区二区三区-日韩亚洲欧洲人妻三区中文字幕-国产精品一区二区男女羞羞无遮挡-日韩特黄免费在线观看-视频一区二区三区免费在线视频-天天在线天天看成人免费视频-人人妻天天爽夜夜爽视频-国产极品久久久久久久久久-老司机午夜福利视频一区

資訊在沃

Allen人工智能研究所推出MolmoWeb:開源視覺網(wǎng)絡(luò)智能體新選擇

   發(fā)布時間:2026-04-03 04:37 作者:陸辰風(fēng)

在人工智能領(lǐng)域,能夠自主瀏覽網(wǎng)頁并完成任務(wù)的智能體正成為研究熱點。近日,Allen人工智能研究所(Ai2)推出了名為MolmoWeb的開源視覺網(wǎng)絡(luò)智能體,這一成果為該領(lǐng)域帶來了新的突破。作為Molmo 2模型家族的新成員,MolmoWeb以其獨特的技術(shù)路徑和開源特性引發(fā)了廣泛關(guān)注。

MolmoWeb的最大亮點在于其開源屬性。該模型提供了40億和80億參數(shù)兩種版本,這種輕量化設(shè)計使其能夠在本地設(shè)備上運(yùn)行,大大降低了使用門檻。與市場上許多依賴專有技術(shù)的同類產(chǎn)品不同,Ai2團(tuán)隊選擇了完全開放的道路,不僅公開了模型權(quán)重,還同步發(fā)布了訓(xùn)練數(shù)據(jù)、代碼(即將上線)和評估工具,為研究人員提供了完整的研究框架。

在技術(shù)實現(xiàn)上,MolmoWeb采用了與眾不同的訓(xùn)練方法。研究團(tuán)隊沒有借助專有視覺智能體的知識蒸餾,而是通過兩種途徑構(gòu)建訓(xùn)練數(shù)據(jù):一是收集了30,000個人類操作軌跡,覆蓋1,100多個網(wǎng)站的近600,000個子任務(wù);二是利用可訪問性樹技術(shù)生成合成軌跡。這種組合方式既保證了數(shù)據(jù)的多樣性,又解決了單純依賴人工標(biāo)注成本高昂的問題。訓(xùn)練數(shù)據(jù)中還包含了220多萬個問答對,幫助模型理解網(wǎng)頁內(nèi)容。

實際性能測試顯示,MolmoWeb在多個基準(zhǔn)測試中表現(xiàn)優(yōu)異。在瀏覽器操作任務(wù)中,它的表現(xiàn)超過了OpenAI的舊版GPT-4o模型,在開放權(quán)重模型中更是領(lǐng)先于Fara-7B和GLM-4.1V-9B等競爭對手。盡管與Anthropic、谷歌等公司的專有模型相比仍有差距,但MolmoWeb的開源特性使其成為研究社區(qū)的重要參考。

Ai2團(tuán)隊強(qiáng)調(diào),他們的目標(biāo)不是與商業(yè)巨頭競爭,而是為學(xué)術(shù)界提供可復(fù)現(xiàn)的研究基礎(chǔ)。當(dāng)前網(wǎng)絡(luò)智能體領(lǐng)域面臨的一個關(guān)鍵問題是缺乏公開資源,這限制了研究的透明度和進(jìn)展速度。MolmoWeb的發(fā)布,包括其龐大的訓(xùn)練數(shù)據(jù)集(包含帶注釋的網(wǎng)頁截圖和操作軌跡),為解決這一問題提供了重要資源。

目前,MolmoWeb的相關(guān)資源已在Hugging Face和GitHub平臺開放下載。研究人員可以獲取完整的模型架構(gòu)、訓(xùn)練數(shù)據(jù)集以及評估工具包,這為深入理解網(wǎng)絡(luò)智能體的工作原理和改進(jìn)方向提供了寶貴機(jī)會。隨著更多研究者基于這一開源框架開展工作,網(wǎng)絡(luò)智能體技術(shù)有望迎來新的發(fā)展階段。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容