近日,清華大學(xué)教授唐杰在社交媒體上分享了他對(duì)人工智能領(lǐng)域發(fā)展的最新思考,這些觀點(diǎn)引發(fā)了行業(yè)內(nèi)外的廣泛關(guān)注。唐杰教授的分享涵蓋多個(gè)關(guān)鍵議題,為AI技術(shù)的研究方向和應(yīng)用路徑提供了新的視角。
在基礎(chǔ)模型擴(kuò)展方面,唐杰指出,預(yù)訓(xùn)練技術(shù)已使大型模型掌握世界常識(shí)并具備初步推理能力。通過(guò)增加數(shù)據(jù)量、擴(kuò)大參數(shù)規(guī)模和提升計(jì)算飽和度,仍是提升基礎(chǔ)模型性能的最有效途徑。這一觀點(diǎn)與當(dāng)前行業(yè)主流技術(shù)路線高度契合,為模型優(yōu)化提供了明確方向。
針對(duì)模型的實(shí)際應(yīng)用能力,唐杰強(qiáng)調(diào)了長(zhǎng)尾能力對(duì)齊和推理增強(qiáng)的必要性。他觀察到,現(xiàn)有通用基準(zhǔn)測(cè)試可能導(dǎo)致模型過(guò)度擬合,而真實(shí)場(chǎng)景中需要模型快速適應(yīng)多樣化需求。通過(guò)中期和后期訓(xùn)練技術(shù),可以顯著提升模型在特定場(chǎng)景下的表現(xiàn),這為解決模型落地難題提供了新思路。
智能體(Agent)技術(shù)的發(fā)展被視為AI進(jìn)入真實(shí)世界的關(guān)鍵標(biāo)志。唐杰比喻道,沒(méi)有Agent能力的大模型就像只積累知識(shí)而不實(shí)踐的學(xué)者。當(dāng)前模型已能將Agent數(shù)據(jù)直接融入訓(xùn)練過(guò)程,但不同環(huán)境間的泛化遷移仍是主要挑戰(zhàn)。增加多樣化環(huán)境數(shù)據(jù)和強(qiáng)化學(xué)習(xí)訓(xùn)練成為突破瓶頸的主要方法。
記憶機(jī)制的實(shí)現(xiàn)被認(rèn)定為模型應(yīng)用的核心能力。唐杰借鑒人類(lèi)記憶的分層結(jié)構(gòu),提出大模型需要發(fā)展短期、中期、長(zhǎng)期和歷史記憶能力。當(dāng)前技術(shù)路徑包括上下文記憶、檢索增強(qiáng)生成和參數(shù)調(diào)整,但如何實(shí)現(xiàn)知識(shí)迭代和參數(shù)更新仍是待解難題。支持長(zhǎng)上下文的模型架構(gòu)可能成為解決方案。
在線學(xué)習(xí)和自我評(píng)估機(jī)制的建設(shè)被視為下一代模型的關(guān)鍵特征。唐杰批評(píng)了當(dāng)前定時(shí)重新訓(xùn)練的模式,指出其存在無(wú)法自我迭代和浪費(fèi)交互數(shù)據(jù)等問(wèn)題。他提出,構(gòu)建自我評(píng)估體系是實(shí)現(xiàn)在線學(xué)習(xí)的前提,這可能成為新的技術(shù)擴(kuò)展范式,涉及持續(xù)學(xué)習(xí)、實(shí)時(shí)學(xué)習(xí)和在線學(xué)習(xí)等方向。
在應(yīng)用開(kāi)發(fā)層面,唐杰強(qiáng)調(diào)AI應(yīng)直接替代人類(lèi)工作而非創(chuàng)造新應(yīng)用。他預(yù)測(cè),2025年將成為AI替代多種工種的爆發(fā)年,當(dāng)前聊天機(jī)器人已部分取代搜索引擎并融入情感交互功能。這種應(yīng)用導(dǎo)向的思維正在重塑AI產(chǎn)品的開(kāi)發(fā)邏輯。
對(duì)于多模態(tài)和具身智能的發(fā)展,唐杰持謹(jǐn)慎樂(lè)觀態(tài)度。他認(rèn)為多模態(tài)技術(shù)雖前景廣闊,但當(dāng)前對(duì)提升通用AI能力上限的作用有限,建議文本、多模態(tài)生成等方向分開(kāi)發(fā)展。具身智能面臨數(shù)據(jù)獲取和機(jī)器人硬件穩(wěn)定性等挑戰(zhàn),但數(shù)據(jù)規(guī)模擴(kuò)大后可能形成技術(shù)壁壘,預(yù)計(jì)2026年將取得實(shí)質(zhì)性進(jìn)展。
關(guān)于領(lǐng)域?qū)S媚P停平苤毖赃@是"偽命題"。他認(rèn)為隨著通用AI的發(fā)展,領(lǐng)域知識(shí)終將融入主模型。當(dāng)前領(lǐng)域模型的存在更多是企業(yè)構(gòu)建技術(shù)護(hù)城河的策略,但最終將被AI浪潮席卷。AI應(yīng)用應(yīng)聚焦于替代或輔助人類(lèi)工作,創(chuàng)造實(shí)際價(jià)值,而非開(kāi)發(fā)無(wú)人使用的工具。




















