在线亚洲国产一区二区三区-日韩亚洲欧洲人妻三区中文字幕-国产精品一区二区男女羞羞无遮挡-日韩特黄免费在线观看-视频一区二区三区免费在线视频-天天在线天天看成人免费视频-人人妻天天爽夜夜爽视频-国产极品久久久久久久久久-老司机午夜福利视频一区

資訊在沃

AlphaGo核心負(fù)責(zé)人戴維·席爾瓦創(chuàng)業(yè):繞過LLM,探索自主探索新知的智能系統(tǒng)

   發(fā)布時(shí)間:2026-02-21 12:13 作者:唐云澤

人工智能領(lǐng)域再掀波瀾,前谷歌DeepMind首席科學(xué)家、AlphaGo項(xiàng)目核心負(fù)責(zé)人戴維·席爾瓦(David Silver)宣布在倫敦創(chuàng)立新公司"Ineffable Intelligence",并計(jì)劃完成10億美元種子輪融資。這一金額與OpenAI前首席科學(xué)家伊利亞·蘇茨克維(Ilya Sutskever)2024年創(chuàng)立Safe Superintelligence(SSI)時(shí)持平,引發(fā)資本市場(chǎng)對(duì)AI技術(shù)新路徑的強(qiáng)烈關(guān)注。

與當(dāng)前主流的大語言模型(LLM)依賴海量文本預(yù)訓(xùn)練不同,席爾瓦提出要徹底顛覆現(xiàn)有范式。他主張回歸強(qiáng)化學(xué)習(xí)(Reinforcement Learning)本質(zhì),構(gòu)建無需人類知識(shí)輸入、能自主探索未知的智能系統(tǒng)。這一理念源于其2025年4月與導(dǎo)師查理·薩頓(Charlie Sutton)在arXiv發(fā)布的論文《歡迎來到經(jīng)驗(yàn)時(shí)代》,論文強(qiáng)調(diào)智能體應(yīng)通過與環(huán)境持續(xù)交互積累經(jīng)驗(yàn),而非被動(dòng)接受靜態(tài)數(shù)據(jù)訓(xùn)練。

作為強(qiáng)化學(xué)習(xí)領(lǐng)域的標(biāo)志性人物,席爾瓦的學(xué)術(shù)影響力不容小覷。其論文被引用量超28萬次,2019年獲得的ACM計(jì)算獎(jiǎng)更印證了他在該領(lǐng)域的地位。DeepMind發(fā)言人確認(rèn)其離職時(shí)特別強(qiáng)調(diào):"戴維的貢獻(xiàn)對(duì)DeepMind的發(fā)展具有不可估量的價(jià)值。"這位與DeepMind聯(lián)合創(chuàng)始人德米斯·哈薩比斯(Demis Hassabis)相識(shí)于大學(xué)時(shí)代的科學(xué)家,曾主導(dǎo)開發(fā)了AlphaGo、AlphaZero和MuZero等突破性項(xiàng)目。

資本市場(chǎng)對(duì)席爾瓦的押注,反映出AI行業(yè)正經(jīng)歷路線分化。當(dāng)前主流模型通過"預(yù)訓(xùn)練+微調(diào)"掌握語言規(guī)律,但席爾瓦指出這種路徑存在根本局限:模型能力受限于人類標(biāo)注數(shù)據(jù)的質(zhì)量。他曾在播客中直言:"要超越人類認(rèn)知,必須讓AI自主發(fā)現(xiàn)人類尚未掌握的知識(shí)。"新公司計(jì)劃開發(fā)的"持續(xù)學(xué)習(xí)超級(jí)智能"將通過模擬環(huán)境中的自我博弈,從第一性原理推導(dǎo)解決方案,而非依賴語言模仿。

這種技術(shù)路線爭(zhēng)議頗大。支持者認(rèn)為,強(qiáng)化學(xué)習(xí)在規(guī)則明確的環(huán)境中已展現(xiàn)超越人類的能力,只需設(shè)計(jì)合理獎(jiǎng)勵(lì)機(jī)制即可推廣至現(xiàn)實(shí)任務(wù)。反對(duì)者則指出,現(xiàn)實(shí)世界存在規(guī)則模糊、反饋稀疏等問題,完全摒棄語言路徑可能面臨算力成本過高和訓(xùn)練效率低下等挑戰(zhàn)。據(jù)知情人士透露,Ineffable Intelligence可能需要構(gòu)建復(fù)雜的數(shù)字孿生系統(tǒng)進(jìn)行試錯(cuò)訓(xùn)練,這解釋了其巨額融資需求。

行業(yè)格局正在加速重構(gòu)。除席爾瓦外,參與AlphaGo項(xiàng)目的多名科學(xué)家近期創(chuàng)立Reflection AI,meta在楊立昆(Yann LeCun)帶領(lǐng)下重組"超級(jí)智能實(shí)驗(yàn)室"探索新架構(gòu)。有觀察家比喻:"當(dāng)前局面類似深度學(xué)習(xí)爆發(fā)前夜,頂尖科學(xué)家都在尋找突破LLM瓶頸的新路徑。"席爾瓦代表的原教旨主義派認(rèn)為,智能本質(zhì)是決策與探索能力,而非語言預(yù)測(cè)水平。

目前,Ineffable Intelligence已在倫敦設(shè)立總部并啟動(dòng)全球人才招募,重點(diǎn)吸引強(qiáng)化學(xué)習(xí)領(lǐng)域的頂尖研究員。盡管尚未公布產(chǎn)品時(shí)間表,但這家公司的技術(shù)路線選擇和資源投入規(guī)模,已被視為影響AI技術(shù)演進(jìn)方向的關(guān)鍵變量。其能否在算力成本與訓(xùn)練效率之間找到平衡點(diǎn),將成為決定這場(chǎng)技術(shù)路線之爭(zhēng)走向的重要因素。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容