日韩高清在线观看不卡一区二区,嫩模精品视频在线观看

AlphaGo核心負(fù)責(zé)人戴維·席爾瓦創(chuàng)業(yè)：繞過LLM，探索自主探索新知的智能系統(tǒng)

發(fā)布時(shí)間：2026-02-21 12:13 來源：快訊作者：唐云澤

人工智能領(lǐng)域再掀波瀾，前谷歌DeepMind首席科學(xué)家、AlphaGo項(xiàng)目核心負(fù)責(zé)人戴維·席爾瓦（David Silver）宣布在倫敦創(chuàng)立新公司"Ineffable Intelligence"，并計(jì)劃完成10億美元種子輪融資。這一金額與OpenAI前首席科學(xué)家伊利亞·蘇茨克維（Ilya Sutskever）2024年創(chuàng)立Safe Superintelligence（SSI）時(shí)持平，引發(fā)資本市場(chǎng)對(duì)AI技術(shù)新路徑的強(qiáng)烈關(guān)注。

與當(dāng)前主流的大語言模型（LLM）依賴海量文本預(yù)訓(xùn)練不同，席爾瓦提出要徹底顛覆現(xiàn)有范式。他主張回歸強(qiáng)化學(xué)習(xí)（Reinforcement Learning）本質(zhì)，構(gòu)建無需人類知識(shí)輸入、能自主探索未知的智能系統(tǒng)。這一理念源于其2025年4月與導(dǎo)師查理·薩頓（Charlie Sutton）在arXiv發(fā)布的論文《歡迎來到經(jīng)驗(yàn)時(shí)代》，論文強(qiáng)調(diào)智能體應(yīng)通過與環(huán)境持續(xù)交互積累經(jīng)驗(yàn)，而非被動(dòng)接受靜態(tài)數(shù)據(jù)訓(xùn)練。

作為強(qiáng)化學(xué)習(xí)領(lǐng)域的標(biāo)志性人物，席爾瓦的學(xué)術(shù)影響力不容小覷。其論文被引用量超28萬次，2019年獲得的ACM計(jì)算獎(jiǎng)更印證了他在該領(lǐng)域的地位。DeepMind發(fā)言人確認(rèn)其離職時(shí)特別強(qiáng)調(diào)："戴維的貢獻(xiàn)對(duì)DeepMind的發(fā)展具有不可估量的價(jià)值。"這位與DeepMind聯(lián)合創(chuàng)始人德米斯·哈薩比斯（Demis Hassabis）相識(shí)于大學(xué)時(shí)代的科學(xué)家，曾主導(dǎo)開發(fā)了AlphaGo、AlphaZero和MuZero等突破性項(xiàng)目。

資本市場(chǎng)對(duì)席爾瓦的押注，反映出AI行業(yè)正經(jīng)歷路線分化。當(dāng)前主流模型通過"預(yù)訓(xùn)練+微調(diào)"掌握語言規(guī)律，但席爾瓦指出這種路徑存在根本局限：模型能力受限于人類標(biāo)注數(shù)據(jù)的質(zhì)量。他曾在播客中直言："要超越人類認(rèn)知，必須讓AI自主發(fā)現(xiàn)人類尚未掌握的知識(shí)。"新公司計(jì)劃開發(fā)的"持續(xù)學(xué)習(xí)超級(jí)智能"將通過模擬環(huán)境中的自我博弈，從第一性原理推導(dǎo)解決方案，而非依賴語言模仿。

這種技術(shù)路線爭(zhēng)議頗大。支持者認(rèn)為，強(qiáng)化學(xué)習(xí)在規(guī)則明確的環(huán)境中已展現(xiàn)超越人類的能力，只需設(shè)計(jì)合理獎(jiǎng)勵(lì)機(jī)制即可推廣至現(xiàn)實(shí)任務(wù)。反對(duì)者則指出，現(xiàn)實(shí)世界存在規(guī)則模糊、反饋稀疏等問題，完全摒棄語言路徑可能面臨算力成本過高和訓(xùn)練效率低下等挑戰(zhàn)。據(jù)知情人士透露，Ineffable Intelligence可能需要構(gòu)建復(fù)雜的數(shù)字孿生系統(tǒng)進(jìn)行試錯(cuò)訓(xùn)練，這解釋了其巨額融資需求。

行業(yè)格局正在加速重構(gòu)。除席爾瓦外，參與AlphaGo項(xiàng)目的多名科學(xué)家近期創(chuàng)立Reflection AI，meta在楊立昆（Yann LeCun）帶領(lǐng)下重組"超級(jí)智能實(shí)驗(yàn)室"探索新架構(gòu)。有觀察家比喻："當(dāng)前局面類似深度學(xué)習(xí)爆發(fā)前夜，頂尖科學(xué)家都在尋找突破LLM瓶頸的新路徑。"席爾瓦代表的原教旨主義派認(rèn)為，智能本質(zhì)是決策與探索能力，而非語言預(yù)測(cè)水平。

目前，Ineffable Intelligence已在倫敦設(shè)立總部并啟動(dòng)全球人才招募，重點(diǎn)吸引強(qiáng)化學(xué)習(xí)領(lǐng)域的頂尖研究員。盡管尚未公布產(chǎn)品時(shí)間表，但這家公司的技術(shù)路線選擇和資源投入規(guī)模，已被視為影響AI技術(shù)演進(jìn)方向的關(guān)鍵變量。其能否在算力成本與訓(xùn)練效率之間找到平衡點(diǎn)，將成為決定這場(chǎng)技術(shù)路線之爭(zhēng)走向的重要因素。

更多>同類內(nèi)容

AlphaGo核心負(fù)責(zé)人戴維·席爾瓦創(chuàng)業(yè)：繞過LLM，探索自主探索新知的智能系統(tǒng)

AlphaGo核心負(fù)責(zé)人戴維·席爾瓦創(chuàng)業(yè)：繞過LLM，探索自主探索新知的智能系統(tǒng)