在线亚洲国产一区二区三区-日韩亚洲欧洲人妻三区中文字幕-国产精品一区二区男女羞羞无遮挡-日韩特黄免费在线观看-视频一区二区三区免费在线视频-天天在线天天看成人免费视频-人人妻天天爽夜夜爽视频-国产极品久久久久久久久久-老司机午夜福利视频一区

資訊在沃

AlphaGo核心人物戴維·席爾瓦創(chuàng)業(yè):10億美元融資,探索強(qiáng)化學(xué)習(xí)新路徑

   發(fā)布時(shí)間:2026-02-21 01:47 作者:顧雨柔

人工智能領(lǐng)域迎來一位重量級創(chuàng)業(yè)者的身影——前谷歌DeepMind首席科學(xué)家、AlphaGo項(xiàng)目核心負(fù)責(zé)人戴維·席爾瓦(David Silver)宣布在倫敦創(chuàng)立人工智能公司"Ineffable Intelligence"。據(jù)知情人士透露,這家初創(chuàng)企業(yè)正在推進(jìn)規(guī)模達(dá)10億美元的種子輪融資,目前已進(jìn)入收官階段。這一融資規(guī)模與OpenAI前首席科學(xué)家伊利亞·蘇茨克維(Ilya Sutskever)2024年創(chuàng)立的Safe Superintelligence(SSI)持平,創(chuàng)下AI初創(chuàng)企業(yè)融資新紀(jì)錄。

與當(dāng)前主流的大語言模型技術(shù)路線形成鮮明對比,席爾瓦的新公司明確提出要突破傳統(tǒng)范式。其核心戰(zhàn)略是回歸強(qiáng)化學(xué)習(xí)(Reinforcement Learning)本質(zhì),構(gòu)建能夠自主探索未知領(lǐng)域的智能系統(tǒng)。這種技術(shù)路徑不依賴人類既有知識(shí)庫,而是通過智能體與環(huán)境的持續(xù)交互實(shí)現(xiàn)自我進(jìn)化。作為圖靈獎(jiǎng)得主查理·薩頓(Charlie Sutton)的得意門生,席爾瓦在強(qiáng)化學(xué)習(xí)領(lǐng)域深耕二十余年,其學(xué)術(shù)成果被引用超28萬次,2019年更榮獲ACM計(jì)算獎(jiǎng)。

2025年4月,席爾瓦與導(dǎo)師薩頓聯(lián)合發(fā)表的《歡迎來到經(jīng)驗(yàn)時(shí)代》論文引發(fā)學(xué)界震動(dòng)。該研究提出新一代AI系統(tǒng)應(yīng)聚焦"經(jīng)驗(yàn)學(xué)習(xí)"——通過持續(xù)試錯(cuò)、自我迭代和長期互動(dòng)積累知識(shí),而非單純依賴靜態(tài)數(shù)據(jù)訓(xùn)練。這一理論框架直接構(gòu)成了Ineffable Intelligence的技術(shù)基石。論文指出,當(dāng)前主流的"預(yù)訓(xùn)練+微調(diào)"模式存在根本性局限:AI的能力邊界被人類數(shù)據(jù)規(guī)模和質(zhì)量所束縛,難以實(shí)現(xiàn)真正的認(rèn)知突破。

資本市場對席爾瓦的技術(shù)路線表現(xiàn)出強(qiáng)烈信心。參與融資談判的投資人分析,10億美元的天價(jià)估值主要基于兩點(diǎn)考量:一是席爾瓦在AI領(lǐng)域的權(quán)威地位,二是其提出的"后大模型時(shí)代"技術(shù)路線具有戰(zhàn)略前瞻性。盡管公司尚未發(fā)布任何產(chǎn)品,但多位頂級風(fēng)投機(jī)構(gòu)已承諾注資,認(rèn)為這可能是通往通用人工智能(AGI)的全新路徑。

這場技術(shù)路線之爭正引發(fā)AI界的深刻變革。2024年以來,多位參與AlphaGo項(xiàng)目的核心成員陸續(xù)離職創(chuàng)業(yè),其中Reflection AI同樣聚焦強(qiáng)化學(xué)習(xí)領(lǐng)域。meta首席AI科學(xué)家楊立昆(Yann LeCun)則帶領(lǐng)團(tuán)隊(duì)重組"超級智能實(shí)驗(yàn)室",探索非Transformer架構(gòu)的新路徑。行業(yè)觀察家指出,當(dāng)前局面與2010年代深度學(xué)習(xí)爆發(fā)前夜頗為相似,學(xué)界普遍意識(shí)到現(xiàn)有大模型可能并非通往AGI的終極方案。

不過,席爾瓦的激進(jìn)路線也面臨現(xiàn)實(shí)挑戰(zhàn)。批評者指出,強(qiáng)化學(xué)習(xí)在圍棋等規(guī)則明確的環(huán)境中表現(xiàn)優(yōu)異,但在現(xiàn)實(shí)世界這類開放環(huán)境中,其有效性尚未得到充分驗(yàn)證。大語言模型的成功恰恰在于語言作為人類智慧載體的高效性——通過學(xué)習(xí)語言,AI能以較低成本獲取常識(shí)知識(shí)。若完全摒棄這條路徑,Ineffable Intelligence可能需要構(gòu)建極其復(fù)雜的數(shù)字孿生系統(tǒng),其算力成本將呈指數(shù)級增長。

據(jù)悉,Ineffable Intelligence已在倫敦設(shè)立總部,并啟動(dòng)全球頂尖強(qiáng)化學(xué)習(xí)專家的招募計(jì)劃。雖然公司尚未公布具體產(chǎn)品路線圖,但其技術(shù)方向和資源投入規(guī)模,已使其成為影響AI技術(shù)演進(jìn)的關(guān)鍵力量。這場由技術(shù)理想主義驅(qū)動(dòng)的創(chuàng)業(yè)實(shí)驗(yàn),或?qū)⒅匦露x人工智能的發(fā)展邊界。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容