在人工智能與機(jī)器人領(lǐng)域,陳佳玉的學(xué)術(shù)軌跡呈現(xiàn)出獨特的跨學(xué)科特征。這位兼具香港大學(xué)博士生導(dǎo)師與原力無限首席科學(xué)家雙重身份的學(xué)者,其研究領(lǐng)域橫跨自動駕駛、核聚變控制與通用家用機(jī)器人開發(fā),始終圍繞復(fù)雜系統(tǒng)的智能控制展開探索。2025年開啟的全新職業(yè)階段,標(biāo)志著他正式將研究重心轉(zhuǎn)向具身智能領(lǐng)域,試圖打通學(xué)術(shù)理論與產(chǎn)業(yè)實踐的壁壘。
從北京大學(xué)工學(xué)院本科畢業(yè)后,陳佳玉的早期研究聚焦自動駕駛技術(shù),逐步深入強(qiáng)化學(xué)習(xí)理論。在卡內(nèi)基梅隆大學(xué)博士后階段,他創(chuàng)新性地將強(qiáng)化學(xué)習(xí)應(yīng)用于核聚變反應(yīng)堆的等離子體控制,解決了高維非線性系統(tǒng)的建模難題。這段經(jīng)歷讓他深刻認(rèn)識到,無論是核聚變裝置的精密調(diào)控還是機(jī)器人執(zhí)行日常任務(wù),本質(zhì)上都是通過馬爾可夫決策過程構(gòu)建的數(shù)學(xué)問題。"觀測空間、動作空間與獎勵函數(shù)的設(shè)計,決定了控制系統(tǒng)的最終效能。"他解釋道。
在研究方法論上,陳佳玉形成了獨特的雙重思維模式。博士導(dǎo)師Vanita Gawva培養(yǎng)的數(shù)學(xué)抽象能力,使他能夠從統(tǒng)計學(xué)與優(yōu)化理論視角剖析算法本質(zhì);博后導(dǎo)師Joshua Rendell強(qiáng)調(diào)的工程迭代思維,則讓他學(xué)會根據(jù)實際需求動態(tài)調(diào)整技術(shù)路線。這種理論嚴(yán)謹(jǐn)性與工程實用性的融合,在其主導(dǎo)的持續(xù)性強(qiáng)化學(xué)習(xí)研究中得到充分體現(xiàn)——該技術(shù)旨在解決人工智能系統(tǒng)學(xué)習(xí)新任務(wù)時遺忘舊知識的難題,目前正嘗試在機(jī)器人平臺上實現(xiàn)算法突破。
選擇加入原力無限創(chuàng)業(yè)團(tuán)隊,源于陳佳玉對具身智能落地路徑的深刻認(rèn)知。他指出,香港高校在設(shè)備采購、實驗室空間與算力支持方面存在顯著局限,而產(chǎn)業(yè)界提供的聯(lián)合實驗室環(huán)境恰好能彌補(bǔ)這些短板。公司已商業(yè)化的FORCE系列機(jī)器人與MASTER COFFEE服務(wù)機(jī)器人,為其研究提供了真實場景驗證平臺。"真正的技術(shù)突破需要形成商業(yè)-技術(shù)正向循環(huán),"他強(qiáng)調(diào),"當(dāng)1000臺機(jī)器人部署到家庭場景持續(xù)產(chǎn)生數(shù)據(jù)時,數(shù)據(jù)飛輪效應(yīng)將推動通用物理世界模型的構(gòu)建。"
針對具身智能的發(fā)展路線,陳佳玉提出"任務(wù)泛化-場景泛化"的雙階段論。預(yù)計未來2-3年內(nèi),機(jī)器人將首先實現(xiàn)特定場景下的多任務(wù)穩(wěn)定執(zhí)行,隨后通過海量跨場景數(shù)據(jù)訓(xùn)練突破場景限制。他特別指出,當(dāng)前行業(yè)過度追求泛化性卻缺乏理論保障,而持續(xù)學(xué)習(xí)能力的缺失更被嚴(yán)重低估。"Richard Sutton提出的持續(xù)學(xué)習(xí)難題,需要跨學(xué)科協(xié)作才能突破。"這位青年學(xué)者透露,其團(tuán)隊正在開發(fā)以智能體為中心的世界模型,通過構(gòu)建因果推理機(jī)制提升機(jī)器人任務(wù)遷移能力。
在研究資源獲取方面,陳佳玉形成了一套務(wù)實策略。他建議年輕研究者首先建立完整的研究體系框架:"先拆解領(lǐng)域內(nèi)標(biāo)桿學(xué)者的思維模式,再結(jié)合自身優(yōu)勢定義核心問題。"對于學(xué)術(shù)與產(chǎn)業(yè)的平衡,他采取"80-20法則":將主要精力投入具有長期影響力的核心研究,同時保留20%資源用于探索性工作。這種策略既保證了研究深度,又維持了學(xué)術(shù)產(chǎn)出效率。
面對"天才少年"的標(biāo)簽,陳佳玉表現(xiàn)出超越年齡的成熟。"標(biāo)簽本身沒有意義,"他坦言,"真正重要的是能否在資源約束下找到最優(yōu)解。"這種務(wù)實態(tài)度貫穿其研究生涯——從自動駕駛感知決策到核聚變控制,再到通用機(jī)器人開發(fā),每次方向調(diào)整都基于對技術(shù)本質(zhì)與產(chǎn)業(yè)需求的深刻理解。正如他所強(qiáng)調(diào)的:"具身智能是人工智能的終極試驗場,這里需要的不只是算法創(chuàng)新,更是系統(tǒng)級解決方案。"






















