在上海浦江AI學(xué)術(shù)年會上,阿里巴巴攜手上海人工智能實驗室共同推出《守己利他:智能時代做負責(zé)任的技術(shù)》白皮書。該文件聚焦人工智能體安全議題,提出全行業(yè)應(yīng)對技術(shù)風(fēng)險的三大核心原則:守己、利他、合作。這是阿里巴巴連續(xù)第四年發(fā)布人工智能治理領(lǐng)域的實踐成果,其構(gòu)建的全棧AI安全防護體系引發(fā)學(xué)界與產(chǎn)業(yè)界關(guān)注。
阿里巴巴人工智能治理與可持續(xù)發(fā)展實驗室主任薛暉在發(fā)布會上強調(diào),全球AI技術(shù)正從"語言交互"向"任務(wù)執(zhí)行"跨越式發(fā)展,智能體自主調(diào)度資源、完成復(fù)雜操作的能力顯著增強,但隨之而來的安全風(fēng)險呈現(xiàn)集中爆發(fā)態(tài)勢。"安全已從技術(shù)選項變?yōu)樯鐣湃蔚幕枰袠I(yè)建立命運共同體意識。"他指出,阿里巴巴將安全基因深度植入芯片、云計算、模型開發(fā)到應(yīng)用落地的全鏈條,通過源頭管控確保技術(shù)產(chǎn)品的本質(zhì)安全。
針對用戶自定義智能體存在的安全隱患,阿里巴巴通義實驗室安全負責(zé)人張榮用"保險箱與家門口"的比喻形象說明風(fēng)險差異。他表示,未經(jīng)專業(yè)封裝的智能體如同暴露在公共區(qū)域的保險箱,而通過系統(tǒng)級安全加固的產(chǎn)品則具備多層防護機制。該團隊構(gòu)建的立體化防護體系包含兩大核心策略:強化基礎(chǔ)模型的內(nèi)生安全能力,以及建立覆蓋全流程的系統(tǒng)級安全圍欄。
在技術(shù)實現(xiàn)層面,阿里巴巴依托20余年安全研究積累的千萬級真實漏洞數(shù)據(jù)庫,打造出行業(yè)領(lǐng)先的安全訓(xùn)練語料庫。通過將代碼安全知識深度融入千問大模型訓(xùn)練過程,并實施多輪嚴格的安全對齊,使模型生成的代碼安全性在開源領(lǐng)域達到頂尖水平。據(jù)權(quán)威評測基準(zhǔn)SecCodeBench顯示,該模型在代碼安全指標(biāo)上持續(xù)領(lǐng)跑同類開源產(chǎn)品。
為推動行業(yè)共建安全生態(tài),阿里巴巴堅持開源開放戰(zhàn)略,將內(nèi)部驗證的安全技術(shù)轉(zhuǎn)化為公共產(chǎn)品向全行業(yè)共享。這種"守己利他"的實踐模式,既保障了自身技術(shù)產(chǎn)品的安全性,也為千行百業(yè)踐行負責(zé)任創(chuàng)新提供了可復(fù)制的解決方案。隨著智能體加速滲透至社會生產(chǎn)生活各領(lǐng)域,這種全鏈條、系統(tǒng)化的安全治理思路正獲得越來越多機構(gòu)的認可與應(yīng)用。





















