在近日舉行的上海浦江AI學(xué)術(shù)年會(huì)上,阿里巴巴與上海人工智能實(shí)驗(yàn)室聯(lián)合發(fā)布了《守己利他:智能時(shí)代做負(fù)責(zé)任的技術(shù)》白皮書。該文件聚焦人工智能技術(shù)發(fā)展中的安全挑戰(zhàn),提出全行業(yè)需以"守己、利他、合作"為原則,共同構(gòu)建安全可信的AI生態(tài)。白皮書強(qiáng)調(diào),在智能體加速滲透社會(huì)各領(lǐng)域的背景下,安全已從技術(shù)選項(xiàng)演變?yōu)殛P(guān)乎社會(huì)信任的核心命題。
阿里巴巴人工智能治理與可持續(xù)發(fā)展實(shí)驗(yàn)室主任薛暉指出,當(dāng)前AI技術(shù)正從"交互能力"向"執(zhí)行能力"躍遷,這種轉(zhuǎn)變要求技術(shù)體系必須具備與之匹配的安全防護(hù)水平。"去年以來,具備自主調(diào)度能力的智能體開始大規(guī)模應(yīng)用,其在執(zhí)行復(fù)雜任務(wù)時(shí)暴露出的安全風(fēng)險(xiǎn)呈現(xiàn)集中化特征。"他以金融交易場(chǎng)景為例說明,智能體若缺乏有效安全約束,可能引發(fā)系統(tǒng)性風(fēng)險(xiǎn)。
針對(duì)智能體安全防護(hù)難題,阿里巴巴構(gòu)建了覆蓋全技術(shù)棧的安全體系。該體系通過芯片層、云計(jì)算層、模型層到應(yīng)用層的縱深防御,在技術(shù)源頭植入安全基因。特別在模型訓(xùn)練環(huán)節(jié),研發(fā)團(tuán)隊(duì)基于千萬級(jí)真實(shí)漏洞樣本構(gòu)建安全語料庫(kù),通過多階段強(qiáng)化訓(xùn)練使千問大模型的代碼生成安全性達(dá)到行業(yè)領(lǐng)先水平。在權(quán)威評(píng)測(cè)基準(zhǔn)SecCodeBench中,該模型生成的代碼安全指標(biāo)位居開源模型首位。
通義實(shí)驗(yàn)室安全負(fù)責(zé)人張榮用"保險(xiǎn)箱悖論"闡釋用戶自建智能體的風(fēng)險(xiǎn):"普通用戶開發(fā)的智能體如同將保險(xiǎn)柜置于開放空間,其安全防護(hù)機(jī)制往往存在明顯短板。"他對(duì)比指出,經(jīng)過系統(tǒng)安全加固的商業(yè)化產(chǎn)品(如Qoder、MuleRun等),通過內(nèi)置訪問控制、異常檢測(cè)等機(jī)制,能提供更可靠的安全保障。這種差異在代碼執(zhí)行和工具調(diào)用等高風(fēng)險(xiǎn)環(huán)節(jié)尤為顯著。
在技術(shù)開放方面,阿里巴巴采取"安全先行"策略,將內(nèi)部驗(yàn)證的安全技術(shù)模塊化輸出。這種開源模式既降低了行業(yè)整體安全成本,又通過技術(shù)共享推動(dòng)形成安全標(biāo)準(zhǔn)。據(jù)介紹,其安全防護(hù)體系已實(shí)現(xiàn)智能體風(fēng)險(xiǎn)的全鏈路管控,從模型訓(xùn)練階段的對(duì)抗樣本防御,到運(yùn)行時(shí)的實(shí)時(shí)行為監(jiān)測(cè),形成閉環(huán)式安全保障機(jī)制。



















