新加坡國家人工智能計(jì)劃(AI Singapore,簡稱AISG)近日宣布,其最新版本的“Sea-Lion”大語言模型(LLM)——Qwen-Sea-Lion-v4,將由阿里巴巴集團(tuán)旗下的阿里云提供全面技術(shù)支持。這一合作標(biāo)志著AISG在區(qū)域人工智能領(lǐng)域邁出了重要一步,同時(shí)也反映出國際科技合作在推動(dòng)本地化創(chuàng)新中的關(guān)鍵作用。
Qwen-Sea-Lion-v4基于阿里云的Qwen3-32B基礎(chǔ)模型構(gòu)建,該模型經(jīng)過特別優(yōu)化,以適應(yīng)東南亞地區(qū)多樣化的語言需求。阿里云在新聞稿中強(qiáng)調(diào),Qwen3-32B不僅接受了超過119種語言與方言的預(yù)訓(xùn)練,總數(shù)據(jù)量達(dá)到36萬億詞元,還額外使用了超過1000億個(gè)東南亞語種詞元進(jìn)行強(qiáng)化訓(xùn)練。這一舉措顯著提升了模型對本地表達(dá)方式、對話細(xì)微差別以及區(qū)域性知識(shí)領(lǐng)域的理解能力。
此次合作中,阿里云不僅提供了基礎(chǔ)模型架構(gòu),還深度參與了Qwen-Sea-Lion-v4的高級(jí)后訓(xùn)練階段。通過這一階段的技術(shù)支撐,模型在處理復(fù)雜語言任務(wù)時(shí)的表現(xiàn)得到了進(jìn)一步提升。與此同時(shí),AI Singapore貢獻(xiàn)了其開源的區(qū)域性數(shù)據(jù)集,包括針對東南亞語言任務(wù)的數(shù)據(jù)整理、優(yōu)化與評估工作,為模型的本地化適配提供了重要支持。
在性能評估方面,Qwen-Sea-Lion-v4在參數(shù)規(guī)模低于2000億的開源大模型中表現(xiàn)突出,位居“東南亞語言模型綜合評估排行榜”首位。這一成果不僅驗(yàn)證了模型的技術(shù)實(shí)力,也為其在區(qū)域內(nèi)的廣泛應(yīng)用奠定了基礎(chǔ)。目前,該模型已在AI Singapore官網(wǎng)及Hugging Face平臺(tái)開放免費(fèi)下載,供研究人員和開發(fā)者使用。
新加坡在人工智能領(lǐng)域的投入持續(xù)加大。2023年12月,該國啟動(dòng)了一項(xiàng)總額7000萬新元(約合3.81億元人民幣)的國家級(jí)計(jì)劃,旨在全面提升多模態(tài)大語言模型的科研與工程能力。該項(xiàng)目由新加坡國家研究基金會(huì)(NRF)提供資金支持,并獲得資訊通信媒體發(fā)展局(IMDA)的認(rèn)可,進(jìn)一步凸顯了新加坡在人工智能領(lǐng)域的戰(zhàn)略布局。
此次阿里云與AI Singapore的合作,不僅為東南亞地區(qū)的人工智能發(fā)展提供了新的技術(shù)范式,也為全球科技企業(yè)如何通過本地化創(chuàng)新滿足區(qū)域需求提供了參考。隨著Qwen-Sea-Lion-v4的推廣應(yīng)用,預(yù)計(jì)將在教育、醫(yī)療、金融等多個(gè)領(lǐng)域產(chǎn)生積極影響。





















