資訊在沃

藏語大模型亮相北京科博會:跨越語言障礙 助力藏語使用者擁抱AI時代

   發布時間:2026-05-11 05:15 作者:沈瑾瑜

第二十八屆中國北京國際科技產業博覽會上,一款藏語大模型成為焦點。展會現場,觀眾只需對著智能鼠標說出藏語問題,大模型便能迅速識別語音,并以地道的藏語作出回應。這一創新應用,讓藏語在人工智能時代煥發出新的活力。

西藏大學博士研究生才讓東知長期從事藏語大模型研發。他指出,當前主流的通用大模型多基于漢語、英語等語言訓練,在藏語理解和生成方面存在明顯不足。通用大模型給出的藏語回答往往缺乏自然語感,帶有明顯的人工轉碼痕跡,無法滿足藏語使用者的實際需求。

針對這一痛點,研發團隊采用藏語語音語料進行專門訓練,使大模型能夠以藏語思維進行思考和作答。在展會現場,藏語大模型展示了強大的實用功能:它可以協助起草買賣牦牛的合同,創作贊美父母的詩歌,還能為長期素食者提供營養建議。這些應用場景覆蓋了日常生活的多個方面。

據"DeepZang"產品部負責人多吉美久介紹,該模型收集了近7000萬條藏漢平行語料,采集超過30500小時藏語語音數據,覆蓋衛藏、康巴、安多三大藏語方言區。這種全面的語料采集,使模型能夠理解不同方言區的語音特征,實現跨方言交流。國家知識產權局網站顯示,開發方西藏覺羅數字產業管理有限公司已申請相關專利,通過聲紋識別與方言分類技術解決溝通障礙。

在西藏山南市從事藏漢翻譯工作的洛桑頓玉深有體會。他表示,良好的跨方言識別能力大大降低了使用門檻,用戶無需具備高水平的藏語文字能力,通過語音交互即可獲得服務。據他介紹,藏語大模型已顯著提升工作效率:"過去需要兩三人合作、耗時40分鐘的翻譯任務,現在借助AI輔助,單人20多分鐘即可完成。"

覺羅數字提供的數據顯示,"DeepZang"已擁有30多萬用戶,其中18至40歲青年占比超過70%。用戶主要分布在西藏、青海、四川、甘肅等地區,不少來自偏遠地帶。隨著西藏主電網實現全域覆蓋,70%行政村通達5G網絡,藏語AI的應用基礎日益完善,能夠為更多藏語使用者提供服務。

盡管取得顯著進展,藏語大模型仍面臨諸多挑戰。多吉美久坦言,從"可用"到"好用"還有很長的路要走。部分用戶反映,持續使用后會遇到"token余額不足"的提示。這正是團隊參展科博會的重要目的——尋求技術合作,解決算力成本高、資金壓力大、商業模式不成熟等問題。

作為首次參展企業,覺羅數字董事長旦增羅布認為,科博會為藏語AI技術提供了融入全國科技創新生態的重要平臺。當被問及藏語大模型的意義時,AI自身給出了回答:它既是藏語使用者的新時代工具,也是連接藏語與其他語言的橋梁。

 
 
更多>同類內容
全站最新
熱門內容