資訊在沃

藏語大模型北京科博會首秀:以科技之力,架起藏語溝通新橋梁

   發布時間:2026-05-10 22:54 作者:蘇婉清

在第二十八屆中國北京國際科技產業博覽會上,一款藏語大模型吸引了眾多目光。現場演示中,參觀者只需對著智能鼠標說出藏語問題,大模型便能迅速識別語音,并以地道的藏語給出回應,展現出強大的語言處理能力。

據從事藏語大模型研發的西藏大學博士研究生才讓東知介紹,傳統通用大模型多基于漢語、英語等語言訓練,在藏語理解和生成方面存在明顯不足。這些模型給出的回答往往缺乏藏語特有的自然語感和文化韻味,更像是機械翻譯的結果。而新推出的藏語大模型則完全不同,它采用藏語語音語料進行訓練,能夠以藏語思維進行思考和表達,有效彌補了這一缺陷。

在展會現場,這款名為“DeepZang”的藏語大模型展示了其強大的實用功能。它不僅能協助撰寫買賣牦牛的合同、創作贊美父母的詩歌,還能為長期素食者提供營養建議。據產品部負責人多吉美久透露,為打造這款模型,團隊收集了近7000萬條藏漢平行精準語料,并采集了超過30500小時的藏語語音數據,覆蓋了衛藏、康巴、安多三大藏語方言區。

多吉美久進一步解釋說,雖然不同藏語方言地區的文字相通,但口語差異較大。通過使用各方言區的語音語料進行訓練,AI模型實現了藏語的跨方言交流能力。國家知識產權局網站顯示,開發方西藏覺羅數字產業管理有限公司已申請相關專利,其技術通過結合聲紋識別和方言分類,有效解決了方言差異帶來的溝通障礙。

在西藏山南市從事藏漢翻譯工作的洛桑頓玉對這款模型贊不絕口。他表示,良好的跨方言語音識別能力大大降低了使用門檻,即使藏語文字水平不高的人也能通過語音與AI互動。他透露,自己和同事已將藏語大模型應用于日常翻譯工作,原本需要兩三人合作、耗時40分鐘的翻譯任務,現在借助AI輔助,一人20多分鐘即可完成。

據覺羅數字提供的數據,“DeepZang”目前已擁有30多萬用戶,其中18至40歲的青年用戶占比超過70%。用戶主要分布在西藏、青海、四川和甘肅等藏語使用地區,不少用戶來自偏遠地區。多吉美久認為,西藏電力和5G網絡的普及為藏語AI的推廣提供了有力支撐。

盡管取得了一定成果,但開發團隊也清醒地認識到面臨的挑戰。多吉美久坦言,從“可用”到“好用”還有很長的路要走。部分用戶反饋,在使用“DeepZang”進行多輪問答后,系統會提示“token余額不足”。這正是團隊參展科博會的重要原因——尋求合作機會,以解決算力成本高、資金壓力大、商業閉環尚未形成等問題。

此次參展是覺羅數字首次亮相科博會。公司董事長旦增羅布表示,希望通過這個平臺更好地融入全國科技創新生態,推動藏語AI技術的進一步發展。當被問及藏語大模型的意義時,AI自身給出了回答:它既為藏語使用者提供了新時代工具,也搭建了藏語與其他語言之間的溝通橋梁。

 
 
更多>同類內容
全站最新
熱門內容