資訊在沃

藏語大模型北京科博會首秀:以科技之力跨越語言壁壘 助力藏語傳承發展

   發布時間:2026-05-11 09:09 作者:顧雨柔

在近日舉行的中國北京國際科技產業博覽會上,一款能夠用藏語進行自然交互的智能大模型成為焦點。這款名為“DeepZang”的藏語大模型,通過藏語語音識別和生成技術,為藏語使用者提供了全新的智能交互體驗。

研發團隊介紹,傳統通用大模型主要基于漢語、英語等語言訓練,在處理藏語時存在明顯不足。西藏大學博士研究生才讓東知指出,通用模型生成的藏語回答往往缺乏自然語感,帶有明顯的人工翻譯痕跡。而“DeepZang”通過專門使用藏語語料進行訓練,能夠以更地道的藏語思維進行思考和作答。

在展會現場,觀眾可以通過智能鼠標用藏語提出各種問題,模型能夠準確識別并給出流暢的藏語回答。從撰寫牦牛買賣合同到創作贊美父母的詩歌,再到提供營養建議,這款大模型已經能夠完成多種日常任務。一位來自西藏山南市的翻譯工作者洛桑頓玉表示,使用這款模型后,原本需要兩三個人合作40分鐘完成的翻譯工作,現在一個人20多分鐘就能完成。

據產品負責人多吉美久介紹,“DeepZang”的訓練數據包括近7000萬條藏漢平行語料和超過30500小時的藏語語音數據,覆蓋了衛藏、康巴、安多三大藏語方言區。這種全面的方言覆蓋使得模型能夠實現跨方言交流,有效解決了不同地區藏語使用者之間的溝通障礙。國家知識產權局網站顯示,開發方西藏覺羅數字產業管理有限公司已申請相關專利,通過聲紋識別與方言分類技術進一步提升溝通效率。

目前,“DeepZang”已擁有30多萬用戶,其中18至40歲青年占比超過70%,用戶主要分布在西藏、青海、四川和甘肅等藏語使用地區。隨著西藏電力和網絡基礎設施的不斷完善,主電網覆蓋所有縣區、70%行政村通達5G網絡,為藏語AI的推廣應用提供了有力支撐。

盡管取得了一定進展,但研發團隊坦言仍面臨諸多挑戰。多吉美久表示,用戶反饋在使用過程中會遇到“token余額不足”的問題,這反映出當前模型在算力成本和商業運營方面還存在不足。此次參加科博會,正是希望尋求更多合作機會,解決資金壓力和商業閉環等問題。公司董事長旦增羅布認為,參與這類科技展會有助于企業更好地融入全國科技創新生態。

當被問及藏語大模型的意義時,AI自身給出了這樣的回答:對于藏語使用者,它是新時代的高效工具;對于其他語言使用者,它架起了溝通的橋梁。

 
 
更多>同類內容
全站最新
熱門內容