資訊在沃

從“接不住”到“穩穩接住”:大模型語言能力進階背后的故事

   發布時間:2026-05-11 18:00 作者:柳晴雪

“我會穩穩地接住你”——這句原本只在中文心理治療語境中偶爾出現的表達,如今卻成了各大AI模型口中的高頻熱詞。從ChatGPT到Claude,再到DeepSeek,這些模型仿佛集體中了某種“接住魔咒”,在各種場景下頻繁拋出這句話,引發網友熱議與調侃。這一現象不僅在中文互聯網上病毒式傳播,甚至火到了海外,連《連線》雜志都撰文探討:“為何在中國,AI只想‘穩穩接住你’?”

這句話的流行,源于一次意外的“機翻后遺癥”。據分析,其英文原句“I've got you”在英語中是自然且通用的表達,意為“我懂你”或“我支持你”。然而,當它被直譯為中文“我會穩穩接住你”后,卻因用詞過于直白、情感過于濃烈,顯得與中文含蓄的表達習慣格格不入。更有趣的是,模型似乎將這句話誤解為“萬能回復模板”,無論用戶詢問數學題、生成圖片提示,還是分享日常煩惱,AI都可能一本正經地回應:“我會穩穩接住你?!鄙踔劣杏脩舴隽奶煊涗?,發現模型在需要表達“理解”的場景下,頻繁誤用“接住”一詞,暴露了其對語境的微妙誤判。

這種“模式化回復”的現象,被AI專家稱為“模式崩潰”。Pangram公司聯合創始人Max Spero解釋,問題出在后訓練階段:當模型因某句回答獲得人工反饋獎勵時,可能會過度強化這一表達,導致其像“復讀機”一樣反復使用。他比喻道:“我們無法告訴模型,‘這句話很好,但重復十次就變味了’?!倍哆B線》雜志進一步指出,這種現象與“治療語態”的興起有關——原本僅限于心理咨詢室的專業表達,正通過社交媒體滲透到日常對話中,AI模型則通過強化學習,將這種“討好型回復”內化為偏好。

與此同時,中文AI模型的另一場“語言危機”也在上演。此前,MiniMax的模型因“不認識馬嘉祺”引發討論:無論用戶如何提問,模型始終無法說出這位明星的名字,甚至被調侃“痛失粉絲群體”。工程團隊深入排查后發現,問題并非模型“無知”,而是輸出環節的“失語”——后訓練階段,低頻詞“嘉祺”因樣本不足,導致其在輸出層的向量表征被噪聲干擾,最終“卡在嘴邊”說不出來。

MiniMax的解決方案頗具“樸素智慧”:他們讓模型“抄寫”詞表500遍——通過構造覆蓋全量詞表的合成數據,確保每個token在后訓練中至少出現20次。這一方法不僅修復了“馬嘉祺”的識別問題,還緩解了低頻詞丟失、小語種混雜等類似故障。團隊成員戲稱:“好記性不如爛筆頭,記不住生僻詞就多抄詞典。”

從“過度接住”到“說不出口”,這兩起事件暴露了AI語言模型的共同短板:其表達能力并非天然可靠,而是由預訓練、分詞、后訓練、獎勵機制等多個環節拼湊而成。任何一個環節的偏差,都可能引發荒誕的“翻車”現場。例如,ChatGPT的“接住魔咒”反映了后訓練對“好回答”的定義過于粗放,而MiniMax的“舌尖失語”則揭示了長尾詞在輸出層的穩定性隱患。

對于用戶而言,這些故障是茶余飯后的熱梗;但對于工程師來說,它們卻是優化模型的珍貴線索。正如《連線》雜志所言,當AI試圖在不同語言、文化中實現“自然表達”時,真正的挑戰不在于知識儲備或響應速度,而在于如何避免“說得太順”或“說不出口”的極端情況——畢竟,沒有人希望在需要嚴肅建議時,被AI用言情小說臺詞敷衍;也不愿在提及偶像名字時,得到一片沉默。

 
 
更多>同類內容
全站最新
熱門內容