在人工智能(AI)領(lǐng)域,一個長期存在的疑問困擾著市場:如果AI技術(shù)如此強(qiáng)大,為何真正實現(xiàn)盈利的似乎只有GPU制造商,而從事大模型開發(fā)和應(yīng)用的企業(yè)卻鮮有高額利潤?英偉達(dá)憑借超過70%的毛利率和接近兩千億美元的數(shù)據(jù)中心年收入,成為AI產(chǎn)業(yè)鏈上游的典型代表。然而,全球主要模型廠商幾乎全部處于虧損狀態(tài),中國大模型市場在經(jīng)歷激烈競爭后,推理服務(wù)價格已接近成本線。這種“上游盈利、下游虧損”的現(xiàn)象,引發(fā)了關(guān)于AI產(chǎn)業(yè)是否陷入泡沫的討論。
從經(jīng)濟(jì)學(xué)視角分析,這一現(xiàn)象并非源于AI未能創(chuàng)造價值,而是因為已創(chuàng)造的價值尚未被充分轉(zhuǎn)化為收入。要理解這一邏輯,需從AI經(jīng)濟(jì)的核心計量單位——Token入手。Token是大語言模型處理和生成信息的基本單元,無論是用戶提問還是AI回答,均需消耗Token。英偉達(dá)CEO黃仁勛將AI產(chǎn)業(yè)劃分為能源、芯片、基礎(chǔ)設(shè)施、模型、應(yīng)用五層,并將Token定義為貫穿各層的“語言與貨幣”。這一設(shè)計使AI經(jīng)濟(jì)具備了可計量、定價和核算的基礎(chǔ),類似于千瓦時之于電力、桶之于石油。圍繞Token形成的經(jīng)濟(jì)運(yùn)行邏輯,正逐漸構(gòu)成一套獨(dú)特的“Token經(jīng)濟(jì)學(xué)”。
Token經(jīng)濟(jì)的一個反直覺特征是:Token價格越低,總支出反而越高。過去兩年,Token生產(chǎn)成本下降超過99%,但全球企業(yè)AI支出卻增長三倍以上。這一現(xiàn)象與19世紀(jì)英國經(jīng)濟(jì)學(xué)家杰文斯的觀察類似——蒸汽機(jī)效率提升導(dǎo)致煤炭總消耗量不降反升。然而,Token與煤炭的本質(zhì)區(qū)別在于其價值完全取決于用途。耶魯大學(xué)研究指出,Token是“可合同化的計量單位”:同一Token用于閑聊可能僅值幾分錢,用于編寫代碼則可能價值數(shù)百美元,用于法律分析更可能達(dá)到上千美元。這種因任務(wù)而異的價值差異,被稱為“可編程性”——傳統(tǒng)生產(chǎn)要素如鋼鐵、石油的價值由物理屬性決定,而Token的價值僅因指令不同即可跨越多個數(shù)量級。
當(dāng)前,Token消費(fèi)的結(jié)構(gòu)與預(yù)期存在顯著差異。增長最快的并非企業(yè)生產(chǎn)力工具,而是角色扮演、對話娛樂等消費(fèi)性應(yīng)用。這表明,AI經(jīng)濟(jì)的增長引擎并非“替代人力”,而是由AI原生消費(fèi)驅(qū)動的增量需求。例如,用戶與AI聊天產(chǎn)生的價值,以“消費(fèi)者剩余”形式留存于用戶手中,尚未轉(zhuǎn)化為模型廠商的收入。然而,聊天框背后的成本卻十分沉重:數(shù)據(jù)中心持續(xù)運(yùn)轉(zhuǎn)、GPU排隊上架、電力與冷卻系統(tǒng)鎖定,以及不斷攀升的資本開支。黃仁勛的“五層蛋糕”模型揭示了AI產(chǎn)業(yè)的重資產(chǎn)屬性——每一層均需巨額投資,從能源供應(yīng)到模型調(diào)優(yōu),再到應(yīng)用落地,全球科技公司的年資本開支已從百億美元躍升至近千億美元,絕大部分投向AI數(shù)據(jù)中心及配套電力。
盡管Token生產(chǎn)成本以驚人速度下降——GPU算力成本的學(xué)習(xí)率高達(dá)89%,大模型推理成本每年下降約一個數(shù)量級——但利潤仍集中在上游。原因在于,成本下降越快,越需要前置重資產(chǎn)投入推動下一輪降價。英偉達(dá)的護(hù)城河不僅在于GPU性能,更在于CUDA生態(tài)構(gòu)成的轉(zhuǎn)換成本。訓(xùn)練層市場呈現(xiàn)寡頭格局,門檻以十億美元計;推理層則趨向競爭,開源模型已將價格壓低九成以上。中國模型憑借算法效率、開源策略和極致定價,在全球Token市場迅速崛起,其推理計算部署于海外云節(jié)點,本質(zhì)是算法出海而非電力出口。競爭加劇使Token價格持續(xù)走低,最終受益的是全球開發(fā)者和用戶。
與2000年互聯(lián)網(wǎng)泡沫時期的“光纖過剩”不同,當(dāng)前Token消費(fèi)量正處于高速增長階段。中國日均Token調(diào)用量從兩年前的約1000億飆升至140萬億,增長約1400倍。需求真實且旺盛,只是尚未被充分貨幣化。這一現(xiàn)象與電力從照明進(jìn)入工業(yè)動力、互聯(lián)網(wǎng)從人類瀏覽轉(zhuǎn)向機(jī)器通信的歷史進(jìn)程類似——每一代通用技術(shù)均經(jīng)歷過需求主體的轉(zhuǎn)換。
未來,Token經(jīng)濟(jì)的規(guī)模可能不再取決于人類需求,而是由機(jī)器需求主導(dǎo)。人類處理信息的速度存在生理上限,而智能體(Agent)的崛起正在打破這一瓶頸。智能體是能自主執(zhí)行多步驟任務(wù)的AI程序,可24小時不間斷運(yùn)行,消耗數(shù)百萬Token完成復(fù)雜任務(wù)。例如,一家企業(yè)部署上千個智能體,年Token消耗量可能超過一個中等國家全部人類用戶的總和。更關(guān)鍵的是,智能體不僅能消耗Token,還能自主采購——根據(jù)任務(wù)需求選擇模型和資源,全程無需用戶干預(yù)。這種非人類買家的出現(xiàn),使Token市場結(jié)構(gòu)發(fā)生根本性變化:它們對延遲敏感但對價格不敏感,可在毫秒間切換供應(yīng)商,推動需求量級躍升。
斯坦福大學(xué)經(jīng)濟(jì)學(xué)教授的研究指出,AI生產(chǎn)率提升受制于組織適配、制度變革和人類認(rèn)知等薄弱環(huán)節(jié)。若瓶頸在于人類組織無法匹配AI速度,那么讓AI自主組織——構(gòu)建智能體網(wǎng)絡(luò)——可能是釋放生產(chǎn)率潛力的關(guān)鍵。Token經(jīng)濟(jì)的未來,將取決于機(jī)器能消耗多少Token,而非人類。當(dāng)前,我們僅能觀察到這場變革的開端:凡工作環(huán)節(jié)可拆解為“輸入信息、處理、輸出結(jié)果”的模式,均有可能被Token化。而人類的核心價值,將聚焦于判斷、創(chuàng)意、關(guān)系和不確定性——這些恰恰是Token難以復(fù)制的領(lǐng)域。




















