在线亚洲国产一区二区三区-日韩亚洲欧洲人妻三区中文字幕-国产精品一区二区男女羞羞无遮挡-日韩特黄免费在线观看-视频一区二区三区免费在线视频-天天在线天天看成人免费视频-人人妻天天爽夜夜爽视频-国产极品久久久久久久久久-老司机午夜福利视频一区

資訊在沃

“龍蝦”攪動大模型江湖:新邏輯涌現(xiàn),推理時代加速狂奔

   發(fā)布時間:2026-03-28 13:51 作者:鐘景軒

在中關村國際創(chuàng)新中心,一場聚焦大模型行業(yè)變革的討論吸引了眾多目光。此次論壇匯聚了月之暗面創(chuàng)始人楊植麟、智譜CEO張鵬、無問芯穹創(chuàng)始人夏立雪、小米MiMo負責人羅福莉以及香港大學助理教授黃超等業(yè)內核心人物,他們圍繞近期行業(yè)熱點“OpenClaw”展開了深入探討。

過去一個月,OpenClaw成為行業(yè)焦點,它幾乎重塑了大模型的調用格局。智譜、Kimi以及小米MiMo等多家模型廠商都從中受益。3月下旬,在全球最大的模型API聚合平臺OpenRouter上,一款名為Hunter Alpha的模型調用量迅速登頂,隨后小米確認該模型正是MiMo - V2 - Pro。OpenClaw帶來的影響遠不止調用量的增長,它讓行業(yè)清晰地看到大模型進入實際應用階段后,技術與商業(yè)邏輯正發(fā)生深刻改變。

在討論中,模型承擔“完整任務鏈路”成為重要話題。過去,用戶向大模型提問,大模型僅作答,任務鏈路斷裂。如今,OpenClaw將模型引入任務執(zhí)行環(huán)節(jié),用戶給出目標,系統(tǒng)負責拆解、嘗試、修正和交付。張鵬將其比作“腳手架”,普通人可借此調用頂級模型完成完整任務,用戶與模型的關系從“提問—回答”轉變?yōu)椤澳繕恕獔?zhí)行—迭代”。這一轉變改變了評價方式,單輪回答不再重要,復雜任務能否穩(wěn)定收斂成為關鍵,模型被置于交付結果的語境中,系統(tǒng)規(guī)劃、調度和試錯消耗時間,也堆疊了能力。

Token的變化也備受關注。夏立雪提到,公司Token用量從1月底開始每兩周翻一倍,在Agent場景下,單個任務的Token消耗是傳統(tǒng)問答的10倍甚至100倍。過去,大模型對話問答時代,Token消耗量低,普通用戶免費就能使用AI。但OpenClaw出現(xiàn)后,Token用量呈指數(shù)增長成為新共識,其消耗量遠高于傳統(tǒng)對話。不過,Token不再只是成本指標,它對應規(guī)劃、執(zhí)行、調用工具的全過程,接近“機器工時”,將重塑價格體系,成本上升與任務價值綁定,成為新的定價基礎。

大模型行業(yè)正從訓練時代快速邁向推理時代。在智譜、MiniMax等大模型公司未上市階段,“訓練”曾是主流,但OpenClaw加速了推理時代的到來。隨著任務復雜度上升,Context長度迅速拉長到1M甚至10M級別,這促使廠商在推理側進行結構創(chuàng)新,如Hybrid架構、Linear Attention、Long Context Efficient設計等,目的是在更長Context下降低成本、提高穩(wěn)定性。這也意味著競爭維度下沉,從模型參數(shù)規(guī)模轉向推理效率、系統(tǒng)調度甚至能源成本。

在Agent框架下,系統(tǒng)能力開始抵消模型差距。模型之間的能力差距被部分壓縮,通過Skill和工具組合,次頂級模型也能完成復雜任務。此時,用戶更關注任務結果,而非模型本身指標,參與門檻降低,構建能力向系統(tǒng)工程傾斜,不再局限于算法。

對于OpenClaw,各位嘉賓發(fā)表了不同看法。楊植麟提出,大家在日常使用或類似產品時,覺得什么最有想象力或印象深刻,并請張鵬從技術角度談談對OpenClaw和相關Agent的看法。張鵬認為它是一個“腳手架”,為在模型基礎上搭建提供了牢固、方便且靈活的可能性,普通人能極低門檻使用頂尖模型,尤其是編程和整體能力,這是重大突破。夏立雪起初不適應OpenClaw,覺得它慢,后來發(fā)現(xiàn)能完成大型任務,從按Token聊天到能完成任務的Agent,想象力空間提升,但對系統(tǒng)能力要求增大,作為基礎設施廠商,看到機遇和挑戰(zhàn),資源需支撐快速增長時代。羅福莉認為OpenClaw具有革命性和顛覆性,在Agent框架設計上領先于Code,其“開源”有利于社區(qū)參與,拉高了國內次頂級閉源模型上限,保證了任務完成度下限,還點燃了大家想象力,讓更多人參與AGI變革。黃超表示,OpenClaw在交互模式上給人“更有活人感”的體驗,更接近個人賈維斯,還證明了架構Agent的框架可簡單高效,讓大家思考是否需要All in one的超級智能體,撬動生態(tài)工具賦能各行各業(yè)。

討論中,楊植麟還詢問張鵬智譜新發(fā)布的GLM Turbo模型情況。張鵬稱發(fā)布Turbo是為了讓大模型從“簡單對話”轉向“干活”,OpenClaw讓大家看到大模型能干活,但背后Token消耗高,需要規(guī)劃、嘗試等,Turbo在這些方面優(yōu)化,本質是多智能體協(xié)同架構,能力上有偏向性加強。關于提價,他解釋因干活消耗的Token量是簡單問答的10倍甚至100倍,成本大幅提高,長期低價競爭不利于行業(yè)發(fā)展,調整價格是為回歸正常商業(yè)價值,持續(xù)優(yōu)化模型提供更好服務。

當被問到小米做大模型的優(yōu)勢時,羅福莉先談了中國大模型團隊的優(yōu)勢。兩年前,中國團隊在算力受限,尤其是互聯(lián)帶寬受限的情況下,通過模型結構創(chuàng)新(如DPCV3、M1、MA等)追求最高效率,這給了團隊勇氣和信心。如今國產芯片不再受限,但對高效率、低推理成本的探索依然重要,如現(xiàn)在的Hybrid、SPA、Linear attention結構等。結構創(chuàng)新重要是因為OpenClaw越用越聰明的前提是推理Context,難題是在1M或10M的長上下文下做到成本低、速度快,以激發(fā)高生產力任務,實現(xiàn)模型自迭代。小米正在探索Long Context Efficient架構,以及在真實長距離任務上做到穩(wěn)定和高上限。更長期看,隨著推理需求爆發(fā),今年可能增長100倍,競爭維度將下探到算力、推理芯片甚至能源層面。

 
 
更多>同類內容
全站最新
熱門內容