效能改進邊際遞減、開源模型成本只需十分之一、專用晶片讓推論費用下砍、零切換成本讓用戶秒跳槽、本地模型 4 至 5 年內有望終結訂閱制。AI 大廠維持高定價的空間正在快速收窄?
(前情提要:OpenAI 旗艦模型 GPT-5.6 Sol 獨家登陸 Cerebras,「白毛股神」Serenity 喊「技術獲驗證」進場抄底)
(背景補充:Citrini Research:避開 AI 泡沫!點名「5 大暴利盲區」迎資金輪動)
本文目錄
- 效能天花板與開源的雙重夾擊
- 晶片革命與零切換成本
- 本地模型:訂閱制的終局威脅
軟體工程師 Aditya Patadia 在個人部落格指出:Uber 4 個月燒光全年 AI 預算,微軟、Salesforce、GitHub 也相繼宣布要管控員工的 AI 花費,這已是整個產業的共同困境,不是個別公司的財務紀律問題。但他預測,當前頂尖 AI 公司的昂貴收費結構即將迎來逆轉。
效能天花板與開源的雙重夾擊
Patadia 的第一個觀察:模型效能的改進正在邊際遞減。每次模型迭代仍有進步,但進步幅度越來越小,而訓練資料的問題更是結構性的,各大 AI 實驗室大概已經消化了人類有史以來幾乎所有可數位化的書面知識,繼續改善訓練集的難度極高。
他舉 Claude Opus 4.8 與 Claude Opus 4.7 定價相同為佐證:當模型無法再展示跨代的顯著躍進,漲價的理由就消失了,競爭將只剩降價一條路。
第二重壓力來自開源陣營。他以 GLM-5.2 為例,這款開源模型在程式碼基準測試上已媲美 GPT 5.5 和 Claude Opus,定價卻只有 GPT 5.5 的十分之一,在定價上形成碾壓式優勢。
Patadia 的判斷是:只要開源模型持續縮小與閉源旗艦的效能差距,閉源定價的空間就會持續壓縮。
晶片革命與零切換成本
AI 定價的另一條壓力線來自硬體層。Patadia 指出,Cerebras、Groq、Google 等公司開發的 AI 專用晶片,正在改寫推論成本的底線。以 Google TPU 為例,其推論成本比 Nvidia H100 GPU 便宜 30% 到 70%。
簡單來說就是,同樣的計算量,用對晶片可以省下一大筆錢,而這個差距會直接壓縮模型服務商的定價下限。除了晶片,模型架構本身也在降本:快取機制讓重複查詢不必重新計算,MoE 混合專家架構,白話說就是讓模型按需呼叫部分「專家」,不必每次動員全部神經元,讓模型在維持同等準確度的前提下顯著降低運算開銷。
還有一點,Patadia 認為最被低估的結構性因素:零切換成本。
他的對比很直接,Windows、Adobe、Salesforce 這類傳統軟體的護城河,在於換掉它們代價極高,往往需要數個月的遷移工程;AI 模型沒有這道護城河。OpenRouter.ai 這類 AI 閘道服務,讓開發者切換模型提供商只需要幾秒鐘,甚至可以程式化地讓系統在不同提供商之間自動切換。
當競品隨時可以被秒速替換,任何一家廠商的漲價嘗試都將直接送走用戶。
本地模型:訂閱制的終局威脅
Patadia 最大膽的一個預測,指向本地模型。他的估算是 4 到 5 年內:晶片效能持續提升加上記憶體(RAM)價格的必然下滑,將讓消費者等級的電腦和智慧型手機有能力在本地執行語言模型。他進一步預測,主流作業系統將內建模型部署介面,讓本機應用程式可以直接呼叫本地模型。
這個場景一旦成立,意味著什麼?雲端模型只剩最複雜的任務有呼叫必要,法律檔案分析、長文脈推理、跨資料庫整合。程式碼自動補全、檔案校對、基礎事實查核這類日常任務,將在本地完成,不再需要每月 $20 甚至 $200 的雲端訂閱費。
當然,Patadia 自己也標注了這是「預測」而非確定事實,他聲明這些是他的「大膽賭注」,時間會給出答案。但以上五個壓力方向,效能邊際遞減、開源替代崛起、專用晶片降本、零切換成本、本地模型替代,每一個都已有現實案例支撐,並非純粹的思想實驗。
如果 Patadia 的預測是對的,那對於用戶來說是好事;可是對收錢的 AI 公司來說,那就是另一回事了。
📍相關報導📍
GraniteShares 將推美股首檔「SK 海力士 2 倍槓桿 ETF」,程式碼 $SKUU 曝光
OpenAI 新模型撞名「Sol、Terra、Luna」,Solana 官方爆笑神評:Sam Altcoinman
Anthropic 解禁最強模型 Mythos 5 但「僅供美國政府使用」!網怒轟雙標,Fable 5 慘遭持續封殺
OpenAI 正式發表 GPT-5.6 家族!一文拆解 Sol、Terra 與 Luna 三款模型與定價
川普祭出「100% 關稅」核彈!警告各國:敢對美企徵數位稅,將撕毀所有貿易協定



