【編者按】以變革應對變局,以遠見超越未見。四木相對論 、大象新聞、大象財富聯合騰訊新聞、騰訊財經、騰訊科技推出2024年終策劃《變局之下》,回望2024、展望2025,讓洞見穿越時間,向未來尋求確定。
過去12個月,幾乎所有的大模型六小虎都遇到過“不得不選”的時刻。只不過,2024年上半年他們還在選“該走哪條路”,下半年則只能考慮“還剩哪條路可以走”了。
一位在2024年投進六小虎的投資人告訴「四木相對論」,2024年上半年,大多數小虎的融資還處于烈火烹油的狀態(tài)。
他舉了一個例子,以示他們在盛極時刻的狀態(tài):當時,以Kimi為代表的明星公司不僅不開放全部盡調,還有老股東計劃對一些希望入局的小股東們設置投資機制,自己從中賺取新的管理費。
但到了下半年,在投資市場和AI行業(yè),包括六小虎在內的AI初創(chuàng)公司們,口碑開始急轉直下?!艾F在除了國資,基本沒有什么潛在買家。”上述投資人表示。
此外,「四木相對論」還了解到,有一、兩家小虎希望長期尋找國際化資本的支持,但沒有拿到結果。
2024年上半年,六小虎們還在考慮做To C還是To B,聚焦國內市場還是進軍全球市場。到了下半年,大家發(fā)現國內的C端用戶忠誠度不高,B端錢又很難賺,六小虎中至少有三家認真考慮過出海。
但是,在月之暗面階段性收縮出海業(yè)務之后,近期又有一家明星大模型公司對北美團隊進行了裁撤。MiniMax的海外拳頭產品Talkie,12月中旬也在美區(qū) App Store 中消失。
這一困局不僅限于中國的六小虎,無論是激進的國內大廠,還是海外AI公司,都經歷了曲折的一年。
首先,以通用助手為代表的To C模式,已經不是初創(chuàng)企業(yè)玩得起的“樂園”。
“接下來的目標,是追平豆包目前的用戶數量?!币晃活^部六小虎的業(yè)務負責人告訴我們,這是這家公司近期經過業(yè)務復盤,對通用助手產品提出的預期。
一位接近Kimi的投資人表示,它2024年原本的目標是日活1000萬,現在完成了1/3左右。
在內測時,豆包還叫Grace,在文心一言、通義千問、萬卷(現在的海螺AI)都推出后,才在2023年8月正式發(fā)布。
但一年之后,綜合AI產品榜、量子位智庫等渠道的數據,豆包在2024年11月的月活已經接近6000萬,日活超過900萬,是國內通用助手的斷層第一。
在我們近期密切交流的多位創(chuàng)業(yè)者和投資人朋友中,大多數人認為豆包App之所以異軍突起,最大優(yōu)勢是對流量渠道的掌控。
根據移動營銷平臺AppGrowing數據,2024年以來(截止11月15日),Kimi、豆包、星野等國內十款大模型產品,合計投放超625萬條廣告,投放金額達15億元。
但至少對掌握流量渠道的大廠來說,投放金額的確用不了這么多。大廠內部的業(yè)務投放自家的渠道,往往會采用特殊的結算標準,“有時候內部部門會分得一部分流量,也可以用其他內部資源兌換?!庇写髲SAI從業(yè)者告訴我們。
一家在2024年獲得巨頭投資,估值超1億美金的AI明星初創(chuàng)公司曾對「四木相對論」表示,由于自己主攻的領域和某大公司重注的方向基本重合,所以在被該大廠掌控的流量渠道上,自己無法進行投放。
Kimi也不例外。不久前曾有媒體報道,年初在抖音、B站等內容APP上刷屏并獲取大量用戶的Kimi,下半年在抖音上被限制投放,不得不轉戰(zhàn)快手等平臺。
據“AI新榜”公眾號統(tǒng)計,截至10月29日,Kimi在過去三個月內的廣告投放總數已經超過2500條。其中,在快手平臺上投放的內容超過2100條,幾乎占據總投放量的84%。
還有一些沒能在熱錢涌動時完成融資的創(chuàng)業(yè)公司,負擔不起日漸增長的流量成本,只能轉型。
有家2024年成立的AI教育公司CEO告訴我們,自己的早期產品定價在20元,但現在投放一個人至少需要25元,“我們根本算不過來帳”。
海外,大模型公司賣API是個還不錯的生意。OpenAI預計2024年將依靠API賺得5億美元,占總營收的15%。據CNBC報道,Anthropic對API的依賴更大,預計總營收的60%~75%將來自第三方調用API。
在國內,提供大模型API,愈發(fā)變成模型廠商搶占市場的方式,未被寄予豐厚的利潤預期。
同樣是在5月,字節(jié)跳動把豆包通用模型pro-32k版的推理輸入價格定為0.0008元/千tokens,比行業(yè)均價低99.3%。
面對價格攻勢,競爭對手只能快速應對。阿里將通義千問主力模型的價格下調97%;百度宣布文心兩款模型免費。
「四木相對論」了解到,2024年初,字節(jié)內部就定下了要成為LLM調用市場第一的目標。其中,企業(yè)客戶的占比要接近一半。為此,火山引擎還組建了算法和服務數十人團隊,幫助客戶做咨詢、測試Prompt,消耗量大的“優(yōu)質客戶”有機會獲得更多優(yōu)惠。
一位大廠的大模型銷售告訴我們,現在一個日Token消耗超過二十億的客戶,用豆包API每月花費的成本只需要小幾千。但在其他公司,這樣的模式不一定被支持。
到了年末,字節(jié)已經在檢索、對話、文娛、游戲、客服等領域,收獲了不少公有云客戶。
智譜在很長時間里,是唯一從中刷到存在感的初創(chuàng)公司。到了2024年下半年,百川和零一,也出現了個位數的公開中標信息。
對比2023年年初大模型1000萬的部署價格,現在一些純軟件、小幾百萬的單子,算上人力成本和服務周期,很可能導致AI公司“做一單虧一單”。但即便如此,在非招投標渠道中,各AI公司的私有化部署業(yè)務已開始白熱化搶奪。
一家在2024年下半年才加入大B市場的六小虎,曾嘗試按市場價溝通客戶,但后續(xù)遇到另一家老牌“四小龍”故意壓低價格,客戶選擇了低價的一方。
前不久,火山引擎總裁譚待表示,雖然他更看好在公有云上使用大模型,但接下來混合模式還會持續(xù)存在。
2024年下半年,火山引擎開始頻繁出現在招投標信息中。字節(jié)最近主推的AI應用開發(fā)平臺「HiAgent」,由于主攻企業(yè)場景,也會搭載豆包的私有化部署版本。
事實上,雖然很多人是在年底舉辦的火山「原動力大會」上第一次聽到HiAgent——此前更被熟知的是更偏開發(fā)者屬性的Coze/扣子,但HiAgent至少已經低調出現半年之久。
當時——也就是2024年年中,火山的不少內部員工還未意識到字節(jié)也希望提供一些私有化部署方案。有AI公司的員工反饋,之后的幾個月,字節(jié)的銷售開始對外許諾可以免費幫企業(yè)部署、微調。
10月,六小虎中有不少放棄預訓練的消息傳出。雖然,繼續(xù)盲目提升參數量可能會導致模型效果的提升與投入不成正比。但一動作,還是會讓它們動輒幾十億美金的估值被打上問號。
有兩位投資人向我們透露,一家估值不在前三、且確定轉型垂類領域的小虎,甚至已把用作預訓練的卡賣掉了。
反差的地方在于,已經吸金數十億的AI通用助手,并不是所有人心中的Killer App。
前不久「智能涌現」曾報道,即便豆包用戶數斷層第一,但字節(jié)高層認為它只是產品的中間態(tài),另一款App——即夢的優(yōu)先級被提升。
我們觀察到,即夢在持續(xù)嘗試將AI生成的內容,轉化為App中的Feeds流。這個細節(jié)折射出,雖然即夢的關注度遠弱于豆包,但它或許更加AI Native。
2023年3月,開源項目 AutoGPT 的爆火,讓能夠獨立完成人類任務的Agent走到更多人面前。2023年底,OpenAI推出GPTs之后,國內大廠們開始爭相推出如 Coze/扣子、百度文心智能體平臺等一系列Agent構建平臺。
但從實際表現來看,無論是訂機票、還是買咖啡,Agent依舊難被順滑使用。比如,采用了Agent的麥當勞AI點單系統(tǒng),已經因為經常錯誤下單被關停了。加拿大航空的Agent——咨詢和理賠機器人也因為隨意給出并未被授權的優(yōu)惠券被下線。
在12月的火山FORCE大會上,火山引擎總裁譚待表示,Agent落地的核心還是技術要好;智譜2024年也在持續(xù)招募技術人才,目的之一是通過提升模型能力,讓Agent的效果更好。
整個2024年,大模型技術的最大變量是通向AGI之路的法則—— Scaling Law正在失效。
OpenAI在2020年發(fā)布的論文指出,模型的性能會隨著模型參數量、訓練數據規(guī)模、訓練計算資源的增加而呈現線性增長,這是第一代Scaling Law的核心觀點。
然而,Llama-3.1-405B 這樣參數量的模型,在幾乎用盡了所有公開數據集進行訓練后,實際效果并不理想——很多評測場景的結果,它與自家70B的模型相差不大;OpenAI在GPT-4后,也未在2024年推出通用能力明顯提升的基礎大模型。它的GPT-5,被《華爾街日報》曝出由于高質量數據不足等原因,效果遠不達預期。
“GPT-5已至少完成2輪訓練,每次長達數月,但是每次訓練后都遇到新問題?!薄度A爾街日報》援引知情人士稱。
預訓練的規(guī)模秘訣失效,OpenAI和Anthropic給出的解法,是通過強化學習(RL)提升模型推理能力。
2024年9月中,OpenAI上線月底,進階版推理模型o3上線。它展現出大模型在科學、編碼、數學等領域解決復雜問題的能力,引來各家追隨。
11月,也就是OpenAI的 o1 發(fā)布兩個月后,國內至少有近10個團隊在復現o1。
“測了一圈國內的類o1模型,效果都差強人意?!币晃粡氖履P脱芯康乃惴üこ處煾嬖V「四木相對論」,“阿里的QwQ效果能好一點。如果o1是100分,QwQ能達到60-70分?!?
另一種聲音是質疑o1、o3的“應用場景太狹窄”。在數學、代碼之外,它適配的場景并不多。如果再算上成本,落地前景并不明朗。
現在訓練一個性能接近Claude3.5 Sonnet或GPT-4o的模型,價格并非高不可攀。
但它在技術報告中特地表明,這個價格只是正式訓練的成本,不包括之前的研究和算法、架構、數據的試驗成本。
早在2022年,它大火之前,一年的花費是5.4 億美元。而到了2024年,The Information報道,OpenAI的成本恐怕高達85億美元。這里面,訓練和推理成本占了70億美元,人員成本15億美元。
篩選人才和算力這兩個要素,2025年堅持訓練底層大模型的國內公司,恐怕只會剩下四、五家。
根據科技咨詢公司Omdia的報道,2024年采購GPU最多的國內大廠是字節(jié)和騰訊。我們了解到,從2023年起,字節(jié)內部就在“不惜一切代價”囤卡。2024年,它依舊在搶奪GPU和內含GPU的整機。
?。萍甲稍児綩mdia估計,2024年買卡最多的國內公司是字節(jié)和騰訊)
一位頭部大模型公司高管曾對我們評價,字節(jié)豆包大模型的效果,是在高價挖來原通義千問技術負責人周暢后,才有明顯起色。
和張一鳴的動作一致,最近,科技圈的另一位大佬雷軍也開始親自下場挖人。12月底,DeepSeek成員羅福莉被曝出即將加入小米大模型團隊。
「四木相對論」還了解到,由于雷軍的順為資本投資了智譜、月之暗面、百川智能、MiniMax等公司。雷軍在招攬人才期間,也親自接觸了六小虎的高管。
“但小米開出的Offer不一定有吸引力。”一位AI投資人表示,雖然小米在努力挖人,但算上算力資源和品牌知名度,還是難和“搶人大戶”字節(jié)相比。
六小虎中,被認為會堅定發(fā)力模型層的公司是智譜和階躍。它們在12月分別公布了數億元的大額融資。
還有一個出人意料的面孔出現在了資本市場。多方消息稱,DeepSeek數月前就在推進獨立融資。
剩下的創(chuàng)業(yè)者,大概率會主攻AI應用。2024年底,十余家早期投資機構告訴我們,2025年會重點關注AI應用。
近期最快拿下大額融資的項目,幾乎都是創(chuàng)始團隊為大公司高管或六小虎聯創(chuàng)的AI應用。這類項目團隊背景閃亮,融資周期極短,一般會由三、四家知名美元基金一起搶定首輪融資,估值迅速飆升至億元級別。
最近的例子,就是追覓前中國區(qū)執(zhí)行總裁郭人杰的消費機器人創(chuàng)業(yè)項目。我們還了解到,一些大廠和創(chuàng)業(yè)公司的高P近期也在籌備創(chuàng)業(yè),正在初步接觸投資人。
至于小而美的AI應用團隊,雖無法斬獲巨額融資,但有更高概率收獲50萬美金左右的小額投資支票。這些團隊的員工一般只有個位數。他們會基于大模型,做出AI內容創(chuàng)作、AI健康監(jiān)測、AI小游戲等精巧的功能/應用。50萬美金至150萬美金的投資,足夠支撐他們跑出第一、二個版本的產品,獲得用戶和一部分收入。
但另一個問題是,不論是明星創(chuàng)業(yè)者的AI Coding、消費機器人項目,還是開發(fā)者小團隊的AI創(chuàng)作應用、健康監(jiān)九游娛樂 九游娛樂官方測,似乎都和想象中Killer APP的樣子有些距離。
“團隊背景很重要,數據很重要,增長很重要?!辈恢挂晃籄I投資人如此總結自己對AI應用的投資標準。
這個和移動互聯時代如出一轍的標準,似乎說明對Killer App的思考已經擱置。