作者:吳芊語??
人類的悲歡并不相通。從2016年開啟的人工智能元年,AI產(chǎn)業(yè)已經(jīng)歷好幾輪洗牌,借著ChatGPT的東風,DeepSeek如同鲇魚一般攪動了整個大模型市場,同為大模型創(chuàng)業(yè)公司并被業(yè)界視為新貴“六小龍”的廠商們,與其相比,境遇堪稱東邊日出西邊雨。
DeepSeek年前推出低成本、性能媲美GPT-4o的DeepSeek-V3震驚業(yè)界后,其接著在1月20日發(fā)布R1模型,上線六天后登頂蘋果App Store全球下載榜首,上線一個月累計下載量超1.1億次。在這期間各大云廠商迅速上線開源版V3和R1,百度搜索、微信等產(chǎn)品都在積極擁抱DeepSeek。
而和DeepSeek同時期發(fā)布的Kimi全球強化學習模型k1.5、階躍推理模型Step R-mini,在模型能力上諸多層面接近o1,但依然淹沒在了DeepSeek火爆的輿論中。
與DeepSeek的喧鬧相比,“六小龍”也是接二連三的爆出消息:零一萬物進一步拆分、月之暗面預算和仲裁案未和解、MIniMax又一高管離職……
而這背后還有失意的VC們:真金白銀支持的項目,沒有一個達到DeepSeek這樣的熱度。目前,“六小龍”中已經(jīng)4家超半年沒有融資消息釋放。2024年業(yè)界稱“六小龍”中已有兩家掉隊,2025年,下一個掉隊的是誰?
DeepSeek的爆火并非沒有征兆,自2023年11月2日推出首個模型DeepSeek Coder后,一年多時間上線了超10個不同版本的模型。其中去年5月發(fā)布的V2模型,性能上比肩GPT-4 Turbo,價格卻只有GPT-4的1%,因此DeepSeek被稱作“價格屠夫”“AI界拼多多”,同時掀起了大模型行業(yè)的第一輪價格戰(zhàn)。
2025年1月27日DeepSeek超越ChatGPT,登頂中國區(qū)和美國區(qū)蘋果APP Store免費榜,引發(fā)全球關(guān)注。讓DeepSeek有如此成就的是其推理大模型DeepSeek-R1。根據(jù)DeepSeek公布的信息,R1在多項權(quán)威測試中得分與o1正式版接近,部分測試中得分還超過o1正式版。
榜單評分外,開源+性價比則是讓DeepSeek引發(fā)潑天熱度的重要組合拳。受到DeepSeek的沖擊,曾經(jīng)的閉源信徒百度創(chuàng)始人李彥宏也宣布加入開源隊伍,OpenAI創(chuàng)始人山姆.奧特曼也反思道,公司在開源領域的策略上一直處于“錯誤的一方”。
大模型“六小龍”中的MiniMax在1月15日發(fā)布了首個開源模型,其創(chuàng)始人閆俊杰在接受《晚點》采訪時也表示,“第一次創(chuàng)業(yè)很多經(jīng)驗不具備,如果可以重新選,應該第一天就開源。”其他五小龍中,只有智譜是最早開源閉源兩條腿走路的。經(jīng)過近兩年的摸爬滾打后,“六小龍”發(fā)展方向已南轅北轍。
零一萬物是第一家公開大幅調(diào)整的基礎大模型公司,先是裁撤了預訓練算法團隊和Infra團隊,部分人員以跳槽形式加入阿里,后宣布與阿里云、蘇州高新區(qū)分別聯(lián)合成立產(chǎn)業(yè)大模型聯(lián)合實驗室、產(chǎn)業(yè)大模型基地。
人員方面,模型訓練負責人黃文灝、負責大模型API開放平臺的藍雨川、生產(chǎn)力產(chǎn)品負責人曹大鵬都相繼離職。試圖留在牌桌上的零一萬物,掩蓋不住在這一輪大模型競賽中的頹勢。
百川智能則在2024年明確了走醫(yī)療賽道,近期上線了首個“AI兒科醫(yī)生”。在To B的商業(yè)化上百川則似乎不太順利,其聯(lián)合創(chuàng)始人、商業(yè)化負責人洪濤年前已經(jīng)離職。據(jù)百川一位員工告知的確不及預期,“現(xiàn)在有了DeepSeek后,今年的壓力只增不減?!?/p>
To B商業(yè)化負責人離職的還有MiniMax的魏偉,此前魏偉接受采訪時表示,很多B端客戶不會輕易掏這個錢,去支撐大模型公司的營收,只能基于研發(fā)能力、算法能力來幫助客戶在實際場景中對齊輸出效果,也印證了大模型商業(yè)化并非易事。
如此看來,仍在專注于大模型技術(shù)創(chuàng)新和追求AGI的,僅剩下月之暗面、智譜、階躍星辰。受到DeepSeek的影響,階躍星辰也加入了開源陣營,只是與DeepSeek重點在文本模型上不同的是,階躍星辰最新開源的是兩款多模態(tài)模型——Step-Video-T2V、Step-Audio。
2月23日凌晨,月之暗面發(fā)布最新論文《Muon is Scalable for LLM Training》,并開源MoE模型Moonlight,模型激活參數(shù)僅需3B。不少業(yè)內(nèi)人士認為這是在“截胡開源周”,因為早前DeepSeek宣布將連續(xù)5天發(fā)布開源項目。
對月之暗面而言,火燒眉毛的或許是其大手筆投流的Kimi產(chǎn)品。
與大模型“六小龍”一樣DeepSeek也有同名C端產(chǎn)品,在上線后的第一周并沒有在市場上引起過多的關(guān)注。據(jù)QuestMobile向媒體披露的數(shù)據(jù)顯示,2025年1月13日至1月19日,DeepSeek App周下載量僅為28.5萬,遠不及豆包(452萬)以及Kimi(155.7萬)。
在2025年1月20日R1發(fā)布后,DeepSeek下載量開始陡峭式增長,Sensor Tower研究顯示DeepSeek在發(fā)布會18天內(nèi)下載量超1600萬次,幾乎是OpenAI的ChatGPT首次發(fā)布時的900萬次的兩倍。
訪問量激增,一度讓DeepSeek閃崩,而即便如此,增長的勢頭依然很猛,月下載量超1.1億。DeepSeek的光芒再也沒有哪家可以視而不見,2月13日字節(jié)跳動內(nèi)部全員會上,CEO梁汝波談及DeepSeek時,反思跟進速度不夠,今年要追求智能上線。
騰訊的微信灰度測試接入了DeepSeek的AI搜索,在使用量超預期后又調(diào)用了AI應用元寶支持微信搜索。2月22日,騰訊元寶超越字節(jié)的豆包,升至中國區(qū)蘋果免費APP下載排行榜第二,DeepSeek繼續(xù)位居榜首。
“榜一榜二大哥”在短短一個月內(nèi)易主,迫使燒錢換增長的豆包和Kimi優(yōu)勢不再。兩者的區(qū)別是,前者是含著“金鑰匙”出生的貴族,后者則是“創(chuàng)業(yè)新貴”。此前有媒體測算,僅在iPhone渠道,Kimi每天的投放金額接近20萬,豆包則為248萬。
在DeepSeek的影響下,月之暗面近期被爆大幅削減產(chǎn)品投放預算,包括暫停多個安卓渠道的投放,以及第三方廣告平臺的合作。據(jù)內(nèi)部人士向《AI光年》透露,推廣確實做了相應調(diào)整,“有自然新增,但無法和DeepSeek的漲勢相比?!?/p>
kimi當下的煩惱可不止這些:「暗涌Waves」獨家獲悉,擱置頗久的Kimi仲裁案,并未和設想的一樣,完成和解,而是進入到仲裁案的下一流程中。據(jù)知情人透露:Kimi仲裁案的雙方,循環(huán)智能老股東和楊植麟等,已分別于1月底和2月下旬,在HKIAC(香港國際仲裁中心)完成繳費,目前組庭也已完成。而整個事件背后更關(guān)鍵的主角張予彤,或?qū)⒈涣硗鈫为毺崞鹪V訟。
對To C產(chǎn)品同樣予以厚望的還有MiniMax,原因是其旗下明星產(chǎn)品Talkie2024年上半年成為美國下載量第四的AI應用,使之吃到了甜頭。但好景不長,12月中旬Talkie在美國市場的蘋果應用商店中悄然消失,而安卓平臺則未受影響。
階躍星辰、零一萬物、智譜AI和百川智能也都有自家的AI應用產(chǎn)品,但根據(jù)AI產(chǎn)品榜顯示2025年1月,月活前20的AI應用中沒有一家是與這四家廠商相關(guān)的。此前百川智能的員工告訴《AI光年》,“百小應的用戶留存和增長很差也不意外,我們基本不做廣告投放,先讓其他家燒錢完成用戶教育?!?/p>
目前DeepSeek、騰訊元寶、字節(jié)豆包霸占了蘋果免費APP下載排行榜前三。大模型“六小龍”想要上榜,競爭只會更激烈,目前排名第七的納米搜索,周鴻祎正在親自下場“帶貨”。
另外還有一個不容忽視的對手就是阿里,AI應用通義并入阿里智能信息事業(yè)群后,近期阿里AI To C業(yè)務開啟了大規(guī)模招聘,崗位達數(shù)百個,集中在AI大模型相關(guān)的產(chǎn)品、技術(shù)研發(fā)崗位。前有狼后有虎,正是大模型“六小龍”當下處境的真實寫照。
當技術(shù)故事不再浪漫、商業(yè)化不及預期、產(chǎn)品月活用戶增長與投入不成正比,大模型“六小龍”理想豐滿,現(xiàn)實骨感。
大模型預訓練燒錢是公認的事實,李開復曾透露,一次預訓練成本約三四百萬美元,即便是成本更低的Yi-Lightning,在訓練時也用了2000張GPU,耗時一個半月,花費三百多萬美元。
即便標榜低成本的DeepSeek,在前期的投入也是難以估量的,第三方機構(gòu)SemiAnalysis推算,DeepSeek實際擁有龐大的算力儲備:共堆砌了6萬張英偉達GPU卡,其中包括1萬張A100、1萬張H100、1萬張“特供版”H800以及3萬張“特供版”H20。
“通用大模型的訓練成本,我們預估的大概10億美金左右,這僅僅是算力部分,還沒算另外兩個很花錢的部分,一個是數(shù)據(jù),一個是人力成本,現(xiàn)在全球大模型領域的人才,是非常稀缺的?!睂㈤T創(chuàng)投創(chuàng)始合伙人、前微軟創(chuàng)投大中華區(qū)負責人杜楓博士曾告訴作者。
由于需要如此高昂的投入,導致很長一段時間里業(yè)內(nèi)流行一種說法:投資大模型企業(yè)的入場券是1億美金。這句話背后的另外一個信號是,一個大模型創(chuàng)業(yè)公司拿不到融資,是難以活下去的。
2023年百模大戰(zhàn)掀起后,幾乎每隔一個月都會有融資消息釋放出來,但隨著AI泡沫論甚囂塵上,2024年9月起,很長一段時間沒有數(shù)億級的熱錢流向大模型“六小龍”。直到2025年春節(jié)前,智譜和階躍星辰先后宣布拿到了“過冬錢”,前者宣布完成新一輪30億元人民幣融資,后者則完成B輪數(shù)億美元融資。
“六小龍”中另外4家已經(jīng)距離上一次融資動態(tài)發(fā)布有超半年:MiniMax去年3月官宣完成6億美元B輪融資、百川智能去年7月獲得50億元A輪融資、零一萬物去年8月完成新一輪數(shù)億美元融資、月之暗面去年8月完成3億美元融資。
春節(jié)期間,DeepSeek火爆全球,輿論毫不吝嗇夸獎DeepSeek及其創(chuàng)始人梁文峰。在創(chuàng)投圈關(guān)于DeepSeek會不會開啟融資、估值多少,近日一直有不少消息流傳出來。
此前有消息稱阿里將以100億美元估值,投資10億美元占股10%。對此阿里副總裁顏喬很快通過朋友圈辟謠稱,“外界流傳阿里投資 DeepSeek的信息是假消息”。而后外媒稱“DeepSeek首次考慮籌集外部資金”,DeepSeek相關(guān)人士辟謠,融資消息均為謠言。
“不少投資人都直接或者托關(guān)系在約梁文峰,我預測估值應該是遠超于目前‘大模型六小龍’的?!敝薪鹳Y本一位投資人表示,“DeepSeek成為了對標對象,六小龍要在一級市場拿到新融資,門檻顯然更高了?!?/p>
事實上,自大模型創(chuàng)業(yè)潮掀起以來,行業(yè)內(nèi)普遍不太相信“六小龍”最后都能作為獨立“大模型公司”生存下來的?!傲↓垺敝袔孜粍?chuàng)始人也在公開場合表達過類似的觀點,比如MiniMax創(chuàng)始人閆俊杰認為未來全球只會剩下5家大模型企業(yè)。
“中國一定會有自己的ChatGPT。這跟搜索引擎一樣,我們有自己的合規(guī)要求。但是中國版的ChatGPT只會在5家公司里產(chǎn)生:BAT+字節(jié)+華為。”迅雷創(chuàng)始人、遠望資本程浩曾告訴作者。
持續(xù)爆火下,本就走向分化的“六小龍”將加速洗牌。
登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述。文章內(nèi)容僅供參考,不構(gòu)成投資建議。投資者據(jù)此操作,風險自擔。