歡迎來(lái)到淘金地

DeepSeek帶火的MaaS究竟是不是門(mén)好生意

來(lái)源: 發(fā)布時(shí)間:2025-03-12

一邊說(shuō)利潤(rùn)率可以高達(dá)545%,另一邊說(shuō)“部署后一個(gè)月虧損4億”,近日,關(guān)于部署DeepSeek到底是賺錢(qián)還是虧錢(qián)的事在網(wǎng)絡(luò)上引發(fā)了一場(chǎng)爭(zhēng)論。3月1日,DeepSeek在開(kāi)源周的終歸,公布其模型理論上的成本利潤(rùn)率可以高達(dá)545%,在人們?yōu)榇梭@嘆的同時(shí),AI基礎(chǔ)設(shè)施企業(yè)潞晨科技創(chuàng)始人尤洋發(fā)出了不同聲音,他的一則“部署DeepSeek月虧4億”的發(fā)言讓其成為輿論風(fēng)暴的中心。潞晨科技隨后宣布停用DeepSeek的行為,也讓人們重新審視MaaS(模型即服務(wù))這一商業(yè)模式。

何為MaaS服務(wù)?為何提供MaaS服務(wù)的企業(yè)存在“用戶(hù)越多虧損越多”的現(xiàn)象?MaaS是一門(mén)好生意嗎?

如果大模型是煤炭,MaaS就是電廠(chǎng)

MaaS的出現(xiàn),是一種商業(yè)范式的轉(zhuǎn)變。

要想使用大模型,對(duì)于個(gè)人用戶(hù)來(lái)說(shuō),除了使用模型的APP、網(wǎng)頁(yè)版,還可以自己下載DeepSeek等開(kāi)源模型部署到本地,享受更私域的定制化服務(wù),但這類(lèi)部署可能存在運(yùn)行不穩(wěn)定等情況。對(duì)于企業(yè)用戶(hù)來(lái)說(shuō),這種不穩(wěn)定是無(wú)法接受的,因此MaaS的需求就產(chǎn)生了。

所謂MaaS,就是將模型部署到企業(yè)端提供給用戶(hù)使用的服務(wù)。MaaS服務(wù)商部署好模型后,提供API接口,企業(yè)用戶(hù)可以通過(guò)API接口直接調(diào)用,按token計(jì)價(jià)。MaaS模式可提供專(zhuān)業(yè)的模型部署,讓模型運(yùn)行更快,企業(yè)按token調(diào)用不僅可以享受更好的服務(wù),穩(wěn)定性和并發(fā)性高,而且成本更低。

“如果大模型是煤炭,那么MaaS就是電廠(chǎng),它將煤炭變成了人人可以方便使用的電?!蓖蹊F震解釋?zhuān)安挥肕aaS也可以,那就需要自己蓋發(fā)電機(jī),成本高,一些比較大的項(xiàng)目用 ‘發(fā)電機(jī)’是沒(méi)法做的。”王鐵震表示,未來(lái)每一個(gè)企業(yè)用戶(hù)每天可能會(huì)“燒掉”幾億token,作為標(biāo)品的MaaS將成為越來(lái)越重要的基礎(chǔ)服務(wù)。

云廠(chǎng)商是提供MaaS服務(wù)的一大主力,因?yàn)閷?duì)于它們來(lái)說(shuō),提供MaaS服務(wù)為其原有服務(wù)增加了一個(gè)新的項(xiàng)目,可以更好地利用閑置算力。以往企業(yè)按時(shí)間向云廠(chǎng)商租借算力,一個(gè)2小時(shí)的計(jì)算任務(wù)需要租賃2小時(shí)時(shí)長(zhǎng)的8張A100本地計(jì)算卡?!坝捎谒懔π枨蟛▌?dòng),GPU利用率可能只有50%?!盚ugging Face工程師王鐵震表示,這種模式導(dǎo)致算力被大量閑置在“等用戶(hù)”的過(guò)程中。

作為連接大模型底層算力和下游應(yīng)用的中間層,類(lèi)似潞晨科技這樣的AI Infra(AI基礎(chǔ)設(shè)施)企業(yè)也是MaaS服務(wù)商的另一類(lèi)主力。AI Infra廠(chǎng)商所做的工作涵蓋了數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、部署和應(yīng)用整合等,將原始算力資源加工成符合用戶(hù)需求的“成品菜”。

自身沒(méi)有模型的廠(chǎng)商要想經(jīng)營(yíng)MaaS商業(yè)模式,離不開(kāi)開(kāi)源模型。MaaS的產(chǎn)業(yè)鏈格局分成三大板塊,一是創(chuàng)造模型的企業(yè)將模型發(fā)布在如Hugging Face這樣的開(kāi)源社區(qū);二是MaaS服務(wù)商將模型從Hugging Face上下載、部署、優(yōu)化,做好并發(fā)調(diào)度等管理;三是應(yīng)用開(kāi)發(fā)企業(yè)調(diào)用token。因?yàn)橛辛碎_(kāi)源模型,MaaS的商業(yè)模式才成立,所以在DeepSeek這樣的開(kāi)源模型爆火后,助推了一把MaaS,成為了MaaS服務(wù)商的流量密碼。

據(jù)報(bào)道,國(guó)內(nèi)極早部署DeepSeek的AI Infra企業(yè)硅基流動(dòng)自上線(xiàn)DeepSeek R1/V3推理服務(wù)后,流量增長(zhǎng)了數(shù)十倍。

雖然帶來(lái)了流量,但這個(gè)商業(yè)模式現(xiàn)在到底能不能帶來(lái)盈利,大家的意見(jiàn)顯然不太一致。

月虧4億的重點(diǎn)成本是算力

盡管DeepSeek稱(chēng)他們的理論利潤(rùn)率達(dá)到了545%,但尤洋卻表示“月虧4億”?!皾M(mǎn)血版的DeepSeek R1每日輸出1000億token,每月機(jī)器成本是4.5億,虧損4億,用戶(hù)越多虧損越多。”在尤洋發(fā)表這番言論后不久,3月1日,潞晨科技宣布一周后暫停DeepSeek API服務(wù)。

對(duì)于“月虧4億”的言論,尤洋在對(duì)媒體的回應(yīng)中表示,相對(duì)于火山云、阿里云等頭部企業(yè),“類(lèi)似我們這樣中小型企業(yè)去強(qiáng)行燒錢(qián),使用第三方開(kāi)源模型做MaaS的話(huà),肯定是面臨巨額虧損?!庇妊蟊硎?,“初創(chuàng)企業(yè)即使融了幾個(gè)億,可能還沒(méi)大廠(chǎng)一個(gè)月的營(yíng)銷(xiāo)推廣費(fèi)高。我覺(jué)得只使用第三方開(kāi)源模型以當(dāng)下的MaaS模式賣(mài)API的話(huà),肯定是虧的?!?

一位AI Infra從業(yè)者對(duì)澎湃科技表示,MaaS公司目前有兩種收費(fèi)模式:一是企業(yè)調(diào)用API,按token結(jié)算;二是月費(fèi)會(huì)員,例如OpenAI有Pro用戶(hù)、Plus用戶(hù)等。國(guó)內(nèi)MaaS公司以前者為主,按token結(jié)算實(shí)際上是按算力結(jié)算,“每秒鐘推理多少數(shù)據(jù)、輸出多少token,這其實(shí)和算力的價(jià)格完全綁定,重點(diǎn)成本就是算力?!痹谶@種模式下,“客戶(hù)越多虧得越多其實(shí)也比較合理,因?yàn)槟壳皣?guó)內(nèi)模型的API都在降價(jià),本身價(jià)格比較低,譬如DeepSeek-R1官方售價(jià)是百萬(wàn)token 16元?!?

該從業(yè)者解釋?zhuān)绻鸐aaS企業(yè)只提供API服務(wù),沒(méi)有自己的模型、沒(méi)有足夠的算力,“頂多用幾十臺(tái)小集群來(lái)做,一定是虧的,做多少虧多少。”他認(rèn)為這主要由MaaS的商業(yè)模式所引起的,從OpenAI的營(yíng)收比例中可見(jiàn)一斑?!癆PI只占OpenAI營(yíng)收的30%,70%的利潤(rùn)來(lái)自包月用戶(hù)。因?yàn)榘掠脩?hù)實(shí)際上跑不了那么多算力,所以是賺錢(qián)的,利潤(rùn)率很高?!?

“這就是為什么市面上為大模型公司供給服務(wù)器的‘裸金屬企業(yè)’的銷(xiāo)售模式一定不是一個(gè)很好的商業(yè)模式?!痹搹臉I(yè)者表示,token是銷(xiāo)售成本,對(duì)于MaaS企業(yè)來(lái)說(shuō),賣(mài)得越多虧得越多,因此對(duì)成本“特別敏感”。

寧愿虧錢(qián)也愿意先圈用戶(hù)

王鐵震同樣提到,算力成本是決定MaaS定價(jià)的重要因素。MaaS服務(wù)商的類(lèi)別多樣,其算力來(lái)源也多樣,有的可能來(lái)自企業(yè)自身機(jī)房,也可能按小時(shí)向云廠(chǎng)商租賃,有的或來(lái)自閑置的算力中心。每家MaaS企業(yè)每小時(shí)的GPU成本不同,若使用國(guó)內(nèi)算力中心的閑置算力,那么只的成本就是電費(fèi)。算力成本的不同在很大程度上決定了提供MaaS這項(xiàng)服務(wù)能否賺錢(qián)。

此外,技術(shù)和市場(chǎng)競(jìng)爭(zhēng)等因素也會(huì)影響MaaS企業(yè)定價(jià)。他表示,前沿的技術(shù)有助于提升MaaS企業(yè)“煤轉(zhuǎn)電”的效率。業(yè)內(nèi)基于開(kāi)源技術(shù)提供服務(wù)、計(jì)算成本,“如果連開(kāi)源的Infra效果都達(dá)不到,基本上就出局了?!碑?dāng)然,一個(gè)MaaS公司的部署如果有各種bug(漏洞),也會(huì)反映在成本上。

但每個(gè)人的認(rèn)知都有局限。由于行業(yè)并未充分開(kāi)源,不同背景的技術(shù)開(kāi)發(fā)者選擇不同路線(xiàn),不在一個(gè)技術(shù)維度競(jìng)爭(zhēng),認(rèn)知不對(duì)齊,也就無(wú)法預(yù)估他人的成本。不過(guò),DeepSeek開(kāi)源Infra項(xiàng)目源代碼,幫助對(duì)齊認(rèn)知,“以前模型開(kāi)發(fā)者可能從未想到還能用CUDA一個(gè)沒(méi)有公開(kāi)的API才能把成本降下來(lái),現(xiàn)在拉齊認(rèn)知。”DeepSeek實(shí)現(xiàn)PTX編程,能夠直接和底層硬件發(fā)生交互的PTX一般被隱藏在CUDA的驅(qū)動(dòng)中。王鐵震表示,在確定的方向上“卷”就可以繼續(xù)把token價(jià)格打下去,技術(shù)迭代更快,促進(jìn)需求上漲?!皩?duì)于工程師個(gè)人而言,既興奮,又覺(jué)得壓力變大了,因?yàn)檫€要學(xué)更多東西。”

王鐵震說(shuō),DeepSeek開(kāi)源提高了行業(yè)基準(zhǔn),促進(jìn)業(yè)內(nèi)進(jìn)一步降低API調(diào)用價(jià)格。“以前大家用開(kāi)源的大模型發(fā)現(xiàn)成本巨高,只能砸錢(qián)、砸補(bǔ)貼、買(mǎi)用戶(hù)。DeepSeek開(kāi)源后大家都用起來(lái),都開(kāi)始賺錢(qián)了。這時(shí)候有人就想,要不把價(jià)格再降一降,然后大家又不賺錢(qián)了,就開(kāi)始想下一代的技術(shù)重點(diǎn)。”因此,MaaS服務(wù)商要把服務(wù)賣(mài)出去,還要看競(jìng)爭(zhēng)對(duì)手的價(jià)格,“如果賣(mài)得明顯比別人貴很多,就算其他地方都很好也不行。”

雖然純賣(mài)API接口的賬怎么算也算不過(guò)來(lái),但大家爭(zhēng)先恐后接入DeepSeek也不單純是為蹭熱點(diǎn)。尤洋也表示,“如果它(MaaS)作為一個(gè)功能點(diǎn)提供到其他產(chǎn)品里,極終通過(guò)產(chǎn)品賺錢(qián),是有可能的?!彼寡?,大廠(chǎng)的優(yōu)化手段和可選方案或許比中小型廠(chǎng)商會(huì)更好,可能收回更多成本。再加上大廠(chǎng)長(zhǎng)遠(yuǎn)的戰(zhàn)略性布局,即使短期內(nèi)有虧損,日后通過(guò)這些超級(jí)APP和其他業(yè)務(wù)也是可以消耗大量token的,再通過(guò)一些額外付費(fèi)或整體業(yè)務(wù)考慮,就可以把虧損補(bǔ)回來(lái)。

對(duì)于MaaS服務(wù)商來(lái)說(shuō),還可以為各行各業(yè)的企業(yè)用戶(hù)提供整體解決方案,如果將MaaS服務(wù)作為整體解決方案打包出售而非單純銷(xiāo)售API,就會(huì)獲得溢價(jià)。在業(yè)內(nèi)人士看來(lái),如果未來(lái)AI Infra企業(yè)的賺錢(qián)邏輯要改變,會(huì)從為垂直大模型廠(chǎng)商提供MaaS轉(zhuǎn)向?yàn)楦餍懈鳂I(yè)的用戶(hù)提供服務(wù),MaaS服務(wù)將走向更加垂直的領(lǐng)域,擴(kuò)大服務(wù)范圍,改變服務(wù)方式。

王鐵震表示,MaaS行業(yè)當(dāng)前處于早期無(wú)序競(jìng)爭(zhēng)格局,企業(yè)寧愿虧錢(qián)也愿意先銷(xiāo)售服務(wù)、收獲用戶(hù),所以當(dāng)前的MaaS定價(jià)并不能完全反映實(shí)際成本?!皣?guó)內(nèi)所有行業(yè)都在卷。如果一個(gè)行業(yè)不卷,可能是因?yàn)榇蠹叶紱](méi)有意識(shí)到這個(gè)行業(yè)有巨大潛力,卷起來(lái)之后就會(huì)凸顯出誰(shuí)才是這個(gè)行業(yè)真正的技術(shù)超前者。”在他看來(lái),國(guó)內(nèi)AI Infra行業(yè)還有巨大提升空間,“能看到未來(lái)這里面有巨大潛力,提高token輸出速度,降低token價(jià)格,加速技術(shù)進(jìn)步?!?

3月11日,硅基流動(dòng)宣布,DeepSeek API升級(jí),DeepSeek-V3批量推理價(jià)格降低50%,3月11日-18日DeepSeek-R1批量推理價(jià)格降低75%,輸入價(jià)格1元/百萬(wàn)Token、輸出價(jià)格4元/百萬(wàn)Token。轉(zhuǎn)載自澎湃新聞

公司信息

聯(lián) 系 人:

手機(jī)號(hào):

電話(huà):

郵箱:

網(wǎng)址:

地址:

本日新聞 本周新聞 本月新聞
返回頂部