隨著球科技巨頭陸續(xù)入局AI大模型,算力需求(特別是大模型和行業(yè)應(yīng)用等方面)迅速增長(zhǎng),GPU被全球哄搶,漲價(jià)、缺貨不斷。不過,也因此帶火了英偉達(dá)在三月份提出的一項(xiàng)業(yè)務(wù)——算力租賃。
據(jù)悉,GPU不像消費(fèi)顯卡,很多商家會(huì)有庫(kù)存,本身存貨就很少,整個(gè)供應(yīng)鏈上的貨不超過三四千片,ChatGPT熱度起來以后,存貨很快被互聯(lián)網(wǎng)大廠鎖定,今年3月后市場(chǎng)上基本沒有存貨。部分大廠直接從國(guó)外渠道找一些貨回來,如今50%以上的訂單基本都是互聯(lián)網(wǎng)大廠的。
GPU的火爆不僅在現(xiàn)貨市場(chǎng),連訂單都在搶著下。
【資料圖】
上海六尺科技集團(tuán)創(chuàng)始人張亞洲表示:“微軟、英特爾等海外大廠一邊自研、一邊也在對(duì)外采購(gòu),前期訂的一部分(GPU訂單),可能用于大規(guī)模訓(xùn)練,但對(duì)于推理還是不夠。如今基本上廠商低于一個(gè)億的訂單,也許渠道商都不愿搭理,發(fā)郵件都不回。”
價(jià)格方面,多款GPU價(jià)格從3、4月到至今漲幅接近50%。4月份訂單還能排到10月份,如今已排到明年上半年。
價(jià)格暴漲,訂單延后,那對(duì)于迫切需要GPU來訓(xùn)練模型的企業(yè),是否還有其他選擇?在這一背景下,也帶火了更具性價(jià)比的模式——算力租賃
算力租賃,顧名思義就是對(duì)算力進(jìn)行出租,是一種通過云計(jì)算服務(wù)提供商租用計(jì)算資源的模式,適用于各種大規(guī)模計(jì)算需求的場(chǎng)景。企業(yè)用戶可以根據(jù)自己的需求租賃服務(wù)器或虛擬機(jī)實(shí)現(xiàn)大規(guī)模的計(jì)算任務(wù),而無需擁有自己的計(jì)算資源。
其優(yōu)勢(shì)包括:無需投入大量資金購(gòu)買計(jì)算設(shè)備、高效穩(wěn)定的計(jì)算服務(wù)、靈活的擴(kuò)容或縮減,更好地滿足用戶的需求、非常靈活的計(jì)費(fèi)方式,可以根據(jù)實(shí)際使用情況進(jìn)行計(jì)費(fèi)。
通過租賃計(jì)算資源,用戶可以快速地啟動(dòng)項(xiàng)目,使用穩(wěn)定高效的計(jì)算資源,大大縮短了研發(fā)周期和成本。
有數(shù)據(jù)顯示,ChatGPT需要7-8個(gè)算力500P的數(shù)據(jù)中心才能支撐運(yùn)行。對(duì)于微軟、谷歌、百度這樣的巨頭而言,算力成本顯然并不會(huì)成為障礙,但對(duì)于中小團(tuán)隊(duì)來說,如此巨大的成本幾乎就是一座不可逾越的大山,并不是每一家企業(yè)都有能力建設(shè)屬于自己的算力矩陣。
因此,英偉達(dá)就提出了算力租賃的模式。
今年3月,英偉達(dá)CEO宣布了DGX Cloud算力租賃服務(wù)計(jì)劃,讓企業(yè)用戶不需購(gòu)買昂貴的AI服務(wù)器,就能在云端上使用其提供的運(yùn)算能力。企業(yè)用戶可以使用DGX運(yùn)算資源來進(jìn)行生成式AI或應(yīng)用開發(fā)。
據(jù)悉,DGX是英偉達(dá)推出的AI超級(jí)電腦運(yùn)算系統(tǒng),此次新推出的DGX Cloud算力租賃服務(wù)是英偉達(dá)與甲骨文等合作伙伴共同打造的。
至于DGX Cloud服務(wù)的訂閱收費(fèi),未來將按照每個(gè)實(shí)例/每個(gè)執(zhí)行個(gè)體來計(jì)算,每月收費(fèi)36999美元起。每個(gè)實(shí)例包括8個(gè)NVIDIA H100或A100Tensor核心GPU,每個(gè)GPU節(jié)點(diǎn)內(nèi)存高達(dá)640GB,實(shí)現(xiàn)計(jì)算資源專用,不和云中另外的租戶共享。
此外,DGX Cloud本身也支持英偉達(dá)自家的AI軟件和開發(fā)工具,比如Nvidia AI Enterprise提供端到端的AI框架與預(yù)訓(xùn)練模型。
華福證券表示,國(guó)內(nèi)具備研發(fā)及訓(xùn)練大模型實(shí)力的企業(yè)較少,隨著行業(yè)的充分競(jìng)爭(zhēng),未來只會(huì)剩下1-2家大模型,采購(gòu)服務(wù)器建設(shè)數(shù)據(jù)中心的重資產(chǎn)模式將產(chǎn)生大量的算力冗余,以公有云方式部署的算力租賃將是最優(yōu)解。
從算力租賃廠商前期布局的成本來看,核心成本主要集中在服務(wù)器研發(fā)和采購(gòu)、維護(hù)和升級(jí)等方面,可通過特定的技術(shù)和管理手段來控制,如通過智能化管理降低管理成本、與芯片廠商進(jìn)行戰(zhàn)略合作降低采購(gòu)成本等。前期成本情況因公司規(guī)模不同而有所差異,大型廠商通常采用集中采購(gòu)和規(guī)模效應(yīng)來降低成本,而小型廠商則主要通過定制化方案來滿足客戶需求。
而站在用戶角度,基于算力租賃,用戶只要按需付費(fèi),不用承擔(dān)硬件設(shè)備的采購(gòu)、維護(hù)、升級(jí)等費(fèi)用,也不用擔(dān)心設(shè)備閑置或者過時(shí)造成浪費(fèi);用戶可隨時(shí)隨地通過云端訪問所需的算力資源,快速開始訓(xùn)練和應(yīng)用;用戶可根據(jù)需求選擇不同算力平臺(tái)和機(jī)型,也可以不受地域或者時(shí)間的限制模型、工具等資源,進(jìn)行更多的嘗試和探索。
隨著大模型以及相關(guān)應(yīng)用的發(fā)展,算力需求呈現(xiàn)爆發(fā)式增長(zhǎng)。但除了大型互聯(lián)網(wǎng)企業(yè)、AI龍頭企業(yè)具有較多的GPU算力芯片儲(chǔ)備外,中小企業(yè)在發(fā)展AI模型、應(yīng)用過程中,算力租賃或能成為廣大中小企業(yè)解決算力需求的選擇之一。
注:部分信息參考科創(chuàng)板日?qǐng)?bào)、財(cái)聯(lián)社、第一財(cái)經(jīng)等,圖源網(wǎng)絡(luò),本號(hào)文章僅供學(xué)習(xí)和交流之用,不構(gòu)成任何建議,不代表本號(hào)立場(chǎng),如有任何問題,敬請(qǐng)聯(lián)系我們,謝謝。
標(biāo)簽: