亚洲欧美一区二区在线视频,日本免费av网站,91成人看片无在线观看

當(dāng)前位置： 首頁(yè) >推薦 > 正文

當(dāng)前熱文：GPU缺貨、漲價(jià)，卻帶火了「它」!

2023-06-28 05:37:17 來源：互聯(lián)網(wǎng)

隨著球科技巨頭陸續(xù)入局AI大模型，算力需求（特別是大模型和行業(yè)應(yīng)用等方面）迅速增長(zhǎng)，GPU被全球哄搶，漲價(jià)、缺貨不斷。不過，也因此帶火了英偉達(dá)在三月份提出的一項(xiàng)業(yè)務(wù)——算力租賃。

GPU有多搶手？漲價(jià)50%，訂單排到明年

據(jù)悉，GPU不像消費(fèi)顯卡，很多商家會(huì)有庫(kù)存，本身存貨就很少，整個(gè)供應(yīng)鏈上的貨不超過三四千片，ChatGPT熱度起來以后，存貨很快被互聯(lián)網(wǎng)大廠鎖定，今年3月后市場(chǎng)上基本沒有存貨。部分大廠直接從國(guó)外渠道找一些貨回來，如今50%以上的訂單基本都是互聯(lián)網(wǎng)大廠的。

GPU的火爆不僅在現(xiàn)貨市場(chǎng)，連訂單都在搶著下。

【資料圖】

上海六尺科技集團(tuán)創(chuàng)始人張亞洲表示：“微軟、英特爾等海外大廠一邊自研、一邊也在對(duì)外采購(gòu)，前期訂的一部分（GPU訂單），可能用于大規(guī)模訓(xùn)練，但對(duì)于推理還是不夠。如今基本上廠商低于一個(gè)億的訂單，也許渠道商都不愿搭理，發(fā)郵件都不回。”

價(jià)格方面，多款GPU價(jià)格從3、4月到至今漲幅接近50%。4月份訂單還能排到10月份，如今已排到明年上半年。

價(jià)格暴漲，訂單延后，那對(duì)于迫切需要GPU來訓(xùn)練模型的企業(yè)，是否還有其他選擇？在這一背景下，也帶火了更具性價(jià)比的模式——算力租賃

「算力租賃」需求興起

算力租賃，顧名思義就是對(duì)算力進(jìn)行出租，是一種通過云計(jì)算服務(wù)提供商租用計(jì)算資源的模式，適用于各種大規(guī)模計(jì)算需求的場(chǎng)景。企業(yè)用戶可以根據(jù)自己的需求租賃服務(wù)器或虛擬機(jī)實(shí)現(xiàn)大規(guī)模的計(jì)算任務(wù)，而無需擁有自己的計(jì)算資源。

其優(yōu)勢(shì)包括：無需投入大量資金購(gòu)買計(jì)算設(shè)備、高效穩(wěn)定的計(jì)算服務(wù)、靈活的擴(kuò)容或縮減，更好地滿足用戶的需求、非常靈活的計(jì)費(fèi)方式，可以根據(jù)實(shí)際使用情況進(jìn)行計(jì)費(fèi)。

通過租賃計(jì)算資源，用戶可以快速地啟動(dòng)項(xiàng)目，使用穩(wěn)定高效的計(jì)算資源，大大縮短了研發(fā)周期和成本。

英偉達(dá)推出算力租賃服務(wù)

有數(shù)據(jù)顯示，ChatGPT需要7－8個(gè)算力500P的數(shù)據(jù)中心才能支撐運(yùn)行。對(duì)于微軟、谷歌、百度這樣的巨頭而言，算力成本顯然并不會(huì)成為障礙，但對(duì)于中小團(tuán)隊(duì)來說，如此巨大的成本幾乎就是一座不可逾越的大山，并不是每一家企業(yè)都有能力建設(shè)屬于自己的算力矩陣。

因此，英偉達(dá)就提出了算力租賃的模式。

今年3月，英偉達(dá)CEO宣布了DGX Cloud算力租賃服務(wù)計(jì)劃，讓企業(yè)用戶不需購(gòu)買昂貴的AI服務(wù)器，就能在云端上使用其提供的運(yùn)算能力。企業(yè)用戶可以使用DGX運(yùn)算資源來進(jìn)行生成式AI或應(yīng)用開發(fā)。

據(jù)悉，DGX是英偉達(dá)推出的AI超級(jí)電腦運(yùn)算系統(tǒng)，此次新推出的DGX Cloud算力租賃服務(wù)是英偉達(dá)與甲骨文等合作伙伴共同打造的。

至于DGX Cloud服務(wù)的訂閱收費(fèi)，未來將按照每個(gè)實(shí)例/每個(gè)執(zhí)行個(gè)體來計(jì)算，每月收費(fèi)36999美元起。每個(gè)實(shí)例包括8個(gè)NVIDIA H100或A100Tensor核心GPU，每個(gè)GPU節(jié)點(diǎn)內(nèi)存高達(dá)640GB，實(shí)現(xiàn)計(jì)算資源專用，不和云中另外的租戶共享。

此外，DGX Cloud本身也支持英偉達(dá)自家的AI軟件和開發(fā)工具，比如Nvidia AI Enterprise提供端到端的AI框架與預(yù)訓(xùn)練模型。

有望成算力供給主流模式之一

華福證券表示，國(guó)內(nèi)具備研發(fā)及訓(xùn)練大模型實(shí)力的企業(yè)較少，隨著行業(yè)的充分競(jìng)爭(zhēng)，未來只會(huì)剩下1-2家大模型，采購(gòu)服務(wù)器建設(shè)數(shù)據(jù)中心的重資產(chǎn)模式將產(chǎn)生大量的算力冗余，以公有云方式部署的算力租賃將是最優(yōu)解。

從算力租賃廠商前期布局的成本來看，核心成本主要集中在服務(wù)器研發(fā)和采購(gòu)、維護(hù)和升級(jí)等方面，可通過特定的技術(shù)和管理手段來控制，如通過智能化管理降低管理成本、與芯片廠商進(jìn)行戰(zhàn)略合作降低采購(gòu)成本等。前期成本情況因公司規(guī)模不同而有所差異，大型廠商通常采用集中采購(gòu)和規(guī)模效應(yīng)來降低成本，而小型廠商則主要通過定制化方案來滿足客戶需求。

而站在用戶角度，基于算力租賃，用戶只要按需付費(fèi)，不用承擔(dān)硬件設(shè)備的采購(gòu)、維護(hù)、升級(jí)等費(fèi)用，也不用擔(dān)心設(shè)備閑置或者過時(shí)造成浪費(fèi)；用戶可隨時(shí)隨地通過云端訪問所需的算力資源，快速開始訓(xùn)練和應(yīng)用；用戶可根據(jù)需求選擇不同算力平臺(tái)和機(jī)型，也可以不受地域或者時(shí)間的限制模型、工具等資源，進(jìn)行更多的嘗試和探索。

隨著大模型以及相關(guān)應(yīng)用的發(fā)展，算力需求呈現(xiàn)爆發(fā)式增長(zhǎng)。但除了大型互聯(lián)網(wǎng)企業(yè)、AI龍頭企業(yè)具有較多的GPU算力芯片儲(chǔ)備外，中小企業(yè)在發(fā)展AI模型、應(yīng)用過程中，算力租賃或能成為廣大中小企業(yè)解決算力需求的選擇之一。

注：部分信息參考科創(chuàng)板日?qǐng)?bào)、財(cái)聯(lián)社、第一財(cái)經(jīng)等，圖源網(wǎng)絡(luò)，本號(hào)文章僅供學(xué)習(xí)和交流之用，不構(gòu)成任何建議，不代表本號(hào)立場(chǎng)，如有任何問題，敬請(qǐng)聯(lián)系我們，謝謝。

標(biāo)簽：

上一篇：瑞士水果聯(lián)盟董事長(zhǎng)批評(píng)蘋果試圖獲取所有蘋果相關(guān)知識(shí)產(chǎn)權(quán)

上一篇：最后一頁(yè)