您的位置: 首頁(yè) > 新聞 > 時(shí)事焦點(diǎn) > 新聞詳情

微軟內(nèi)部遭遇AI硬件短缺 被迫實(shí)施配額制

時(shí)間:2023-03-16 21:02:01
  • 來(lái)源:新浪科技
  • 作者:新浪科技
  • 編輯:豆角

據(jù)報(bào)道,知情人士透露,雖然微軟即將宣布一整套使用GPT-4人工智能(AI)軟件的Office 365工具,但該公司現(xiàn)在卻面臨內(nèi)部AI服務(wù)器硬件短缺的窘境。

微軟內(nèi)部遭遇AI硬件短缺 被迫實(shí)施配額制

這迫使微軟不得不對(duì)硬件資源采取配額供應(yīng)的方式,限制其他內(nèi)部AI工具開(kāi)發(fā)團(tuán)隊(duì)的使用量,從而確保基于GPT-4的新版必應(yīng)聊天機(jī)器人和即將發(fā)布的新款Office工具獲得足夠的資源。這種硬件短缺的現(xiàn)狀還對(duì)微軟的客戶產(chǎn)生了影響:至少有一個(gè)客戶表示,需要等待很長(zhǎng)時(shí)間,才能使用已經(jīng)通過(guò)微軟Azure云服務(wù)提供的OpenAI軟件。

微軟表示正在加緊添置更多硬件,以便增加AI計(jì)算能力,但如果速度不夠快,就有可能限制其Azure OpenAI服務(wù)對(duì)新客戶的吸引力。這些客戶會(huì)借助此項(xiàng)服務(wù)將AI功能添加到自己的應(yīng)用中。微軟原本在這種新的AI工具的商業(yè)化方面已經(jīng)領(lǐng)先于谷歌,但如果遲遲不能解決硬件短缺問(wèn)題,這種優(yōu)勢(shì)也將難以發(fā)揮出來(lái)。

谷歌搶在微軟之前于本周發(fā)布了自己的AI輔助寫(xiě)作工具,包括能夠根據(jù)簡(jiǎn)短的提示,在谷歌Docs和Sheets中自動(dòng)編寫(xiě)文本的軟件。

服務(wù)器短缺正值OpenAI和微軟試圖快速擴(kuò)大銷售范圍之際,客戶可以使用自己的數(shù)據(jù)對(duì)這種AI軟件進(jìn)行微調(diào),從而開(kāi)發(fā)圖片生成、文檔總結(jié)、搜索引擎和聊天機(jī)器人等定制化AI工具。

微軟已經(jīng)向OpenAI投資了數(shù)十億美元,有權(quán)通過(guò)Azure OpenAI服務(wù)向創(chuàng)業(yè)公司銷售軟件。OpenAI也將軟件直接授權(quán)給客戶使用——而作為與微軟合作的一部分,所有OpenAI機(jī)器學(xué)習(xí)模型都必須運(yùn)行在Azure服務(wù)器上。這兩項(xiàng)服務(wù)的定價(jià)相同,每次請(qǐng)求收費(fèi)都不到一美分。

這兩家公司在過(guò)去3個(gè)月推出的服務(wù)吸引了企業(yè)用戶的廣泛興趣,他們都希望將OpenAI的ChatGPT聊天機(jī)器人的底層技術(shù)整合到自家產(chǎn)品中。但是微軟Azure OpenAI服務(wù)的新客戶卻要面臨很長(zhǎng)的等待時(shí)間。

硬件資源短缺的核心問(wèn)題在于,GPT-4等新的AI大模型需要在GPU上運(yùn)行,這種服務(wù)器芯片可以一次性處理大量數(shù)據(jù)。為了處理這個(gè)模型的龐大計(jì)算需求,微軟已將數(shù)萬(wàn)個(gè)GPU整合成一個(gè)個(gè)群集,分散到各個(gè)數(shù)據(jù)中心里。

在明確用戶需求量之前,微軟目前不得不將現(xiàn)有的大量GPU資源預(yù)留給新的必應(yīng)GPT-4聊天機(jī)器人和即將推出的GPT-4 Office工具。

知情人士表示,微軟2月剛剛推出這項(xiàng)必應(yīng)智能聊天功能,目前還在加緊測(cè)算平均每天有多少人愿意使用這項(xiàng)服務(wù)。知情人士表示,這就導(dǎo)致工程師很難預(yù)測(cè)該功能所需的計(jì)算資源。

而即將推出的Office GPT-4工具也可能導(dǎo)致微軟客戶對(duì)OpenAI聊天機(jī)器人技術(shù)的需求大幅激增。這些新功能包括AI文檔總結(jié)、個(gè)性化寫(xiě)作建議以及編輯建議等。

其他從事AI開(kāi)發(fā)的微軟團(tuán)隊(duì)不得不讓位于必應(yīng)和Office,包括為各種機(jī)器學(xué)習(xí)模型的開(kāi)發(fā)團(tuán)隊(duì),其中就包括微軟的圖靈自然語(yǔ)言生成模型,它可以理解文本,之前曾為電子郵件和Office應(yīng)用中的搜索工具提供底層技術(shù)。

知情人士表示,當(dāng)這些團(tuán)隊(duì)想要使用GPU開(kāi)發(fā)新的AI工具或測(cè)試現(xiàn)有AI軟件時(shí),必須向一位公司副總裁提交特別申請(qǐng),獲批后才能使用硬件。

知情人士稱,有些申請(qǐng)需要等待幾天甚至幾周才能獲批。自2022年末,微軟就一直對(duì)內(nèi)部的GPU資源實(shí)施配額供給,但1月以來(lái)的等待時(shí)間越來(lái)越長(zhǎng)。

微軟發(fā)言人在聲明中補(bǔ)充道,該公司正在為Azure等服務(wù)增加更多AI資源,并且遵循“優(yōu)先滿足客戶需求并根據(jù)需求進(jìn)行調(diào)整的流程”。他們還補(bǔ)充道,微軟并不擔(dān)心AI資源。

至少有一個(gè)微軟客戶透露,他們也經(jīng)歷了延遲訪問(wèn)的問(wèn)題。市場(chǎng)營(yíng)銷軟件創(chuàng)業(yè)公司TouchCast創(chuàng)始人兼CEO Edo Segal說(shuō):“幾乎不可能立刻使用程序”。Edo的公司正在為多家車企開(kāi)發(fā)基于GPT的互動(dòng)式用戶手冊(cè),而這項(xiàng)技術(shù)正是通過(guò)微軟Azure授權(quán)的。

現(xiàn)有的AzureAI客戶幾乎未受影響。無(wú)人駕駛汽車開(kāi)發(fā)商Cruise和AI搜索創(chuàng)業(yè)公司Perplexity的發(fā)言人都表示,他們?cè)谑褂肁zure的GPU資源時(shí)并未遇到困難。

去年11月,微軟和GPU生產(chǎn)商英偉達(dá)共同宣布,微軟將新增數(shù)萬(wàn)個(gè)處理器來(lái)擴(kuò)大AI處理能力,但目前還不清楚采購(gòu)進(jìn)度。

這兩家公司還在周一共同宣布,Azure的客戶很快就能搶先使用英偉達(dá)的新款H100 GPU——這款產(chǎn)品尚未廣泛發(fā)布。而知情人士稱,已經(jīng)有少部分微軟內(nèi)部團(tuán)隊(duì)開(kāi)始使用H100,但多數(shù)部門(mén)尚未獲得這項(xiàng)權(quán)限。

0

玩家點(diǎn)評(píng) 0人參與,0條評(píng)論)

收藏
違法和不良信息舉報(bào)
分享:

熱門(mén)評(píng)論

全部評(píng)論

他們都在說(shuō) 再看看
3DM自運(yùn)營(yíng)游戲推薦 更多+