OpenAI公布GPT-4 可在考試中超過90%的人類
- 來源:互聯(lián)網(wǎng)
- 作者:財(cái)聯(lián)社
- 編輯:陶笛
就在各大企業(yè)競(jìng)相追逐爆火的ChatGPT時(shí),當(dāng)?shù)貢r(shí)間周二(3月14日),人工智能研究公司OpenAI公布了其大型語言模型的最新版本——GPT-4。該公司表示,GPT-4在許多專業(yè)測(cè)試中表現(xiàn)出超過絕大多數(shù)人類的水平。
OpenAI于2020年發(fā)布了GPT(生成型預(yù)訓(xùn)練變換模型)-3(生成型預(yù)訓(xùn)練變換模型),并將其與GPT-3.5分別用于創(chuàng)建Dall-E和聊天機(jī)器人ChatGPT,這兩款產(chǎn)品極大地吸引了公眾的關(guān)注,并刺激其他科技公司更積極地追求人工智能(AI)。
OpenAI周二表示,在內(nèi)部評(píng)估中,相較于GPT-3.5,GPT-4產(chǎn)生正確回應(yīng)的可能性要高出40%。而且GPT-4是多模態(tài)的,同時(shí)支持文本和圖像輸入功能。
OpenAI稱,GPT-4比以前的版本“更大”,這意味著其已經(jīng)在更多的數(shù)據(jù)上進(jìn)行了訓(xùn)練,并且在模型文件中有更多的權(quán)重,這使得它的運(yùn)行成本更高。
據(jù)OpenAI介紹,在某些情況下,GPT-4比之前的GPT-3.5版本有了巨大改進(jìn),新模型將產(chǎn)生更少的錯(cuò)誤答案,更少地偏離談話軌道,更少地談?wù)摻稍掝},甚至在許多標(biāo)準(zhǔn)化測(cè)試中比人類表現(xiàn)得更好。
例如,GPT-4在模擬律師資格考試的成績(jī)?cè)诳忌信琶?0%左右,在SAT閱讀考試中排名前7%左右,在SAT數(shù)學(xué)考試中排名前11%左右。
OpenAI表示,雖然兩個(gè)版本在日常對(duì)話中看起來很相似,但當(dāng)任務(wù)復(fù)雜到一定程度時(shí),差異就表現(xiàn)出來了,GPT-4更可靠、更有創(chuàng)造力,能夠處理更微妙的指令。
不過,OpenAI也警告稱,GPT-4還不完美,在許多情況下,它的能力不如人類。該公司表示:“GPT-4仍有許多已知的局限性,我們正在努力解決,比如社會(huì)偏見、幻覺和對(duì)抗性提示?!?
OpenAI透露,摩根士丹利正在使用GPT-4來組織數(shù)據(jù),而電子支付公司Stripe正在測(cè)試GPT-4是否有助于打擊欺詐。其他客戶還包括語言學(xué)習(xí)公司Duolingo、Khan Academy和冰島政府。
OpenAI合作伙伴微軟周二表示,新版必應(yīng)搜索引擎將使用GPT-4。
玩家點(diǎn)評(píng) (0人參與,0條評(píng)論)
熱門評(píng)論
全部評(píng)論