您的位置: 首頁 > 新聞 > 時事焦點 > 新聞詳情

谷歌發(fā)布新版AI系統(tǒng) 圖像配文準(zhǔn)確率高達(dá)93.9%

時間:2016-09-25 20:29:04
  • 來源:威鋒網(wǎng)
  • 作者:skylark
  • 編輯:豆角

 近日,谷歌發(fā)布了最新版機器學(xué)習(xí)系統(tǒng),通過識別圖像中的內(nèi)容,配上對應(yīng)文字,效果達(dá)到了歷史最佳。

谷歌已經(jīng)在 TensorFlow 上開源了這項成果。自 2014 年以來,谷歌一直致力于這個項目,現(xiàn)在這個算法描述圖像的準(zhǔn)確率已經(jīng)高達(dá) 93.9% 。因為他們正在使用一個使用一個開始架構(gòu)的最新的迭代,所以對于谷歌團隊來說,有個大問題是該算法是否可以做的比簡單識別圖像中的對象更多。

要真正解釋和描述一張照片,人工智能不僅需要了解圖片中是什么,更要了解圖像中這些對象有什么相互關(guān)系。谷歌的開發(fā)人員表示這不只是一個數(shù)據(jù)的倒推。該算法必須能夠自然地理解圖像中的對象和它們的用途。

谷歌研究的博客發(fā)文說:“令人興奮的是,在展示全新情境時,我們的模型的確可以產(chǎn)生準(zhǔn)確的配文,這顯示出系統(tǒng)對圖像中目標(biāo)和背景的理解更深了。”同樣重要的是,“它還學(xué)會了如何表示知識在自然的英語短語,盡管它只讀了人類給的說明字幕,沒有在接受其他額外的訓(xùn)練。”

至少從目前來說,相對于視頻,機器學(xué)習(xí)算法能更好地理解靜止圖像的內(nèi)容。

0

玩家點評 0人參與,0條評論)

收藏
違法和不良信息舉報
分享:

熱門評論

全部評論

他們都在說 再看看
3DM自運營游戲推薦 更多+