德國AI預測世界杯:奪冠概率最的高竟然不是德國
- 來源:網絡
- 作者:Deego
- 編輯:Deego
俄羅斯四世界杯終于要開幕了,又到了喜聞樂見的預測環(huán)節(jié),德國AI的冠軍預測結果竟然是西班牙。其他媒體、機構的預測大都是德國或是巴西。
作為慣例式的娛樂節(jié)目,從電視臺到營銷機構,從博彩公司到普通球迷,都開始了四年一度的冠軍預測……
預測這種事兒吧,一半靠分析,另一半基本靠運氣。這也是為什么博彩業(yè)成百上千名分析師拿著各種數據絞盡腦汁最后得來的賠率和預測結果,還不如章魚保羅準……
當一個行業(yè)沒什么進步的時候,總會有人來顛覆它。近年來人工智能技術發(fā)展迅猛,在統(tǒng)治了圖像識別、語音分析、自動駕駛等熱門領域之后,也開始挑戰(zhàn)世界杯比賽結果預測這門行當了。
在 2018 年世界杯開幕之際,全球多家權威機構都發(fā)布了他們的預測結果。一個很大的亮點是,有不少機構都采用了機器學習的途徑來進行預測。然而更有趣之處在于:不同機構的預測結果竟然完全不同……
1)德國人:西班牙是冠軍
嚴謹誠實的德國人,今年做出了一個非常誠實的判斷……
具體來說,按照今年抽簽的分組結果,從小組賽的階段開始預測,在所有的三十二支球隊中,西班牙最終奪得冠軍的勝算最大,約為 17.8%,高于德國的 17.1% 和巴西的 12.3%。
其實他們采用的是一種近幾年來在機器學習領域開始受歡迎的統(tǒng)計方法:隨機決策森林 (random decision forests),簡稱隨機森林。
Groll 教授介紹,隨機森林是一種融合了統(tǒng)計學和機器學習的方法。它常被人拿來和決策樹,另一種更為人所熟知的統(tǒng)計方法比較。
決策樹和隨機森林的區(qū)別很好理解。就拿世界杯正賽來說,一支球隊最終奪冠的幾率并不是瞎猜出來的。大家都知道,球隊奪冠的路徑是從每組四支球隊的小組賽前兩名出線,然后經歷八分之一決賽、四分之一決賽、半決賽、總決賽才能奪冠。
如果你找一個常見的決策樹系統(tǒng)來判斷,它在 32 進 16、16 進 8、8 進 4、4 進 2 和決賽的每個階段都進行大量的計算,最后可能得到一個十分怪異的結果,比如中國隊奪冠之類的……
因為它在當前階段做出的決策,都高度依賴上一階段的決策。這就好比一棵樹,如果從根部就長歪了,再怎么往上長,也只能是在歪的上面不斷進行修正,還有可能更歪,最后長成一棵扭曲的,現實中根本不可能存在的樹……
至于隨機森林,名字已經很直白了:簡單來說,隨機森林就是一座由很多決策樹所聚集而成的森林,然后用所有決策樹的結果進行投票,得出一個多數的、近似于平均的結果。
在不斷訓練的過程中,沒用的參數就被排除出去了,就像被剪掉的枝杈。這個過程培育出了一座有很多樹,每棵樹都不是太枝繁葉茂的森林。團隊認為,這樣得到的結果應該是比較準確的。最后,這個森林根據模擬出每場比賽的進球數來判定球隊輸贏。
采用隨機森林的方法,還有另外一個效果,那就是在不同階段,根據不同的結果重新預測和修改結果。前面提到,“西班牙是冠軍”的預測是在小組賽還未開始階段得到的。團隊進行了十萬次模擬,發(fā)現如果德國隊和西班牙隊都能突圍四分之一決賽,之后的預測顯示雙方勝率基本相等了。
你可以在上面這個鏈接看到 Groll 教授團隊的論文。如果仔細讀了,你會發(fā)現預測結果有很多矛盾沖突的地方,比如前面說德國衛(wèi)冕概率僅次于西班牙奪冠,后面又說德國突圍四分之一決賽的概率是十萬分之一;再比如西班牙和德國的勝率都 >17%,而總決賽陣容概率最高的卻是巴西對德國,而且居然是德國高。
論文也沒有解釋這些矛盾都是怎么來的(也可能是硅星人讀的不夠仔細?)不過球迷大可不必懊惱,因為預測本身就是概率的游戲,真實情況在一定程度上體現概率的作用,同時總會有概率無法涉及到的情況出現(比如西班牙昨天突然換帥開掉了洛佩特吉,而這又會怎樣影響勝率呢?)
對于 Groll 老師的預測,就跟博彩公司和體育臺的預測一樣,大家看一看,樂一樂,罵一罵就行了,大可不必當真。
2)高盛:西班牙阿根廷低迷,巴西將奪冠雪恥
世界頂尖的投行高盛 (Goldman Sachs) 的經濟學家其實很無聊,所以他們每屆世界杯都會出來發(fā)布一份《世界杯和經濟報告》,順便預測一下今年奪冠形勢。
高盛在小組賽階段預測的結果顯示:巴西最終奪冠的幾率為 18.5%,高于法國 11.3% 和德國 10.7%;西班牙和阿根廷表現低迷在四分之一決賽被淘汰;德國和巴西將分別在半決賽中擊敗葡萄牙和法國晉級;
高盛用的同樣是隨機森林模型,只是用了更少的參數,嚴格限制在球隊和個人級別的指標上,基本上做了一個高級版的《足球經理》游戲系統(tǒng)。
最后只有五個主要指標或者變量,相關性從高到低:球隊評級、球員評級、球隊近期表現、對手近期表現和球隊近期進球勢頭。
憑什么說西班牙和阿根廷表現低迷?做了 20 萬次模擬(比多特蒙德工業(yè)大學多了一倍)之后,高盛經濟學家認為抽簽導致西班牙和阿根廷在小組賽、淘汰賽就被迫面對強敵,而前面提到的五個指標打分,這兩隊在面對巴西和法國時表現不會太好。
下圖為 2014 和 2018 年高盛給各隊的打分:
然而高盛過去幾年的預測其實都挺歪的:比如 2010 年預測總決賽巴西對德國,結果奪冠的是西班牙;2014 年又說巴西會奪冠,而且概率高達 48.5%——哪想到巴西在半決賽被德國 7:1 血洗……
不知道今年的預測,會不會又是一口毒奶啊。
3)藝電:德國衛(wèi)冕失敗,點球大戰(zhàn)法國一球險勝
藝電 (Electronic Arts) 旗下?lián)碛羞\動類游戲大廠 EA Sports。你可能不知道的是,這家備受游戲迷喜愛的廠牌,同時也是頂級比賽結果預測最準的機構……
在過去的 14 場美國職業(yè)橄欖球“超級碗”比賽里,EA Sports 正確預測了 9 場的結果;說回世界杯,四年前,在一大票看好巴西隊的預測結果里,EA Sports 特立獨行地選擇了德國。
上個月,EA Sports 宣布了 2018 年世界杯的預測結果。今年,它選擇了法國作為冠軍,并且解釋了每一階段的預測過程,你可以通過這個鏈接詳細查看:
https://www.easports.com/fifa/news/2018/ea-sports-predicts-world-cup-fifa-18
EA Sports 估計,巴西將在四分之一階段被比利時送回老家,無緣復仇雪恥;法國和德國將分別擊敗烏拉圭和哥倫比亞;西班牙也將以 1:0 擊敗克羅地亞晉級四強;到了全歐洲陣容的半決賽階段,法國將 2:1 擊敗比利時,德國 3:1 擊敗西班牙。
EA Sports 的預測機制跟前面兩家還是很不同的:它就是把最新的 2018 年世界杯各隊數據資料更新到了《FIFA 18》游戲里,然后跑了一個結果出來。
這個預測機制到底是什么樣的,EA Sports 并沒有公開。上個月,《FIFA 18》游戲加入了 2018 年世界杯模塊,有游戲的玩家可以自己更新一下數據,看看會出什么結果;沒有游戲的朋友,可以去 EA Sports 的網站,上面有一個預測模擬器,可以查看官方在小組賽、淘汰賽等每一個階段的預測結果。
看完了 AI 預測,也來看看電視臺、投行和博彩公司等傳統(tǒng)機構的預測結果吧。
ESPN 多數專家(下同):巴西
FOX Sports:巴西
BBC:德國
央視體育:巴西
瑞銀 UBS:德國
大部分博彩公司:巴西
你心目中的奪冠球隊是哪支或者哪幾支呢?歡迎在下面的評論和投票里告訴我們。
玩家點評 (0人參與,0條評論)
熱門評論
全部評論