麻將才是人類智慧最后尊嚴? 阿法狗你敢比運氣嗎
數月前,圍棋項目作為變數最大、可能最多的棋類項目被當作人類的最后一道智能防線,被推上和人工只能前沿與阿爾法狗(AlphaGo)進行對決時,全世界都沒能料到,被視作人類智慧驕傲的李世石竟會一敗涂地,慘敗而歸。
越來越多的項目被人類找尋出來,他們試圖找到人工智能無法攻克的堡壘,德州撲克、電子競技、乒乓球……終于,連麻將也被提及了:在麻將世界里,人類現在尚可與機器一戰嗎?面對這個問題,
涂少博和和俞玉奎兩位高手也感到無從回答起,因為他們的第一反應是:在麻將世界里人機對戰,和圍棋的一對一PK根本是兩回事。
阿爾法狗,你敢和人類比運氣嗎?
涂少博,2015年方莊聯賽年度冠軍、2015年騰訊麻將錦標賽亞軍;俞玉奎,2012年世界麻將錦標賽團體賽冠軍、2015年方莊聯賽年度第3。他們都是公認的麻將高手,可在他們的評價體系里,這和圍棋對弈簡直有著天差地別:相對于圍棋的雙人博弈,當面鑼對面鼓,麻將不僅是四人對陣,更重要的是相對于圍棋,麻將的定位是非完全信息動態博弈,對手的手牌未知以及墻牌的隨機性都是無法預料的,這就造成了麻將三分運七分技的棋牌類運動中獨樹一幟的特點。
運氣是麻將的浪漫,是無法剝離的,和其他運動有著本質區別的地方,這樣的浪漫時而殘酷,時而美艷,麻將無法脫離運氣因素獨立存在。這種運氣“浪漫”到什么程度?目前公認國內水平最高的,由天津市體育總會麻將運動分會舉辦的中國競技麻將牌王賽,已經歷時17屆,但從未產生過相同的冠軍,更別提衛冕了,甚至有一屆比賽的冠軍竟是上屆比賽的最后一名。競技麻將高手段昊在他的知乎回答中給出了他心目中一流高手的勝率預期:“假如一個牌手參加一個類似賽程的杯賽,他能有90%概率獲得前50%成績,2%左右概率獲得前1%的成績(奪冠),那他已經是一個超一流的牌手了。”也就說杯賽制冠軍并不完全說明水平,運氣異常重要,參加的比賽越多,奪冠的機會越高。
回到人機對戰的問題,兩人幾乎異口同聲地回答:“你無法確認一個合適的比賽樣本量去衡量勝負和水平高低。”,在一場類似阿法狗大戰李世石的5局3勝的比賽中,你派一個頂級競技麻將高手很有可能輸給人工智能,而一個平時偶爾打打麻將的大媽完勝阿爾法麻將狗也不足為奇。一般來說,麻將需要2000手牌才能達到一個合適的推斷水平高低樣本量(2000手牌這一數據也選自段昊的知乎問答),而打完2000手牌大概需要100小時,這樣的人機大戰就實在太過冗長枯燥了,并且,即使打完2000手牌的比分,就一定令人信服嗎?也未必。勝負的判定問題是麻將人機對戰的最大難點。
真實世界里的人工麻將智能
另外麻將的AI難做嗎?做出來能像阿爾法狗那樣所向披靡嗎?兩人的回答是“不好說”,因為“理論上不難,但具體操作上還是比較麻煩。”,目前對麻將AI的投入非常有限,而麻將復雜程度要遠小于圍棋(麻將136張牌的數量變化為326520504500種,而圍棋的數量變化為2.08×10^170,基本不在一個數量級上),因此理論上制造麻將AI并不難。
目前比較強的麻將AI是日本麻將中的“暴打”(和阿爾法狗類似,具備自我對局和分析學習人類牌譜的能力),暴打自2015年在日本最大的麻將平臺天鳳麻雀上開始運行至今已經打了1.3萬多場,完全復合對局樣本容量,而它的水平可以穩定在天鳳六段(六段以上的用戶大約有5793人),比90%的麻將玩家要好,但也并未達到最頂級的水準。但暴打只是一個課題組的力量,與阿爾法狗的投入天差地別。
具體到實際操作,制造麻將AI與制造圍棋AI有著很大的區別,麻將判定勝負規則的多樣,對手手牌的未知和牌墻的不確定性都比較復雜,這些都給AI制造了巨大的困難。比如“中、發、白”這三張牌在功能本質上并無區別,AI或玩家隨便打出哪一張牌都不能算是失誤,但假設即將抓到的下一張是“中、發、白”里面的一個的話,你打出哪一張就會有區別,但無論是AI和人類玩家都無法準確地做出預判,但圍棋就不存在類似的問題,這就是上文中提到的不完全信息動態博弈。
對于此前有人提到人機對戰時人類的一個眼神交流就可以讓阿爾法麻將狗輕松狗帶的問題(或者三個阿爾法狗到底貴不貴的問題),兩人也給出了自己的看法,俞玉奎表示:“這并不是需要參考的問題,因為任何的人機大戰或者智能AI,都不能以作弊為基礎的,否則如果AI可以透視麻將,這樣的對決將索然無味。”
人工智能不攻陷麻將只因沒有意義
事實上,在競技麻將的比賽中,這種“保鏢型”打法的確存在,不過只有在利益共贏時才能實現,并不多見,涂少博回憶自己曾經打過那么一次,但他絞盡腦汁也沒想起來還有沒有第二次,因為這樣的機會非常罕見:比如四個人排位恰好是第1、2、3、4湊成一桌,第1和第2之間存在競爭可能,第3與第4距離第1相差較大,沒有競爭可能,此時第1可能會出現刻意給第3或第4“點炮”的現象,以謀求保住自己對于第2的領先優勢,這是競技麻將中的策略選擇。
不過這也是極少發生的現象,因為競技麻將的牌局配對與順位安排比較合理,隊友出現在同一牌局的概率非常低(除了隨機抽,后面的幾局還會按照成績高低進行排位和對局安排),另外這種犧牲小我,在最后的總成績積分統計中也很難成就大我,因為局數多,對局排位變化大,很難把一個人一路“保”到冠軍。
最后,兩位競技麻將選手道出了自己內心的真實想法,多少有些凄涼:“在麻將桌上的人機對決并沒有太大意義。如果說圍棋代表人類智能的巔峰的話,麻將并沒有與之相當的地位。”的確在社會評價體系中,它更像是一種老少咸宜的娛樂,或者說在賭博犯罪和棋牌競技間游走的一個“高危玩物”,它沒有資格成為人類面對人工智能的最后堡壘,或者說人工智能戰勝麻將并不說明任何問題,甚至毫無優越感可以秀。如果說阿爾法狗戰勝李世石(或者即便是輸給李世石),都可以得得廣泛的社會關注,贏得巨大的商業價值的話,那么如果谷歌以同樣的人力物力財力投入到阿爾法麻將狗的研發,然后再進行人機大戰的話,幾乎可以斷定會虧得找不到北。
人類對于智能AI的追求,核心就在于復制人類現有的能力,并不斷自我學習,最終擊敗人類。一旦人類被智能AI擊敗,恐慌和迷茫會因此蔓延,但讓人類真正驕傲的是:當一個傳奇人物的出現,打出“反人類”的表現,讓智能AI無所適從,將非常酷。比如當下在籃球領域的庫里,他在運動戰攻防轉換中的干拔三分的命中率可以達到43%,這讓2K設計者們無所適從:這太變態了,臣妾做不到啊;如果非要強行做到的話,AI設計者們將親手毀了這款游戲。在這一點上,麻將選手相比其他棋牌運動員,更容易讓電腦AI無所適從。