塵埃落定,Master 宣佈自己身份:就是 AlphaGo!

愛範兒 於 05/01/2017 發表 收藏文章

吊打柯潔,戰勝聶衞平,豪取 59 勝的“網絡圍棋高手” Master 的身份終於確定:代為執子的 AlphaGo 團隊黃士傑博士在對戰古力前亮明身份。隨後 DeepMind 團隊發出官方聲明,表示 Master 就是最新版本的 AlphaGo。


(官方聲明中文版請見本文文末)

2016 年的 12 月 29 日到 31 日,Master 在弈城網上連勝柯潔九段、陳耀燁九段、樸廷桓九段、羋昱廷九段、唐韋星九段等高手,取得 30 連勝後,於 2017 年 1 月 1 日晚登錄騰訊圍棋(野狐),繼續中日韓 3 國的多位大師,就在 1 月 3 日晚,Master 再次上線,連勝 2 盤後再一次讓世界冠軍柯潔在中盤投子認輸。最可怕的是,在 3 號晚上第一局與樸延桓的對戰中,Master 似乎在確定自己要贏了的情況下“故意放水”,最後僅以 1 目半的微弱優勢取勝。


1 月 4 日,Master 繼續在網絡“屠殺”圍棋大師,並在下午與聶衞平進行了對戰。之前的棋局“Master”都只接受一手 30 秒以下的快棋挑戰,但面對已經 64 歲的聶衞平,“Master”將棋局調整為 1 分鐘一手。然而這並沒有改變 Master 最終獲勝的比賽結果,在比賽結束後,“Master”還用繁體字向聶衞平留言:“謝謝聶老師!”。

在 1 月 3 日 Master 再次戰勝柯潔後,聶衞平就曾表示:Master改變了我們傳統的厚薄理念,顛覆了多年的定式”,“圍棋遠不像我們想象的那麼簡單,還有巨大的空間等着我們人類去挖掘,AlphaGo 也好,Master也罷,都是‘圍棋上帝’派來給人類引路的。而在今天敗給 Master 後,聶衞平也給出了 Master 的“評測體驗”:

引用Master技術全面,從不犯錯,是其最大優勢,人類要打敗它的話,必須在前半盤領先,然後中盤和官子也不出錯,這樣固然很難,但客觀上也促進了人類在圍棋技術上的提高。這盤棋我佈局不錯,但中盤時打了一個大勺子,斷送好局,有些可惜。

但對於 Master 此次的連勝,聶衞平也表示有些對戰人類確實是讓 Master 給“嚇唬住了”。

引用我看有些棋局,它的對手簡直就是被它嚇死的,僅僅百餘手就崩潰,這已經不能用技術原因來評判了。

而 Master 今晚與古力的最後一戰,也不出意外以勝利告終,拿下了自己這一週來的第 60 場勝利。在敗給 Master 之後,古力也在微博發表了自己的感受:

引用作為第 60 個勇士,犧牲了😥經過這幾天的對局,我深深的感受到圍棋的神祕,似乎 Master 給我們打開一道圍棋的神祕之門,不論勝負,人類與人工智能共同探索圍棋世界的大幕即將拉開,新一次的圍棋革命正在進行着。。。


有趣的是,當前幾天所有人都在猜測 Master 究竟是誰的時候,與 Master 對戰的這些棋手可能早就已經知道,自己面對的,就是最新版的 AlphaGo,柯潔在今晚 10 點 5 分的一條微博也承認,自己早就已經知道,自己在網絡對面的對手就是 AlphaGo。

不到 1 年的時間從 AlphaGo 成長為真·大師,人類幾乎已經毫無勝算


在 16 年 11 月的暴雪嘉年華上,宣佈即將用 AlphaGo 征戰《星際爭霸 2》的 DeepMind 團隊就表示:

引用AlphaGo 的棋力在已過半年有巨大的進步,將會在 2017 年年初復出下棋。AlphaGo 團隊將會在近期內公佈更多訊息。

但這次公佈後,恐怕誰也沒想到,AlphaGo 的迴歸如此之快,而且對戰的方式也由原來的 1 VS 1 五局三勝,變為了直接單挑世界各國高手,並最終未嘗敗績豪取 60 場勝利。在 2016 年對戰李世石時,對戰的規則是:採用貼 7.5 目的中國規則,每位棋手各有兩個小時佈局時間,3 次 60 秒的讀秒。2017 年的網絡對戰中,除了與聶衞平對戰時調整到了 1 分鐘一手,其餘棋局 Master 都只接受一手 30 秒已下的快棋挑戰。


將每一步的決策時間都縮短一倍,對於 AlphaGo 運算能力來説是一個極大的挑戰,而在經歷了將近半年的提升後,原本在與李世石對戰時還能被看出破綻並輸掉一盤的 AlphaGo,在變身 Master 之後變得戰無不勝。

AlphaGO 以大量的棋譜數據為基礎進行深度學習,不斷完善,又通過自我模擬比賽提高實力。背後涉及到三個主要概念:窮舉、蒙特卡羅樹搜索和深度學習。這樣的技術解決方案使得 AlphaGo 下棋的方式完全打破了人類上千年來對於圍棋玩法的認知,不談套路與合理,只看整體勝算。

然而人類想要與 AlphaGo 學習下棋方式,恐怕只能學到皮毛,而不能真正 Get 到人工智能棋手的全部技能。因為畢竟 AlphaGo 的所有着法都是從全局考慮並基於它認為的勝率,如果只是單純地模仿它的下法,恐怕達到的效果會如東施效顰一般。


至於有的人説 AlphaGo 的過於強大幾乎毀掉了圍棋這個遊戲的意義,換個方向説,人類造出了法拉利但我們依然崇拜保特、人類造出了起重機但奧運會依然還有舉重比賽、人類幾十年前就造出了深藍但人與人之前的國際象棋較量仍然有獨到且吸引人的看點。AlphaGo 的出現,就像是人工智能歷史上一個全新的里程碑,最令人期待的,其實並不是 AlphaGo 的棋力究竟是有多高,而是人工智能可能對人們未來生活方式產生的影響。

DeepMind 團隊樊麾在新浪微博上發出的官方聲明中文版:

引用我們最近很努力地開發阿爾法圍棋,剛過去的幾天我們在網絡的對弈平台進行了一些非正式的快棋對局,目的是為了檢驗我們最新版本的阿爾法圍棋是否如我們的預期。我們需要感謝所有與我們的 Magister(P) 和 Master(P) 賬户在弈城圍棋網以及野狐圍棋網對弈的棋手,也要感謝所有觀戰的人!最新的阿爾法圍棋在對局中所富有啟發性的創新,我們從中可以學到的,以及對局的結果都令我們非常激動。

世界冠軍古力與阿爾法圍棋對弈以後寫了,“人類與人工智能共同探索圍棋世界的大幕即將拉開”。我們現在結束了非正式的測試,非常期望今年能有機會與圍棋組織以及專家共同探索神祕的圍棋,在相互啟發的氣氛中共同領會圍棋的奧妙。我們希望儘快發佈其他公告。


資料來源:愛範兒(ifanr)
標籤: AlphaGo  Master  

留言


請按此登錄後留言。未成為會員? 立即註冊
    快捷鍵:←
    快捷鍵:→