第二百零六章 玄清杯
可以說幾十年來一個一直爭論不休的問題就是古棋和現代圍棋誰厲害的問題。
特別是阿爾法狗完敗人類棋手后,這個問題更是爭論不休。以前是爭論黃龍士范西平相當於現在幾段,現在是爭論黃龍士吳清源能否戰勝阿爾法狗。
阿爾法狗是個圍棋軟體,幾乎輸入了所有的古今中外的圍棋高手對局,也是如此,想戰勝的情結也能理解。
關公戰秦雄是相聲裡面的段子,其實就是健在的棋手,也是沒辦法比較的。
一個時代有一個時代的驕傲。聶衛平現在肯定贏不了當下的九段,但要是中日擂台賽的巔峰狀態呢?
曾經石佛李昌鎬現在還不是想贏一盤都難,似乎結婚後水平就江郎才盡了。當然還有同時期的常昊,索性做官了。
圍棋學起來恨簡單,基本規則一天就可以明白。想到這個唐玄生問糖糖:「你有把握嗎?」
糖糖道:「這個月我把死活定式手筋官子都看一遍,應該就可以了。還有那個阿爾法狗的全部對局,知己知彼百戰百勝。我要評估一下他的水平和弱點。」
關子清聽出了一些關鍵:「那就是說,你還不會下棋?我的天啊!」
糖糖道:「這個和贏棋有關係嗎?其實我多數時間是在推導所有的組合概率。這個才是關鍵。現在把所有排列組合演化出來,去掉大量明顯不合理的。然後阿爾法狗也是註定要輸的。」
唐玄生明白糖糖的意思,就是了解圍棋死活定式手筋這些基本概念后,她要把所有的可能性用棋路樹的方法全部推導出來。
所謂棋路樹,就是把所有的下法想象成一棵大樹,從第一步開始,你有三百六十一個選點,這就相當於棋路樹上面從底部生長出三百六十一個分叉。然後對方的選點就變成了三百六十個,這等於又多出三百六十個分叉。
這樣類推下去,所有的下法就像是一棵參天大樹。
當然,現在人類的計算機還沒有這麼大的演算法可以支撐。但對糖糖或者孫小聖而言,這顯然不是什麼問題。
就好比原來一本書很占面積,但用電腦保存的話,一個小小的U盤就相當於一個圖書館的書籍總量。
對糖糖而言,就是更進一步。
而且全部推導出來之後,這樣的下棋其實已經是個BUG了。想想你認真思考的下法在糖糖眼裡僅僅是必然的可能性的一種。也就是說除非你每一步都是最正確的,但這顯然不可能。
當所有的可能性都推導出來后,糖糖就會進行演算法優化,也就是把下法進行評分,每一步后雙方的輸贏概率。
其實這是圍棋選手的一個基本功,就是判斷局勢。但人類的判斷是一種模糊判斷,這個判斷的高低客觀上決定了水平的高低和最後的輸贏。
圍棋比賽經常會有高手解說,譬如這麼走會是黑好,或者盤面白優勢這些說法。但這個都是很模糊的,除非是盤面相差很大。但那種就是業餘棋手都能看出來了。
唐玄生想了想道:「這個想法好,等你推導出來了記得把最優化的走法走個一局然後給我瞧瞧。等以後也公布出去,讓他們知道什麼叫完美的一局棋。」
蘭姐好奇道:「你的大腦會特異功能嗎?這麼厲害,那可是1的後面好多0呢!」
關子清道:「那這樣的話,第一局放在金陵吧。也給公司做個宣傳。一個億的彩頭,想不火都難。要不,乾脆趁機舉辦個世界圍棋大賽,邀請等級分前五十的高手和世界各地選派的高手參加。」
唐玄生道:「那就我們名字都出一個字,叫玄清杯吧。獎金直接比現在的大賽都高一倍,然後參加預賽的就有對局費,越往後對局費就直接翻倍。」
糖糖道:「主人那我就把冠軍贏回來。」
唐玄生想了想道:「你參加第一屆的,後面就讓別人去比賽吧。不過你想的話國際上有許多比賽,你可以弄個大滿貫然後隱退。不然對那些棋手不公平。」
想想將來你怎麼走都在人家的意料之中,就像打牌,無論你出什麼都是大你的,這還這麼玩。
理論上說,圍棋其實就是你的每一步選點都要是效率最大的。但實際上不太現實,因為還有急所的限制。也就是你譬如走個星,但現在涉及死活了,就不能放棄去占那些效率最大的點。
就是如何在全局和局部之間找到那個最大的平衡點。
唐玄生也有些好奇真正最後糖糖拿給自己的棋譜會不會是像古代傳說中那些仙人的棋譜。
古代有些棋譜明顯的看的出來和當時的下法天差地別,這說明還是有厲害的腦洞大開的世外高人的。
很快辣椒蘿蔔和圓晶廠的官網上面就登出了圓晶廠拿出一億彩頭挑戰阿爾法狗的新聞。這甚至還導致股價波動了一下,當然還有後續的辣椒蘿蔔圓晶廠,也就是唐家舉辦的玄清杯世界圍棋大賽。
超高的獎金往往才能出現精彩對局,也就是重賞之下必有勇夫。
其實早在2017年5月,在柯潔與阿爾法圍棋的人機大戰之後,阿爾法圍棋團隊宣布阿爾法圍棋將不再參加圍棋比賽。2017年10月18日,DeepMind團隊公布了最強版阿爾法圍棋,代號AlphaGoZero。
也就是說人家算是功成身退了,糖糖真正要挑戰的應該是最強版的阿爾法狗。
阿爾法圍棋(AlphaGo)是第一個擊敗人類職業圍棋選手、第一個戰勝圍棋世界冠軍的人工智慧機器人,由谷歌(Google)旗下DeepMind公司戴密斯?哈薩比斯領銜的團隊開發。其主要工作原理是「深度學習」。
2016年3月,阿爾法圍棋與圍棋世界冠軍、職業九段棋手李世石進行圍棋人機大戰,以4比1的總比分獲勝。
2016年末2017年初,該程序在中國棋類網站上以「大師」(Master)為註冊帳號與中日韓數十位圍棋高手進行快棋對決,連續60局無一敗績。
2017年5月,在中國烏鎮圍棋峰會上,它與排名世界第一的世界圍棋冠軍柯潔對戰,以3比0的總比分獲勝。
圍棋界公認阿爾法圍棋的棋力已經超過人類職業圍棋頂尖水平,在GoRatings網站公布的世界職業圍棋排名中,其等級分曾超過排名人類第一的棋手柯潔。
阿爾法圍棋系統主要由幾個部分組成:
一、策略網路(PolicyNetwork),給定當前局面,預測並採樣下一步的走棋。
二、快速走子(Fastrollout),目標和策略網路一樣,但在適當犧牲走棋質量的條件下,速度要比策略網路快1000倍。
三、價值網路(ValueNetwork),給定當前局面,估計是白勝概率大還是黑勝概率大。
四、蒙特卡洛樹搜索(MonteCarloTreeSearch),把以上這三個部分連起來,形成一個完整的系統。
阿爾法圍棋(AlphaGo)此前的版本,結合了數百萬人類圍棋專家的棋譜,以及強化學習的監督學習進行了自我訓練。
AlphaGoZero的能力則在這個基礎上有了質的提升。最大的區別是,它不再需要人類數據。
也就是說,它一開始就沒有接觸過人類棋譜。研發團隊只是讓它自由隨意地在棋盤上下棋,然後進行自我博弈。
AlphaGoZero使用新的強化學習方法,讓自己變成了老師。系統一開始甚至並不知道什麼是圍棋,只是從單一神經網路開始,通過神經網路強大的搜索演算法,進行了自我對弈。
隨著自我博弈的增加,神經網路逐漸調整,提升預測下一步的能力,最終贏得比賽。更為厲害的是,隨著訓練的深入,阿爾法圍棋團隊發現,AlphaGoZero還獨立發現了遊戲規則,並走出了新策略,為圍棋這項古老遊戲帶來了新的見解。
也就是說糖糖要挑戰的是最終最強的阿爾法狗。但有個優勢就是,最強版本的阿爾法狗其實也是一種自我學習狀態。但作為真正的人工智慧,糖糖是站在一個全新的高度來俯視的。
唐玄生想了想,畢竟也是一億的賭局,索性讓糖糖去香江和孫小聖一起進行封閉訓練。也讓孫小聖學習一下圍棋,同時也是個最好的對手,看看兩人究竟誰更厲害。
畢竟孫小聖才是終極版的完美人工智慧。但孫小聖這個模樣顯然是不適合參加比賽的。所以作為最佳陪練肯定是合格的。
比賽是五局三勝,第一局在金陵舉行,後面的都在香江舉行。董詩云聽到消息索性和宋亞男開了外圍,也就是和幾大賭球集團合作,哪怕你不懂圍棋也可以像賭球一樣買糖糖勝利還是阿爾法狗勝利。
本來很多人都是認為明顯的唐玄生是錢太多用一億來做廣告。但現在有了這個外圍,似乎一切變的有趣起來。
本來都是看好阿爾法狗勝利的,開始開出的賠率也不是很高,但這個賠率是可以調整的。很多人不明白這一點,以為賠率是固定不變的。
起初糖糖的賠率是一賠五,阿爾法狗的賠率是一賠一點五。其實這個是董詩云故意的,不然吸引不了更多人來買。
而且說是合作,真正的外圍賬戶還是董詩云和宋亞男這邊的,反正現在有安迪幫忙,也不怕賴賬。
當然,那些賭球集團看董詩云宋亞男的表情也是一副人傻錢多的樣子。甚至他們寧願把接下的單子都打到她們的賬戶。自己都買了很多阿爾法狗第一局勝的外圍。
但賭徒的心理永遠是無法猜測的。哪怕是隨便網路上搜索就可以看到阿爾法狗的戰績,但還是有人願意買糖糖勝。
這也是董詩云把糖糖勝的賠率放在一賠五而不是一賠十或者更多的原因。也是怕萬一會有人大額購買。
當然,這個是要為期一個月才舉行比賽的。至少目前買糖糖勝的是寥寥無幾,只有買阿爾法狗的萬分之一。也就是說如果糖糖勝利的話,董詩云和宋亞男是賺大了。
當然虧的話也是個驚人的數字。但有圓晶廠和催化劑的擔保,反而更多人參與進來。
相比之下,同樣一月後在糖糖和阿爾法比賽完就會舉行的玄清杯反而不是很被人重視。但對於職業棋手而言,無疑是多了一些期待。
因為這次的對局費都是超高的,哪怕是預賽的對局費即使是輸也有幾萬對局費,這直接就是增加荷包的事情。
而且進入八強的話,哪怕是最後第八獎金也是和現在世界大賽冠軍獎金一樣的。這直接讓人驚嘆唐玄生的財富和底氣。
其實這次外圍糖糖勝利的話那些錢就完全可以繼續玄清杯比賽而且是用不掉了。因為短短几天的博彩就超過十億了!
宋亞男笑道:「要是這次糖糖輸給了阿爾法狗,估計唐玄生得偷偷哭了。最後的博彩我估計得有千億,這賠的話還真的是讓人心疼。」
孫小聖道:「糖糖不是要來這邊嗎?我好好教教她,正好我這幾天也學了圍棋,其實完全不用擔心的。我雖然不去比賽,但可以給她支持,我可以和她對接,讓她的大數據更流暢,演算法更優化。到時候媽媽偷偷抱著我就可以了。而且在現場我也可以觀察局面幫糖糖一起分析。」
宋亞男笑道:「也是,我都忍不住買了糖糖贏呢。」
董詩云道:「你買這個有意思嗎?都是自己口袋的錢?」
宋亞男道:「畢竟是一個戰壕的啊,支持一下。」
董詩云道:「關子清還弄了個玄清杯出來,要不我們在香江也舉行個圍棋大賽,索性業餘和職業都來。我記得業餘的世界大賽好像都沒有呢。我們把獎金也定的高高的,讓業餘強豪也有對局費和高額獎金,我大氣一點,直接叫紫荊杯,反正比賽廣告這些宣傳都是我們這邊的。寶島那邊出了個林海峰和張羽,我就不信香江這麼大沒有圍棋天賦好的圍棋少年。」
宋亞男笑道:「這樣好,也容易得多官方和民間的雙向支持。就叫紫荊杯世界圍棋職業暨業餘最強者比賽。」
其實世界圍棋業餘大賽也是有的,不過開始華夏都是職業棋手參加,1979年聶衛平獲得冠軍。從1979年以降,至1990年先後有邵震中、曹大元、馬曉春、王群、汪見虹、張文東、車澤武、常昊以專業棋手的身份參加,並獲得了冠軍。
從1990開始才是真正的業餘棋手參賽,但比賽是採用積分循環未必合理,宋亞男和董詩云設想的這個是完全向職業比賽看齊的制度。