搜狗王小川：AlphaGo2.0更接近人重新描繪智慧邊界－七逃人的分享日記

搜狗王小川：AlphaGo2.0更接近人重新描繪智慧邊界

新浪科技訊 5月23日下午消息，中國圍棋峰會今日在浙江桐鄉拉開帷幕，DeepMind旗下機器程序AlphaGo將與全球圍棋排名第一柯潔九段展開5天3局的對弈。

在比賽首日，搜狗公司CEO王小川，就AlphaGo和柯潔的人機大戰發表瞭看法。

他圍繞AlphaGo的變化、比賽最大看點和比賽意義等3方面發表瞭看法。

王小川最後稱，AlphaGo2.0告訴我們：如果有合適的條件，完全可能有其他的生命進化路徑，以及更不一樣的進化結果。讓我們歡呼人的智慧造就瞭AlphaGo，這也幫我們開瞭眼界，看到我們離最終的生命形態和智慧依然有遙遠的距離。保持敬畏，堅定前行，終得圓滿。

以下為搜狗公司CEO王小川在知乎發表的觀點：

該來的終於來瞭。

一年前AlphaGo發佈，看完論文後我就在知乎上發文預測機器會完勝人類。好些行業朋友不相信，為此我收瞭很多“智商稅”，之後微信發紅包一直發到春節才發完。此外我還立瞭兩個斷言：一個是Google很有可能再研發出AlphaGo 2.0，擺脫“監督學習”，不再需要人類下圍棋的歷史數據，而是隻通過“增強學習”，兩臺AlphaGo自我對戰學習如何下棋，並達到登峰造極的地步。從公開的資料判斷，此言中瞭。這意味著什麼呢，又有什麼看點呢？

技術重大提升：和1.0原理大不同更接近於人

AlphaGo 1.0是巧妙地混合瞭三種算法：蒙特卡洛樹搜索+監督學習+增強學習。其中蒙特卡洛樹搜索是一種優化過的暴力計算，比1997年深藍的暴力計算更聰明。而這裡的監督學習，是通過學習3000萬步人類棋譜，對六段以上職業棋手走棋規律進行模仿，也是AlphaGo獲得突破性進展的關鍵算法。而增強學習作為輔助，是兩臺AlphaGo從自我對戰眾中學習如何下棋，據悉對棋力提升有限。

根據公開資料推測，此次AlphaGo2.0的技術原理與之前有著巨大不同：

1。放棄瞭監督學習，沒有再用人的3000萬局棋譜進行訓練。這本是AlphaGo最亮眼的算法，也是今天主流機器學習不可避免的核心條件：依賴於優質的數據，在這個特定問題下就這麼被再次突破瞭。

2。放棄瞭蒙特卡洛樹搜索，不再進行暴力計算。理論上，算法越笨，就越需要暴力計算做補充。算法越聰明，就可以大大減少暴力計算。從AlphaGo 2.0的“馬甲”Master的歷史行為看，走棋非常迅速，約在每10秒鐘就走棋一步，如此速度很可能是放棄瞭暴力的計算。

3。極大地強化瞭增強學習的作用，之前敲邊鼓的算法，正式成為扛把子主力。想想看有多勵志：兩臺白癡機器，遵守走棋和獲勝規則，從隨機走棋開始日夜切磋，總結經驗，不斷批評和自我批評，一周後終成大器。

在這樣的算法下，AlphaGo 2.0對計算資源開銷極小，把當前棋局輸入神經網絡，電流流過，輸出就是最佳的走棋方案。我猜測如此算法下，有可能僅僅依靠一個GPU工作，每一步棋消耗的能源接近人的大腦。

最大看點： AlphaGo2.0棋風完全脫離人類經驗

今年年初，AlphaGo化身Master連勝人類頂尖棋手60局。在圍棋領域，機器完勝已經變成公認的定論。這導致很多人開始問：這次人機大戰還有意義嗎？我們的關註點不再是機器是否會贏——而是機器將用什麼姿勢戰勝人類。

AlphaGo學習瞭3000萬步人類棋譜，走棋風格也近似於人。在比賽現場，偶有AlphaGo走棋和人的經驗不符合，就被評為“愚蠢”，隻是在中盤之後發現機器漸漸局面占優最終獲勝，為瞭自圓其說解讀為“AlphaGo中盤逆轉”，前兩局莫過如此。第三局開始評論者長瞭教訓，開始尊稱AlphaGo為“阿老師”，有瞭欣賞和敬畏的心態。這帶給圍棋界很大的沖擊，以前大傢認為正確的東西，其實是不正確的。柯潔曾經評價說：“AlphaGo出現，很多理論都被推翻，再看以前定式變得好笑，虧那麼多目就不再是兩分。”人類通過數千年實戰，總結瞭圍棋理論，然後計算機告訴人類：這些全都是錯的。現在在很多比賽上，人類棋手已經開始向機器學習，模仿AlphaGo的下法，棋聖聶衛平也曾表示“理論被顛覆瞭”。

而AlphaGo2.0脫離瞭機器對人模仿，走棋風格也將完全脫離人的定式。在與柯潔的比賽中，會不斷出現我們意想不到的走棋，而且這些走棋在教科書中會被認為是低級錯誤或者完全不可理喻，但凡一個正常的棋手都不會這麼玩，但凡一個新手這麼玩都會被點撥這樣不對。而AlphaGo2.0會不斷制造這樣的局面，關鍵他還是對的。可想對專業棋手的心裡會有多大的震撼：不僅自己這一輩子都沒這麼想過這麼下棋，整個圍棋界都沒有想過。會不會懷疑自己白活瞭？會不會反思兩千年圍棋的發展為什麼有這樣的瓶頸？還有多少海闊天空等著我們去探索？可等不及我們去探索，計算機就給出瞭終局的答案，多麼惆悵。

我們會津津樂道，AlphaGo是什麼棋風。但可以這樣推理：但凡有流派和風格，就還有局限性。隻有當所有流派合一看不出流派的時候，才到達致高境界。AlphaGo 2.0便會是這麼一臺機器，沒有風格，穩如磐石。

可以想見這次與柯潔的對弈，能頻現“怪招”，完全顛覆人類對圍棋的理解——這會是比賽最大的看點。英勇的柯潔，要解鎖108種姿勢來抵擋瞭。

2017人機大戰的意義台北靜電機租賃：重演一部進化史重新認識智慧的邊界

2016年在AlphaGo和李世乭的對戰後，人工智能進入大眾的視野，我們開始重新思考機器和人的關系。

圍棋已經有兩千多年的歷史，在漫長歲月的琢磨中，圍棋理論不斷進化，到達瞭很高的水準，AlphaGo的獲勝，我們大可以解讀於“青出於藍”，畢竟是在人類圍棋進化的主路徑上又攀高峰。

而AlphaGo2.0完全拋棄掉人類這兩千年來進化的圍棋經驗，另尋他徑，僅憑兩臺機器自我對弈中學習和進化，最終不僅趕超瞭人類進化的速度，還發展出一套截然不同的下棋方法，並且更加接近完美的狀態，實現瞭對人類的碾壓，重演瞭一部圍棋的進化史，而且得出瞭與這兩千年來不同的進化結果。

這會給我們什麼啟示？如果跳出圍棋的規則，類比看地球生命的進化：人類是從原始的有機物，到單細胞開始逐步變成靈長類動物，並且發展出超越其他一切生物的智慧。這條路徑是唯一的麼？人類的生命形態和最頂級的生命形態還有多大距離？

AlphaGo告訴我們：我們還有極大的發展空間；AlphaGo2.0告訴我們：如果有合適的台中靜電機出租條件，完全可能有其他的生命進化路徑，以及更不一樣的進化結果。

讓我們歡呼人的智慧造就瞭AlphaGo，這也幫我們開瞭眼界，看到我們離最終的生命形態和智慧依然有遙遠的距離。

保持敬畏，堅定前行，終得油煙處理機出租圓滿。

台灣電動床工廠電動床

rVCzpOORa

七逃人的分享日記

rVCzpOORa 發表在痞客邦留言(0) 人氣()

E-mail轉寄

七逃人的分享日記

七逃人的分享日記

搜狗王小川：AlphaGo2.0更接近人重新描繪智慧邊界

歷史上的今天

留言列表

站方公告

活動快報

LG 20...

我的好友

熱門文章

文章分類

最新文章

最新留言

動態訂閱

文章精選

文章搜尋

新聞交換(RSS)

誰來我家

參觀人氣

QR Code

POWERED BY

七逃人的分享日記

七逃人的分享日記

搜狗王小川：AlphaGo2.0更接近人 重新描繪智慧邊界

歷史上的今天

留言列表

站方公告

活動快報

LG 20...

我的好友

熱門文章

文章分類

最新文章

最新留言

動態訂閱

文章精選

文章搜尋

新聞交換(RSS)

誰來我家

參觀人氣

QR Code

POWERED BY

搜狗王小川：AlphaGo2.0更接近人重新描繪智慧邊界