close

最強版AlphaGo100比0完虐前代 柯潔:人類太多餘瞭

原標題: 最強版AlphaGo 100比0完虐前代柯潔:人類太多餘瞭

今日凌晨(倫敦時間10月18日18:00),DeepMind公佈瞭AlphaGo的最新升級版本AlphaGo Zero,並於最新一期的《自然營業用抽油煙機》雜志上,對其使用的相應技術做出詳解。

DeepMind稱, AlphaGo Zero與AlphaGo最大的不同是做到瞭真正的自我學習,經過3天的訓練,就以100:0的戰績完勝前代AlphaGo。

除瞭夜貓子們第一時間看到瞭這則消息外,曾與AlphaGo有過交戰的柯潔也在第一時間做出回應,柯潔表示, 對於AlphaGo的自我進步來講...人類太多餘瞭 。

今年5月,在烏鎮舉辦的圍棋峰會上,世界排名第一的柯潔不敵AlphaGo,最終以0:3告負。隨後,AlphaGo宣佈退役,不再與人類下棋,DeepMind則表示,將在今年晚些時候公佈AlphaGo的技術細節。

那麼,究竟這次的AlphaGo Zero相較此前的版本有哪些提升呢?(劃重點啦)

1.AlphaGo Zero通靜電除油煙機價格過與自己不斷挑戰來進行提升,不依賴人類數據。此前版本則是通過分析海量棋譜數據進行學習。AlphaGo打敗李世石用瞭3000萬盤比賽作為訓練數據,而AlphaGo Zero僅用瞭490萬盤比賽數據。經過3天的訓練,AlphaGo Zero以100:0的戰績完勝AlphaGo。並且隻用瞭1臺機器和4個TPU,而李世石版AlphaGo則用瞭48個TPU。

2.AlphaGo Zero隻使用圍棋棋盤上的黑子和白子作為輸入,而上一版除油煙機本的AlphaGo的輸入包含瞭少量人工設計的特征。

3.AlphaGo Zero 不使用 走子演算 ,它依賴於高質量的神經網絡來評估落子位置。其它圍棋程序使用的快速、隨機遊戲,用來預測哪一方將從當前的棋局中獲勝。

4.在訓練過程中,AlphaGo Zero每下一步需要思考的時間是0.4秒。相比之前的版本,僅使用瞭單一的神經網絡。

5.AlphaGo Zero采用的是人工神經網絡。這種網絡可以計算出下一步走棋的可能性,估算出下棋選手贏的概率。隨後根據計算,AlphaGo Zero會選擇最大概率贏的一步去下。

DeepMind聯合創始人兼CEO哈薩比斯稱: AlphaGo Zero是我們項目中最強大的版本,它展示瞭我們在更少的計算能力,而且完全不使用人類數據的情況下可以取得如此大的進展。

2014年谷歌以4億英鎊的價格收購英國人工智能公司DeepMind。2016年,谷歌旗下的DeepMind團隊發佈AlphaGo,並在以4:1的成績擊敗李世石後,名聲大噪。

相較於研究成果的閃耀,DeepMind在研究費用上的投入也是驚人的。據英國政府此前發佈的資料顯示,DeepMind僅去年一年就虧損瞭1.62億美元。對此,DeepMind則表示, 我們會繼續向自己的科學使命投資,與世界上最聰明的人合作,解決社會上最復雜的問題。


“阿爾法狗”再進化:自學3天,就100:0碾壓李世石版“舊狗”

http://p0.ifengimg.com/pmop/2017/1019/A274261439913203B1E4A6F4229FA07ECFAF4459_size193_w448_h252.png

台灣電動床工廠 電動床

台灣電動床工廠 電動床

AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋

AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots

一川抽水肥清理行|台中抽水肥|台中市抽水肥|台中抽水肥推薦|台中抽水肥價格|台中水肥清運

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 ylo110l8g8 的頭像
    ylo110l8g8

    剛剛喝了咖啡

    ylo110l8g8 發表在 痞客邦 留言(0) 人氣()