小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

雙人限注德州撲克已被程序破解——國際象棋和跳棋是典型的完全信息博弈(perfect-information games),玩家很清楚對手之前的一切動向和目前的局勢,而撲克則相反:有很多信息玩家無法掌握

 成為亨特 2015-01-31
如果你認為IBM的國際象棋超級電腦深藍(Deep Blue)很牛逼,那下面這個可要顛覆你的認知了——雙人限注德州撲克玩法已被破解!在于世界上真正的德州撲克高手面對面切磋時,這個名為“仙王座”(Cepheus)的電腦程序可從不會輸,不信你可以自己試試挑戰(zhàn)它。

   如果你認為 IBM 的國際象棋超級電腦深藍(Deep Blue)很牛逼,那下面這個可要顛覆你的認知了——雙人限注德州撲克玩法已被破解!在于世界上真正的德州撲克高手面對面切磋時,這個名為“仙王座”(Cepheus)的電腦程序可從不會輸,不信你可以自己試試挑戰(zhàn)它。

  仙王座由芬蘭的開發(fā)者 Oskari Tammelin 聯(lián)合由計算機科學家 Michael Bowling 領頭的,來自加拿大阿爾伯特大學(University of Albert)的研究組開發(fā)的,它的設計初衷就是為了打敗所有前來挑戰(zhàn)雙人限注德州撲克的玩家。研究成果在很多方面都令人驚訝,其中最大的成就就是這個叫做“虛擬條件反悔最小化”("counterfactual regret minimization")的算法。在撲克人工智能領域,虛擬條件反悔最小化(以下將簡稱為 CRM )指的是電腦程序通過評估分析之前犯的錯誤而重新校準游戲策略的能力。德州撲克中的重要技巧,也是 CRM 中在最優(yōu)化游戲策略時用到的一招就是詐唬(Bluffing)。

  研究組的另一個成就則是他們的壓縮方法(compression method)。在雙人對戰(zhàn)德州撲克中有 3.16 × 10的17次方種玩家可能碰到的局勢以及 3.19 × 10的14次方種玩家需要做出選擇的情況。要記錄所有這些情況,在過去需要調用大約 262T 的存儲空間——研究組將所需存儲壓縮到了 11T,這讓程序真正流暢運行有了可能,只有在這時候算法才能真正幫助計算機實時調整出牌策略。

  從每一局的概率上來說,仙王座偶爾還是會輸(概率永遠都存在,拿到一手爛牌加更爛的公牌,偶爾的敗仗是難免的),但從長遠來看,仙王座基本都是勝局。援引自《自然》上的文章:

  這意味著,德州撲克中的雙人限注德州撲克算是被破解了...程序開發(fā)者的游戲策略時分接近完美,基本上未來已經沒有必要再這上面再做文章了...破解撲克游戲比跳棋之類的難。國際象棋和跳棋是典型的完全信息博弈(perfect-information games),玩家很清楚對手之前的一切動向和目前的局勢,而撲克則相反:有很多信息玩家無法掌握,其中最致命的當然就是你不知道對方手中拿著什么牌。博弈論學者和經濟學家歷年來對這種不完全信息博弈很感興趣,因為這其中的理論可以解決很多現(xiàn)實問題,比如拍賣場與談判桌上的最優(yōu)策略。

  卡耐基梅隆大學的計算機科學家 Tuomas Sandholm 說這是目前被破解的最復雜的不完全信息博弈。猛擊我可以進入項目主頁親自挑戰(zhàn)仙王座!

    本站是提供個人知識管理的網絡存儲空間,所有內容均由用戶發(fā)布,不代表本站觀點。請注意甄別內容中的聯(lián)系方式、誘導購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權內容,請點擊一鍵舉報。
    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多