game-theory-poker撲克游戲
這是根據(jù) 2005 年的 game-theoretic, heads-up limit Texas Hold'em poker player 理論編寫的撲克游戲,大約有 6000 行 Java 代碼。
操作理論
玩任何游戲的最佳策略都可以確保您至少達(dá)到該游戲的預(yù)期價(jià)值。在撲克中,假設(shè)沒有傭金,則期望值為零,因此,如果您可以計(jì)算出最佳策略,則可以保證不會平均損失。
考慮剪刀石頭布。該游戲的最佳策略是投擲rock1 / 3、1 paper/ 3和scissors1/3的時(shí)間。如果您采用這種策略,那么無論對手采用哪種策略,都可以確保自己不會平均損失。(請注意,即使您的對手rock每次擲球,您平均也會平局(而不輸)。但是在其他游戲中,最佳策略可以主導(dǎo)某些對手的策略,而撲克就是其中之一。)
即使是兩個(gè)玩家限制的撲克,也很難計(jì)算出最佳的撲克策略。但是我們可以為抽象版本的撲克計(jì)算出最佳策略,例如,在翻牌前的下注過程中,成對的ace與國王對使用相同的方式。
該代碼根據(jù)在不同情況下不同手牌的強(qiáng)度來計(jì)算其構(gòu)建的抽象撲克的最佳策略。
關(guān)于這種想法的更詳細(xì)的描述在《面向全尺寸撲克的博弈論最佳策略》(Billings,2003)一書中給出。
評論
圖片
表情
