Dieses Computerprogramm kann jeden schlagen bei Poker
Computer haben herausgefunden, wie man beim Schach, Dame und Tic Tac Toe zu gewinnen, und nun hat ein Computerprogramm das Spiel von Poker erobert.
Ein Forscherteam unter der Leitung von Michael Bowling, Professor für Informatik an der University of Alberta in Kanada, entwickelt ein Computerprogramm, das Menschen in einem zwei-Spieler-Pokerspiel besiegen kann – insbesondere Heads-up-Limit-hold em. Das Ergebnis hätte weit reichende Folgen für andere Situationen, die komplexe Entscheidungsfindung, wie z. B. in der Außenpolitik oder medizinische Behandlung erfordern.
Im Gegensatz zu Schach oder Dame im Poker weiß ein Spieler nicht immer, die Vergangenheit von den anderen Spielern bewegt. Plus, ein Spieler kann eine Hand gewinnen, wenn die anderen Spieler folden. Daher hat das Spiel in mathematischen Begriffen unvollkommene Information. [Top 10 revolutionäre Computer]
"Schach ist eine perfekte Wiedergabe-Lösung – die Antwort für eine bestimmte Position ist, ein Gewinn für Schwarz, ein Gewinn für weiß oder ein Unentschieden" Bowling sagte. "Poker ist mehr probabilistischen." " Das heißt, gibt es keine absolut perfekte Hand oder Strategie.
Wie es funktioniert
In der Version von hold ' em-Poker, die der Computer gespielt, die Wetten zwischen zwei Spielern feststehen und die Anzahl der Erhöhungen ist begrenzt. Der Croupier teilt jedem Spieler zwei Karten, Hole Karten genannt. Einsatzrunde folgt, bekannt als die "Pre-Flop." Danach sind drei weitere Karten auf dem Tisch, genannt einen "Flop." angelegt Der Flop ist ein Satz von Gemeinschaftskarten aufgedeckt, so dass beide Spieler wissen, was sie sind. Folgt eine weitere Wettrunde, und dann eine vierte Karte auf dem Tisch, genannt der "Turn". Nach eine dritte Wettrunde, wird die letzte Gemeinschaftskarte ausgeteilt (Dies ist bekannt als "River"), und an diesem Punkt haben die Spieler zeigen ihre Hole Cards, vorausgesetzt, dass ein Spieler hat nicht noch gefaltet.
Der Computer berechnen nicht jede mögliche Hand, wie es spielt. Stattdessen wird eine Tabelle mit den Ergebnissen, bevor das Spiel beginnt. Mit einige 4.000 zentralen Einheiten für zwei Monate – gleich etwa 1.000 Jahre Rechenzeit — es simuliert Milliarden Hände von Poker. Die Tabelle mit den Ergebnissen allein einige 15 Terabyte Computerspeicher antrat, sagte Bowling. Zum Vergleich: eine typische backup-Laufwerk für einen Desktop-PC ist ein Terabyte. [10 Technologien, die Ihr Leben verändern werden]
Der Algorithmus durchläuft alle der möglichen Hände ein gegnerischen Spieler haben könnte, und dann nach oben deckt sich die Ergebnisse für jede Taktik – z. B. anheben, Falten oder das mitgehen (d. h. die Gegner passend). Um eine Vorstellung davon, wie groß die Aufgabe ist, gibt es 13,8 Billionen unterschiedliche Situationen, die im Spiel auftauchen können. Um dorthin zu gelangen, müsste jeder Mensch auf der Erde fast 4.000 Hände von Poker zu spielen.
Dies unterscheidet sich vom Schach, wo ein Computer kann Brute-Force-berechnen Bewegungen wie das Spiel fortschreitet, um ein Ergebnis zu erhalten, das gut genug um zu gewinnen. (Im Gegensatz zu dem, was viele Leute denken, durchlaufen einige Computerprogramme tatsächlich jede einzelne Permutation, nur diejenigen, die die besten Ergebnisse zu produzieren). Stellen Sie sich stattdessen Schach Computer hatte, um die Ergebnisse der Milliarden der vorherigen Spiele mit einer bestimmten Konfiguration der Figuren auf dem Brett zu suchen.
Da Milliarden Hände gespielt werden, das Programm kommt mit einer optimalen Strategie – das ist es was ist der beste Zug für eine bestimmte Hand konvergiert. "Die Art und Weise, wie, die das funktioniert... es bereits 1000000000 Milliarden Hände Poker gespielt hat," sagte Bowling.
Das Spiel zu meistern
Weil Poker lösbar ist nicht ist die Art und Weise Schach oder Dame, Bowling und sein Team kam mit einem anderen Satz von Anforderungen für den Aufruf des Spiels "gelöst." Aus wissenschaftlicher Sicht ist das Spiel "im Wesentlichen gelöst," was bedeutet, dass es eine Möglichkeit, die Strategie des Computers nutzen bietet. Die Forscher davon ausgegangen, dass eine Person den Computer für 70 Jahre, 365 Tage im Jahr, 24 Stunden am Tag gespielt. Das Programm schrieben spielte so gut, dass bei den big Blind — die feste Wette – beträgt $1.000, die meisten ein perfekter Spieler gewinnen kann ist ungefähr $1 pro Hand oder 1/1000 des big Blind.
Andere Experten arbeiten auf Pokern Computern, die in den Casinos verwendet werden, und mindestens ein Unternehmen sagt, dass es einen maschinelles lernen-Algorithmus entwickelt hat, der Strategie entsprechend den menschlichen Spieler passt. Aber keiner hat gezeigt, dass seine Verwertbarkeit — die Fähigkeit einen vollkommenen menschlichen Spieler, die Maschine zu schlagen – ist so klein wie das Programm von Bowling Team entwickelt. Noch haben das Spiel in der gleichen mathematisch rigorosen Weise gelöst.
Aber der Algorithmus hat Einschränkungen. Zum einen funktioniert es nur mit Two-Handed Spiele. In einem Spiel mit drei Spielern, ist es möglich, dass ein Spieler hätte eine schreckliche Strategie (zum Beispiel, vielleicht der Spieler hat eine Tendenz, ständig zu erhöhen), und weniger als der zweite Spieler, der eine bessere Strategie hat wiederum einen Sieg für den dritten Spieler verliert.
Ein weiteres Problem ist herauszufinden, wie drei-Spieler-Spiele ziemlich zu testen. Ein Experiment konnten zwei Menschen spielen die Maschine, aber Bowling sagte menschlichen Spieler gegen die Maschine zusammenspielen können auch wenn unbeabsichtigt. Ähnliche Probleme entstehen in Experimenten mit zwei Computer-Spieler und ein Mensch: auch wenn die beiden Programme abzusprechen nicht, könnte es auf diese Weise ein Mensch aussehen. "Wir wissen nicht wie es zu ziemlich laufen", sagte er.
Bowling sagte, könnte diese Technologie vielfältige Nutzungen von Staatssicherheit, bis hin zu tracking Schwarzfahrens auf Transit bis hin zu Entscheidungen über medizinische Behandlung haben. Das Programm könnte beispielsweise ein Arzt helfen, muss eine Entscheidung über die Behandlung, aber ist unsicher, die möglichen Ergebnisse. Im Poker Programm verwendeten Methoden könnten Ärzte Behandlungsmöglichkeiten mit optimalen Ergebnissen, oder eins mit die beste Wahrscheinlichkeit des Erfolgs zu identifizieren helfen.
Die Forschung online beschrieben wurde heute (8. Januar) in der Fachzeitschrift Science.
Folgen Sie Live Science @livescience , Facebook & Google + .