AlphaGo selbst beigebracht, zu gewinnen, aber ohne den Menschen würde es aus der Zeit laufen haben

Auch bei Googles DeepMind gibt es immer noch Sachen, die Menschen am besten Code, es scheint – und auf Timing kommt es an


AlphaGo, Brett-Spiel AI von Googles DeepMind Tochter, ist eines der berühmtesten Beispiele des tiefen Lernens – maschinelles Lernen mit neuronalen Netzen – bis heute. So kann es sein, überrascht zu erfahren, dass Teil des Codes, die die Maschine Sieg geführt, wurde von guten altmodischen Menschen erstellt.

Die Software, die koreanische gehen Champion Lee Sedol 4: 1 im März zu schlagen, lehrte selbst zum alten asiatischen spielen indem man Millionen Simulationen gegen sich selbst.

AlphaGo ist eine der zwei neuronale Netze, vermittelt durch eine Mischung aus überwachten Lernen (Studium vergangene Spiele gespielt von Menschen) und Verstärkung (gegen sich selbst spielen und lernen aus ihren Fehlern) zu lernen. Aber einige Dinge, es stellt sich heraus, nicht nur gelehrt werden.

Nach Thore Graepel, Forschung Führung in DeepMind, war AlphaGos fertigen Anlage sehr gut arbeiten, welche Bereiche des Boards zu seinem Denken konzentrieren, aber nicht so gut arbeiten Sie, wann Sie aufhören zu denken und eine Bewegung tatsächlich zu spielen.

Leider ist Ihr Browser nicht in der Lage um dieses Video abzuspielen.

Das ist ein Problem, weil konkurrenzfähigsten Go Spiele verwenden ein komplexes Timing-System: im Match gegen Lee gespielt, zum Beispiel, jeder Spieler hatte insgesamt zwei Stunden, ihre Bewegungen zu machen, und drei Minuten langen erfrischenden Puffer, genannt "Byo-Yomi", das sie in spielen könnte, sobald die zwei Stunden waren. Verwenden Sie nicht das ganze von einem Byo-Yomi, und Sie können es wieder nächste Abbiegung. Führen Sie es aus, und Sie es für immer zu verlieren. Alle drei abgelaufen, und Sie verlieren Zeit.

"Es gibt diesem Meta-Spiel, das gespielt wird," erklärt Graepel. "Menschen tun ganz ausgeklügeltes Zeitmanagement. Sie denken über schwierige Situationen viel länger, und dann spielen mehr reaktiv und schneller in anderen Situationen, und wir haben versucht, dies auch ein wenig zu tun.

"Zeit ist eine wichtige Ressource: je länger wir können denken über einen Wechsel, desto besser die Bewegung im Allgemeinen, aber es werden hat nur begrenzte Zeit. So hatten wir einige Methoden im Ort wo, wenn wir wüssten, dass durch das Denken mehr der Algorithmus nicht seine Entscheidung ändern würde, egal was kam aus, dass zusätzliche Bedenkzeit, die es nicht mehr ändern, wir, die feststellen kann."

Anstatt zu bauen die Timing-Regeln AlphaGos Verständnis des Spiels, aber verschraubt das Team stattdessen es auf als eine zusätzliche Einschränkung. Und im Gegensatz zu den Core-Engine, die Timing-Algorithmus wurde letztlich von hand erzeugt.

Es war immer noch obwohl algorithmisch, perfektioniert. "Wir es durch unser Bewertungssystem optimiert" Graepel sagte. " So wir verschiedene Kurven, die wir vergleichen waren hatten. Sie wissen, weniger Zeit am Anfang und mehr Zeit und mehr später, oder mehr Zeit am Anfang und später weniger... Wir haben getestet, welches die besten gespielt. "

Also mach dir keine Sorgen Sie zu viel über Maschinen, die unter Ihren Job. Gibt es immer etwas für Sie tun – selbst wenn, die nur die Stoppuhr manning ist.

Verwandte Artikel

Ich werfe mein Sohn ein Atheist, aber ich sage ihm immer noch Geschichten aus der Bibel

Obwohl ich Atheist bin, bin ich vertraut mit den Geschichten der Bibel vom Besuch einer katholischen Schule, bis ich High School erreicht. Diese Geschichten waren mein Lieblingsteil der gonna Masse und täglich Religionsunterricht. Ich liebte die wiederkeh...

Ausgestorbenen Baum aus der Zeit Christi steigt von den Toten

Wissenschaftler haben einen Baum von aus der ältesten Samen gekeimt immer gewachsen. Die neuen Bäumchen war von einer 2.000 Jahre alten Dattelpalme ausgegraben in Masada, die Seite einer Klippe Festung in Israel wo alte Juden sich sollen um die Erfassung...

Google sagt, dass Machine Learning ist die Zukunft. Also versuchte ich es mir selbst

Wenn Tiefe lernen so groß wie das Internet, ist es Zeit für alle zu Beginn der Suche eng es Die Welt wird leise durch maschinelles Lernen neu geformt wird. Wir müssen nicht mehr Computer beibringen, wie man komplexe Aufgaben wie Bild Anerkennung oder Text...

Alles, was Sie schon immer über Zähne wissen wollten (aber zu den Zahnarzt zu fragen wagten)

Wie oft sollten Sie Ihre Zähne putzen? Welche Art von Zahnpasta sollten Sie verwenden? Und Mundwasser eine gute Idee? Einst war es eine einfache Frage von oben und unten oder rund und rund. Zähneputzen – eine grundlegende Ritual der Körperpflege – ist heu...

Ohne Subvention läuft unser Theater aus hits

Heben Sie das Glas auf James Corden, Tony-Gewinner für eine Show, die vom Londoner National zu einem kommerziellen Triumph ging. Aber wenn die Koalition "vorläufige" Finanzierung Stick schneidet, es wird noch eine Weile, bevor wir anderen sehen...

Hart gegen den Zahltag Kreditgeber ist Wonga nur der erste Schritt

Bessere Regulierung der Zahltag Darlehen Industrie ist willkommen. Jetzt müssen wir Menschen beschäftigen sich mit ihren Forderungen auf eine nachhaltige, erschwingliche Weise helfen Wonga, das Unternehmen, das für so lange scheinbar der Fahnenträger...

Möglichen Weg für den Menschen für Vogelgrippe gefunden

Neue Mutationen in Teilen des Vogelgrippe-Virus könnte eine mögliche Route für das Virus auf die menschliche Bevölkerung geben bieten. Aber Wissenschaftler darauf hingewiesen, dass gab es keinen Grund zur Beunruhigung. Betrachtet man eine Probe des H...

Boo den Hund: die süßesten Welpen der Welt? Jetzt das süßeste Spielzeug in der Welt?

Sie wissen, wie Sie die heiße neue Sache in der Weihnachtszeit verkaufen? Sie machen etwas so unglaublich süß, dass nicht nur Kinder es wollen aber es so verdammt liebenswert ist, dass die Eltern das Bedürfnis haben, nur um in die Herrlichkeit seiner süße...

Honigbienen gesüßt Leben für den Menschen der Steinzeit

Steinzeitmenschen können ihre süßen Zahn mit Honig, zufriedene neue Forschung findet. Menschen verwende die Produkte der Bienen seit fast 9.000 Jahren, so die Studie, veröffentlicht heute (11. November) in der Zeitschrift Nature. Die chemischen Rückstände...

David Cameron kann die EU-Abstimmung gewinnen, aber verlieren die Hälfte seiner Partei

Der Premierminister hat das Referendum "Schism" in seiner eigenen Konservativen Partei gefunden, die weit mehr Blutergüsse als er erwartet; dieser Krieg wird nicht von Weihnachten sein. Vor langer Zeit, waren nicht selbst konservative Abgeordnet...

Ich ging in den Urlaub ohne meine Kinder, und nicht das Ende der Welt

Eine Woche bevor wir verlassen, und ich ein bisschen ein Wrack bin. In sieben Tagen sind mein Mann Micha und ich wollen in ein Flugzeug steigen und auf halbem Weg um die Welt fliegen. Ohne unsere drei Kinder. Es ist mein erstes Mal aus dem Land und zum er...

Einige nicht spezifiziert, aber ohne Zweifel Bantertastic Pfand

In der heutigen Fiver: Englands Euro Countdown, eine Siedlung und Dulwich Hamlet CHANTILLY-BASIS UND EIN LÖWENGESICHT Vier weitere Schlafplätze. Das ist wie viele Links sind bevor England kick-off der Euro 2016 Kampagne gegen Russland an diesem Wochenende...

Gareth Bale Herzstück der Euro 2016 gewinnen aber Wales sind keine ein-Mann-team

Real Madrid star Noten in der Gruppe B entsprechen aber Wales Teamkollegen beweisen, dass sie "Gemeinsam stärker", wie die Manic Street Preachers, das Lied geht Hier kommt er. Es war ein hoch Erwartungen an das andere Ende des Stade de Bordeaux,...

Neuer Auftrag: "Wir wollen Musik ohne den peripheren Müll" – ein klassisches Interview aus den Tresoren

Im Vorfeld des Konzerns 10. Album, komplette Musik findet ein 1983 Interview aus dem Gesicht, von Rock Backpages, wiederbelebt Sumner und co Lenkung frei von major-Labels und Überlistung den New Order-sound Irgendwo am südlichen Stadtrand von Manches...