Künstliche Intelligenz

Computer bringt sich selbst Go bei – und wird Weltklasse

Von Alexander Armbruster
 - 13:42

Das Brettspiel Go ist mehrere Tausend Jahre alt und kompliziert: Spielstrategien lassen sich viel schwerer abschätzen als im Schach und die Zahl der verschiedenen Spielvariationen ist gewaltig – sie ist größer als die Zahl der Atome im Universum. Deswegen braucht es Intuition, Rechenleistung und Erfahrung, um darin Weltspitze zu werden.

Umso beachtlicher war darum der Sieg, den ein schlaues Computerprogramm vor bald zwei Jahren schon über den damals stärksten Go-Spieler der Welt errang. Die Mitarbeiter der zum Technologiekonzern Alphabet (Google) gehörenden und auf Künstliche Intelligenz ausgerichteten Unternehmung Deep Mind hatten es erdacht und AlphaGo genannt.

Beeindruckend an dem Programm ist, dass es in diesem Zweikampf zum Beispiel an einer Stelle sogar einen Spielzug ausführte, der nicht nur genial war, sondern alle menschlichen Profis überraschte und von dem das Programm sogar „wusste“, dass er außergewöhnlich war. Im Mai folgte dann ein weiteres Duell gegen einen chinesischen Superspieler.

„Nicht durch menschliches Wissen begrenzt“

Nun teilte Deep Mind mit, einen weiteren Durchbruch erzielt zu haben: Den KI-Experten gelang eigenen Angaben zufolge die neueste Version ihres Go-Programms so intelligent zu machen, dass es sich das Spiel nahezu komplett selbst aneignete. Verglichen mit früheren Versionen brauchte es nicht erst Zigtausende Go-Spiele zwischen menschlichen Spielern anzuschauen und zu analysieren und darauf aufbauend eigene Wettstreits zu absolvieren, um sich Stück für Stück zu verbessern. Die Forscher erklärten der neuesten AlphaGo-Version schlicht die Spielregeln. Von da an spielte das Programm gegen sich selbst und brachte sich innerhalb weniger Tage damit auf ein Spielniveau, welches das vorangegangene Programm in den Schatten stellte – nach nur drei Tagen Lernen.

„Vorangegangene Versionen von AlphaGo wurde anfangs mit Tausenden Spielen menschlicher Amateure und Profis trainiert, um zu lernen, wie man Go spielt. AlphaGo Zero (so heißt die neue Version) überspringt diesen Schritt und lernt das Spiel einfach dadurch, dass es Spiele gegen sich selbst spielt, beginnend von einem komplett zufälligen Spiel. Schnell überflügelte es menschliches Spielniveau und besiegte die letzte veröffentlichte AlphaGo-Version mit 100 zu null“, teilten die Deep-Mind-Experten in ihrem Blog mit (hier auf Englisch). Sie veröffentlichten die Details zu ihrer neuen Leistung außerdem im renommierten Wissenschaftsmagazin „Nature“.

Faktisch brachte sich der Computer also innerhalb weniger Tage selbst das Wissen bei, was sich Menschen über Jahrtausende angeeignet hatten. Demis Hassabis, der Deep Mind mitgründete und das Projekt heute noch leitet, hob denn auch als Vorzug der neuesten Version denn auch hervor, dass sie so mächtig sei, weil sie „nicht länger eingeschränkt ist durch die Grenzen des menschlichen Wissens“.

Er und seine Mitarbeiter wollen seinen Worten zufolge nun die dahinterstehende Netzwerkstruktur auf andere Bereich übertragen und sie dort für nutzbringende Anwendungen etablieren. Hassabis nennt dabei zum Beispiel die Bereiche Gesundheit und Energieversorgung.

Trotz des Durchbruchs, den die Deep-Mind-Fachleute nun erreicht haben, ist das schlaue Programm AlphaGo Zero vor allem eine geschicktere Kombination existierender KI-Methoden. Sie verbergen sich hinter Begriffen wie „künstlichen neuronalen Netzen“ und „Reinforcement Learning“. „Die Kombination dieser Komponenten ist allerdings neu und nicht gerade Standard“, erklärt der Experte Andrej Karpathy, seit einigen Monaten KI-Forschungschef des Elektroautoherstellers Tesla. Er verweist auch darauf, dass Go ein anspruchsvolles Spiel ist, aber in mancher Hinsicht Eigenschaften hat, die von den gerade angesagten KI-Methoden tendenziell gut bewältigt werden können: Es gibt keine „versteckten Informationen“, das Spielfeld ist für alle Spieler komplett ersichtlich - beim Pokern ist das beispielsweise anders. Zweitens sind die Spielregeln klar und ändern sich nicht. Und drittens ist die Zahl der möglichen Züge jeweils abzählbar und endlich.

Aber auch Karpathy betont schlussendlich die Leistung der Forscher nun. „Alphabet schließt eine große Wette auf KI ab, und es ist eine sichere“, äußert er - und dürfte selbst sehr gut informiert sein: Bevor er für Tesla arbeitete, forschte er für Elon Musks KI-Projekt „Open AI“ und davor war er Mitarbeiter von Deep Mind.

Quelle: FAZ.NET
Autorenporträt / Armbruster, Alexander (ala.)
Alexander Armbruster
Redakteur in der Wirtschaft.
Twitter
  Zur Startseite
Ähnliche ThemenComputerKünstliche Intelligenz