Künstliche Intelligenz

Schlauer Computer spielt Weltklasse-Schach – nach nur vier Stunden

Von Alexander Armbruster
 - 11:34

Künstliche Intelligenz (KI) ist mitunter schwer greifbar. Wirklich anschaulich wird der Fortschritt in dieser Technologie aber zum Beispiel immer dann, wenn ein schlaues Computerprogramm in einem bekannten Spiel die besten menschlichen Spieler schlägt. Als der Computer Deep Blue etwa im Jahr 1997 den damaligen langjährigen Schachweltmeister Garry Kasparow besiegte, machte das Schlagzeilen. Mittlerweile sind die Computer noch viel weiter: Der IBM-Rechner Watson gewann das beliebte Quizformat Jeopardy, Forscher der Carnegie Mellon University in Pittsburgh erdachten eine Software, die einige der besten Pokerspieler der Welt besiegte.

Mitarbeiter der zum amerikanischen Technologiekonzern Alphabet (Google) gehörenden KI-Unternehmung Deepmind haben bereits mehrmals durch schlaue Computerprogramme, die bahnbrechende Erfolge im traditionsreichen chinesischen Brettspiel Go erzielten, auf sich aufmerksam gemacht. Sie bezwangen nicht nur die besten menschlichen Go-Spieler der Welt. Zuletzt stellten sie auch eine Programm-Variante vor, die sich das Spiel nahezu komplett selbst aneignete. Die Forscher erklärten „AlphaGo-Zero“, wie sie das Programm nennen, schlicht die Spielregeln. Von da an spielte das Programm gegen sich selbst und brachte sich innerhalb weniger Tage damit auf ein Spielniveau, welches das vorangegangene Programm in den Schatten stellte – nach nur drei Tagen Lernen.

„Nicht mehr vom Menschen begrenzt“

Nun sind sie offenkundig noch einen Schritt weiter vorangekommen: Eigenen Angaben zufolge haben sie ein schlaues Computerprogramm kreiert, das sie schlicht „Alpha Zero“ nennen, und das nicht nur in einem, sondern in drei Brettspielen zugleich übermenschliche Fähigkeiten erlangt hat – und in Duellen die jeweils besten bisher existierenden Computerprogramme schlug.

„Wir haben unseren Ansatz verallgemeinert in einen einzelnen Algorithmus, der übermenschliche Leistungen in vielen herausfordernden Gebieten erreicht“, schreiben die Deepmind-Mitarbeiter in einem Arbeitspapier, das sie auf der Internetseite Arxiv.org veröffentlicht haben (hier, auf Englisch). Demnach hat sich die Software innerhalb von nur 24 Stunden so viel Wissen und Können angeeignet, dass sie in allen drei Spielen die führenden Computerprogramme ausstach – im Schach dauerte es demzufolge nur vier Stunden.

Das Ergebnis – zumal im Schach – ist eindeutig ausgefallen. „Alpha Zero“ spielte gegen das führende und von Spitzenspielern vielfach verwendete Programm Stockfish – von den hundert gespielten Partien gewann „Alpha Zero“ 28. 72 endeten Remis, Niederlagen musste die neue Software keine einzige einstecken. In den beiden anderen Spielen Go und der japanischen Schachvariante Shogi waren die Ergebnisse knapper.

Zugleich scheint auch die jeweilige unterstützende Computer-Rechenleistung der Kontrahenten ähnlich gewesen zu sein, zumindest während der Spielphase. Insgesamt hat Deepmind aber mit der eingesetzten Hardware aufgerüstet. Die Vorgängerversion „AlphaGo Zero“ haben die Mitarbeiter den Angaben im Arbeitspapier zufolge noch mit sogenannten GPU-Prozessoren angelernt und spielen lassen. Diesmal verwendeten sie eigens von Google konstruierte TPUs, das steht für Tensor Processing Unit und knüpft namentlich an die im Internet frei zugängliche KI-Plattform Tensorflow an, die Google aufgebaut hat und betreibt.

Die TPUs sind extra dafür gemacht, die im Rahmen von Maschinellem Lernen oder Künstlicher Intelligenz nötigen Rechenschritte besonders schnell durchführen zu können - ebenso wie die GPUs, die derzeit vor allem das amerikanische Unternehmen Nvidia vorantreibt und verkauft. Über die TPUs ranken sich wiederum einige Spekulationen, besonders um die neue zweite Generation. Nach Angaben von Google sollen sie deutlich leistungsfähiger sein als GPUs und effizienter, wenn es um den Energieverbrauch geht.

Die technische Seite ist in solchen Wettstreits und in der Künstlichen Intelligenz insgesamt nie zu vernachlässigen. Der Fortschritt auch der vergangenen Jahre liegt nicht nur an verbesserten Lern-Algorithmen, sondern auch an schnelleren Rechnern und gestiegenen verfügbaren Datenmengen.

Demis Hassabis, der selbst Schach spielt und Deepmind mitgründete, hob schon infolge der Vorstellung der Version „AlphaGo Zero“ hervor, dass sie so stark spiele, weil sie „nicht länger eingeschränkt ist durch die Grenzen des menschlichen Wissens“. Nun teilte er über den Kurznachrichtendienst Twitter auf die Frage, ob denn wenigsten bestimmte Schacheröffnungen dem neuen Programm bekannt gewesen seien, mit: „Nein, keine Eröffnungsbücher, keine Endspieldatenbank (...) gar nichts.“

Quelle: FAZ.NET
Alexander Armbruster
Redakteur in der Wirtschaft.
Twitter
  Zur Startseite
Ähnliche ThemenComputerAlphaGoIBMKünstliche Intelligenz