Künstliche Intelligenz

Wenn der Computer aggressiv wird

Von Alexander Armbruster
 - 13:40

Beinahe ein Jahr ist es nun her, dass ein schlaues Computerprogramm im traditionsreichen Brettspiel „Go“ den Weltmeister besiegte. Der spektakuläre Sieg ging durch die Presse. Fachleute staunten nicht nur über das Ergebnis. Denn das selbstlernende Programm, dass Mitarbeiter von Googles Abteilung für künstliche Intelligenz „Deep Mind“ erschaffen hatten, führte an einer Stelle einen strategischen Spielzug aus, der Profispieler vollkommen überraschte und von dem der Computer sogar „wusste“, dass er außergewöhnlich war.

Kürzlich besiegte dann eine von zwei Forschern der amerikanischen Carnegie-Mellon-Universität entwickelte künstliche Intelligenz vier der besten Pokerspieler der Welt. Auch das deuteten Experten als großen Schritt auf diesem Gebiet, denn einem Computerprogramm gelang es, unvollkommene oder irreführende Informationen wie einen Bluff korrekt zu interpretieren – der große Unterschied zu den Erfolgen in Go und zuvor schon im Schach, in Spielen, in denen es keine versteckten Informationen gibt.

Computer verhalten sich je nach gemachter Erfahrung anders

Nun ist wiederum Forschern von Google ein weiteres bemerkenswertes Experiment gelungen, das zeigt, wie und was Computer lernen. Sie haben künstliche Intelligenzen in einfachen zweidimensionalen Computerspielen gegeneinander antreten lassen. Dabei stellten sie fest, dass sie sich je nach Umfeld aufgrund gemachter eigener Erfahrungen unterschiedlich verhalten (zum Forschungspapier geht es hier entlang, auf Englisch). In einem ersten Spiel geht es darum, möglichst viele grüne Äpfel auf einer Fläche einzusammeln. Jeder Apfel bedeutet einen Spielpunkt. Die Spieler können aber auch einen Laserstrahl einsetzen und ihren Gegner dadurch vorübergehend außer Gefecht setzen. Dafür bekommen sie nichts, dieses Verhalten bedeutet zunächst einmal Kosten in dem Sinne, dass sie während dieser Zeit keine Äpfel sammeln können.

Die Google-Fachleute um Joel Leibo haben 40 Millionen Spielschritte durchgeführt und dabei ermittelt: Wenn es ein großes Angebot an Äpfeln gibt, verhalten sich beide Spieler kooperativ, sie sammeln einfach ein und teilen sich quasi die Äpfel untereinander auf. Wenn sich das Umfeld so verändert, dass die Äpfel knapper werden, ändert sich das Verhalten hingegen: Die Spieler werden dann aggressiver, sie versuchen häufiger, den Gegner aus dem Spiel zu nehmen und in dieser Zeit die knapperen Äpfel einzusammeln – ohne, dass sie zuvor diese mögliche Strategie „erklärt“ bekommen hätten.

„Weniger aggressive Strategien entstehen vor allem in einem Lernumfeld, das durch Überfluss geprägt ist, mit weniger Anwendungsmöglichkeiten für kostenträchtiges Verhalten“, schreiben die Forscher in ihrem Fachaufsatz. Sie fanden außerdem heraus, dass die künstliche Intelligenz in einem größeren und komplexeren zugrunde liegenden Netzwerk schneller lernte, den Wettstreiter zu sabotieren als in einem einfacheren System. Und dieses Verhalten sogar in einer Umgebung mit reichlichen Ressourcen (Äpfeln) an den Tag legte. Das Ergebnis mag menschlich intuitiv sein, es basiert auch auf Erkenntnissen aus der Spieltheorie. Dass Computer durch Lernen darauf kommen, dürfte in der Forschung gleichwohl Eindruck hinterlassen.

Auch in einem zweiten Spiel erlernen die künstlichen Intelligenzen, miteinander zu kooperieren. Dieser Wettstreit besteht aus zwei Wölfen, die eine Beute jagen. Jeder einzelne kann sie erlegen, allerdings unter einem bestimmten drohenden Risiko (Schaden), nämlich sie an den Konkurrenten zu verlieren. Nach wieder Tausenden von Spielgängen zeigte sich, dass die beiden Jäger ihr Verhalten aufeinander abstimmen und lernen, die Beute gemeinsam zu erlegen und dann miteinander zu teilen.

„Zum jetzigen Zeitpunkt betrachten wir die Kooperation zwischen Handelnden als wissenschaftliche Frage“, sagte Deep-Mind-Forscher Leibo gegenüber dem Internetdienst „Wired“. „Längerfristig könnte uns diese Forschung helfen, das Verhalten komplexer Systeme mit vielen Teilnehmern besser zu verstehen und zu kontrollieren wie beispielsweise eine Volkswirtschaft, Verkehr oder Herausforderungen für die Umwelt.“

Quelle: FAZ.NET
Autorenporträt / Armbruster, Alexander (ala.)
Alexander Armbruster
Redakteur in der Wirtschaft.
Twitter
  Zur Startseite
Ähnliche ThemenGoogleBrettspielComputerKünstliche Intelligenz