Datenbasierte Algorithmen

Wie Flüchtlinge und Arbeit optimiert zusammenfinden können

Von Sibylle Anderl
 - 15:57

Der Einsatz datengetriebener Algorithmen hat schon viele gesellschaftliche Bereiche revolutioniert, indem verfügbare Angebote und Kundenbedarf individuell abgeglichen und ausgewertet werden können. Amerikanische Wissenschaftler um Kirk Bansak von der Stanford University haben nun den Versuch unternommen, ein solches algorithmisches Vorgehen auch auf das Problem der Flüchtlingsintegration in den Arbeitsmarkt anzuwenden. In der in dieser Woche im Journal „Science“ veröffentlichten Arbeit ist dabei ihre Ausgangsthese, dass bereits die räumliche Verteilung der Flüchtlinge im Gastland die weitreichendsten Konsequenzen für deren weiteren Erfolg bei der Jobsuche hat.

Dieser Erfolg beruhe auf drei Gruppen von Faktoren: dem geographischen Kontext wie der lokalen ökonomischen Situation, den individuellen Eigenschaften der Flüchtlinge wie deren Sprache und Ausbildung und den Synergien aus beidem. Die Autoren beklagen, dass in der Praxis der geographischen Zuweisung von Flüchtlingen auf diese Faktoren kaum eingegangen werde. Theoretisch existierende Strategien, diese Zuteilung in Hinsicht auf ökonomische Bedürfnisse oder auch Präferenzen auf Seiten der Flüchtlinge und der verschiedenen Standorte zu optimieren, scheiterten laut der Autoren bisher an der praktischen Umsetzung. Gründe seien insbesondere das Fehlen systematisch erhobener Datensätze, die etwas über bestehende Präferenzen aussagen können, und Probleme in der politischen Koordination.

Analyse auf der Grundlage vorliegender Daten

Der Ansatz der Forscher ist daher, ihren Optimierungs-Algorithmus ausschließlich auf Daten basieren zu lassen, die bereits erhoben werden und vorliegen. Dies ermöglicht ihnen, maschinelles Lernen einzusetzen: Die existierenden Daten werden schon in der Entwicklung dafür genutzt, den Algorithmus optimal an die nationalen Gegebenheiten anzupassen und damit dessen Vorhersagekraft zu verbessern, ohne dass dafür erst besondere Studien durchgeführt werden müssten. Der Algorithmus arbeitet dabei in drei Stufen. In einer ersten „Modellierungsphase“ wird der Algorithmus unter menschlicher Anleitung darauf trainiert, auf der Grundlage historischer Daten ein Modell zu erstellen, das für alle verfügbaren Ansiedlungsorte Vorhersagen in Hinsicht auf den Erfolg bei der Jobsuche eines Flüchtlings oder auch einer Untergruppe von Flüchtlingen mit bestimmten Merkmalen machen kann.

Dieses Modell kann daraufhin auf neue Daten angewendet werden: Wenn ein Datenset mit den spezifischen Merkmalen eines neu angekommenen Flüchtlings eingespeist wird, kann das Modell vorhersagen, an welchen Standorten welcher Erfolg bei der Suche nach Arbeit zu erwarten ist. Schließlich wird das Modell in einem letzten Schritt so transformiert, dass es nicht nur Aussagen über den Erfolg einzelner Flüchtlinge machen kann, sondern auch zu berücksichtige vermag, dass die Flüchtlingszuweisung oft in Gruppen, beispielsweise als Familie, geschieht. In der Studie sollte der Algorithmus in diesem Fall sicherstellen, dass zumindest ein Familienmitglied mit hoher Wahrscheinlichkeit eine Beschäftigung findet. Der eigentliche Zuteilungsschritt finden schließlich so statt, dass flexibel Zusatzkriterien definiert werden können, die die Verteilung erfüllen soll. Eine naheliegende zusätzliche Randbedingung wäre beispielsweise, wie viele Familien jeweils an verschiedene Standorte vermittelt werden können.

Flüchtlinge in den Vereinigten Staaten

Die Wissenschaftler testeten ihren Algorithmus am Beispiel der Vereinigten Staaten und der Schweiz. Bei ersteren wird die Entscheidung über die Verteilung der Flüchtlinge bislang von neun ehrenamtlichen Agenturen auf der Grundlage der jeweiligen lokalen Kapazitätsbeschränkungen getroffen noch bevor die Flüchtlinge angekommen sind und selbst befragt werden können. Die allgemeinen Merkmale der Flüchtlinge wie Geschlecht, Alter, Sprachkenntnisse, Bildungsniveau und Nationalität liegen allerdings zu diesem Zeitpunkt bereits vor und können insofern für eine algorithmische Auswertung genutzt werden. Die Agenturen sind verpflichtet, 90 Tage nach der Ankunft den Beschäftigungsstatus der Flüchtlinge zu melden – diese Daten, im konkreten Testfall aufgenommen in einem Zeitraum von 2011 bis zum Sommer 2016, flossen in das Training des Algorithmus ein.

Mit dem so trainierten Algorithmus konnte daraufhin eine optimale Verteilung für Flüchtlinge des dritten Quartals 2016 berechnet und mit den tatsächlichen Daten dieses Quartals verglichen werden. Die Wissenschaftler berichten, dass die mittlere Wahrscheinlichkeit eine Beschäftigung für Flüchtlinge unter Verwendung des Algorithmus von 25 auf 50 Prozent gesteigert werden konnte. Die durchschnittliche Beschäftigungsrate an den berücksichtigten Standorten konnte so von 34 Prozent unter der tatsächlichen Verteilung auf 48 Prozent mit der optimierten Verteilung gesteigert werden.

Erfolge auch im Schweizer Modell

Als zweites Testland wurde die Schweiz betrachtet, wo Flüchtlinge zunächst an einen der 26 Kantone verwiesen werden um dort auf eine weitere Entscheidung in Hinsicht auf ihren Asylantrag zu warten. Die Wissenschaftler betrachteten Flüchtlinge mit subsidiärem Schutzstatus, die die Mehrheit der Flüchtlinge in der Schweiz ausmachen. Die Zuteilung der Flüchtlinge an verschiedene Orte geschieht in der Schweiz gemäß einer proportionalen Zufallsverteilung, deren Beschäftigungsstatus wird daraufhin mehrere Jahre lang aufgezeichnet. In diesem Fall wurden Daten von rund 22000 Flüchtlingen für das Training des Algorithmus genutzt, die zwischen 1999 und 2012 in der Schweiz angekommen waren. Daten von 2013 wurden dann verwendet, um den Algorithmus in Hinsicht auf das vorhergesagte Beschäftigungsverhältnis drei Jahre nach der Ankunft zu testen. Auch hier schnitt die algorithmisch optimierte Zuteilung deutlich besser ab: Die Beschäftigung im dritten Jahr konnte um 73 Prozent gesteigert werden.

Die Forscher führten für beide Länder weitere Testläufe mit modifizierten Randbedingungen durch, in denen die optimierte Methode unverändert besser abschnitt als die aktuell praktizierten Verteilungsstrategien. Die Notwendigkeit weiterer Test räumen sie allerdings selbst ein - insbesondere der Versuch einer wirklichen Vorhersage über vorliegende Daten hinaus wäre eine wichtige Probe für den vorgestellten Algorithmus. Gleichzeitig betonen sie als Stärken ihres Ansatzes dessen Kosteneffizienz, da er ausschließlich auf bereits existierenden Daten und Organisationsstrukturen aufbaut, sowie dessen Flexibilität in Hinsicht auf politisch präferierte Randbedingungen, die im letzten „Matching“-Schritt als Randbedingungen in den Algorithmus integriert werden können.

Ob der Algorithmus aber tatsächlich den Praxistest bestehen kann und auch in Ländern wie Deutschland Einsatz finden könnte, hängt noch von weiteren Unsicherheiten ab. Nicht nur, dass die Methode mit der Qualität der Daten und damit dem Vorliegen korrekter Angaben steht und fällt, auch eigenmächtige Ortswechsel der Flüchtlinge weg von ihrem zugewiesenen Wohnort könnten dem Erfolg letztendlich doch im Wege stehen. Die zugrundeliegende Idee scheint davon unabhängig aber durchaus einleuchtend zu sein. Auf weitergehende Tests in der Praxis ist insofern zu hoffen.

Quelle: FAZ.NET
Sibylle Anderl
Redakteurin im Feuilleton.
Twitter
  Zur Startseite
Ähnliche ThemenFlüchtlingeSchweizStanford