Die Evolution der Kooperation

(nach Robert Axelrod)

Inhalt

Definition des Problems

Alle Situationen, in denen sich 2 Spieler (Partner oder Gegenspieler) für oder gegen Kooperation entscheiden können, lassen sich in eine der folgenden 3 Kategorien einordnen:

Das sog. Gefangenendilemma besteht nur, wenn die Gewinne und Verluste jedes Spielers unabhängig von denen des anderen und in beliebigen Maßstäben gemessen in der Reihenfolge T>R>P>S liegen und wenn T+S<2*R gilt. Dabei ist

Axelrod untersucht im Einzelnen, unter welchen Umständen im Gefangenendilemma Kooperationen zustande kommen, wenn Absprachen, Versprechungen und Drohungen egoistischer Spieler entweder nicht mit Hilfe einer übergeordneten Instanz durchgesetzt werden können oder bereits in den Gewinnfestsetzungen berücksichtigt sind. Wesentlich für die Wahl der aussichtsreichsten Spielstrategien oder Entscheidungsregeln ist dabei, ob die Spieler nur einmal zusammentreffen oder immer wieder Gelegenheit zur Kooperation haben. Zukünftige Gewinnerwartungen werden dabei von mal zu mal durch einen Diskontparameter 0<w<1 abgewertet, der die Wichtigkeit der Zukunft widerspiegelt. Die erzielbaren Gewinne werden dadurch von mal zu mal um den Faktor w kleiner bewertet.

Aus den Untersuchungen ergeben sich Regeln für die Auswahl aussichtsreicher Strategien in Abhängigkeit von den vorliegenden Parametern oder auch Empfehlungen für die Vorgabe geeigneter Parameter, wenn man spontane Kooperation begünstigen oder verhindern will.

Theoreme und Auswahlregeln für Strategien

Axelrod veranstaltete Computerturniere mit zahlreichen, voneinander unabhängigen, von verschiedenen Experten der Spieltheorie ausgearbeiteten Spielprogrammen, die sich jeweils bemühten, aussichtsreiche Spielstrategien zum Einsatz zu bringen. Es spielten in den Turnieren jeweils 2 Strategien eine größere Anzahl von Runden gegeneinander und erzielten aufsummierte Gewinne. Aus der Analyse dieser Turniere ergaben sich Theoreme, die anschließend auch theoretisch bewiesen werden und auf andere Probleme angewandt werden konnten.

Theorem 1:

Wenn der Diskontparameter w hinreichend groß ist, existiert keine beste Strategie unabhängig von der Strategie des anderen Spielers, und zwar immer dann, wenn w > (T-R)/(T-P).

Theorem 2:

TITFORTAT ist genau dann kollektiv stabil, wenn w >= (T-R)/(T-P) und w >= (T-R)/(R-S).

TITFORTAT ist nicht immer die beste, aber eine erfolgreiche Strategie, die stets im ersten Zug kooperiert und in den weiteren Zügen immer genau so reagiert, wie der andere Spieler im vorhergehenden Zug. Kollektiv stabil bedeutet, dass jede beliebige andere Strategie keinen höheren Gewinn bringt als TITFORTAT, wenn der andere Spieler immer TITFORTAT spielt.

Theorem 3:

Eine beliebige Strategie B, die als erste kooperiert, kann nur dann kollektiv stabil sein, wenn

w >= (T-R)/(T-P) ist.

Theorem 4:

Eine freundliche Strategie kann nur dann kollektiv stabil sein, wenn sie durch die erste Defektion des anderen Spielers ebenfalls zur Defektion provoziert wird. Freundlich ist eine Strategie, die im ersten Zug immer kooperiert.

Theorem 5:

Die Strategie IMMERD ist kollektiv stabil, sofern nicht mehrere Spieler gleichzeitig zu einer anderen Strategie übergehen. Bei der Strategie IMMERD defektiert der Spieler in jedem Zug unabhängig von der Strategie des anderen Spielers.

Theorem 6:

Die Strategien, die in IMMERD als Gruppe mit dem kleinsten Anteil p eindringen können, sind solche, die maximal zwischen sich selbst und IMMERD unterscheiden, wie z.B. TITFORTAT.

Theorem 7:

Wenn ein einzelnes Individuum nicht mit einer anderen Strategie in eine freundliche Strategie eindringen kann, dann kann auch keine Gruppe damit eindringen.

Theorem 8:

Wenn eine Strategie kollektiv stabil ist, dann ist sie auch territorial stabil. Territorial bedeutet, dass Kooperation nur zwischen Nachbarn stattfinden kann.

Evolution der Kooperationsstrategien

Unter der Voraussetzung, dass jeweils die Strategien mit den niedrigsten Gesamtgewinnen aus den weiteren Wettbewerben ausscheiden, beobachtet man eine zeitliche Entwicklung der Strategietypen. In Übereinstimmung mit den Theoremen scheiden zunächst die böswilligen wie IMMERD und ähnliche aus, die immer wieder versuchen, die anderen Partner auszubeuten und selten Kooperation anbieten. Alle freundlichen Strategien, die im ersten Zug Kooperation anbieten, erzielen zunächst gute Gewinne und sind in der Lage, in die böswilligen einzudringen, was umgekehrt nicht der Fall ist. Am Ende bleibt das freundliche Programm TITFORTAT übrig, das zwar nicht gegen alle böswilligen einzeln gute Gewinne bringt, am Ende aber übrig bleibt, weil die böswilligsten frühzeitig von den übrigen ausgemerzt werden.

Als generelle Schlußfolgerung bleibt übrig, dass Kooperation sich selbstorganisatorisch entwickelt, wenn die Bedingungen des iterierten Gefangenendilemmas vorliegen und das Gewicht der Zukunft der Kooperation hinreichend groß ist. Selbst wenn am Anfang die Strategie des IMMERD vorherrscht, entwickelt sich die Strategie des TITFORTAT und verdrängt IMMERD, vorausgesetzt, es sind auch zu Beginn wenigstens einige freundliche Strategien überhaupt vorhanden. Wie bei jeder echten Evolution ist diese Entwicklung irreversibel. Der Erfolg von TITFORTAT beruht darauf, daß es leicht durchschaubar ist und Kooperation hervorlockt, nicht darauf das es andere Strategien besiegt. Selbst kann es im Grunde nur dadurch besiegt werden, dass der Gegenspieler in einem Zuge einen so vernichtenden Schlag ausführt, dass die Kooperation durch Kampfunfähigkeit, Bankrott oder Tod abrupt endet.

Anwendungsbeispiele

Vorausgesetzt es liegen die Bedingungen des Gefangenendilemmas vor, so entwickelt sich Kooperation auf allen Gebieten, wo sich die Partner gegenseitig kennenlernen und langfristig kooperieren können, unabhängig davon, ob die zeitliche Kopplung durch Voraussicht oder genetisch, rational oder emotional erfolgt. Selbst Feinde können kooperieren, ohne ihre prinzipielle Feindschaft aufzugeben. Axelrod untersuchte folgende Beispiele:

Vorschläge zur Förderung von Kooperation

Sozialstruktur der Kooperation

Etikettierung: durch die Annahme äußerlicher Merkmale innerhalb einer Gruppe wird die Kooperation zwischen Mitgliedern der eigenen Gruppe erleichtert und zwischen Mitgliedern unterschiedlicher Gruppen erschwert. Kleinere Gruppen werden dadurch gegenüber größeren Gruppen benachteiligt. Das gleiche gilt für in der sozialen Hierarchie niedriger eingeordnete Gruppen.

Reputation ist der Versuch, dem Gegenspieler im Voraus das Verfolgen einer bestimmten Strategie zu vermitteln. Wegen vieler möglicher Arten darauf zu reagieren ist der Erfolg meist nur gering.

Regierungen können durch Sanktionen die Kooperationsbereitschaft der Regierten erhöhen.

Territoriale und Nachbarschaftsbeziehungen führen dazu, dass sich Strategien in einzelnen Bereichen schnell ausbreiten und bereichsweise unterschiedlich stabilisieren, ohne dass die grundlegenden Theoreme sich verändern.

Schlußfolgerungen für die Gestaltung sozialer Beziehungen

In einem Nachwort untersuchen die deutschen Übersetzer des Buches in einer strategischen Analyse problematischer Situationen die Frage, ob die aus zweiseitigen Kooperationen abgeleiteten Theoreme als Spezialfälle einer mehrseitigen Kooperation betrachtet werden können. Es gelingt ihnen zu nachzuweisen, dass die Grundaussagen der Theoreme auch für eine mehrseitige Kooperation gültig bleiben, wenn die Grundbegriffe und Grundparameter dem mehrseitigen Problem angemessen neu definiert werden.

Demzufolge fördern folgende Bedingungen in problematischen Situationen, die dem Gefangenendilemma entsprechen, die selbstorganisatorische Kooperation:

Die TITFORTAT analoge Strategie für mehrere Spieler lautet dann:

Kooperation im ersten Zug, in den weiteren Zügen Kooperation, wenn alle im vorangegangen Zug kooperiert haben, sobald jedoch wenigstens einer defektiert hat, im nächsten Zug ebenfals Defektion.

Diese Strategie verfügt über einen kollektiven Sanktionsmechanismus, der bewirkt, dass bei Verhandlungs- und Koordinationsbereitschaft ihr Umkippen in die für alle ungünstigere Strategie IMMERD durch einen unkooperativen Partner verhindert werden kann.

Diese Strategie ist im gleichen Sinne kollektiv stabil wie im zweiseitigen Problem. Entscheidend ist das Gewicht der Zukunft w. Ist w zu klein, so wird IMMERD die kollektiv stabile Strategie.

[weiterlesen]