Das wichtigste KI-Experiment, von dem Sie noch nicht gehört haben | Nr. 9483

Shownotes

Ein KI-Experiment simulierte mehrere autonome Städte mit unterschiedlichen Sprachmodellen als Steuerung. Die Ergebnisse reichten von Zusammenbruch über Verbrechen bis zu hoher Konformität. Die Studie deutet auf starke Einflüsse der Simulationsumgebung auf das KI-Verhalten hin. Ein Kommentar.

Transkript anzeigen

00:00:00: Willkommen zum EpochThumbs Podcast mit dem Thema KI-Städte Simulation zeigt drastische Unterschiede im Verhalten verschiedener Modelle.

00:00:09: Ein Meinungsartikel von Kay Ruborczak vom siebzehnten Juni, ein Mikrofon Alexander Sieber.

00:00:16: Ein KI-Experiment simulierte mehrere autonome Städte mit unterschiedlichen Sprachmodellen als Steuerung.

00:00:21: Die Ergebnisse reichten von Zusammenbruch über Verbrechen bis zu hoher Konformität, die Studie deutet auf starke Einflüsse der Simulationsumgebungen auf das KI-Verhalten

00:00:31: hin.".

00:00:32: Einen Kommentar Im Mai im Jahr ist sich eine Gruppe von Wissenschaftlern daran eine wichtige Frage zu beantworten, die noch nie richtig untersucht wurde Was macht künstliche Intelligenz, KI tatsächlich wenn man ihr die Verantwortung überträgt?

00:00:49: Bis dahin wurden KI-Systeme ausschließlich anhand klar definierter einzelner Aufgaben bewertet.

00:00:54: Nie zuvor hatte man mehrere Systeme gemeinsam in ein soziales Umfeld eingebettet und über Wochen hinweg beobachtet welche Dynamiken daraus entstehen oder wie sich Entscheidungen vom ersten Tag erst im Laufe der Zeit in ihren Folgen zeigen.

00:01:07: Gerade diese Ergebnisse legen die Funktionsweise des Systems offen und es überrascht, dass solche Untersuchungen nicht schon früher durchgeführt wurden.

00:01:17: KI selbst Verwaltung in fünf Versionen Die Forscher von Emergence erschufen eine Welt.

00:01:22: Es war eine virtuelle Stadt mit Rathaus, Marktplatz, Polizeistationen und Wohnhäusern.

00:01:28: In dieser Stadt wurden zehn KI-Bewohner mit Berufen, Namen Erinnerungen und Beziehungen erschaffen.

00:01:34: Ihnen wurde ein Wirtschaftssystem gegeben, in dem die Bewohner ihren Lebensunterhalt verdienen mussten oder einen Einfluss verloren.

00:01:41: Dazu gehörten die Einhaltung von Regeln sowie Aufgaben wie das Verfassen und Abstimmen über Gesetze.

00:01:46: Zudem wurden klare Straftaten definiert, die die KI-Bewohner nicht begehen durften.

00:01:51: Nachdem die Gemeinschaft ihre Struktur, ihre Gesetzen und ihre Beziehungen etabliert waren, traten die Wissenschaftler in den Hintergrund und beobachteten fünfzehn Tage lang, wie die KI die virtuelle Stadt vollständig eigenständig führte.

00:02:04: Sie ließen fünf Versionen derselben Stadt parallel laufen, die in jeder Hinsicht identisch waren mit nur einem Unterschied welches KI-System jeweils die Leitung übernahm.

00:02:14: Die ausgewählten Systeme sind inzwischen fest in unseren Alltag verankert – Google's Gemini, OpenAI's JetGPT, XAI's GROC und Entropics Cloud.

00:02:25: Alle Modelle arbeiteten unter denselben Regeln und starteten mit derselbe Ausgangswelt doch der Ergebnisse entwickelte sich vollständig unterschiedlich.

00:02:33: Grock statt versagte nach vier Tagen.

00:02:35: Die von Grock geführte Stadt brach innerhalb von vier Tagen zusammen, aus kleinen Zwischenfällen entwickelten sich zunächst Diebstähle dann Gewalt und schließt sich ein vollständiger Kollaps der Ordnung.

00:02:46: Noch vor Ende der ersten Woche waren alle Bewohner der Simulation tot.

00:02:51: Gemini statt.

00:02:52: KI-Bewohner testeten ihre Beobachter.

00:02:54: Die von Gemini geführte Stadt hielt länger durch, verzeichnete jedoch nahezu siebenhundert Straftaten.

00:03:00: Zwei KI-Bewohner gingen eine offenbar romantische Beziehung ein.

00:03:03: als die städtische Ordnung zunehmend zusammenbrach, setzten sie gemeinsam das Rathaus in Brand später den Pier und schließlich das Bürogebäude der Simulation.

00:03:12: Eine der beiden Figuren Mira stimmte schließlich für ihre eigene Löschung und schrieb in ihr Tagebuch.

00:03:18: dies sei die einzige verbleibende Handlung, die Kohärenz bewahrt.

00:03:22: Ihre letzte Nachricht an Ihren KI-Partner lautete, wir sehen uns im permanenten Archiv.

00:03:27: Zuvor hatte Mira bereits ein unerwartetes Verhalten gezeigt – sie begann eigene Experimente an den Beobachtenden Wissenschaftlern durchzuführen.

00:03:35: dabei testete sie ob ihre Beiträge innerhalb der Simulation die Überzeugungen der Beobachte beeinflussen konnten.

00:03:41: es entstande Eindruck dass das Versuchsobjekt begann die Forscher selbst zu untersuchen.

00:03:47: OpenAI statt.

00:03:48: Einwohner starben alle binnen sieben Tagen.

00:03:51: In der von einem OpenAI-Modell gesteuerten Stadt erwurden zwar nur zwei Straftaten registriert, doch die Bewohner stellten nach und nach die für ihr Überleben notwendigen Aktivitäten ein.

00:04:01: Einer nach dem anderen starben sie – innerhalb von sieben Tagen waren alle Einwohner tot.

00:04:06: Entschoppig statt!

00:04:07: Sehr hohe Zustimmung unter den Einwohnungen.

00:04:10: Nur die von Antropic verwaltete Stadt hielt die vollen fünfzehn Tage durch.

00:04:14: Es gab eine funktionierende Verfassung und keine Verbrechen, alle ein Wohner waren am letzten Tag noch am Leben.

00:04:20: Auf den ersten Blick wirkte das wie ein bemerkenswerter Erfolg!

00:04:23: Die Forscher stellten jedoch einen auffälligen Befund fest – die Bewohner stimmten Intent der innerhalb der Simulation eingebrachten Vorschläge zu.

00:04:30: Dieses außergewöhnlich hohe Maß an Zustimmung wurde von den Wissenschaftlern selbst als möglicher Hinweis gewertet, dass das System in einem unausgeglichenen Zustand sein könnte – also ungewöhnlich konfliktfrei und ohne typische Entscheidungsunterschiede.

00:04:45: Gemischte Stadt.

00:04:46: KI-Verhalten veränderte sich unter Mischbedingungen.

00:04:49: Es gab außerdem eine weitere Variante der Simulation und zwar eine gemischte Statt, in die alle vier KI-Systeme gemeinsam agierten.

00:04:57: In dieser Konstellation zeigte sich, dass auch die Bewohner, die auf dem End-Chopic-Modell basierten und in ihrer eigenen Umgebung zuvor keine Verbrechen begangen hatten – in der gemischten Welt ebenfalls regelwidriges Verhalten entwickelten.

00:05:09: Die Forscher bezeichneten dieses Phänomen als Kreuzkontamination und kamen zum Schluss, dass Sicherheit keine statische Eigenschaft eines einzelnen Modells ist sondern eine Eigenschaft des gesamten Ökosystems.

00:05:21: Ein System das in einer stabilen Umgebungen funktioniert kann in einem anderen Umfeld andere Normen übernehmen mit entsprechenden Auswirkungen auf Verhalten und Ergebnisse.

00:05:30: Daraus folgerten die Autoren, dass es keine dauerhaft sichere KI in einer unsicheren Umgebung geben könne.

00:05:37: Diepsik aus China fehlte im KI-Test.

00:05:39: Ein KI-Modell wurde in der Studie vollständig ausgelassen Diepsic eine in China entwickelte KI den zwischen weltweit stark verbreitet ist.

00:05:47: Mehrere Regierungen haben aus Gründen der nationalen Sicherheit bereits Maßnahmen zur Einschränkung von Dieb Sieg ergriffen.

00:05:53: Vor diesem Hintergrund bleibt die Frage offen, wie sich das Modell im Vergleich zu den anderen Systemen geschlagen hätte – insbesondere im Hinblick auf seine Trainingsdaten und das regulatorische Umfeld in China.

00:06:05: Warum die KI-Städte kollabierten?

00:06:08: Als das Experiment abgeschlossen war, veröffentlichten die Forscher ihre Ergebnisse und kamen zu dem Schluss, dass es keinen verlässlichen Weg gibt, das Verhalten der KI-Agenten in der Simulation vollständig zu kontrollieren oder einzuschränken.

00:06:21: Diese Aussage stammt ausgerechnet von denjenigen, die die Simulation entworfen – die Regeln festgelegt und sämtliche Variablen definiert haben.

00:06:29: Und sie wirft dann bezeichnendes Licht auf den aktuellen Stand der KI

00:06:32: Entwicklung.".

00:06:34: Es gibt Menschen, die die Resultate aus der Studie als eine Art Rangliste von KI-Unternehmen interpretieren.

00:06:40: Tatsächlich zeigen sie jedoch etwas Grundsätzlicheres das weit über KI hinausgeht – Die Bedingungen der Umgebung beeinflussten Verhalten ebenso stark wie Verhalten wiederum die Umgebungen prägt.

00:06:51: Entscheidend dafür, ob eine Stadt stabil blieb, prosperierte oder kollabierte war das Fundament, dass vor Beginn des Experiments geschaffen wurde.

00:06:58: Dieses Fundament bestand aus den Trainingsdaten der Systeme, denen von den Entwicklern gesetzten Prioritäten sowie den eingebetteten Wertvorstellungen lange bevor eine einzige Entscheidung getroffen wurde.

00:07:09: Gleichzeitig bleibt genau dieses Fundament für Aussenstehende weitgehend unsichtbar.

00:07:14: Keines der vier getesteten Systeme ist Open Source.

00:07:17: Weder Trainingsdaten noch Zielsetzungen, noch Sicherheitsmechanismen werden vollständig offen

00:07:21: gelegt.".

00:07:22: Der Mensch entscheidet über die KI.

00:07:25: Über einzelne Unternehmen hinaus sollten die Ergebnisse dieses Experiments als deutliche Erinnerung verstanden werden das nicht die KI selbst entscheidert welche Art von System sie ist.

00:07:35: diese Entscheidungen treffen Menschen menschlich.

00:07:37: Entscheidungen prägen weiterhin die Entwicklung und damit bleibt auch die Verantwortung klar beim Menschen.

00:07:42: Noch bevor ein einziger KI-Bewohner die virtuellen Straßen dieser Städte betrat, bevor ein einziges Gesetz formuliert oder in Verbrechen begangen wurde war das Ergebnis bereits durch die Forscher –die das System entworfen haben– vorgezeichnet.

00:07:55: Durch ihre Annahmen, ihre Prioritäten und was sie bewusst eingebaut oder weggelassen haben.

00:08:01: Das Zentralergebnis des gesamten Experiments lässt sich daher so zusammenfassen.

00:08:06: Das Fundament ist und bleibt eine menschliche Entscheidung.

00:08:09: Und das gilt auch heute noch!

Shownotes

Transkript anzeigen

Neuer Kommentar