Warum der Roboter nur scheinbar tut was wir von ihm wollen

Einer künstlichen Intelligenz (KI) beizubringen was man möchte ist schwierig. Der Fachmann spricht vom „Alignment Problem“. Das Problem hängt im Grunde damit zusammen dass Maschinen genau das tun was man ihnen aufträgt und dabei Dinge ignorieren an die wir nicht Mal denken.

Trägt man dem KI-Roboter auf eine Tasse Tee zu bringen dann überfährt er Menschen am Weg dorthin, wenn man ihm nicht sagt dass er das nicht tun soll.

Sagt man es ihm fährt er durch die Wand und wenn man ihn versucht abzuschalten dann versucht er das zu verhindern weil er sonst ja keinen Tee bringen könnte und wenn man ihm einprogrammiert, dass es ihm egal sein soll ob er angeschaltet oder abgeschalten ist, dann dreht er sich selber ab weil er so einen stabilen Zustand schneller erreicht.

Schenk uns bitte ein Like auf Facebook! #meinungsfreiheit #pressefreiheit

Danke!

In anderen Worten: eine KI dazu zu bringen das zu tun was man möchte das sie tut ist bei weitem nicht so einfach wie einem Menschen zu sagen was er tun soll.

Und hier endet das Problem nicht, hier beginnt es erst so wirklich. Selbst wenn die Entwickler lernen ihre Ziele eindeutig und unmissverständlich zu kommunizieren, können interne Mechanismen dazu führen dass diese Ziele verändert werden können. Vor wenigen Jahren war dieses Problem noch hochspekulativ, wurde aber kürzlich in einem Paper von Jack Koch und Lauro Langosco beleuchtet.

Im Wesentlichen wurde eine eher schwache KI trainiert und meisterte nach akzeptierten Metriken die Tests. Die KI tat was man von ihr erwartete. Dann veränderte man minimale Parameter und lernte dass die KI sich eben nicht so verhielt wie man es erwartete sondern wie man es befürchtet hatte: es lernte die falschen Dinge und verhielt sich dann entsprechend. Das Problem wurde natürlich provoziert, man änderte etwa die Farben des Zielmarkers und so weiter, es beweist aber die Bedanken die Forscher im Bezug auf solche KIs haben: sie haben die Neigung etwas scheinbar korrekt zu lernen, tun dann aber etwas das wir nicht im Ansatz wollen, weil das Training eben nicht die reale Welt ist.

Das Problem an der Sache ist dass es Tests besteht und so scheint als wäre seine Zielsetzung deckungsgleich mit unserer eigenen, nur um sich dann als völlig anders herauszustellen.

Das ist übel. Das gute an der Sache ist dass die Forscher auch an Lösungen gearbeitet haben. Im Wesentlichen entwickelten sie Werkzeuge um „in die KI“ zu sehen. Während die KI also tat was sie tat konnte man sehen „auf was sie sich konzentrierte“ und „warum“. Das hilft zu verstehen warum sie tut was sie tut und hilft uns zu erkennen wann sie etwas Falsches gelernt hat. Das ist ein gewaltiger Sprung.

robert miles https://www.youtube.com/watch?v=zkbPdEHEyEI

Gute Nachrichten? Nicht wirklich.

In den entsprechenden Testprogrammen erschien es oftmals nur so als ob die KI „verstanden“ hat was wir wollten, tatsächlich handelt es sich aber um eine Fehlinterpretation auf Seiten des Menschen. So wurde eine KI etwa darauf trainiert eine Münze am Ende des Levels aufzuheben. Die Münze erschien beim „in die KI schauen“ dann auch als positives Ziel. Tatsächlich lernte die KI aber nur ans Ende des Levels zu gehen, sie lernte aber in Wirklichkeit nie dass die Münze einen wert hätte, nur der Ort an dem sie lag war für sie wichtig.

Verschob man dann im Anwendungsbeispiel die Münze irgendwo anders hin leuchtete nicht mehr die Münze als Ziel auf sondern eben das Ende des Levels, die KI hatte etwas falsches gelernt obwohl sie im Test bestanden hat und auch das „in sie hineinsehen“ bestätigt hat dass sie tut was sie tun soll.

Es gilt dabei zu verstehen warum das so ein gigantisches Problem ist. In der frühen Zeit der KI Programmierung beschäftigten sich die Forscher damit die KIs kompetent zu machen, sie beschäftigten sich quasi damit Super Mario dazu zu bringen das Level zu schaffen. Diesen Teil haben sie nun ausgesprochen gut im Griff: die KIs lernen in atemberaubender Geschwindigkeit und erreichen rasch eine Kompetenz die größer ist als die der Menschen die sie programmiert haben. Die KI spielt Super Mario besser als ihr Schöpfer, sie ist kompetenter als er und kann die Dinge die sie haben will damit schneller erreichen als ihr Schöpfer. Jetzt geht es darum dafür zu sorgen dass dieses Ding, dass kompetenter ist als der kompetenteste Mensch und daher alles, in diesem Kompetenzfeld, rascher erreichen kann als ein Mensch, auch tut was wir von ihm erwarten.

Das Problem ist deswegen so gigantisch weil diese superkompetenten Maschinen jedem der sie verwendet einen Vorteil verschafft. Börse, Produktion und Militär warten gierig darauf diese Dinge einzusetzen und wenn man etwas aus der Geschichte der Technologie lernt dann dass wir Geräte nutzen wenn sie da sind, nicht erst wenn wir sie wirklich unter Kontrolle haben.

Das Alles ist genau deswegen bedeutend. Eine ganze Armee von Menschen wartet nur darauf KIs auf die Welt loszulassen und es gilt zu vermuten dass diese Dinge, wenigstens zum Teil, nicht das tun werden was sie tun sollen, gleichzeitig aber kompetent genug sind ihr Ziel zu erreichen und zu dieser Kompetenz gehört das was sie tun nicht zu unterbrechen nur weil wir panisch auf den Notaus Knopf hämmern.

Das Problem mit KIs ist nicht dass sie wie Menschen nach Macht und Reichtum streben, das Problem ist vielmehr dass sie Ziele haben die uns im Traum nicht einfallen würden und über Leichen gehen um diese völlig abstrusen Ziele zu erreichen und eben entsprechend kompetent sind um ihr Ziel zu erreichen.

Dieser Themenkomplex ist bedeutender als wer gerade Kanzler ist, welche Ideologie besser ist oder wer wem mit Krieg droht. Die KI ist gleichzeitig das potentiell wichtigste Werkzeug des Menschen seit der Entwicklung des Faustkeils, gleichzeitig aber auch eine erhebliche Bedrohung, nicht weil das Ding „böse“ ist sondern weil wir noch nicht gelernt haben einer Entität, die kein Mensch ist, unmissverständliche Anweisungen zu geben. Die Ironie an der Sache ist dass der nächste Schritt im Umgang mit der KI also eine Verbesserung auf unserer Seite voraussetzt.

Nur wenn wir lernen wie wir intuitive Dinge wie „Moral“ in klar definierten, unmissverständlichen, eindeutigen Code zu verwandeln, können wir in der KI Forschung den nächsten Schritt gehen.

Tun wir das nicht, sondern lassen wir einfach nur hoch kompetente, völlig unmoralische Maschinen auf die Welt los, ist das Resultat vermutlich hochgradig desaströs und genau das wird auch passieren wenn wir uns weigern mit diesen Dingen zu beschäftigen, weil sie uns eben nicht so verständlich sind wie Minister und Generäle.

Ich mag doch keine Fische vergeben

Meine Bewertung zurückziehen

Du hast None Fische vergeben

6 von 6 Fischen

bewertete diesen Eintrag

Benni bewertete diesen Eintrag 14.10.2021 11:16:51

Kai-Uwe Lensky bewertete diesen Eintrag 12.10.2021 18:15:35

1 Kommentare

Mehr von Angus

Thema des Tages

Thema des Tages: Ignazio Silone und die Wiederkehr des Faschismus
#Politik
#IgnazioSilone
#Faschismus
#Meinungsfreiheit

Manfred Breitenberger

Der Sozialist François Bondy schrieb über die deutschen Vernichtungslager in Polen und der Sozialist Ignazio Silone über den Aufstieg Mussolinis, beide arbeiteten aus dem Exil gegen den italienischen Faschismus und den deutschen Nationalsozialismus. Silone war der Leiter des Auslandsbüros der … weiterlesen

mehr „Themen des Tages“

Top-Blogbeiträge

Ein in sich abgeschlossenes System, ein Schutzraum in dem sich Leben entwickelt. Perfekt geplant und nur solange von Dauer bis das Leben bereit ist … weiterlesen

Wen die aktuellen Lockerungsübungen zwischen der Union und der AfD nicht beunruhigen, der sollte mal einen Blick auf die USA werfen. Das ist die … weiterlesen

Wenn du wissen willst, wie die deutsche Sprache richtig geht, frag ʼnen Ausländer! Denn Migrant:innen, die wirklich daran interessiert sind … weiterlesen

mehr „Top-Blogbeiträge“

Neue Beiträge

Schon mal reingeschaut auf TIK TOK? Der Islam-die muslimische Welt verfolgt auf TIK TOK einen Plan, vor allem in Europa. Der Islam soll die einzige … weiterlesen

Ein schönes Eigentor der AfD im Saarland: Die AfD-Landtagsfraktion im Saarland hat in einer kleinen Anfrage an die Landesregierung ein Ranking der … weiterlesen

## **Kapitel 3: Schattenarchive – Von verlorenen Worten und verborgener Regierung** Es gibt Worte, die einst gesprochen wurden – in Ritualen, in … weiterlesen

Macht euch auf Verbote, Zensur und Willkür gefasst, sobald die AfD an die Macht kommt. Wer Andersdenkende verbieten und queere Menschen unsichtbar … weiterlesen

Wenn Menschen Dinge kritisieren, dann können sie grundsätzlich einen von zwei Wegen gehen: sie vergleichen das Ding mit einem anderen Ding oder sie … weiterlesen

Viele muslimische Zuwanderer lehnen die kollektivistischen islamischen Gesellschaften, aus denen sie stammen, zwar ausdrücklich ab. Es sind jedoch … weiterlesen

Einen Tag nach dem 65. Geburtstag des ehemaligen deutschen Nationalspielers beschloss das ungarische Parlament eine Verfassungsänderung, mit der … weiterlesen

Nun ist er endlich kommen doch in grünem Knospenschuh. "Er kam, er kam ja immer noch", die Bäume nicken sich′ s zu. Sie konnten ihn all erwarten … weiterlesen

Marketagent hat „aus aktuellem Anlass“, die Frage beantwortet: „Und was, wenn es Ostern plötzlich nicht mehr gäbe? Für den Großteil der … weiterlesen

Menschen trösten einander. Wenn der Vater eines Freundes im Sterben liegt, sagen wir ihm nicht, dass er sich damit abfinden muss, dass sein Vater … weiterlesen

mehr „Neue Beiträge“

Was hier passiert

hat den Blogbeitrag kommentiert.

hat einen neuen Beitrag gepostet.

%sweiterlesen

ist neu auf fisch+fleisch. Willkommen!

Das Beste der letzten 7 Tage

meistdiskutiert

thomas schweighäuser (ex Gotha)
Jetzt machen sie Jagd auf Kinder

153 neue Kommentare in den letzten 7 Tagen
wunderbarerEsel
Wenn Krankheit zum Vorwurf wird: Die gefährliche Logik der Rechten

94 neue Kommentare in den letzten 7 Tagen
Don Quijote
Das dramatische Verhängnis des noch immer etablierten Obrigkeitsstaates

87 neue Kommentare in den letzten 7 Tagen

aktivste Bloggende

Kvasir

6 neue Blogbeiträge in den letzten 7 Tagen
Bachatero

4 neue Blogbeiträge in den letzten 7 Tagen
Angus

3 neue Blogbeiträge in den letzten 7 Tagen

beliebteste Kommentatoren

trognon de pomme

184 likes in den letzten 7 Tagen
Aron Sperber

172 likes in den letzten 7 Tagen
Tourix

154 likes in den letzten 7 Tagen

mehr „Das Beste“

#jetztich

Wer heute noch gegen das Gendersternchen wettert, stellt sich nicht nur gegen die gesellschaftliche Entwicklung, sondern auch offen gegen die … weiterlesen

Vor einem Supermarkt in Sachsen sind zwei Menschen bei einem Messerangriff schwer verletzt worden. Sie schweben aber nicht in Lebensgefahr, wie … weiterlesen

Eine bulgarische Familie ist vor einem Jahr durch Brandstiftung in Solingen gestorben. Bei den Ermittlungen stießen die Beamten auf Bücher von … weiterlesen

Deutschland hat, als eines der wenigen Länder dieser Erde, einen Paragraph für Majestätsbeleidigung. Namentlich der Pragraph 188 des … weiterlesen

So könnte eine Boulevard-Zeitung vom Tod des Sängers MAX ROMEO am vergangenen Freitag (11.4.2025) berichtet haben. Wenn diese „Reggae-Legende“ denn … weiterlesen

Ein in sich abgeschlossenes System, ein Schutzraum in dem sich Leben entwickelt. Perfekt geplant und nur solange von Dauer bis das Leben bereit ist … weiterlesen

Der Sozialist François Bondy schrieb über die deutschen Vernichtungslager in Polen und der Sozialist Ignazio Silone über den Aufstieg Mussolinis … weiterlesen

Wenn du wissen willst, wie die deutsche Sprache richtig geht, frag ʼnen Ausländer! Denn Migrant:innen, die wirklich daran interessiert sind … weiterlesen

Ein schönes Eigentor der AfD im Saarland: Die AfD-Landtagsfraktion im Saarland hat in einer kleinen Anfrage an die Landesregierung ein Ranking der … weiterlesen

Hunyadi - Aufstieg zur Macht Der Spiegel zu heute ist unverkennbar. Quelle,Zitat, ORF: Bildgewaltige, packende zehnteilige Historien-Serie um den … weiterlesen

mehr „#jetztich“

Warum der Roboter nur scheinbar tut was wir von ihm wollen

Schenk uns bitte ein Like auf Facebook! #meinungsfreiheit #pressefreiheit

Mehr von Angus

fisch+fleisch Account erstellen

Benachrichtigungen

Der fisch+fleisch SLANG Editor

Der fisch+fleisch SLANG Editor

Kategorie

Schlagworte

Kommentare

Dein Blogbeitrag ist veröffentlicht!