GPT-4 von OpenAI, ein Modell für generative künstliche Intelligenz (KI), hat laut Ethereum-Mitbegründer Vitalik Buterin den Turing-Test bestanden.

Der Turing-Test ist ein vager Benchmark für KI-Systeme, der bestimmen soll, wie menschenähnlich ein Konversationsmodell ist. Der Begriff wurde nach dem berühmten Mathematiker Alan Turing geprägt, der den Test 1950 vorschlug.

Laut Turing würde ein KI-System, das in der Lage wäre, Texte zu generieren, die Menschen vorgaukeln, sie würden sich mit einem anderen Menschen unterhalten, die Fähigkeit zum „Denken“ besitzen.

Fast 75 Jahre später interpretierte die Person, der die Erfindung der zweitbeliebtesten Kryptowährung der Welt zugeschrieben wird, eine aktuelle Vorabveröffentlichung einer Studie der UC San Diego dahingehend, dass der Turing-Test endlich von einem Produktionsmodell „bestanden“ worden sei.

Quelle: @Vitalik.eth auf Farcaster.

Forscher an der University of California in San Diego haben kürzlich eine Vorabveröffentlichung mit dem Titel „Menschen können GPT-4 in einem Turing-Test nicht von einem Menschen unterscheiden“ veröffentlicht. Darin ließen sie etwa 500 menschliche Testpersonen in einem Blindtest mit Menschen und KI-Modellen interagieren, um festzustellen, ob die Probanden herausfinden konnten, wer wer war.

Laut der Studie haben Menschen in 56 % der Fälle fälschlicherweise festgestellt, dass GPT-4 ein „Mensch“ sei. Das bedeutet, dass die Maschine die Menschen in den meisten Fällen täuschte, indem sie sie glauben ließ, es handele sich um einen von ihnen.

Vitalik Buterins Meinung

Laut Buterin hat ein KI-System den Turing-Test bestanden, wenn es in der Lage ist, mehr als die Hälfte der Menschen zu täuschen, mit denen es interagiert.

Laut einer Besetzung auf Farcaster, in der aktuelle Vorabdruckforschung diskutiert wird:

„Das bedeutet, dass die Fähigkeit der Menschen, zu erkennen, ob es sich um einen Menschen oder einen Bot handelt, im Grunde genommen vom Zufall abhängt!“

Buterin relativierte seine Aussage in einer nachfolgenden Klammer: „Okay, nicht ganz, denn Menschen werden in 66 % der Fälle als Menschen erraten, Bots hingegen in 54 % der Fälle, aber ein Unterschied von 12 % ist winzig; in jeder realen Umgebung gilt das im Grunde als Bestehen.“

Später fügte er als Reaktion auf Kommentare zu seiner ursprünglichen Besetzung hinzu, dass der Turing-Test „bei weitem der berühmteste und gesellschaftlich anerkannteste Meilenstein für ‚KI ist jetzt eine ernste Angelegenheit‘ ist. Es ist also gut, uns daran zu erinnern, dass dieser Meilenstein jetzt erreicht wurde.“

Turings Test

Künstliche allgemeine Intelligenz (AGI) und der Turing-Test sind nicht unbedingt verwandt, auch wenn die beiden Begriffe oft verwechselt werden. Turing formulierte seinen Test auf der Grundlage seines mathematischen Scharfsinns und sagte ein Szenario voraus, in dem KI Menschen durch Konversation täuschen könnte, sodass sie denken, sie sei einer von ihnen.

Es muss erwähnt werden, dass der Turing-Test ein flüchtiges Konstrukt ohne echten Maßstab oder technische Grundlage ist. Es gibt keinen wissenschaftlichen Konsens darüber, ob Maschinen wie lebende Organismen zum „Denken“ fähig sind oder wie eine solche Leistung gemessen werden würde. Einfach ausgedrückt ist künstliche allgemeine Intelligenz oder die Fähigkeit einer KI zum „Denken“ derzeit weder messbar noch von der wissenschaftlichen noch von der technischen Gemeinschaft definiert.

Turing machte seine konzeptionellen Vorhersagen lange vor dem Aufkommen tokenbasierter künstlicher Intelligenzsysteme und der Entstehung generativer kontradiktorischer Netzwerke (GANs), den Vorläufern der heutigen generativen KI-Systeme.

Künstliche allgemeine Intelligenz

Die Sache wird noch komplizierter durch die Idee der künstlichen allgemeinen Intelligenz (AGI), die oft mit dem Turing-Test in Verbindung gebracht wird. In der wissenschaftlichen Sprache ist eine „allgemeine Intelligenz“ eine Intelligenz, die zu jeder auf Intelligenz basierenden Leistung fähig sein sollte. Dies schließt den Menschen aus, da kein Mensch „allgemeine“ Fähigkeiten über das gesamte Spektrum menschlicher intellektueller Leistungsfähigkeit gezeigt hat. Daraus folgt, dass eine „allgemeine künstliche Intelligenz“ über Denkfähigkeiten verfügen würde, die weit über die jedes bekannten Menschen hinausgehen.

Allerdings ist klar, dass GPT-4 nicht die Beschreibung einer echten „allgemeinen Intelligenz“ im streng wissenschaftlichen Sinne erfüllt. Das hat die Mitglieder der KI-Community jedoch nicht davon abgehalten, die Messlatte zu verschieben und den Begriff „AGI“ für jedes KI-System zu verwenden, das in der Lage ist, eine signifikante Anzahl von Menschen zu täuschen.

In der heutigen Kultur werden Begriffe und Ausdrücke wie „AGI“, „menschenähnlich“ und „besteht den Turing-Test“ häufig als Bezeichnung für alle KI-Systeme verwendet, die Inhalte ausgeben, die mit den von Menschen produzierten Inhalten vergleichbar sind.

Verwandt: „Wir kratzen gerade erst an der Oberfläche“ von Krypto und KI – Microsoft-Manager