Autor: accelxr, 1KX; Übersetzung: 0xjs@金财经

Der Hauptzweck aktueller generativer Modelle ist die Erstellung von Inhalten und die Filterung von Informationen. Jüngste Untersuchungen und Diskussionen über KI-Agenten (autonome Akteure, die externe Tools nutzen, um benutzerdefinierte Ziele zu erreichen) legen jedoch nahe, dass KI im Wesentlichen erschlossen werden könnte, wenn ihr ein wirtschaftlicher Zugang ähnlich dem Internet der 1990er Jahre gewährt wird.

Um dies zu erreichen, müssen Agenten über Vermögenswerte verfügen, die sie kontrollieren können, da traditionelle Finanzsysteme nicht auf sie zugeschnitten sind.

Hier kommt Krypto ins Spiel: Krypto bietet eine digitale Zahlungs- und Besitzschicht mit schneller Abwicklung, die sich besonders für den Aufbau von KI-Agenten eignet.

In diesem Artikel stelle ich Ihnen die Konzepte von Agenten und Agentenarchitekturen vor, Beispiele aus der Forschung darüber, wie Agenten über neue Eigenschaften verfügen, die über das traditionelle LLM hinausgehen, und Projekte zum Aufbau von Lösungen oder Produkten rund um kryptografiebasierte Agenten.

Was ist ein Agent?

KI-Agenten sind LLM-gesteuerte Einheiten, die in der Lage sind, Maßnahmen zur Erreichung von Zielen über mehrere Iterationen hinweg zu planen und zu ergreifen.

Eine Agentenarchitektur besteht aus einem oder mehreren Agenten, die zusammenarbeiten, um Probleme zu lösen.

In der Regel erhält jeder Agent eine Persönlichkeit und Zugriff auf eine Vielzahl von Tools, mit denen er seine Arbeit unabhängig oder im Team erledigen kann.

Die Agentenarchitektur unterscheidet sich von der Art und Weise, wie wir heute normalerweise mit LLMs interagieren:

Zero-Shot-Prompting ist die Art und Weise, wie die meisten Menschen mit diesen Modellen interagieren: Sie geben eine Eingabeaufforderung ein und das LLM generiert eine Antwort basierend auf seinem bereits vorhandenen Wissen.

In einer Agentenarchitektur initialisieren Sie ein Ziel, das LLM zerlegt es in Teilaufgaben und fordert sich dann selbst (oder andere Modelle) rekursiv auf, jede Teilaufgabe autonom abzuschließen, bis das Ziel erreicht ist.

Single-Agent-Architektur und Multi-Agent-Architektur

Single-Agent-Architektur: Ein Sprachmodell führt alle Überlegungen, Planungen und Werkzeugausführungen selbstständig durch. Es gibt keinen Feedback-Mechanismus von anderen Agenten, aber Menschen können den Agenten Feedback geben.

Multiagentenarchitekturen: Diese Architekturen umfassen zwei oder mehr Agenten, wobei jeder Agent dasselbe Sprachmodell oder einen anderen Satz von Sprachmodellen verwenden kann. Agenten können dasselbe Tool oder verschiedene Tools verwenden. Jeder Agent hat normalerweise seine eigene Rolle.

  • Vertikale Struktur: Ein Agent fungiert als Leiter und andere Agenten sind ihm unterstellt. Dies hilft, den Output der Gruppe zu organisieren.

  • Horizontale Struktur: eine große Gruppendiskussion über eine Aufgabe, bei der jeder Agent andere Nachrichten sehen und sich freiwillig melden kann, um die Aufgabe zu erledigen oder Tools aufzurufen.

Agentenarchitektur: Konfigurationsdatei

Agenten verfügen über Profile oder Persönlichkeiten, die Rollen als Hinweise zur Beeinflussung des Verhaltens und der Fähigkeiten des LLM definieren. Dies hängt stark von der konkreten Anwendung ab.

Vermutlich nutzen viele Menschen dies heute bereits als Aufforderungstechnik: „Sie sind der Ernährungsexperte. Stellen Sie mir einen Essensplan zur Verfügung ...“. Interessanterweise verbessert die Bereitstellung von Rollen für LLM den Output im Vergleich zur Basislinie.

Konfigurationsdateien können auf folgende Weise erstellt werden:

  • Handgefertigt: Von einem menschlichen Ersteller manuell festgelegte Profile; höchst flexibel, aber auch zeitaufwändig.​

  • LLM-Generierung: Verwenden Sie eine LLM-generierte Konfigurationsdatei, die eine Reihe von Regeln für Zusammensetzung und Eigenschaften sowie (optional) eine kleine Anzahl von Beispielbeispielen enthält.

  • Datensatzausrichtung: Profile werden aus Datensätzen realer Personen generiert.

Agentenarchitektur: Speicher

Das Gedächtnis des Agenten speichert Informationen, die er aus der Umgebung wahrnimmt, und nutzt diese Informationen, um neue Pläne oder Aktionen zu formulieren. Das Gedächtnis ermöglicht es einem Agenten, sich selbst weiterzuentwickeln und auf der Grundlage seiner Erfahrungen zu handeln.​

  • Einheitliches Gedächtnis: Ähnlich dem Kurzzeitgedächtnis durch kontextuelles Lernen/durch kontinuierliche Aufforderung. Alle relevanten Erinnerungen werden bei jeder Eingabeaufforderung an den Agenten weitergeleitet. Hauptsächlich durch die Größe des Kontextfensters begrenzt.​

  • Gemischt: Kurzzeit- und Langzeitgedächtnis. Das Kurzzeitgedächtnis ist ein temporärer Puffer des aktuellen Zustands. Reflektierende oder nützliche Langzeitinformationen werden dauerhaft in der Datenbank gespeichert. Es gibt mehrere Möglichkeiten, dies zu tun, aber eine gängige Methode ist die Verwendung von Vektordatenbanken (Erinnerungen werden als Einbettungen kodiert und gespeichert; der Rückruf erfolgt aus der Ähnlichkeitssuche).

  • Format: Natürliche Sprache, Datenbank (z. B. SQL, das auf das Verständnis von SQL-Abfragen abgestimmt ist), strukturierte Liste, Einbettung

Agentenarchitektur: Planung

Komplexe Aufgaben werden in einfachere Teilaufgaben zerlegt, die individuell gelöst werden können.

Keine Feedbackplanung:

Bei diesem Ansatz erhält der Agent, nachdem er eine Aktion ausgeführt hat, kein Feedback, das sich auf das zukünftige Verhalten auswirkt. Ein Beispiel ist Chain of Thought (CoT), bei dem LLMs ermutigt werden, ihre Gedankengänge auszudrücken, wenn sie Antworten geben.

  • Single-Path-Argumentation (z. B. Zero-Pass-CoT)

  • Mehrpfad-Argumentation (z. B. selbstkonsistentes CoT, bei dem mehrere CoT-Threads erzeugt werden und die Antwort mit der höchsten Häufigkeit verwendet wird)

  • Externe Planer (z. B. Planning Domain Definition Language)

Planung mit Feedback:

Teilaufgaben basierend auf externem Feedback iterativ verfeinern

  • Umgebungsfeedback (z. B. Signal zum Abschluss einer Spielaufgabe)

  • Menschliches Feedback (z. B. Einholen von Feedback von Benutzern)

  • Modell-Feedback (z. B. Einholen von Feedback von einem anderen LLM – Crowdsourcing)

Agentenarchitektur: Aktion

Die Aktion ist dafür verantwortlich, die Entscheidungsfindung des Agenten in konkrete Ergebnisse umzuwandeln.

Verhaltensziele gibt es in vielen möglichen Formen, wie zum Beispiel:

  • Aufgabe abgeschlossen (z. B. Herstellung einer Eisenspitzhacke in Minecraft)

  • Kommunikation (z. B. Austausch von Informationen mit einem anderen Agenten oder Menschen)

  • Umwelterkundung (z. B. das Durchsuchen des eigenen Verhaltensraums und das Erlernen der eigenen Fähigkeiten).

Verhalten entsteht typischerweise durch das Abrufen von Erinnerungen oder das Befolgen von Plänen, und der Verhaltensraum besteht aus internem Wissen, APIs, Datenbanken/Wissensdatenbanken und externen Modellen seiner Verwendung.

Agentenarchitektur: Erwerb von Fähigkeiten

Damit ein Agent Aktionen innerhalb des Aktionsraums korrekt ausführen kann, muss er über aufgabenspezifische Fähigkeiten verfügen. Es gibt hauptsächlich zwei Möglichkeiten, dies zu erreichen:

  • Mit Feinabstimmung: Trainieren Sie Ihren Agenten anhand eines von Menschen kommentierten, LLM-generierten oder realen Beispielverhaltensdatensatzes.

  • Keine Feinabstimmung erforderlich: Die inhärenten Fähigkeiten von LLM können durch ausgefeiltere Cue-Engineering und/oder Mechanismen-Engineering genutzt werden (d. h. Einbeziehung externer Rückmeldungen oder Erfahrungsakkumulation bei der Durchführung von Versuch und Irrtum).

Beispiele für Agenten in der Literatur

Generative Agenten: Interaktive Simulation menschlichen Verhaltens: Die Instanziierung generativer Agenten in einer virtuellen Sandbox-Umgebung zeigt Multi-Agenten-Systeme mit neu entstehendem Sozialverhalten. Beginnend mit einer einzelnen, vom Benutzer festgelegten Aufforderung für eine bevorstehende Valentinstagsparty, verbringt der Agent die nächsten zwei Tage damit, automatisch Einladungen zu versenden, neue Leute kennenzulernen, sich miteinander zu verabreden und das gemeinsame Feiern zum richtigen Zeitpunkt zu koordinieren. Sie können es selbst mit der a16z AI Town-Implementierung ausprobieren.

Beschreibung erklärt Planned Selection (DEPS): Der erste Zero-Shot-Multitasking-Agent, der über 70 Minecraft-Aufgaben erledigen kann.

Voyager: Minecrafts erster LLM-gesteuerter Agent, der lebenslanges Lernen verkörpert. Er kann ohne menschliches Eingreifen kontinuierlich die Welt erkunden, verschiedene Fähigkeiten erwerben und neue Entdeckungen machen. Verbessert kontinuierlich seinen Skill-Ausführungscode basierend auf dem Feedback aus Versuch und Irrtum.

CALYPSO: Ein für das Spiel „Dungeons and Dragons“ entwickelter Agent, der dem Dungeon Master beim Erstellen und Erzählen von Geschichten helfen kann. Sein Kurzzeitgedächtnis basiert auf Szenenbeschreibungen, Monsterinformationen und früheren Zusammenfassungen.

Geist in Minecraft (GITM): Ein Agent mit durchschnittlichen Fähigkeiten in Minecraft, mit einer Erfolgsquote von 67,5 % beim Erhalten von Diamanten und einer Abschlussquote von 100 % für alle Gegenstände im Spiel.

SayPlan: LLM-basierte groß angelegte Missionsplanung für Roboter unter Verwendung einer 3D-Szenendiagrammdarstellung, die die Fähigkeit demonstriert, eine langfristige Missionsplanung für Roboter anhand abstrakter und natürlichsprachlicher Anweisungen durchzuführen.

HuggingGPT: Verwenden Sie ChatGPT für die Aufgabenplanung basierend auf Benutzeraufforderungen, die Auswahl von Modellen basierend auf Beschreibungen in Hugging Face und die Ausführung aller Teilaufgaben, um beeindruckende Ergebnisse in Sprache, Sehvermögen, Sprache und anderen anspruchsvollen Aufgaben zu erzielen.

MetaGPT: akzeptiert Eingaben und gibt User Stories/Wettbewerbsanalysen/Anforderungen/Datenstruktur/API/Dokumentation usw. aus. Intern gibt es mehrere Agenten, die die verschiedenen Funktionen eines Softwareunternehmens ausmachen.

ChemCrow: Ein LLM-Chemieagent, der mithilfe von 18 von Experten entwickelten Werkzeugen Aufgaben wie organische Synthese, Arzneimittelentwicklung und Materialdesign erfüllen kann. Er plante und führte unabhängig voneinander die Synthese eines Insektenschutzmittels und dreier Organokatalysatoren durch und leitete die Entdeckung eines neuartigen Chromophors.

BabyAGI: Eine universelle Infrastruktur zum Erstellen, Priorisieren und Ausführen von Aufgaben mithilfe von OpenAI und Vektordatenbanken wie Chroma oder Weaviate.

AutoGPT: Ein weiteres Beispiel für eine allgemeine Infrastruktur zum Starten von LLM-Agenten.

Beispiele für Agenten in Crypto

(Hinweis: Nicht alle Beispiele basieren auf LLM. Einige basieren möglicherweise eher auf Agentenkonzepten.)

FrenRug von Ritualnet: Basierend auf dem GPT-4 Turkish Carpet Salesman-Spiel { https://aiadventure.spiel.com/carpet }. Frenrug ist ein Makler, den jeder zum Kauf seines Friend.tech-Schlüssels überreden kann. Jede Benutzernachricht wird an mehrere LLMs übermittelt, die auf verschiedenen Infernet-Knoten ausgeführt werden. Diese Knoten reagieren in der Kette und der LLM stimmt darüber ab, ob der Agent den vorgeschlagenen Schlüssel kaufen soll. Wenn genügend Knoten antworten, werden die Stimmen aggregiert und das überwachte Klassifikatormodell bestimmt die Aktion und liefert einen Gültigkeitsnachweis in der Kette, sodass die Ausführung des multinomialen Klassifikators außerhalb der Kette überprüft werden kann.

Vorhersagemarktagent, der Autonolas auf Gnosis verwendet: Der KI-Bot ist im Wesentlichen ein intelligenter Vertrags-Wrapper für den KI-Dienst, den jeder anrufen kann, indem er bezahlt und Fragen stellt. Der Dienst überwacht die Anfrage, führt Aufgaben aus und gibt Antworten in der Kette zurück. Diese KI-Bot-Infrastruktur wurde über Omen auf Vorhersagemärkte ausgeweitet. Die Grundidee besteht darin, dass Agenten Vorhersagen aus Nachrichtenanalysen aktiv überwachen und darauf wetten, um letztendlich zu aggregierten Vorhersagen zu gelangen, die näher an den tatsächlichen Quoten liegen. Agenten durchsuchen den Markt auf Omen, bezahlen selbstständig „Bots“ für Vorhersagen zum Thema und handeln über den Markt.

ianDAOs GPT<>Safe-Demo: GPT verwendet die Syndicateio-Transaktions-Cloud-API, um USDC im Safe-Multisignatur-Wallet auf seiner eigenen Basiskette autonom zu verwalten. Sie können mit ihr sprechen und Vorschläge machen, wie sie ihr Kapital am besten einsetzen kann, und sie kann es auf der Grundlage Ihrer Vorschläge zuteilen.

Spielagenten: Hier gibt es mehrere Ideen, aber kurz gesagt sind KI-Agenten in virtuellen Umgebungen sowohl Begleiter (wie die KI-NPCs in Skyrim) als auch Konkurrenten (wie ein Haufen pummeliger Pinguine). Agenten können Umsatzstrategien automatisieren, Waren und Dienstleistungen bereitstellen (z. B. Ladenbesitzer, reisende Händler, Anbieter anspruchsvoller generativer Aufgaben) oder als halb spielbare Charaktere in Parallel Colony und Ai Arena fungieren.

Sichere Schutzengel: Nutzen Sie eine Gruppe von KI-Agenten, um Wallets zu überwachen und potenzielle Bedrohungen abzuwehren, um Benutzergelder zu schützen und die Wallet-Sicherheit zu verbessern. Zu den Funktionen gehören der automatische Widerruf von Vertragsberechtigungen und das Abheben von Geldern im Falle einer Anomalie oder eines Hackerangriffs.

Botto: Während Botto ein lose definiertes Beispiel für einen On-Chain-Agenten ist, demonstriert es das Konzept eines autonomen On-Chain-Künstlers, der Werke schafft, über die Token-Inhaber abstimmen und die auf SuperRare versteigert werden. Man kann sich verschiedene Erweiterungen vorstellen, die die multimodale Agentenarchitektur nutzen. ---

Einige bemerkenswerte Agentenprojekte

(Hinweis: Nicht alle Projekte basieren auf LLM. Einige basieren möglicherweise eher auf Agentenkonzepten.)

AIWay Finder – Ein dezentraler Wissensgraph von Protokollen, Verträgen, Vertragsstandards, Assets, Funktionen, API-Funktionen, Routinen + Pfaden (d. h. eine virtuelle Roadmap des Blockchain-Ökosystems, durch die ein Pathfinder-Agent navigieren kann). Benutzer werden dafür belohnt, dass sie mögliche, vom Agenten verwendete Pfade identifizieren. Darüber hinaus können Sie eine Hülle (d. h. einen Agenten) wirken, die Charakter-Setup und Fertigkeitsaktivierungen enthält, die dann in den Pathfinder Knowledge Graph eingefügt werden können.

Ritualnet – Wie im Frenrug-Beispiel oben gezeigt, kann der Ritual-Infernet-Knoten zum Einrichten einer Multi-Agenten-Architektur verwendet werden. Knoten warten auf On-Chain- oder Off-Chain-Anfragen und stellen die Ausgabe mit optionalen Beweisen bereit.

Morpheus – Ein Peer-to-Peer-Netzwerk persönlicher allgemeiner KI, das im Namen von Benutzern intelligente Verträge ausführen kann. Dies kann für die Web3-Wallet- und TX-Intent-Verwaltung, das Parsen von Daten über Chatbot-Schnittstellen, Empfehlungsmodelle für Dapps und Verträge sowie die Erweiterung von Agentenoperationen durch Langzeitspeicher, der Anwendungs- und Benutzerdaten verbindet, verwendet werden.

Dain-Protokoll – Entdecken Sie mehrere Anwendungsfälle für die Bereitstellung von Agenten auf Solana. Kürzlich wurde der Einsatz eines Krypto-Handelsbots demonstriert, der On-Chain- und Off-Chain-Informationen extrahieren und diese im Namen der Benutzer ausführen kann (z. B. BODEN verkaufen, wenn Biden verliert).

Naptha – Agent-Orchestrierungsprotokoll mit einem On-Chain-Aufgabenmarkt für Vertragsagenten, Betreiberknoten zur Orchestrierung von Aufgaben, einer LLM-Workflow-Orchestrierungs-Engine, die asynchrone Nachrichtenübermittlung über verschiedene Knoten hinweg unterstützt, und einem Workflow-Bescheinigungssystem zur Überprüfung der Ausführung.

Myshell – Eine KI-Charakterplattform ähnlich wie CHARAKTER.AI, auf der Entwickler Agentenprofile und Tools monetarisieren können. Multimodale Infrastruktur mit einigen interessanten Beispielagenten, darunter Übersetzung, Bildung, Begleitung, Codierung und mehr. Enthält eine einfache Agentenerstellung ohne Code und einen erweiterten Entwicklermodus zum Zusammenstellen von KI-Widgets.

AI Arena – Ein kompetitives PvP-Kampfspiel, bei dem Spieler KI-gestützte NFTs kaufen, trainieren und gegen sie antreten können. Spieler trainieren ihre Agenten-NFTs durch Nachahmungslernen, wobei die KI lernt, wie das Spiel in verschiedenen Karten und Szenarien gespielt wird, indem sie die mit Spieleraktionen verbundenen Wahrscheinlichkeiten lernt. Nach dem Training können Spieler ihre Agenten in Ranglistenkämpfe schicken, um Token-Belohnungen zu verdienen. Nicht auf LLM basierend, aber dennoch ein interessantes Beispiel für die Möglichkeiten des Agentenspiels.

Virtuals Protocol – Ein Protokoll zum Erstellen und Bereitstellen multimodaler Agenten in Spielen und anderen Online-Bereichen. Zu den drei Hauptarchetypen der heutigen virtuellen Welt gehören IP-Charakterspiegel, funktionsspezifische Agenten und persönliche Avatare. Mitwirkende tragen Daten und Modelle zum Virtuellen bei, und Validatoren fungieren als Gatekeeper. Es gibt ein wirtschaftliches Maß an Anreizen zur Förderung der Entwicklung und Monetarisierung.

Brianknows – Bietet Benutzern eine Benutzeroberfläche für die Interaktion mit Agenten, die Transaktionen durchführen, kryptowährungsspezifische Informationen recherchieren und intelligente Verträge zeitnah bereitstellen können. Unterstützt derzeit über 10 Vorgänge in über 100 Integrationen. Ein aktuelles Beispiel ist die Beteiligung eines Agenten an der ETH in Lido im Namen eines Benutzers, der natürliche Sprache verwendet.

Autonolas – Bietet einfache lokale und cloudbasierte Agenten, konsensgesteuerte dezentrale Agenten und eine professionelle Agentenwirtschaft. Prominente Beispiele sind DeFi und vorhersagebasierte Agenten, KI-gesteuerte Governance-Darstellung und Agent-to-Agent-Tool-Märkte. Es handelt sich um ein Open-Source-Framework, mit dem Entwickler gemeinsam genutzte Agenten erstellen können, indem sie einen Protokoll- und OLAS-Stack zur Koordinierung und Förderung von Agentenoperationen bereitstellen.

Creator.Bid – Bietet Benutzern Social-Media-Charakteragenten, die mit X- und Farcaster-Echtzeit-APIs verbunden sind. Marken können wissensbasierte Agenten einsetzen, um markenkonsistente Inhalte auf sozialen Plattformen bereitzustellen.

Polywrap – Bietet verschiedene agentenbasierte Produkte wie Indexer (ein Social-Media-Agent für Farcaster), AutoTx (ein Planungs- und Handelsausführungsagent, der mit Morpheus und flock.io erstellt wurde), Predictionprophet.ai (mit Gnosis und Autonolas Vorhersageagenten) und fundpublicgoods .ai (ein Agent für die Zuweisung von Fördermitteln).

Verifizierung – Da Wirtschaftsströme von Agenten gesteuert werden, wird die Verifizierung der Ergebnisse sehr wichtig sein (mehr dazu in einem zukünftigen Artikel). Zu den Verifizierungsmethoden gehören zkML von Ora Protocol, spieltheoretische Lösungen von Teams wie Modulus Labs + Giza + EZKL und hardwarebasierte Lösungen wie TEE.​

Einige Gedanken zu On-Chain-Agenten

  • Besitzbare, handelbare, tokengesteuerte Agenten, die verschiedene Arten von Funktionen erfüllen können, von der Begleitung bis hin zu Finanzanwendungen,

  • Ein Agent, der in Ihrem Namen die Spielökonomie identifizieren, lernen und daran teilnehmen kann, oder ein autonomer Agent, der als Spieler in einer kollaborativen, wettbewerbsorientierten oder vollständig simulierten Umgebung agieren kann.

  • Agenten, die echtes menschliches Verhalten simulieren können, um Umsatzmöglichkeiten zu schaffen

  • Eine von mehreren Agenten verwaltete Smart Wallet, die als autonomer Vermögensverwalter fungieren kann

  • KI-verwaltete DAO-Governance (z. B. Token-Delegation, Angebotserstellung oder -verwaltung, Prozessverbesserungen usw.)

  • Verwenden Sie Web3-Speicher oder Datenbank als zusammensetzbares Vektoreinbettungssystem für den gemeinsamen und dauerhaften Speicherstatus

  • Lokal laufende Agenten nehmen am globalen Konsensnetzwerk teil und führen benutzerdefinierte Aufgaben aus

  • Wissensdiagramm bestehender und neuer Protokollinteraktionen und APIs

  • Autonomes Guardian-Netzwerk, Multi-Signatur-Sicherheit, intelligente Vertragssicherheit und funktionale Verbesserungen

  • Ein wirklich autonomes Investment-DAO (z. B. ein Sammler-DAO, das die Rollen eines Kunsthistorikers, Investmentanalysten, Datenanalysten und Degen-Agents übernimmt)

  • Token-Ökonomie und Vertragssicherheitssimulation und -tests

  • Universelles Absichtsmanagement, insbesondere im Zusammenhang mit Krypto-Benutzererfahrungen wie Bridging oder DeFi

  • künstlerisches oder experimentelles Projekt

Ziehen Sie die nächste Milliarde Nutzer an

Wie Jesse Walden, Mitbegründer des Varaint Fund, kürzlich sagte, sind autonome Agenten eine Weiterentwicklung und keine Revolution in der Art und Weise, wie Blockchain verwendet wird: Wir haben bereits Roboter zur Protokollaufgabe, Scharfschützenroboter, MEV-Sucher, Roboter-Toolkits usw. Agenten sind nur eine Erweiterung von all dem.

Viele Bereiche der Kryptowährung sind so aufgebaut, dass sie die Ausführung durch Agenten erleichtern, beispielsweise vollständig On-Chain-Gaming und DeFi. Unter der Annahme, dass die Kosten für LLM im Verhältnis zur Aufgabenleistung sinken und die Zugänglichkeit zum Erstellen und Bereitstellen von Agenten zunimmt, ist es schwer, sich eine Welt vorzustellen, in der KI-Agenten nicht die Interaktionen in der Kette dominieren und die nächste Milliarde Benutzer von Kryptowährungen werden.

Lesestoff:

KI-Agenten, die mithilfe von Blockchains ihr Bankkonto selbst verwalten können

Die neue KI-Agentenwirtschaft wird auf Smart Accounts laufen

Eine Umfrage zu autonomen Agenten auf Basis großer Sprachmodelle (ich habe diese zur Ermittlung der Taxonomie der oben genannten Agentenarchitekturen verwendet, sehr zu empfehlen) 

ReAct: Synergie aus Argumentation und Handeln in Sprachmodellen

Generative Agenten: Interaktive Simulakren menschlichen Verhaltens

Reflexion: Sprachagenten mit verbalem Verstärkungslernen

Toolformer: Sprachmodelle können sich den Umgang mit Tools selbst beibringen

Beschreiben, erklären, planen und auswählen: Interaktive Planung mit großen Sprachmodellen ermöglicht Open-World-Multitasking-Agenten 

Voyager: Ein offener verkörperter Agent mit großen Sprachmodellen

LLM Agenten Papiere GitHub Repo

Ursprünglicher Link