Autor: Stephen Katte, CoinTelegraph; Übersetzung: Tao Zhu, Jinse Finance
Das KI-Forschungslabor DeepMind von Google erklärte, dass sein neuestes veröffentlichtes KI-Modell Gemini 2.0 die Grundlage für die Entwicklung fortschrittlicherer KI-Agenten bilden wird.
Demis Hassabis, CEO von Google DeepMind, und Koray Kavukcuoglu, CTO, erklärten in einem Blogbeitrag vom 11. Dezember, dass die von Gemini 2.0 betriebenen KI-Agenten komplexe Anweisungen verstehen, planen, schlussfolgern, über Websites hinweg handeln und sogar bei der Entwicklung von Videospielstrategien helfen können.
Hassabis und Kavukcuoglu sagten: "Die praktische Anwendung von KI-Agenten ist ein Forschungsbereich voller aufregender Möglichkeiten."
„Wir erkunden dieses neue Gebiet durch eine Reihe von Prototypen, die den Menschen helfen, Aufgaben zu erledigen und Dinge richtig zu machen.“
Laut Hassabis und Kavukcuoglu gibt es derzeit mehrere experimentelle KI-Assistentenprojekte, die von Gemini betrieben werden, wobei jedes Projekt unterschiedliche Funktionen hat.
Eines der Projekte trägt den Namen Deep Research, das durch das Durchsuchen des Internets mehrstufige Forschungspläne erstellen kann, um dann einen langen Bericht über die Forschungsergebnisse zu generieren, der den Benutzern hilft, komplexe Themen zu erkunden.
Project Astra ist ein universeller KI-Assistent, der sich hauptsächlich auf alltägliche Aufgaben konzentriert, wie zum Beispiel Vorschläge und Ratschläge basierend auf den vom Benutzer bereitgestellten Eingaben zu geben, etwa wie man Wäsche wäscht oder mehr Informationen über Sehenswürdigkeiten zu erhalten.
Project Mariner konzentriert sich darauf, einen KI-Agenten zu schaffen, der Ihren Chrome-Browser steuern, den Cursor bewegen, Schaltflächen anklicken, Formulare ausfüllen und Websites durchsuchen kann.
Laut Hassabis und Kavukcuoglu befinden sich diese Projekte "noch in der frühen Entwicklungsphase", aber sie hoffen, dass sie nach Tests und weiterer Entwicklung "in zukünftigen Produkten weit verbreitet eingesetzt werden".
„Es ist jetzt noch zu früh, aber das Mariner-Projekt zeigt, dass das Navigieren im Browser technisch möglich geworden ist, obwohl es derzeit nicht immer genau und langsam ist, wird sich dies mit der Zeit schnell verbessern.“
Inzwischen wird das Jules-Projekt als Entwicklerassistent entwickelt, der direkt in den GitHub-Workflow integriert werden kann und bei Aufgaben wie dem Codieren und der Planung hilft.
Hassabis und Kavukcuoglu sagten, dass sie auch Agenten für Videospiele mit Gemini 2.0 entwickelt haben, die in Echtzeit Gespräche führen können, um Spielern Ratschläge für die nächsten Schritte zu geben und online nach „reichhaltigem Spielewissen“ zu suchen.
„Wir arbeiten mit führenden Spieleentwicklern wie Supercell zusammen, um zu erkunden, wie diese Agenten funktionieren, und ihre Fähigkeit zu testen, verschiedene Spielregeln und Herausforderungen zu interpretieren, von Strategiespielen bis hin zu Landwirtschaftssimulatoren“, sagten sie.
Im November erklärte Marc Benioff, CEO des amerikanischen Cloud-Computing-Softwareunternehmens Salesforce, dass die Zukunft der KI in autonomen Agenten liegt und nicht in großen Sprachmodellen (LLMs).
„Tatsächlich denke ich, dass wir jetzt das Limit für den Master of Laws erreicht haben“, sagte er in einem Podcast mit dem Titel „Die Zukunft aller Dinge“ vom 23. November (Wall Street Journal).
Nvidia konzentriert sich ebenfalls darauf, sich an der Spitze des Trends zu positionieren.
„Wir sehen, dass die Anzahl der KI-nativen Unternehmen weiterhin wächst. Natürlich beginnen wir zu sehen, dass Unternehmen die Annahme von Agenten-KI wirklich als den neuesten Trend betrachten“, sagte Nvidia-CEO Jensen Huang während einer Telefonkonferenz zur dritten Quartalsbilanz im November.
Darüber hinaus erklärten Hassabis und Kavukcuoglu, dass das Team mit Robotik experimentiert, um Agenten zu testen, die in der physischen Welt helfen können. Derzeit sind die KI-Agenten von Google nur für Tester und Entwickler verfügbar.