Autor: Stephen Katte, CoinTelegraph; redakcja: Tao Zhu, Złote Finanse

Laboratorium badań sztucznej inteligencji Google DeepMind ogłosiło, że ich najnowszy model AI Gemini 2.0 stanie się podstawą do budowy bardziej zaawansowanych agentów AI.

Dyrektor generalny Google DeepMind, Demis Hassabis, oraz dyrektor techniczny Koray Kavukcuoglu stwierdzili w artykule na blogu z 11 grudnia, że agenci AI napędzani przez Gemini 2.0, wydani 11 grudnia, mogą rozumieć złożone instrukcje, planować, wnioskować, podejmować działania w różnych witrynach, a nawet pomagać w opracowywaniu strategii gier wideo.

Hassabis i Kavukcuoglu stwierdzili: „Praktyczne zastosowanie agentów AI to ekscytująca dziedzina badań pełna możliwości.

„Eksplorujemy tę nową dziedzinę poprzez szereg prototypów, które mogą pomóc ludziom w realizacji zadań i wykonywaniu ich dobrze.”

Według Hassabisa i Kavukcuoglu, obecnie istnieje wiele eksperymentalnych projektów asystentów AI napędzanych przez Gemini, z których każdy ma różne funkcje.

Jeden z projektów nosi nazwę Deep Research, który może tworzyć wieloetapowe plany badawcze poprzez przeszukiwanie sieci, a następnie generować długie raporty na temat wyników badań, pomagając użytkownikom zgłębiać złożone tematy.

Projekt Astra to uniwersalny asystent AI, który koncentruje się na codziennych zadaniach, takich jak udzielanie sugestii i opinii na podstawie podanych przez użytkowników wskazówek, na przykład jak prać ubrania lub więcej informacji o zabytkach.

Projekt Mariner koncentruje się na stworzeniu agenta AI, który może kontrolować przeglądarkę Chrome, poruszać kursorem, klikać przyciski, wypełniać formularze i przeszukiwać strony internetowe.

Według Hassabisa i Kavukcuoglu, projekty te „są wciąż na wczesnym etapie rozwoju”, ale mają nadzieję, że po testach i dalszym rozwoju, będą mogły być „szeroko stosowane w przyszłych produktach”.

„Jest jeszcze za wcześnie, ale projekt Mariner pokazuje, że nawigacja w przeglądarkach stała się technicznie możliwa, chociaż obecnie nie zawsze dokładnie wykonuje zadania i jest powolna, to z biegiem czasu sytuacja ta z pewnością się poprawi.”

Tymczasem projekt Jules jest w fazie rozwoju jako asystent dla programistów, który można bezpośrednio zintegrować z przepływem pracy GitHub i pomaga w takich zadaniach jak kodowanie i planowanie.

Hassabis i Kavukcuoglu stwierdzili, że wykorzystali również Gemini 2.0 do budowy agentów dla gier wideo, którzy mogą udzielać graczom sugestii dotyczących następnych kroków podczas rozmów na żywo i przeszukiwania „bogatej wiedzy o grach” w Internecie.

„Współpracujemy z wiodącymi deweloperami gier, takimi jak Supercell, aby zbadać, jak te agenci działają, testując ich zdolność do interpretacji różnych zasad gier i wyzwań, od gier strategicznych po symulatory rolnicze,” powiedzieli.

W listopadzie, dyrektor generalny firmy Salesforce, Marc Benioff, stwierdził, że przyszłość sztucznej inteligencji leży w autonomicznych agentach, a nie w dużych modelach językowych (LLM).

„W rzeczywistości uważam, że osiągnęliśmy już szczyt magistra prawa,” powiedział w podcaście „Przyszłość wszystkiego” z 23 listopada (Wall Street Journal).

Nvidia również koncentruje się na pozycjonowaniu się na czołowej pozycji w trendzie.

„Widoczna jest ciągła liczba firm z AI natywnymi. Oczywiście, zaczynamy dostrzegać, że przedsiębiorstwa przyjmują agentów AI jako najnowszy trend,” powiedział Jensen Huang, dyrektor generalny Nvidia, podczas telekonferencji dotyczącej wyników za trzeci kwartał w listopadzie.

Dodatkowo, Hassabis i Kavukcuoglu stwierdzili, że zespół eksperymentuje z agentami, którzy mogą udzielać pomocy w fizycznym świecie za pomocą robotyki. Na razie agenci AI Google są udostępniani tylko testerom i deweloperom.