Jeśli AIGC otworzyło erę inteligentnego generowania treści, wówczas AI Agent ma możliwość prawdziwego wykorzystania możliwości AIGC.

AI Agent jest jak bardziej konkretny, wszechstronny pracownik, co nazywa się pierwotną formą robota sztucznej inteligencji. Potrafi on obserwować otaczające środowisko, podejmować decyzje i działania automatycznie jak człowiek.

Bill Gates powiedział kiedyś bez ogródek: „Kontrola agenta AI to prawdziwe osiągnięcie. Do tego czasu nie będziesz już musiał samodzielnie szukać informacji w Internecie”. Autorytatywni eksperci w dziedzinie AI również wiążą duże nadzieje z perspektywami AI Agenci. Dyrektor generalny Microsoft, Satya Nadella, przewidział kiedyś, że AI Agent stanie się główną metodą interakcji człowiek-komputer, zdolną do zrozumienia potrzeb użytkowników i proaktywnego świadczenia usług. Profesor Ng Enda przewiduje również, że w przyszłym środowisku pracy ludzie i agenci sztucznej inteligencji będą ściślej współpracować, aby stworzyć wydajne modele pracy i poprawić wydajność.

AI Agent to nie tylko produkt technologii, ale także rdzeń przyszłego stylu życia i pracy.

Przypomina nam to, że kiedy Web3 i blockchain po raz pierwszy wywołały szeroką dyskusję, ludzie często używali słowa „zakłócenie”, aby opisać potencjał tej technologii. Patrząc wstecz na ostatnie kilka lat, Web3 stopniowo ewoluował od początkowej wersji ERC-20 i dowodu wiedzy zerowej do DeFi, DePIN, GameFi itp., które są zintegrowane z innymi dziedzinami.

Czy jeśli połączymy Web3 i sztuczną inteligencję, dwie popularne technologie cyfrowe, wystąpi efekt 1+ 1>2? Czy projekt Web3 AI, przy coraz większej skali finansowania, może wnieść do branży nowe paradygmaty przypadków użycia i stworzyć nowe realne potrzeby?

Agent AI: Najbardziej idealny inteligentny asystent ludzkości

Gdzie jest wyobraźnia agenta AI? W Internecie szeroko rozpowszechniona jest odpowiedź, która zyskała wiele punktów: „Wielki model językowy może zaprogramować tylko chciwego węża, ale Agent AI może zaprogramować całego Króla Chwały”. Brzmi to przesadnie, ale nie jest przesadzone.

W Chinach agent jest zwykle tłumaczony jako „inteligentny organ”. Koncepcję tę zaproponował Minsky, „ojciec sztucznej inteligencji”, w swojej książce „The Society of Thinking” opublikowanej w 1986 roku. Minsky wierzył, że określone jednostki w społeczeństwie mogą znaleźć rozwiązanie określonego problemu po negocjacjach są Agenci. Agenci od wielu lat stanowią podstawę interakcji człowiek-komputer, począwszy od asystenta edycji firmy Microsoft Clippy po automatyczne sugestie Dokumentów Google. Te wczesne formy agentów wykazały potencjał spersonalizowanej interakcji, ale ich zdolność do wykonywania bardziej złożonych zadań jest nadal ograniczona . Dopiero pojawienie się dużych modeli językowych (LLM) umożliwiło wykorzystanie prawdziwego potencjału agentów.

W maju tego roku profesor Andrew Ng, autorytatywny badacz w dziedzinie AI, wygłosił przemówienie na temat AI Agent na wydarzeniu Sequoia AI w Stanach Zjednoczonych, w którym pokazał serię eksperymentów przeprowadzonych przez jego zespół:

Pozwól sztucznej inteligencji napisać jakiś kod i uruchomić go, a następnie porównać wyniki z różnych LLM i przepływów pracy. Wynik jest następujący:

  • Model GPT-3.5: dokładność 48%

  • Model GPT-4: dokładność 67%

  • GPT-3.5 + Agent: wyższa wydajność niż model GPT-4

  • GPT-4 + Agent: znacznie wyższy niż model GPT-4, bardzo dobry

Rzeczywiście. Kiedy większość ludzi korzysta z LLM, takiego jak ChatGPT, zwykle wprowadzają szybkie słowo, a duży model natychmiast generuje odpowiedź bez automatycznego identyfikowania i poprawiania błędów, usuwania i przepisywania.

Dla porównania przepływ pracy AI Agent wygląda następująco:

Najpierw pozwól LLM napisać konspekt artykułu. Jeśli to konieczne, najpierw przeszukaj treść w Internecie w poszukiwaniu badań i analiz, wyślij pierwszą wersję roboczą, a następnie przeczytaj wersję roboczą i zastanów się, jak ją zoptymalizować. Cykl ten powtarza się przez wiele iteracji. i wreszcie generuje logiczny i rygorystyczny artykuł. Artykuły wysokiej jakości z najniższym poziomem błędów.

Możemy stwierdzić, że różnica między agentem AI a LLM polega na tym, że interakcja między LLM a ludźmi opiera się na szybkich słowach (podpowiedź). Agent AI musi jedynie wyznaczyć cel, a może samodzielnie myśleć i działać zgodnie z celem. Rozłóż szczegółowo każdy etap planu w oparciu o dane zadanie i polegaj na informacjach zwrotnych ze świata zewnętrznego oraz niezależnym myśleniu, aby stworzyć dla siebie podpowiedzi umożliwiające osiągnięcie swoich celów.

Dlatego definicja agenta AI według OpenAI to: system napędzany przez LLM jako mózg, posiadający zdolność autonomicznego rozumienia percepcji, planowania, pamięci i użycia narzędzi oraz mogący automatycznie wykonywać złożone zadania.

Kiedy sztuczna inteligencja zmienia się z używanego narzędzia w podmiot, który może z niego korzystać, staje się agentem sztucznej inteligencji. Dlatego AI Agent może stać się najbardziej idealnym inteligentnym asystentem ludzkości. Na przykład agent AI może zrozumieć i zapamiętać zainteresowania, preferencje i codzienne nawyki użytkownika na podstawie historycznych interakcji użytkownika w Internecie, zidentyfikować intencje użytkownika, aktywnie zgłaszać sugestie i koordynować wiele aplikacji w celu wykonania zadań.

Podobnie jak w wizji Gatesa, w przyszłości nie będziemy już musieli przełączać się na różne aplikacje do różnych zadań. Wystarczy, że będziemy używać zwykłego języka, aby powiedzieć komputerom i telefonom komórkowym, co chcemy zrobić w oparciu o dane, których chcą użytkownicy udostępnić, agent AI zapewni spersonalizowaną odpowiedź.

Jednoosobowe jednorożce stają się rzeczywistością

AI Agent może również pomóc przedsiębiorstwom w stworzeniu nowego inteligentnego modelu operacyjnego, którego podstawą jest „współpraca człowiek-maszyna”. Coraz więcej działań biznesowych będzie realizowanych przez sztuczną inteligencję, a ludzie będą musieli skupić się jedynie na wizji korporacyjnej, strategii i decyzjach dotyczących ścieżki krytycznej.

Tak jak kiedyś w wywiadzie wspomniał dyrektor generalny OpenAI Sam Altman o tak istotnym punkcie, wraz z rozwojem AI wkraczamy w erę „jednorożców jednoosobowych”, czyli firm zakładanych przez jedną osobę i osiągających 1 miliard Spółka wyceniana jest w dolarach amerykańskich.

Brzmi to jak fantazja, ale dzięki pomocy agentów AI pomysł ten staje się rzeczywistością.

Załóżmy, że chcemy założyć startup technologiczny. Przy tradycyjnym podejściu oczywiście musiałbym zatrudnić inżynierów oprogramowania, menedżerów produktu, projektantów, marketerów, sprzedawców i specjalistów od finansów, wszyscy robiliby swoje, ale byliby przeze mnie koordynowani.

Jeśli więc skorzystam z agenta AI, być może nie będę musiał nawet zatrudniać pracowników.

  • Devin — Programowanie automatyki

Zamiast inżyniera oprogramowania mógłbym zatrudnić Devina, inżyniera oprogramowania AI, który w tym roku eksplodował i który pomoże mi w wykonaniu wszystkich prac front-endowych i backendowych.

Devin został opracowany przez Cognition Labs i jest reklamowany jako „pierwszy na świecie inżynier oprogramowania AI”. Może samodzielnie ukończyć całą pracę związaną z tworzeniem oprogramowania, analizować problemy, podejmować decyzje, pisać kod i samodzielnie naprawiać błędy, a wszystko to można wykonać niezależnie. To znacznie odciąża programistów. Devin otrzymał finansowanie w wysokości 196 milionów dolarów w ciągu zaledwie sześciu miesięcy, a jego wycena szybko wzrosła do miliardów dolarów. Wśród inwestorów znajdują się znane firmy venture capital, takie jak Founders Fund i Khosla Ventures.

Chociaż Devin nie wypuścił jeszcze publicznej wersji, możemy rzucić okiem na potencjał Cursora, innego ostatnio popularnego produktu Web2. Wykonuje prawie całą pracę za Ciebie, zamieniając prosty pomysł w funkcjonalny kod w ciągu kilku minut. Wystarczy wydać polecenie i „usiąść i cieszyć się wynikami”. Istnieją doniesienia, że ​​ośmioletni dzieciak bez żadnego doświadczenia w programowaniu faktycznie użył Cursora do ukończenia prac związanych z kodowaniem i zbudowania strony internetowej.

  • Hebbia — przetwarzanie plików

Zamiast menadżera produktu lub finansisty prawdopodobnie wybrałbym firmę Hebbia, która zajmuje się za mnie sortowaniem i analizą dokumentów.

W przeciwieństwie do Glean, który koncentruje się na wyszukiwaniu dokumentów w przedsiębiorstwie, Hebbia Matrix jest platformą AI Agent na poziomie przedsiębiorstwa, która wykorzystuje wiele modeli AI, aby pomóc użytkownikom efektywnie wyodrębniać, porządkować i analizować dane i dokumenty, promując w ten sposób poprawę produktywności przedsiębiorstwa . To imponujące, ile milionów dokumentów Matrix może obsłużyć jednocześnie.

W lipcu tego roku Hebbia zakończyła rundę serii B o wartości 130 milionów dolarów, prowadzoną przez a16z, przy udziale znanych inwestorów, takich jak Google Ventures i Peter Thiel.

  • Jasper AI — generowanie treści

Zamiast operacji i projektantów w mediach społecznościowych mógłbym wybrać Jasper AI, który pomoże mi w generowaniu treści.

Jasper AI to asystent pisania agenta AI, zaprojektowany, aby pomóc twórcom, marketerom i firmom usprawnić proces generowania treści oraz zwiększyć produktywność i efektywność twórczą. Jasper AI może generować wiele rodzajów treści w oparciu o styl żądany przez użytkownika, w tym posty na blogach, posty w mediach społecznościowych, teksty reklamowe, opisy produktów i nie tylko. I generuj obrazy na podstawie opisów użytkowników, aby zapewnić pomoc wizualną dla treści tekstowej.

Jasper AI zebrał 125 milionów dolarów finansowania i osiągnął wycenę na 1,5 miliarda dolarów w 2022 roku. Według statystyk Jasper AI pomógł użytkownikom wygenerować ponad 500 milionów słów, co czyni go jednym z najczęściej używanych narzędzi do pisania AI.

  • MultiOn — automatyzacja stron internetowych

Zamiast asystenta mógłbym wybrać MultiOn, który pomoże mi zarządzać codziennymi zadaniami, układać harmonogramy, ustawiać przypomnienia, a nawet planować podróże służbowe, automatycznie rezerwować hotele i automatycznie organizować transport online.

MultiOn to zautomatyzowany agent AI do zadań sieciowych, który może pomóc w autonomicznym wykonywaniu zadań w dowolnym środowisku cyfrowym, na przykład pomagać użytkownikom w wykonywaniu zadań osobistych, takich jak zakupy online i umawianie się na spotkania w celu poprawy osobistej wydajności, lub pomagać użytkownikom upraszczać codzienne zadania i poprawiać wydajność pracy.

  • Zakłopotanie — poszukiwania, badania

Zamiast badacza wybrałbym pewnie Perplexity, z którego na co dzień korzysta prezes NVIDII.

Perplexity to wyszukiwarka AI, która rozumie pytania użytkowników, rozkłada je na czynniki pierwsze, a następnie wyszukuje i agreguje treści oraz generuje raporty, aby zapewnić użytkownikom jasne odpowiedzi.

Zagubienie jest odpowiednie dla różnych grup użytkowników. Na przykład studenci i badacze mogą uprościć proces wyszukiwania informacji podczas pisania, a marketerzy mogą uzyskać wiarygodne dane wspierające strategie marketingowe.

Powyższa treść to tylko wyobraźnia. Rzeczywiste możliwości i poziomy tych agentów AI nie są jeszcze wystarczające, aby zastąpić elitarne talenty we wszystkich dziedzinach życia. Jak powiedział Li Bojie, współzałożyciel Logen AI, obecne możliwości LLM są jedynie na poziomie podstawowym i dalekie od poziomu eksperckiego. Obecny agent AI bardziej przypomina pracownika, który pracuje szybko, ale nie jest zbyt niezawodny.

Jednak dzięki swoim specjalizacjom ci agenci AI pomagają obecnym użytkownikom poprawić wydajność i wygodę w różnych scenariuszach.

Nie tylko firmy technologiczne – wszystkie środowiska mogą skorzystać na fali agentów AI. W dziedzinie edukacji AI Agent może zapewnić spersonalizowane zasoby edukacyjne i korepetycje w oparciu o postępy w nauce, zainteresowania i umiejętności uczniów; w dziedzinie finansów AI Agent może pomóc użytkownikom zarządzać finansami osobistymi, udzielać porad inwestycyjnych, a nawet przewidywać trendy na giełdzie ; w dziedzinie medycyny AI Agent może pomóc lekarzom w diagnozowaniu chorób i formułowaniu planów leczenia w obszarze e-commerce AI Agent może również służyć jako inteligentna obsługa klienta, automatycznie odpowiadając na zapytania użytkowników, obsługując problemy z zamówieniami i prośby o zwrot za pomocą języka naturalnego; technologii przetwarzania i uczenia maszynowego. Popraw efektywność obsługi klienta.

Multi-agent: kolejny krok dla agentów AI

W przedstawionej w poprzedniej sekcji koncepcji jednoosobowej firmy jednorożca pojedynczy agent AI boryka się z ograniczeniami w obsłudze złożonych zadań i trudno jest mu sprostać rzeczywistym potrzebom. W przypadku korzystania z wielu agentów AI, ponieważ ci agenci AI opierają się na heterogenicznym LLM, zbiorowe podejmowanie decyzji jest trudne, a ich możliwości są ograniczone, dlatego ludzie muszą działać jako osoby planujące między niezależnymi agentami AI w celu koordynowania tych agentów AI obsługujących różne scenariusze zastosowań Idź do pracy. Doprowadziło to do powstania „Multi-Agent (framework wieloagentowy)”.

Złożone problemy często wymagają integracji wielu aspektów wiedzy i umiejętności, a pojedynczy agent AI ma ograniczone możliwości i jest trudny w obsłudze. Łącząc organicznie agentów AI o różnych możliwościach, system wieloagentowy pozwala agentom AI wykorzystać swoje mocne strony i uczyć się od siebie nawzajem, aby skuteczniej rozwiązywać złożone problemy.

Jest to bardzo podobne do naszego rzeczywistego procesu pracy lub struktury organizacyjnej: lider przydziela zadania, a osoby o różnych umiejętnościach są odpowiedzialne za różne zadania. Wyniki każdego procesu są przekazywane do następnego procesu i ostatecznie uzyskuje się ostateczne wyniki zadania. .

W procesie wdrożenia agenci AI niższego poziomu wykonują swoje zadania, a agenci AI wyższego poziomu przydzielają zadania i nadzorują ich realizację.

Multi-Agent może również symulować nasz ludzki proces decyzyjny. Podobnie jak w przypadku napotkania problemów, będziemy szukać porady u innych. Wielu agentów AI może również symulować wspólne podejmowanie decyzji i zapewniać nam lepsze wsparcie informacyjne. Na przykład AutoGen opracowany przez Microsoft spełnia to wymaganie:

  • Możliwość tworzenia agentów AI o różnych rolach. Ci agenci AI mają podstawowe możliwości konwersacyjne i mogą generować odpowiedzi na podstawie otrzymanych wiadomości.

  • Użyj GroupChat, aby utworzyć środowisko czatu grupowego obejmującego wielu agentów AI. W tym GroupChat agent AI z rolą administratora zarządza zapisami czatów, kolejnością mówców, zakończeniem wypowiedzi itp. innych agentów AI.

Jeśli zastosujemy ideę jednoosobowej firmy-jednorożca, możemy poprzez architekturę Multi-Agent stworzyć kilku Agentów AI o różnych rolach, np. kierowników projektów, programistów czy przełożonych. Powiedz im, jakie są nasze cele i pozwól im wymyślić, jak to zrobić. Wystarczy, że wysłuchamy raportu. Jeśli uznamy, że mamy jakieś zastrzeżenia lub jeśli zrobią coś złego, pozwólmy im to zmienić, aż będziemy usatysfakcjonowani.

W porównaniu z pojedynczym agentem AI, Multi-Agent może osiągnąć:

  • Skalowalność: rozwiązuj problemy na większą skalę, zwiększając liczbę agentów AI, z których każdy zajmuje się częścią zadania, co pozwala na skalowanie systemu w miarę wzrostu zapotrzebowania.

  • Równoległość: Naturalnie obsługuje przetwarzanie równoległe, wielu agentów AI może pracować nad różnymi częściami problemu w tym samym czasie, przyspieszając w ten sposób rozwiązywanie problemów.

  • Ulepszanie decyzji: Usprawnij podejmowanie decyzji poprzez agregowanie spostrzeżeń od wielu agentów AI, każdy z własną perspektywą i wiedzą specjalistyczną.

W miarę ciągłego rozwoju technologii sztucznej inteligencji można sobie wyobrazić, że środowisko wieloagentowe będzie odgrywać większą rolę w większej liczbie branż i będzie promować rozwój różnych nowych rozwiązań opartych na sztucznej inteligencji.

Wiatr AI Agent wieje w stronę Web3

Wychodząc z laboratorium, AI Agent i Multi-Agent mają przed sobą długą drogę.

Niezależnie od Multi-Agenta, nawet najbardziej zaawansowany pojedynczy agent AI ma obecnie wyraźny górny limit zasobów obliczeniowych i mocy obliczeniowej wymaganej na poziomie fizycznym i nie może być rozszerzany w nieskończoność. W obliczu niezwykle złożonych i wymagających obliczeń zadań Agent AI niewątpliwie napotka wąskie gardło w mocy obliczeniowej, a jego wydajność zostanie znacznie zmniejszona.

Co więcej, systemy AI Agent i Multi-Agent to zasadniczo model architektury scentralizowanej, co oznacza, że ​​charakteryzują się one bardzo wysokim ryzykiem pojedynczej awarii. Co ważniejsze, monopolistyczne modele biznesowe OpenAI, Microsoft, Google i innych firm oparte na dużych modelach o zamkniętym kodzie źródłowym poważnie zagrażają środowisku przetrwania niezależnych i pojedynczych startupów zajmujących się sztuczną inteligencją, uniemożliwiając agentom AI skuteczne wykorzystanie ogromnych prywatnych danych korporacyjnych do celów Spraw, aby stali się mądrzejsi i wydajniejsi. Istnieje pilna potrzeba stworzenia demokratycznego środowiska współpracy między agentami AI, aby naprawdę wartościowi agenci AI mogli służyć szerszemu gronu osób mających potrzeby i tworzyć większą wartość dla społeczeństwa.

Wreszcie, chociaż agent AI jest bliżej branży niż LLM, jego rozwój opiera się na LLM. Jednak obecna ścieżka dużego modelu charakteryzuje się wysokim progiem technicznym, dużymi inwestycjami kapitałowymi i niedojrzałym modelem biznesowym jest zwykle trudna do uzyskania Finansowanie w celu dalszej aktualizacji i iteracji.

Paradygmat wieloagentowy to doskonały punkt widzenia dla Web3, który może pomóc sztucznej inteligencji. Wiele zespołów programistów Web3 już inwestuje w badania i rozwój, aby zapewnić rozwiązania w tych obszarach.

Systemy AI Agent i Multi-Agent często wymagają dużych ilości zasobów obliczeniowych do wykonywania złożonych zadań związanych z podejmowaniem decyzji i przetwarzaniem. Web3 może zbudować zdecentralizowany rynek mocy obliczeniowej poprzez blockchain i zdecentralizowaną technologię, dzięki czemu zasoby mocy obliczeniowej będą mogły być dystrybuowane oraz wykorzystywane bardziej sprawiedliwie i efektywnie w skali globalnej. Projekty Web3, takie jak Akash, Nosana, Aethir i IO.net, mogą zapewnić moc obliczeniową na potrzeby podejmowania decyzji i rozumowania przez agentów AI.

Tradycyjne systemy AI są często zarządzane w sposób scentralizowany, co powoduje, że agenci AI napotykają pojedyncze punkty awarii i problemy z prywatnością danych. Zdecentralizowany charakter Web3 może sprawić, że system wieloagentowy będzie bardziej zdecentralizowany i autonomiczny. Każdy agent AI może działać niezależnie na innym serwery. W węźle wymagania stawiane przez użytkowników są realizowane autonomicznie, co zwiększa niezawodność i bezpieczeństwo. Ustanowienie mechanizmów zachęt i kar dla osób składających zobowiązania i delegujących za pośrednictwem PoS, DPoS i innych mechanizmów może promować demokratyzację systemów z jednym agentem AI lub systemami wieloagentowymi.

Pod tym względem GaiaNet, Theoriq, PIN AI i HajimeAI podejmują bardzo nowatorskie próby.

  • Theoriq to projekt obsługujący „AI for Web3”. Ma on na celu ustanowienie systemu wywołującego i ekonomicznego dla agentów AI za pośrednictwem protokołu Agentic, spopularyzowanie rozwoju Web3 i wielu scenariuszy funkcjonalnych oraz zapewnienie weryfikowalnych możliwości wnioskowania modelowego dla Web3 dApps.

  • GaiaNet to oparte na węzłach środowisko do tworzenia i wdrażania agentów AI, którego punktem wyjścia jest ochrona własności intelektualnej i prywatności danych ekspertów i użytkowników, aby konkurować ze scentralizowanym sklepem OpenAI GPT.

  • HajimeAI opiera się na obu, aby ustanowić przepływy pracy agentów AI w oparciu o rzeczywiste potrzeby oraz aby inteligentnie i automatyzować sam cel, nawiązując do „personalizacji inteligencji AI”, o której wspomina PIN AI.

  • W tym samym czasie Modulus Labs i ORA Protocol poczyniły postępy w kierunku algorytmów odpowiednio zkML i opML agenta AI.

Wreszcie, rozwój i iteracja systemów agentów AI i systemów wieloagentowych często wymaga dużej ilości wsparcia finansowego, a Web3 może pomóc potencjalnym projektom agentów AI uzyskać cenne wsparcie na wczesnym etapie dzięki funkcji płynności z wyprzedzeniem.

Zarówno Spectral, jak i HajimeAI zaproponowały koncepcje produktów, które wspierają emisję aktywów AI Agent w łańcuchu: wydając tokeny za pośrednictwem IAO (Initial Agent Offer), AI Agenci mogą bezpośrednio pozyskać środki od inwestorów, a jednocześnie zostać członkiem DAO zarządzanie, zapewniając inwestorom możliwość uczestniczenia w rozwoju projektu i udziału w przyszłych zyskach. Wśród nich Benchmark DAO HajimeAI ma nadzieję organicznie połączyć zdecentralizowaną punktację agentów AI i emisję aktywów agentów AI poprzez finansowanie społecznościowe i zachęty symboliczne, aby stworzyć zamkniętą pętlę agenta AI opierającą się na finansowaniu przez Web3 i zimnym starcie, co również jest stosunkowo nową próbą.

Puszka Pandory AI została otwarta i wszyscy w niej są zarówno podekscytowani, jak i zdezorientowani. Nikt nie wie, czy to szaleństwo jest szansą, czy ukrytym niebezpieczeństwem. Obecnie wszystkie dziedziny życia nie są już w epoce finansowania PPT. Niezależnie od tego, jak najnowocześniejsza jest technologia, wartość można osiągnąć dopiero po jej wdrożeniu. Przyszłość AI Agent ma być długim maratonem, a Web3 zapewnia, że ​​nie zniknie w tym wyścigu.