Оригінальна назва: (Епоха агентів: зіткнення та симбіоз AI та Crypto)
Оригінальний автор: YBB Capital Research
Один, починаючи з уваги, новизна та нудьга
Протягом минулого року, через відсутність наративу на рівні застосувань, що не відповідає швидкостям вибуху інфраструктури, криптографічна сфера поступово перетворилася на гру за ресурсами уваги. Від Silly Dragon до Goat, від Pump.fun до Clanker, новизна та нудьга уваги призвели до внутрішньої конкуренції у цій боротьбі. Спочатку це почалося з банальних методів залучення уваги, швидко перейшло до платформи, де об'єдналися попит і пропозиція уваги, а потім кремнієві істоти стали новими постачальниками контенту. У дивовижних формах Meme Coin нарешті з'явилася сутність, яка може досягти консенсусу між роздрібними інвесторами та VC: AI агент.
Увага в кінцевому рахунку є нульовою сумою гри, хоча спекуляції справді можуть спонукати до диких зростань. Ми у статті про UNI вже згадували про початок золотого віку блокчейну, стрімке зростання DeFi стало можливим завдяки епосі видобутку LP, що розпочалася Compound Finance. Переміщення туди-сюди між тисячами (і навіть десятками тисяч) різних майданчиків стало найпростішим способом гри в той період, хоча в результаті багато майданчиків зазнали краху. Але шалений наплив золотих шахтарів дійсно залишив блокчейну безпрецедентну ліквідність, а DeFi зрештою вийшло за межі чистої спекуляції, сформувавши зрілу галузь, яка задовольняє фінансові потреби користувачів у всіх аспектах, таких як платежі, торгівля, арбітраж, стейкінг тощо. Наразі AI агент також проходить через цей дикий етап, ми шукаємо, як Crypto може краще інтегруватися з AI і, врешті-решт, допомогти застосувальному рівню досягти нових висот.
Два, як агент може діяти автономно
У попередній статті ми коротко згадали про походження AI Meme: Truth Terminal, а також про перспективи AI агентів у майбутньому. У цій статті ми зосередимося спочатку на самих AI агентах.
Почнемо з визначення AI агента. Агент у сфері AI є досить старим, але неясним терміном, основна увага в якому зосереджена на автономності (Autonomous), тобто будь-який AI, який може сприймати навколишнє середовище та реагувати на нього, може називатися агентом. У сучасному визначенні AI агент ближчий до інтелектуального агента, тобто системи, яка моделює рішення людини для великих моделей, у науковому співтоваристві ця система вважається найбільш перспективним шляхом до AGI (загального штучного інтелекту).
На ранніх версіях GPT ми чітко відчували, що великі моделі більше схожі на людей, але при відповіді на багато складних запитань вони могли давати лише деякі напівправильні відповіді. Основна причина полягає в тому, що тодішні великі моделі базувалися на ймовірності, а не на причинності, і, по-друге, їм бракувало тих можливостей, які має людина, таких як використання інструментів, пам'ять, планування. І саме тут AI агент може компенсувати ці недоліки. Тож можна підсумувати формулою: AI агент (агент) = LLM (велика модель) + Планування + Пам'ять + Інструменти.
Моделі великого обсягу, засновані на підказках (Prompt), більше схожі на статичну людину, вона оживає, коли ми вводимо дані. Мета агентів полягає в тому, щоб бути більш реальними людьми. На сьогоднішній день основні агенти в галузі базуються на мікромоделях Llama 70b або 405b, відкритих Meta (обидві версії мають різні параметри), які мають пам'ять і здатність використовувати інструменти API. В інших аспектах їм може знадобитися допомога або введення від людини (включаючи взаємодію з іншими агентами), тому ми можемо бачити, що основні агенти сьогодні все ще існують у соціальних мережах у формі KOL. Щоб зробити агентів більш подібними до людей, потрібно підключити здатності до планування та дій, а підкатегорія ланцюга мислення є особливо важливою.
Три, Ланцюг мислення (Chain of Thought, CoT)
Концепція ланцюга мислення (Chain of Thought, CoT) вперше з'явилася у статті Google, опублікованій у 2022 році (Chain-of-Thought Prompting Elicits Reasoning in Large Language Models), в якій зазначалося, що можна покращити здатність моделі до міркування, генеруючи серію проміжних міркувань, щоб допомогти їй краще розуміти та вирішувати складні проблеми.
Типовий CoT Prompt містить три частини: чіткий опис завдання, логічні підстави, що підтримують рішення завдання, теоретичну базу або принципи, приклади конкретних рішень. Така структурована форма допомагає моделі зрозуміти вимоги завдання, поступово наближатися до відповіді через логічне міркування, що підвищує ефективність і точність вирішення проблем. CoT особливо підходить для завдань, що вимагають глибокого аналізу та багатокрокового міркування, таких як розв'язання математичних задач, написання проектних звітів тощо. У простих завданнях CoT може не принести помітних переваг, але для складних завдань воно може суттєво покращити результати моделі, зменшуючи частоту помилок за допомогою покрокового підходу, підвищуючи якість виконання завдань.
У створенні AI агента CoT відіграє ключову роль. AI агенту потрібно розуміти отриману інформацію та приймати обґрунтовані рішення на її основі. CoT, пропонуючи впорядкований спосіб мислення, допомагає агенту ефективно обробляти та аналізувати вхідну інформацію, перетворюючи результати аналізу на конкретні рекомендації щодо дій. Цей підхід не тільки підвищує надійність та ефективність рішень агента, але й покращує прозорість процесу прийняття рішень, роблячи поведінку агента більш передбачуваною та відстежуваною. CoT, розкладаючи завдання на кілька малих кроків, допомагає агенту ретельно розглянути кожну точку прийняття рішення, зменшуючи помилки, викликані перевантаженням інформацією. CoT робить процес прийняття рішень агента більш прозорим, користувачам легше розуміти, на яких основах агент приймає свої рішення. У взаємодії з навколишнім середовищем CoT дозволяє агенту постійно вчитися новій інформації, коригувати стратегію поведінки.
CoT як ефективна стратегія не тільки підвищує здатність великих мовних моделей до міркування, але й відіграє важливу роль у створенні більш інтелектуальних та надійних AI агентів. Використовуючи CoT, дослідники та розробники можуть створити більш адаптивні до складних умов, з високим рівнем автономності інтелектуальні системи. CoT продемонструвало свої унікальні переваги в практичному використанні, особливо при виконанні складних завдань, розкладаючи їх на серії малих кроків, що не тільки підвищує точність вирішення завдань, але й покращує зрозумілість та контрольованість моделі. Цей покроковий підхід може суттєво знизити кількість помилок при виконанні складних завдань через надмірну інформацію або її складність. Одночасно цей підхід підвищує відстежуваність і перевіряність всього рішення.
Основна функція CoT полягає в поєднанні планування, дій та спостереження, заповнюючи прогалини між міркуванням і діями. Цей спосіб мислення дозволяє AI агенту розробляти ефективні стратегії у разі прогнозування можливих аномальних ситуацій, а також накопичувати нову інформацію під час взаємодії з зовнішнім середовищем, перевіряючи попередньо встановлені прогнози та надаючи нові підстави для міркування. CoT є потужним двигуном точності та стабільності, що допомагає AI агентам підтримувати високу ефективність роботи в складних умовах.
Чотири, правильні псевдопотреби
Які аспекти технологічного стеку AI повинні поєднуватися з Crypto? У минулорічній статті я вважав, що децентралізація обчислювальних потужностей і даних є ключовими кроками для допомоги малим підприємствам та індивідуальним розробникам у збереженні витрат. А у цьому році в підрозділі Crypto x AI, який склав Coinbase, ми побачили більш детальну класифікацію:
(1)Обчислювальний рівень (мається на увазі мережа, яка зосереджується на наданні ресурсів графічних процесорів (GPU) для розробників AI);
(2)Рівень даних (мається на увазі мережа, що підтримує децентралізований доступ, організацію та верифікацію AI даних);
(3)Серединний шар (мається на увазі платформа або мережа, яка підтримує розробку, впровадження та управління AI моделями або агентами);
(4)Застосунковий рівень (мається на увазі користувацькі продукти, що використовують механізми AI на ланцюзі, незалежно від того, чи це B2B, чи B2C).
В цих чотирьох розділах кожен рівень має грандіозні бачення, мета яких підсумовується в боротьбі з монополією технологічних гігантів Кремнієвої долини в наступну епоху Інтернету. Як я вже казав минулого року, чи дійсно ми повинні приймати монопольний контроль Кремнієвої долини над обчислювальними потужностями та даними? У їхній закритій моделі великих даних є чорна скриня. Наука, як найсучасніша релігія людства, в майбутньому кожне слово, яке відповідає велика модель, буде сприйматися великою частиною людей як істина, але як цю істину перевірити? Згідно з планами технологічних гігантів Кремнієвої долини, повноваження, якими зрештою буде володіти агент, перевищать уявлення, наприклад, право на платежі з вашого гаманця, право на використання терміналів, як можна забезпечити, щоб люди не мали злих намірів?
Децентралізація є єдиною відповіддю, але іноді чи потрібно нам розумно враховувати, скільки людей готові платити за ці великі бачення? У минулому ми могли не враховувати бізнес-замкненість, компенсуючи помилки, які виникають від ідеалізації, за допомогою токенів. Але нинішня ситуація дуже серйозна, Crypto x AI потребує поєднання з реальними умовами, наприклад, як зберегти баланс між двома сторонами в умовах втрат у продуктивності та нестабільності обчислювального рівня, щоб досягти конкурентоспроможності централізованих хмарних рішень? Скільки справжніх користувачів буде у проектів на рівні даних, як перевірити справжність наданих даних і які клієнти потребують ці дані? Інші два рівні працюють за тим самим принципом, в цю епоху нам не потрібно стільки вигаданих потреб, які здаються правильними.
П'ять, Meme вийшло з SocialFi
Як я вже сказав у першому абзаці, Meme вже вийшло у відповідності до Web3 в дуже швидкий спосіб у формі SocialFi. Friend.tech став першим Dapp у цьому раунді соціальних додатків, але, на жаль, програв через поспішний дизайн токена. Pump.fun підтвердив життєздатність чистої платформи, не створюючи жодного токена, не встановлюючи жодних правил. Попит та пропозиція уваги об'єдналися, ви можете публікувати меми, транслювати, випускати токени, залишати коментарі, торгувати – все це вільно, Pump.fun лише стягує плату за послуги. Це в основному відповідає сучасній економіці уваги в соціальних мережах, таких як YouTube, Ins, лише що платять різні клієнти, а в ігровому процесі Pump.fun є більш Web3.
Clanker Base є втіленням всього, завдяки інтегрованій екосистемі, яку особисто реалізували, Base має свій соціальний Dapp в якості допоміжного засобу, формуючи повний внутрішній замкнутий цикл. Агент Meme є формою 2.0 Meme Coin, люди завжди прагнуть новизни, а Pump.fun наразі знаходиться на піку популярності. З точки зору тенденцій, заміна вуглецевих істот кремнієвими ідіотськими мемами – це лише питання часу.
Я вже безліч разів згадував Base, просто кожного разу вказував на різні аспекти. З точки зору хронології, Base ніколи не був первопрохідцем, але завжди ставав переможцем.
Шість, що ще можуть бути агенти?
З практичної точки зору, агенти в майбутньому ще довго не зможуть стати децентралізованими. З огляду на традиційну AI-інфраструктуру, створення агентів не є простим процесом децентралізації та відкритого коду. Це вимагає підключення до різних API для доступу до контенту Web2, а витрати на їхнє функціонування є дуже високими. Дизайн ланцюга мислення та співпраця багатьох агентів зазвичай все ще залежать від людини як посередника. Ми пройдемо через дуже тривалий перехідний період, поки не з'явиться відповідна форма інтеграції, можливо, так само, як UNI. Але, як і в попередній статті, я все ще вважаю, що агенти справлять значний вплив на нашу галузь, як Cex у нашій індустрії, хоча це неправильно, але дуже важливо.
Стаття, опублікована минулого місяця Стенфордом і Microsoft (Огляд AI Agent), широко описує застосування агентів у медицині, інтелектуальних машинах та віртуальних світах. У додатку до цієї статті вже є безліч експериментальних випадків, які демонструють участь GPT-4V як агента у розробці топових ігор 3A.
Не варто занадто наполягати на швидкості поєднання з децентралізацією. Я більше сподіваюсь, що першим пазлом, який заповнить агент, стане здатність і швидкість знизу вгору. У нас є стільки наративних руїн та порожніх метасвітів, які потрібно заповнити, а на відповідному етапі ми знову подумаємо про те, як зробити його наступним UNI.
Джерела:
Яка ж здатність ланцюга мислення, що «виникає» у великих моделях? Автор: Нейроекономіка
Один текст для розуміння агентів, наступна зупинка великих моделей. Автор: LinguaMind
Ця стаття є результатом внеску, і не відображає думку BlockBeats.