Переклад: Проста мова блокчейн
Для багатьох майбутні AI-агенти нагадують персонажа J.A.R.V.I.S. з кіновсесвіту Marvel.
J.A.R.V.I.S., що розшифровується як «Just A Rather Very Intelligent System» (Просто досить розумна система), спочатку був створений Тоні Старком - вигаданим промисловцем і видатним інвестором - як система обробки природної мови. Згодом він став AI-системою, яка слугувала помічником Старка. Пізніше J.A.R.V.I.S. отримав синтетичне тіло, ставши роботом «Віжн» (Vision).
Хоча AI-агенти - це автономні та напівавтономні генеративні AI-системи, здатні виконувати дії незалежно, вони, ймовірно, ще далеко від здатності мати фізичну форму, але вони можуть наблизитися до або навіть перевершити J.A.R.V.I.S. десь у наступному році.
У другій половині 2024 року зростання популярності AI-агентів нагадуватиме швидке зростання ChatGPT та інших генеративних AI-систем у 2022 році, які змінили ринок AI. Постачальники, здається, швидко переходять від розробки останніх великих мовних моделей (LLMs) і AI-чат-ботів до створення агентів і моделей дій.
Наприклад, Salesforce минулої осені запустила Agentforce, інструмент побудови агентів з низьким кодом. Microsoft запустила AI Agents Service, платформу спільноти для розробників, яка допомагає створювати AI-агентів.
Інші постачальники також впроваджують AI-агентів у бізнес для автоматизації різних бізнес-процесів. Аналітична компанія Forrester Research перерахувала 400 постачальників, які наразі створюють агентів.
«Аналітик Forrester Research Крейг Ле Клер сказав: «В даний час існує великий ентузіазм щодо них». Він додав: «Але існує певний ризик, оскільки ви звільняєте автоматизований процес, який може виконуватися без людської перевірки та контролю».
Ентузіазм та ризики йдуть рука в руку, що означає, що експерти з AI та постачальники мають великі очікування щодо агентів AI у 2025 році.
1. Позбавлення плутанини через реальні застосування
Одне з очікувань полягає в тому, що, незважаючи на те, що 2024 рік закладає основу для AI-агентів, 2025 рік стане роком, коли AI-агенти зможуть зустрітися з готовістю підприємств, кажуть експерти ринку AI.
Це означає, що плутанина навколо агентів зникне, сказав співзасновник та CIO Responsive AJ Sunder, компанії, що постачає програмне забезпечення для пропозицій та відповідей, яке працює на базі AI.
«Існує багато плутанини між агентами та автоматизацією, між агентами та RPA (роботизованою автоматизацією процесів),» сказав Сундер. «Більшість цієї плутанини зникне. Тоді ми почнемо бачити більше агентів, які будуть розгорнуті та використовуватимуться в реальному світі».
RPA використовує роботів або автоматизацію для автоматизації повторюваних завдань без залежності від AI, тоді як агенти передбачають використання AI-технологій. RPA є детермінованим і передбачуваним, тоді як агенти - ні.
«Їхня схожість полягає в тому, що обидва є цифровими колегами», - сказав Ле Клер. «Просто, коли ви додаєте AI до цифрових колег, ми називаємо це AI-агентом, який є більш інтелектуальним, розуміє контекст і знає, як уникати зависання».
Сундер сказав, що деякі практичні застосування агентів з’являться в обслуговуванні клієнтів; інші з’являться у фінансовій сфері або при виявленні шахрайства.
«Будь-яке складне завдання вимагає від AI пам'яті, планування та виконання багатоступеневих, складних завдань, я вважаю, що агенти відіграватимуть велику роль у цьому», - сказав Сундер.
Одним із складних застосувань є створення відео.
«Багато з цих рішень агентного AI фактично можуть бути розгорнуті таким чином, щоб допомогти в процесі створення відео», - сказав Шахзаіб Аслам, дослідник платформи AI-відео Colossyan.
AI-агенти можуть допомогти створити захоплююче відео, надати переконливі аргументи та включити заклик до дії, щоб заохотити клієнтів до дій, таких як купівля продукту, сказав Аслам.
«Це стає дуже потужним інструментом, оскільки це допоможе вам створити більш залучаюче та успішне відео», - сказав він.
Агенти відіграватимуть роль не тільки в таких різних застосуваннях, як створення відео, але багато людей також почнуть використовувати їх для вирішення проблем масштабу, - сказав аналітик Gartner Том Кошоу.
Однак застосування та використання AI-агентів мають різні рівні, - сказав Петер ван дер Путтен, директор AI-лабораторії та головний науковець компанії Pegasystems, постачальника автоматизації робочих процесів і рішень для прийняття рішень.
Він зазначив, що в одному з крайнощів AI-агенти можуть читати, інтегрувати та синтезувати інформацію для формулювання певних висновків, але не виконують жодних дій. На іншому кінці спектру AI-агенти виконують дії на основі інтегрованої інформації.
«Справжній успіх агентів полягає не в їхніх власних інтелектуальних можливостях, а в тому, як вони інтегровані в реальні застосування», - сказав він.
Однак він продовжив, що більшість компаній повинні спочатку провести випробування, перш ніж побачити цінність AI-агентів.
«Іноді я навіть дивуюсь тому, на що ці системи здатні», - сказав ван дер Путтен. «Єдиний спосіб зрозуміти це - це проводити безпечні експерименти».
2. Кращі моделі міркування
Ще одне очікування щодо AI-агентів полягає в тому, що великі мовні моделі (LLM) продовжать слугувати їхнім «мозком». Це означає, що LLM потрібно стати сильнішими в міркуваннях, щоб AI-агенти могли краще виконувати свої завдання.
Аслам зазначив, що підказки ланцюгового мислення (chain of thought prompting) вже продемонстрували це.
Ця концепція полягає в тому, що моделі генерують не лише одну відповідь на питання, а кілька відповідей і міркують через ряд кроків, щоб зрештою дійти до відповіді.
Хоча це може бути досить дорогим, оскільки підприємствам потрібно запускати кілька міркувань для генерації ланцюгового мислення, це також підвищує здатність моделей до міркування, - сказав Аслам.
Він додав, що це буде галузь, яку AI-індустрія та академічні кола глибше вивчать у 2025 році.
«Спосіб, яким ми вносимо пояснюваність у моделі, має великий сенс, і ми побачимо більше роботи та досліджень у цьому напрямку, що полягає у розширенні обчислювальної потужності під час міркувань, а також у тому, щоб моделі забезпечували прогнози в систематичній та логічній формі, а не просто генерували вміст», - продовжив він.
3. Спеціалізовані агенти
Хоча до 2025 року може з'явитися більше агентних застосувань, це не усуне потребу в людському втручанні.
Однак, з появою нових рівнів автоматизації, які забезпечують AI-агенти, страхи щодо заміни робочих місць все ще існують.
Деякі в галузі стверджують, що, незважаючи на те, що до 2025 року AI-агенти матимуть певну автономію, вони не будуть повністю автономними. Іншими словами, AI-агенти виконуватимуть частину роботи конкретної особи, але не будуть відповідати за всю роботу. Наприклад, AI-агент може допомогти вам знайти контактну інформацію туристичної агенції, яку ви хочете використовувати, але не зможе завершити весь процес бронювання.
«Ми побачимо, що агенти не зовсім самостійно беруть на себе всю роботу, а виконуватимуть частину відповідальності однієї особи або частину процесу, а потім працюватимуть разом з традиційними системами автоматизації, людським співробітництвом та іншими агентами», - сказав старший віце-президент та генеральний директор UiPath Марк Грін.
Ті агенти, які беруть на себе частину відповідальності, будуть спеціалізованими і виконуватимуть завдання однобічно. Це зробить AI-агентів точнішими при виконанні завдань, сказав Грін.
"Чим ясніше визначена відповідальність, тим легше оцінити її ефективність", - сказав він.
4. Інфраструктура AI-агентів
Окрім зростання одноразових AI-агентів, 2025 рік може також стати роком для створення інфраструктури AI-агентів, сказав аналітик Futurum Group Олівер Бланшар.
Щоб AI-агенти могли спілкуватися з іншими агентами, а також співпрацювати з людьми для виконання завдань, потрібен координуючий рівень, сказав Бланшар.
"2025 рік не буде роком, коли ми побачимо повністю зрілі агентні AI," сказав він. "2025 рік - це рік, коли ми будуємо інфраструктуру для них, створюємо їхню базову структуру."
Він додав, що постачальники, які, можливо, допоможуть у створенні цієї інфраструктури, включають виробників чіпів, таких як Qualcomm, Intel та AMD.
"Процесори Qualcomm будуть в основному використовуватися для агентних AI на пристроях," продовжив Бланшар. Тим часом процесори Nvidia наразі більше використовуються для співпраці в хмарі з агентними AI.
"GPU Nvidia вже широко використовуються для навчання AI-моделей, що закладає основу для майбутнього агентного AI," сказав він. "Через два роки агентний AI буде гібридом програмного забезпечення в хмарі та на пристроях, які працюють разом."
Наразі Nvidia в основному співпрацює з хмарою, тоді як Qualcomm зосереджується на пристроях. З іншого боку, такі виробники пристроїв, як Apple та Samsung, братимуть участь у створенні координуючого рівня, що дозволить агентним AI працювати разом між платформами, пристроями та додатками, сказав Бланшар.
"Ми вже маємо цю основу," сказав Бланшар. "Те, що нам не вистачає, це система, яка може 'робити все'".
5. Один із способів руху до координуючого рівня є мультимодальний AI.
Хоча генеративні AI-системи, такі як ChatGPT, мають функціонал введення-виведення, вони не можуть з’єднуватися з іншими додатками від імені людини.
Однак із розвитком і зрілістю мультимодальних AI, здатних генерувати відео-вихід з вхідних зображень, це покращить роботу агентних AI.
"Коли моделі стають розумнішими, наші агенти також стають розумнішими," сказав Кошоу.
Бланшар сказав, що AI-агенти потребують координуючого рівня, який працює на всіх платформах і пристроях. Координуючий рівень складається з зв'язків, які дозволяють AI-агентам переходити з однієї платформи або інтерфейсу на іншу або з одного додатку на наступний.
Якщо Qualcomm створить свій координуючий рівень, а AMD також створить свій координуючий рівень, це зробить взаємодію агентних AI великим викликом.
"Якщо всі виробники чіпів використовують свої власні координуючі рівні, це не обов'язково дозволить їм добре спілкуватися один з одним," сказав Бланшар.
6. Виклики, з якими зіткнуться агентні AI у 2025 році
Подібно до інших AI-технологій, агентні AI також зіткнуться з рядом викликів у 2025 році. Одним із них є проблема з даними.
Оскільки дані зазвичай розподілені між різними джерелами та процесами, надання агентним AI даних, необхідних для виконання завдань, може стати великим викликом, - сказав Грін.
Ще одна проблема - це нестача знань про процеси автоматизації агентів, додав Грін.
Наприклад, галузь повинна зрозуміти, коли взаємодіяти з агентними AI людьми, як це робити, а також через які канали спілкуватися з агентами AI, сказав він.
Ще однією проблемою є проблема довіри, заявив Сундерс.
"Якщо базові технології все ще покладаються на генеративний AI та великі мовні моделі, тоді ці недоліки також будуть успадковані агентними AI," сказав він.
Незважаючи на ці перешкоди, Сундерс вважає, що 2025 рік стане важливим роком для агентних AI.
«Ми розберемося, в яких сценаріях агентний AI має сенс, як їх розгортати, як здобути довіру, а потім повністю відпустити,» - сказав він. «Цей обіцянка повної автономії, я вважаю, зрештою реалізується; але чи станеться це у 2025 році, я вважаю, що малоймовірно».