Traducere: Blocchain informal
Pentru mulți, viitorul agenților AI este similar cu personajul J.A.R.V.I.S. din Universul Cinematic Marvel.
J.A.R.V.I.S., prescurtarea pentru „Just A Rather Very Intelligent System” (Doar un sistem destul de inteligent), a fost inițial un sistem de computere cu limbaj natural creat de Tony Stark - un industriaș și investitor proeminent fictiv. Ulterior, a devenit un sistem AI care a acționat ca asistentul lui Stark. Mai târziu, J.A.R.V.I.S. a obținut un corp sintetic, transformându-se în robotul „Vision”.
Deși agenții AI - sistemele AI generative autonome și semi-autonome capabile să execute acțiuni independent - pot fi încă departe de a avea capacitatea de a deține un corp, există posibilitatea ca în anul următor să se apropie sau chiar să depășească J.A.R.V.I.S.
În a doua jumătate a anului 2024, creșterea popularității agenților AI este similară cu ascensiunea rapidă a ChatGPT și a altor sisteme AI generative din 2022, care au schimbat piața AI. Furnizorii par să se fi îndreptat rapid de la dezvoltarea celor mai recente modele mari de limbaj (LLM) și chatboturi AI, către crearea de agenți și modele de acțiune.
De exemplu, Salesforce a lansat anul trecut Agentforce, un instrument de construire a agenților cu cod redus. Microsoft a lansat AI Agents Service, o platformă comunitară care ajută dezvoltatorii să construiască agenți AI.
Alte companii au introdus deja agenți AI în afaceri, automatizând diverse procese de afaceri. Compania de analiză Forrester Research a enumerat în prezent 400 de furnizori care construiesc agenți.
„Analistul Craig Le Clair de la Forrester Research a spus: „Entuziasmul pentru ele este foarte ridicat în prezent.” El a spus: „Dar există și anumite riscuri, deoarece eliberezi un proces de automatizare care poate fi executat automat fără verificare și echilibrare umană.”
Entuziasmul și riscurile coexistă, ceea ce înseamnă că experții și furnizorii AI au așteptări mari pentru agenții AI din 2025.
1. Eliminarea confuziei prin aplicații reale
Una dintre așteptări este că, deși 2024 a pus bazele pentru agenții AI, 2025 va fi un an în care agenții AI se vor pregăti pentru afaceri, spun experții în piața AI.
Aceasta înseamnă că confuzia în jurul agenților va dispărea, a spus AJ Sunder, cofondator și CIO al Responsive, un furnizor de software pentru propuneri și răspunsuri bazate pe AI.
„Există multă confuzie între agenți și automatizare, agenți și RPA (automatizarea proceselor robotizate)”, a spus Sunder. „Această confuzie va dispărea în mare parte. Apoi, vom începe să vedem mai mulți agenți desfășurați și utilizati în lume reală.”
RPA folosește roboți sau automate pentru a automatiza sarcini repetitive, fără a se baza pe AI; agenții implică tehnologia AI. RPA este determinist și previzibil, în timp ce agenții nu sunt.
„Similaritatea lor constă în faptul că amândouă sunt colegi digitali”, a spus Le Clair. „Numai că, atunci când adaugi AI în colegii digitali, le numim agenți AI; sunt mai inteligenți, înțeleg contextul și știu cum să evite blocajele.”
Sunder a spus că unele aplicații practice ale agenților vor apărea în serviciul clienți; altele vor apărea în domeniul financiar sau în detectarea fraudei.
„Orice sarcină complexă necesită ca AI să memoreze, să planifice și să execute sarcini complexe și cu mai multe pași, cred că agenții vor avea un rol imens în aceasta”, a spus Sunder.
Una dintre aplicațiile complexe este crearea de videoclipuri.
„Multe dintre aceste soluții AI pentru agenți pot fi de fapt desfășurate într-un mod care să ajute procesul de creare a videoclipurilor”, a spus Shahzaib Aslam, director de cercetare la Colossyan (o platformă AI pentru videoclipuri).
Agenții AI pot ajuta la crearea unui videoclip captivant, oferind argumente convingătoare și includerea unui apel la acțiune, încurajând clienții să acționeze, cum ar fi achiziționarea de produse, a spus Aslam.
„Aceasta a devenit o unealtă foarte puternică deoarece te va ajuta să creezi un videoclip mai captivant și cu o rată de succes mai mare”, a spus el.
Agenții nu vor juca doar un rol în diferite aplicații, cum ar fi crearea de videoclipuri; multe persoane vor începe să le folosească pentru a aborda problemele de scalare, a spus analistul Gartner, Tom Coshow.
Cu toate acestea, aplicațiile și utilizarea agenților AI au diferite niveluri, a spus Peter van der Putten, director al laboratorului AI și om de știință principal la Pegasystems, furnizor de automatizare a fluxurilor de lucru și deciziilor.
El a spus că, în extremitatea aplicației, agenții AI pot citi, integra și sintetiza informații, ajungând la anumite concluzii, dar nu vor lua nicio măsură. La cealaltă extremitate, agenții AI acționează pe baza informațiilor pe care le-au sintetizat.
„Adevăratul succes al agenților nu constă în abilitățile lor de inteligență, ci în modul în care sunt integrați în aplicațiile reale”, a spus el.
Cu toate acestea, el a continuat să spună că majoritatea companiilor trebuie să experimenteze înainte de a vedea valoarea agenților AI.
„Uneori, mă surprinde chiar și ceea ce pot face aceste sisteme”, a spus van der Putten. „Singura modalitate de a înțelege acest lucru este prin experimente sigure.”
2. Modele de raționare mai bune
O altă așteptare în legătură cu agenții AI este că modelele mari de limbaj (LLM) vor continua să funcționeze ca creierul lor. Aceasta înseamnă că LLM trebuie să devină mai puternice în raționare, astfel încât agenții AI să își poată îndeplini mai bine sarcinile.
Aslam a spus că sugestiile de gândire în lanț (chain of thought prompting) au demonstrat acest lucru.
Conceptul este că modelele nu generează doar un răspuns la o problemă, ci generează mai multe răspunsuri și raționează printr-o serie de pași pentru a ajunge la un răspuns final.
Deși acest lucru poate fi costisitor, deoarece companiile trebuie să ruleze mai multe raționări pentru a genera gândirea în lanț, aceasta crește și capacitatea de raționare a modelelor, a spus Aslam.
El a adăugat că acesta va fi un domeniu în care industria AI și academia se vor aprofunda în 2025.
„Această modalitate de a adăuga interpretabilitate în modele este foarte semnificativă; vom vedea mai multe muncă și cercetare îndreptate în această direcție, adică extinderea dimensiunii de calcul în timpul raționării și determinarea predicțiilor într-un mod sistematic și rațional, nu doar generând conținut simplu,” a continuat el.
3. Agenți pentru sarcini specifice
Deși până în 2025 ar putea apărea mai multe scenarii de aplicații pentru agenți AI, aceasta nu va elimina cererea de intervenție umană.
Cu toate acestea, pe măsură ce agenții AI aduc noi niveluri de automatizare, frica că locurile de muncă vor fi înlocuite rămâne.
Unii din industrie susțin că, deși agenții AI vor avea un anumit grad de autonomie până în 2025, nu vor fi complet autonomi. Cu alte cuvinte, agenții AI vor îndeplini o parte din munca unei persoane, dar nu vor prelua întreaga muncă. De exemplu, un agent AI ar putea ajuta să găsești informațiile de contact ale agenției de turism pe care dorești să o folosești, dar nu va putea finaliza întregul proces de rezervare.
„Vom vedea agenții nu preluând complet locurile de muncă, ci asumând o parte din responsabilitatea unei persoane sau o parte dintr-un proces, apoi colaborând cu sistemele tradiționale de automatizare, colaborarea umană și alți agenți”, a spus Mark Greene, vicepreședinte senior și director general la UiPath.
Agenții care își asumă o parte din responsabilitate vor fi specializați și vor îndeplini sarcinile într-un mod singular. Acest lucru va face agenții AI mai precisi în îndeplinirea sarcinilor, a spus Greene.
„Cu cât responsabilitatea este mai clar definită, cu atât mai bine poate fi măsurat efectul său”, a spus el.
4. Infrastructura agenților AI
Pe lângă ascensiunea agenților AI cu o singură sarcină, 2025 ar putea deveni și un an pentru construirea infrastructurii agenților AI, a spus analistul Olivier Blanchard de la Futurum Group.
Pentru ca agenții AI să poată comunica cu alți agenți, chiar și cu oamenii pentru a îndeplini sarcini, este nevoie de un strat de coordonare, a spus Blanchard.
„2025 nu va fi anul în care vom vedea agenți AI complet maturi”, a spus el. „2025 este anul în care construim infrastructura pentru aceasta, construind cadrul de bază.”
El a adăugat că furnizorii care ar putea ajuta la construirea acestor infrastructuri includ producători de cipuri precum Qualcomm, Intel și AMD.
„Procesoarele Qualcomm vor fi folosite în principal pentru agenți AI pe dispozitive”, a continuat Blanchard. Între timp, procesoarele NVIDIA sunt utilizate în prezent mai mult pentru colaborarea în cloud cu agenți AI.
„GPU-urile NVIDIA au fost deja utilizate pe scară largă pentru antrenarea modelelor AI, ceea ce a pus bazele pentru viitorul stratului de agenți AI”, a spus el. „În doi ani, agenții AI vor fi un amestec de software în cloud și pe dispozitive, colaborând între ei.”
În prezent, NVIDIA colaborează în principal cu cloud, în timp ce Qualcomm se concentrează în principal pe dispozitive. Pe de altă parte, producători de dispozitive precum Apple și Samsung vor fi implicați în crearea stratului de coordonare care va permite agenților AI să colaboreze între platforme, dispozitive și aplicații, a spus Blanchard.
„Avem deja aceste baze”, a spus Blanchard. „Ceea ce ne lipsește este un sistem care să poată 'face totul'.”
5. Una dintre modalitățile de a ajunge la stratul de coordonare este AI multimodal
Deși sistemele AI generative precum ChatGPT au funcționalitate de input-output, acestea nu pot conecta oamenii cu alte aplicații.
Cu toate acestea, pe măsură ce AI multimodal se dezvoltă și maturizează, capabil să genereze ieșiri video din intrări de imagini, acest lucru va facilita o mai bună funcționare a agenților AI.
„Pe măsură ce modelele devin mai inteligente, agenții noștri vor deveni mai inteligenți”, a spus Coshow.
Blanchard a spus că agenții AI au nevoie de un strat de coordonare care să funcționeze pe mai multe platforme și dispozitive. Stratul de coordonare este format din linkuri care permit agenților AI să comute de la o platformă sau interfață la alta, sau de la o aplicație la alta.
Dacă Qualcomm își construiește propriul strat de coordonare, iar AMD își construiește propriul strat de coordonare, aceasta va face interoperabilitatea agenților AI o mare provocare.
„Dacă toți producătorii de cipuri folosesc straturi de coordonare proprii, acestea nu vor putea comunica între ele foarte bine”, a spus Blanchard.
6. Provocările agenților AI în 2025
La fel ca în cazul altor tehnologii AI, agenții AI vor înfrunta o serie de provocări în 2025. Una dintre ele este problema datelor.
Deoarece datele sunt adesea dispersate între diferite surse și procese, furnizarea datelor necesare agenților AI pentru a îndeplini sarcinile poate deveni foarte provocatoare, a spus Greene.
O altă problemă este lipsa cunoștințelor despre procesul de proiectare a automatizării agenților, a adăugat Greene.
De exemplu, industria trebuie să înțeleagă când ar trebui oamenii să interacționeze cu agenții AI, cum să interacționeze și prin ce canale ar trebui să comunice cu agenții AI, a spus el.
O altă provocare este problema încrederii, a spus Sunder.
„Dacă tehnologia de bază continuă să depindă de AI generativ și de modele de limbaj mari, atunci aceste dezavantaje vor fi moștenite și de agenții AI”, a spus el.
În ciuda acestor obstacole, Sunder consideră că 2025 va fi un an important pentru agenții AI.
„Vom înțelege în ce scenarii agenții AI au sens, cum să îi desfășurăm, cum să câștigăm încrederea, apoi să îi lăsăm complet liberi”, a spus el. „Această promisiune de a putea fi complet autonom, cred că în cele din urmă se va realiza; dar dacă se va realiza în 2025, cred că este puțin probabil.”