Autore: Swayam
Compilato da: Deep Tide TechFlow
Lo sviluppo rapido dell'intelligenza artificiale (AI) ha portato poche grandi aziende tecnologiche a detenere capacità computazionali, risorse di dati e tecnologie algoritmiche senza precedenti. Tuttavia, mentre i sistemi AI si integrano sempre più nella nostra società, le questioni di accessibilità, trasparenza e controllo sono diventate il fulcro delle discussioni tecnologiche e politiche. In questo contesto, l'integrazione della tecnologia blockchain con l'AI ci offre un percorso alternativo da esplorare: un modo che potrebbe ridefinire lo sviluppo, il dispiegamento, la scalabilità e la governance dei sistemi AI.
Non stiamo cercando di sovvertire completamente le attuali infrastrutture AI, ma desideriamo esplorare, attraverso l'analisi, i vantaggi unici che i metodi decentralizzati potrebbero offrire in alcuni casi d'uso specifici. Allo stesso tempo, riconosciamo che in alcune circostanze, i sistemi centralizzati tradizionali potrebbero ancora essere la scelta più pratica.
Le seguenti domande chiave hanno guidato la nostra ricerca:
Le principali caratteristiche dei sistemi decentralizzati (come trasparenza, resistenza alla censura) possono integrarsi con le esigenze moderne dei sistemi AI (come efficienza, scalabilità) o generare conflitti?
In quali modi la tecnologia blockchain può apportare miglioramenti sostanziali in tutte le fasi dello sviluppo dell'AI, dalla raccolta dei dati all'addestramento dei modelli fino all'inferenza?
Quali compromessi tecnici ed economici affronteranno le varie fasi nella progettazione di sistemi AI decentralizzati?
Limitazioni attuali nel stack tecnologico dell'AI
Il team di Epoch AI ha fatto importanti contributi nell'analisi delle limitazioni attuali nel stack tecnologico dell'AI. La loro ricerca descrive in dettaglio i principali colli di bottiglia che l'espansione della capacità di calcolo per l'addestramento dell'AI potrebbe affrontare entro il 2030, utilizzando il numero di operazioni in virgola mobile al secondo (Floating Point Operations per Second, FLoPs) come indicatore chiave per misurare le prestazioni computazionali.
La ricerca mostra che l'espansione del calcolo per l'addestramento dell'AI può essere limitata da vari fattori, tra cui l'insufficienza dell'approvvigionamento energetico, colli di bottiglia nelle tecnologie di produzione dei chip, scarsità di dati e problemi di latenza di rete. Questi fattori pongono diversi limiti praticabili alle capacità computazionali, con il problema della latenza considerato il limite teorico più difficile da superare.
Questo grafico sottolinea la necessità di progressi in hardware, efficienza energetica, sblocco dei dati catturati nei dispositivi edge e miglioramenti nelle reti per supportare la crescita futura dell'intelligenza artificiale.
Limitazioni energetiche (prestazioni):
Fattibilità dell'espansione delle infrastrutture energetiche (previsioni per il 2030): Si prevede che entro il 2030, la capacità dei parchi dei datacenter raggiunga tra 1 e 5 gigawatt (GW). Tuttavia, questa crescita richiede investimenti massicci nelle infrastrutture energetiche, oltre a superare eventuali ostacoli logistici e normativi.
Limitata dall'approvvigionamento energetico e dalle infrastrutture elettriche, si prevede che il limite massimo di espansione della capacità computazionale globale possa raggiungere fino a 10.000 volte l'attuale livello.
Capacità di produzione dei chip (verificabilità):
Attualmente, la produzione di chip per supportare calcoli avanzati (come NVIDIA H100, Google TPU v5) è limitata dalla tecnologia di packaging (ad esempio, la tecnologia CoWoS di TSMC). Questa limitazione influisce direttamente sulla disponibilità e scalabilità dei calcoli verificabili.
I colli di bottiglia nella produzione e nella catena di approvvigionamento dei chip rappresentano il principale ostacolo, ma potrebbe comunque essere possibile raggiungere un aumento della capacità computazionale fino a 50.000 volte.
Inoltre, è fondamentale abilitare aree di isolamento sicuro o ambienti di esecuzione fidati (Trusted Execution Environments, TEEs) nei chip avanzati sui dispositivi edge. Queste tecnologie possono non solo verificare i risultati del calcolo, ma anche proteggere la privacy dei dati sensibili durante il processo di calcolo.
Scarsità di dati (privacy):
Barriere alla latenza (prestazioni):
Limiti intrinseci alla latenza nell'addestramento dei modelli: Con l'aumento della scala dei modelli AI, il tempo necessario per una singola propagazione in avanti e indietro aumenta significativamente a causa della sequenzialità del processo di calcolo. Questa latenza rappresenta un vincolo fondamentale che non può essere eluso durante il processo di addestramento, impattando direttamente sulla velocità di addestramento.
Le sfide nell'aumentare la dimensione del batch: Per mitigare i problemi di latenza, un approccio comune è quello di aumentare la dimensione del batch affinché più dati possano essere elaborati in parallelo. Tuttavia, ci sono limiti pratici all'espansione della dimensione del batch, come la capacità di memoria insufficiente e il ritorno marginale decrescente dell'efficacia della convergenza dei modelli all'aumentare della dimensione del batch. Questi fattori rendono più difficile compensare la latenza aumentando il batch.
Fondamenti
Triangolo dell'AI decentralizzata
Le molteplici limitazioni attuali dell'AI (come scarsità di dati, colli di bottiglia nella capacità computazionale, problemi di latenza e capacità di produzione dei chip) costituiscono un "triangolo dell'AI decentralizzata". Questo framework cerca di bilanciare privacy, verificabilità e prestazioni. Queste tre proprietà sono elementi chiave per garantire l'efficacia, l'affidabilità e la scalabilità dei sistemi AI decentralizzati.
La seguente tabella analizza in dettaglio i principali compromessi tra privacy, verificabilità e prestazioni, approfondendo le loro definizioni, tecnologie di realizzazione e le sfide che affrontano:
Privacy: Durante l'addestramento e l'inferenza dell'AI, è cruciale proteggere i dati sensibili. A tal fine, vengono utilizzate varie tecnologie chiave, tra cui ambienti di esecuzione fidati (TEEs), calcolo multi-party (MPC), apprendimento federato, crittografia omomorfica (FHE) e privacy differenziale. Sebbene queste tecnologie siano efficaci, portano anche a costi di prestazione, problemi di trasparenza che influenzano la verificabilità e limitazioni nella scalabilità.
Verificabilità: Per garantire la correttezza e l'integrità dei calcoli, vengono utilizzate tecnologie come le prove a conoscenza zero (ZKP), i certificati crittografici e i calcoli verificabili. Tuttavia, raggiungere un equilibrio tra privacy e prestazioni con la verificabilità spesso richiede risorse e tempo aggiuntivi, il che può comportare ritardi nel calcolo.
Prestazioni: L'esecuzione efficiente dei calcoli AI e la realizzazione di applicazioni su larga scala si basano su infrastrutture di calcolo distribuito, accelerazione hardware e connessioni di rete efficienti. Tuttavia, l'adozione di tecnologie per la privacy può rallentare la velocità di calcolo, e i calcoli verificabili possono comportare costi aggiuntivi.
Dilemma triplo della blockchain:
Le sfide principali nel campo della blockchain si riassumono nel dilemma triplo, dove ogni sistema blockchain deve bilanciare tra tre opzioni:
Decentralizzazione: Previene il controllo di qualsiasi entità unica sul sistema distribuendo la rete su più nodi indipendenti.
Sicurezza: Assicura che la rete sia protetta da attacchi e mantenga l'integrità dei dati, spesso richiedendo più processi di verifica e consenso.
Scalabilità: Gestire rapidamente ed economicamente grandi volumi di transazioni, tuttavia, ciò spesso comporta compromessi in decentralizzazione (riduzione del numero di nodi) o sicurezza (riduzione della forza di verifica).
Ad esempio, Ethereum priorizza decentralizzazione e sicurezza, quindi la sua velocità di elaborazione delle transazioni è relativamente lenta. Una comprensione approfondita di questi compromessi nell'architettura blockchain può essere trovata nella letteratura pertinente.
Matrice di analisi della cooperazione AI-Blockchain (3x3)
L'integrazione dell'AI e della blockchain è un processo complesso di compromesso e opportunità. Questa matrice mostra dove queste due tecnologie possono generare attriti, trovare punti di armonia e talvolta amplificare le debolezze reciproche.
Meccanismo di funzionamento della matrice di cooperazione
L'intensità di cooperazione riflette la compatibilità e l'influenza delle proprietà di blockchain e AI in specifici domini. In particolare, dipende da come le due tecnologie affrontano insieme le sfide e migliorano le funzioni reciproche. Ad esempio, in ambito privacy, l'immutabilità della blockchain combinata con la capacità di elaborazione dei dati dell'AI potrebbe portare a nuove soluzioni.
Meccanismo di funzionamento della matrice di cooperazione
Esempio 1: Prestazioni + Decentralizzazione (bassa cooperazione)
Nei network decentralizzati, come Bitcoin o Ethereum, le prestazioni sono spesso limitate da vari fattori. Queste limitazioni includono la volatilità delle risorse dei nodi, l'alta latenza di comunicazione, i costi di elaborazione delle transazioni e la complessità dei meccanismi di consenso. Per le applicazioni AI che richiedono bassa latenza e alta capacità di elaborazione (come l'inferenza AI in tempo reale o l'addestramento di modelli su larga scala), queste reti faticano a fornire la velocità e l'affidabilità computazionale necessarie per soddisfare le esigenze di alte prestazioni.
Esempio 2: Privacy + Decentralizzazione (alta cooperazione)
Tecnologie AI a protezione della privacy (come l'apprendimento federato) possono sfruttare appieno le caratteristiche decentralizzate della blockchain, consentendo una collaborazione efficiente mentre si proteggono i dati degli utenti. Ad esempio, SoraChain AI offre una soluzione che, attraverso l'apprendimento federato supportato dalla blockchain, garantisce che i diritti sui dati non vengano violati. I proprietari dei dati possono contribuire con dati di alta qualità per l'addestramento dei modelli, mantenendo la privacy e ottenendo un win-win tra privacy e collaborazione.
L'obiettivo di questa matrice è aiutare l'industria a comprendere chiaramente i punti di intersezione tra AI e blockchain, guidando innovatori e investitori a dare priorità a direzioni praticabili, esplorando aree con potenziale, evitando nel contempo di cadere in progetti puramente speculativi.
Matrice di cooperazione AI-Blockchain
Le due dimensioni della matrice di cooperazione rappresentano diverse proprietà: una dimensione è costituita dalle tre caratteristiche chiave dei sistemi AI decentralizzati - verificabilità, privacy e prestazioni; l'altra dimensione è il dilemma triplo della blockchain - sicurezza, scalabilità e decentralizzazione. Quando queste proprietà si intersecano, si generano una serie di effetti di cooperazione, che variano da un alto allineamento a potenziali conflitti.
Ad esempio, quando la verificabilità si combina con la sicurezza (alta cooperazione), possono essere costruiti sistemi robusti per dimostrare la correttezza e l'integrità dei calcoli AI. Ma quando le esigenze di prestazioni entrano in conflitto con la decentralizzazione (bassa cooperazione), l'alto costo dei sistemi distribuiti impatta significativamente sull'efficienza. Inoltre, alcune combinazioni (come privacy e scalabilità) si trovano in una zona intermedia, con potenziale ma anche complessi problemi tecnici.
Perché è importante?
Bussola strategica: Questa matrice fornisce a decisori, ricercatori e sviluppatori una direzione chiara, aiutandoli a concentrarsi su aree di alta cooperazione, come garantire la privacy dei dati attraverso l'apprendimento federato o utilizzare il calcolo decentralizzato per realizzare addestramenti AI scalabili.
Concentrazione su innovazioni influenti e allocazione delle risorse: Comprendere la distribuzione dell'intensità di cooperazione (come sicurezza + verificabilità, privacy + decentralizzazione) aiuta le parti interessate a concentrare le risorse in aree di alto valore, evitando sprechi in integrazioni deboli o non praticabili.
Guidare l'evoluzione dell'ecosistema: Con il continuo sviluppo delle tecnologie AI e blockchain, questa matrice può servire come strumento dinamico per valutare progetti emergenti, assicurando che soddisfino esigenze reali e non alimentino tendenze di sovraesposizione.
La seguente tabella riassume queste combinazioni di proprietà in base all'intensità di cooperazione (da alta a bassa) e spiega come operano nella pratica all'interno di sistemi AI decentralizzati. La tabella fornisce anche alcuni esempi di progetti innovativi, mostrando gli scenari reali di applicazione di queste combinazioni. Attraverso questa tabella, i lettori possono avere una comprensione più intuitiva dei punti di intersezione tra blockchain e tecnologie AI, identificando aree veramente influenti e evitando direzioni eccessivamente enfatizzate o tecnologicamente impraticabili.
Matrice di cooperazione AI-Blockchain: punti di intersezione chiave classificati per intensità di cooperazione
Conclusione
L'integrazione della blockchain e dell'AI racchiude un enorme potenziale di cambiamento, ma lo sviluppo futuro richiede una direzione chiara e sforzi concentrati. I progetti che realmente guidano l'innovazione stanno plasmando il futuro dell'intelligenza decentralizzata affrontando sfide chiave come la privacy dei dati, la scalabilità e la fiducia. Ad esempio, l'apprendimento federato (privacy + decentralizzazione) consente la collaborazione proteggendo i dati degli utenti, mentre il calcolo e l'addestramento distribuiti (prestazioni + scalabilità) migliorano l'efficienza dei sistemi AI, e zkML (apprendimento automatico a conoscenza zero, verificabilità + sicurezza) garantisce la fiducia nei calcoli AI.
Allo stesso tempo, dobbiamo anche adottare un approccio prudente nei confronti di questo campo. Molti dei cosiddetti agenti intelligenti AI sono in realtà solo semplici rivestimenti di modelli esistenti, con funzionalità limitate e una combinazione con la blockchain che manca di profondità. I veri breakthrough verranno da progetti che sfruttano appieno i punti di forza sia della blockchain che dell'AI, e che si dedicano a risolvere problemi pratici, piuttosto che inseguire semplicemente prodotti che inseguono il mercato.
Guardando al futuro, la matrice di cooperazione AI-Blockchain diventerà uno strumento importante per valutare i progetti, aiutando efficacemente i decisori a distinguere tra innovazioni realmente influenti e rumori privi di significato.
Il prossimo decennio apparterrà a quei progetti in grado di combinare l'alta affidabilità della blockchain con il potere trasformativo dell'AI per risolvere problemi pratici. Ad esempio, l'addestramento di modelli a basso consumo energetico ridurrà significativamente il consumo energetico dei sistemi AI; la collaborazione a protezione della privacy fornirà un ambiente più sicuro per la condivisione dei dati; e la governance AI scalabile guiderà l'implementazione di sistemi intelligenti su scala più ampia e più efficiente. L'industria deve concentrarsi su queste aree chiave per davvero aprire il futuro dell'intelligenza decentralizzata.