TLDR:

  • Meta’s Llama è una famiglia di modelli di intelligenza artificiale generativa aperta con versioni 8B, 70B e 405B

  • I modelli Llama 3.1 hanno finestre di contesto da 128.000 token e possono eseguire varie attività basate su testo

  • Meta offre strumenti come Llama Guard e Prompt Guard per rendere Llama più sicuro da usare

  • Llama è disponibile sulle principali piattaforme cloud e alimenta i chatbot AI di Meta

  • Ci sono preoccupazioni circa potenziali problemi di copyright con i dati di addestramento di Llama

Meta, il gigante della tecnologia precedentemente noto come Facebook, ha compiuto passi da gigante nel campo dell'intelligenza artificiale con la sua ultima iterazione della famiglia di modelli Llama. Llama 3.1, rilasciato a luglio 2024, rappresenta un importante progresso nell'intelligenza artificiale open source, offrendo a sviluppatori e aziende un potente strumento per un'ampia gamma di applicazioni.

Llama 3.1 è disponibile in tre dimensioni: 8B, 70B e 405B, in riferimento al numero di parametri in ciascun modello. Le versioni 8B e 70B sono progettate per applicazioni più compatte, in grado di funzionare su dispositivi che vanno dai laptop ai server. Il modello 405B, tuttavia, è una versione su larga scala che in genere richiede hardware per data center per prestazioni ottimali.

Una delle caratteristiche più importanti di tutti i modelli Llama 3.1 è la loro impressionante finestra di contesto di 128.000 token, equivalenti a circa 100.000 parole o 300 pagine di testo. Questo contesto esteso consente ai modelli di mantenere coerenza e pertinenza su lunghi periodi di input, riducendo potenzialmente gli errori e migliorando la qualità complessiva dell'output.

Le capacità di Llama 3.1 abbracciano un'ampia gamma di attività basate su testo. Queste includono la codifica, la risposta a domande matematiche di base e la sintesi di documenti in otto lingue diverse. Il modello può analizzare vari tipi di file, inclusi PDF e fogli di calcolo. Sebbene Llama 3.1 al momento non elabori o generi immagini, può essere configurato per sfruttare app, strumenti e API di terze parti per completare le attività.

Meta ha reso disponibile Llama 3.1 sulle principali piattaforme cloud, collaborando con oltre 25 provider tra cui AWS, Google Cloud e Microsoft Azure. Questa ampia disponibilità mira a dare agli sviluppatori scelta e flessibilità nel modo in cui implementano e utilizzano il modello.

Per affrontare i problemi di sicurezza, Meta ha introdotto diversi strumenti insieme a Llama 3.1. Llama Guard funge da framework di moderazione per rilevare contenuti potenzialmente problematici, mentre Prompt Guard mira a proteggere dagli attacchi di iniezione rapida. Inoltre, CyberSecEval fornisce una suite per la valutazione del rischio di sicurezza informatica.

La natura aperta di Llama 3.1 lo distingue dagli altri principali modelli di intelligenza artificiale come GPT-4 di OpenAI e Gemini di Google, accessibili solo tramite API. Tuttavia, questa apertura comporta anche alcune restrizioni. Gli sviluppatori di app con oltre 700 milioni di utenti mensili devono richiedere una licenza speciale da Meta per utilizzare Llama 3.1.

Nonostante i suoi progressi, Llama 3.1 non è esente da potenziali problemi. Ci sono preoccupazioni in corso sull'uso di materiale protetto da copyright nei dati di training, il che potrebbe portare a complicazioni legali per gli utenti. Meta ha dovuto affrontare controlli e sfide legali in merito alle sue pratiche di training AI, tra cui una causa che ha coinvolto diversi autori per presunto uso non autorizzato di dati protetti da copyright.

Il rilascio di Llama 3.1 coincide con progressi più ampi nel campo dei grandi modelli linguistici. Anche altre aziende, come Microsoft con il suo modello Orca 2, stanno spingendo i confini delle capacità dell'IA. Questi sviluppi stanno guidando la necessità di applicazioni più specializzate dei modelli di IA.

Per soddisfare questa domanda, la messa a punto è diventata un processo essenziale. AWS di Amazon, ad esempio, offre ora strumenti tramite Amazon SageMaker JumpStart per aiutare gli sviluppatori a mettere a punto i modelli Llama 3 per attività specifiche del dominio. Questo processo può migliorare significativamente le prestazioni del modello in applicazioni mirate.

Il post Meta rilascia Llama 3.1: uno sguardo completo al modello di intelligenza artificiale open source è apparso per la prima volta su Blockonomi.