Scris de: Heart of the Metaverse

EvolutionaryScale, un laborator de cercetare de ultimă oră în domeniul inteligenței artificiale în biologie, a anunțat recent că a primit peste 142 de milioane de dolari SUA în finanțare rundă și a lansat modelul emblematic AI ESM3. Ce idei unice are această companie veche de un an în domeniul științelor vieții AI? Ce fel de descoperiri tehnologice are noul model de proteine ​​mari?

În urmă cu o săptămână, când Meta era în plină desfășurare pe piesa Vincent Video, echipa de proteine ​​EvolutionaryScale, care a fost desființată de aceasta, a primit o finanțare de peste 142 de milioane de dolari, se poate spune că această sumă de finanțare este ridicol de mare domeniul biotehnologiei.

În august anul trecut, Meta a anunțat oficial că echipa sa de pliere a proteinelor Meta-FAIR a fost desființată. Acest proiect pur „știință + IA” nu îi va permite Meta să obțină profit rapid, iar decizia lui Meta de a se concentra pe comercializarea AI pare a fi rezonabilă.

Cu toate acestea, această echipă subapreciată i-a dat o palmă pe Meta în doar un an. Cel mai recent ESM3 al lor este considerat un model AI generativ de reper în domeniul biologiei, deschizând noi posibilități pentru programarea biologică.

01. Prezentare generală a proiectului de 1 minut

1. Numele proiectului: EvolutionaryScale

2. Data înființării: iulie 2023

3. Introducere produs:

Dezvoltarea unui model de limbaj mare pentru crearea de noi proteine ​​și alte sisteme biologice - ESM, repetată în prezent la ESM-3.

4. Echipa fondatoare:

  • Om de știință șef: Alexander Rives (doctor în Informatică, Universitatea din New York, fost om de știință Facebook AI)

  • Tom Sercu

  • Sal Candido

5. Situația finanțării:

A finalizat o rundă de finanțare inițială de până la 142 milioane USD pe 25 iunie 2024. Runda a fost condusă de Nat Friedman și Daniel Gross și Lux Capital, cu participarea Amazon, NVentures (filiala cu capital de risc a Nvidia) și investitori îngeri.

02. Urmărirea muncii în echipă și a conceptelor consistente

Progresele în inteligența artificială au creat oportunități fără precedent pentru cercetarea în domeniul bioștiinței, inclusiv proiectarea de biomolecule funcționale, în special proteine. Aplicarea inteligenței artificiale la proiectarea proteinelor poate nu numai să îmbunătățească eficiența și rata de succes a proiectării proteinelor, ci și să ajute omenirea să rezolve unele dintre provocările cu care se confruntă, răspunzând rapid la focarele de boli infecțioase.

Alexander Rives și alții au văzut decalajul în proiectarea proteinelor și au decis să dezvolte modele mari bazate pe învățarea profundă, promovând astfel proiectarea proteinelor la nivel industrial în „era generării inteligente complet automate”.

Astfel, EvolutionaryScale a luat ființă. Este un laborator de cercetare AI de ultimă oră, care se concentrează pe domeniul științelor biologice și se angajează să lanseze modele de limbaj la scară largă în fruntea biologiei.

Interesant este că toți cei opt membri ai echipei fondatoare a companiei provin din departamentul FAIR (Fundamental Artificial Intelligence Research) al lui Meta. În ciuda faptului că au fost frustrați de gigantul social media de clasă mondială, membrii de bază ai echipei inițiale nu au renunțat, în schimb, au intrat rapid pe noul câmp de luptă și au început să dezvolte modelul de generație următoare bazat pe rezultatele echipei originale.

Modelele mari EvolutionaryScale susțin cercetarea și dezvoltarea în domenii precum sănătatea și știința mediului, explorând în mod constant scalabilitatea biologiei și alimentând cercetarea științifică inovatoare. Unul dintre cele mai semnificative rezultate este descoperirea tehnologiei de pliere a proteinelor, modelele ESM au dezvăluit structurile a sute de milioane de proteine ​​metagenomice, ajutând oamenii de știință din întreaga lume să simuleze și să înțeleagă proteinele.

EvolutionaryScale își propune să ghideze dezvoltarea tehnologiei inteligenței artificiale în domeniul proiectării proteinelor prin metode de cercetare deschise și sigure.

Pe această bază, compania, în calitate de semnatar, a condus peste 160 de părți interesate globale din mediul academic, guvern și privat să dezvolte în comun această tehnologie și să se asigure că este sigură și fiabilă, realizând astfel viziunea de a aduce beneficii sănătății umane și societății.

Tocmai din cauza simțului responsabilității de a conduce tehnologia AI avansată în lumea biologică, Alexander Rives și echipa sa nu se opresc niciodată.

Anterior, EvolutionaryScale a lansat modelul de limbaj la scară largă ESM1, care este considerat primul model de limbaj transformator pentru proteine ​​și a fost construit de echipa fondatoare a EvolutionaryScale în timp ce lucra în departamentul FAIR al Meta. ESM2, un model modernizat de ESM1, are 15 milioane de parametri și are performanțe mai bune decât modelul mai vechi ESM1b (care are 650 de milioane de parametri).

Săptămâna trecută, EvolutionaryScale a lansat cel mai recent model ESM3 AI, un pas uriaș către viitorul biologiei. Cu puterea acestui model, este posibilă accelerarea descoperirilor cu aplicații pe scară largă, favorizând crearea de proteine ​​care ajută la captarea carbonului pentru a dezvolta noi tratamente pentru cancer.

03.Pionier în aplicarea IA în biologie

ESM3 este un model AI generativ a cărui funcție principală este de a genera noi proteine. Modelul folosește tehnologia de învățare profundă pentru a se antrena folosind o cantitate mare de date despre proteine ​​pentru a afla relația dintre secvența proteinelor, structură și funcție.

ESM3 a fost antrenat folosind mai mult de 1 trilion de teraflopi de putere de calcul, cea mai mare scară de calcul cunoscută în biologie. A fost instruit pe un set de date de 2,78 miliarde de proteine ​​din diversitatea naturală a Pământului, permițându-i să raționeze simultan despre secvența, structura și funcționarea proteinelor.

Fluxul de lucru principal al ESM3 poate fi simplificat în următorii patru pași:

  • Colectarea și procesarea datelor: EvolutionaryScale colectează mai întâi o cantitate mare de date biologice din diverse surse, inclusiv secvențe de gene, structuri de proteine, adnotări funcționale etc. Datele vor fi curățate, standardizate și formatate pentru a facilita analiza și aplicarea ulterioară.

  • Antrenamentul modelului: Folosind algoritmi de învățare profundă și o cantitate mare de resurse de calcul, EvolutionaryScale va antrena datele procesate pentru a construi un model de limbaj mare care poate înțelege și prezice legile biologice. Aceste modele nu numai că sunt foarte precise, ci și sunt capabile să gestioneze probleme biologice complexe.

  • Generați noi proteine: prin intermediul solicitărilor interactive, ESM3 este capabil să genereze noi proteine ​​care ar fi durat sute de milioane de ani pentru a evolua în natură.

  • Validare științifică: Noile proteine ​​generate vor fi validate prin experimente științifice pentru a le determina funcțiile și aplicațiile potențiale.

În prezent, unul dintre cele mai convingătoare cazuri de utilizare pentru ESM3 este generarea unei noi proteine ​​fluorescente verzi (GFP).

GFP este una dintre cele mai frumoase și unice proteine ​​din natură, responsabilă de strălucirea meduzelor și de culorile fluorescente vii ale coralilor. ESM3 a creat această nouă proteină fluorescentă printr-un proces de gândire care acoperă 500 de milioane de ani de evoluție. Acest proces ar putea dura mai mult de 500 de milioane de ani în evoluția naturală, dar ESM3 face acest salt posibil din punct de vedere computațional.

Lansarea ESM3 a revoluționat, de asemenea, domeniile descoperirii de medicamente și biologiei sintetice.

În ceea ce privește descoperirea medicamentelor, ESM3 poate genera proteine ​​noi cu activități biologice specifice, oferind mai multe molecule candidate pentru screening-ul și optimizarea medicamentelor. În același timp, ESM3 poate, de asemenea, prezice și optimiza mecanismul de interacțiune dintre medicamente și ținte, oferind o bază mai științifică pentru proiectarea și dezvoltarea medicamentelor.

În ceea ce privește biologia sintetică, ESM3 este capabil să genereze sisteme biologice cu funcții specifice, oferind noi soluții în domenii precum bioproducția și bioenergia. De exemplu, ESM3 poate genera un sistem enzimatic care convertește eficient dioxidul de carbon în materie organică, oferind o nouă abordare a captării și utilizării carbonului.

Modelul ESM3 de la EvolutionaryScale reprezintă o nouă piatră de hotar în AI în biologie. Prin capabilitățile sale puternice de generare și colaborarea cu liderii din industrie, ESM3 este de așteptat să accelereze descoperirea de noi proteine ​​și proiectarea sistemelor biologice, aducând un impact revoluționar dezvoltării viitoare a medicamentelor, științei materialelor și științei mediului.

04. Călătoria inovației în domeniul biologiei

Biologie sintetică: programarea vieții

Biologia sintetică este o direcție importantă pentru dezvoltarea viitoare a EvolutionaryScale. Prin proiectarea și sintetizarea de noi circuite genetice și căi biologice, oamenii de știință pot crea organisme cu funcții specifice.

  • Circuitele genetice sunt similare cu circuitele electronice, dar controlează procesele biologice din celule.

Circuitele genice permit controlul precis al expresiei genelor specifice în interiorul celulelor. De exemplu, un circuit genetic poate fi proiectat pentru a activa sau opri expresia unei anumite gene atunci când celula detectează un semnal specific, cum ar fi o anumită substanță chimică sau o schimbare de mediu.

  • Căile biologiei sintetice implică combinația de mai multe enzime și căi metabolice utilizate pentru a produce compuși valoroși.

Prin analiza și designul AI, oamenii de știință pot crea noi căi metabolice care permit organismelor să sintetizeze compuși care nu pot fi produși în mod natural. De exemplu, microorganismele pot produce intermediari farmaceutici, biocombustibili sau substanțe chimice industriale prin reproiectarea căilor lor metabolice.

  • Fabrica de celule este un sistem biologic care folosește inginerie genetică pentru a modifica microorganismele pentru a produce eficient produse țintă în condiții industriale.

Prin proiectarea asistată de IA, oamenii de știință pot modifica genomul microorganismelor, astfel încât acestea să poată prezenta performanțe excelente de producție în condiții specifice. De exemplu, prin editarea genelor drojdiei sau bacteriilor, oamenii de știință pot eficientiza aceste microorganisme în producerea de antibiotice, enzime sau alte produse biologice.

Dacă această tehnologie poate continua să se dezvolte, nu numai că va promova dezvoltarea de ultimă oră a cercetării științifice, dar va aduce și perspective importante de aplicare în domenii precum medicina, protecția mediului și agricultura.

Medicină personalizată bazată pe date

EvolutionaryScale promovează progresul medicinei personalizate prin IA și tehnologia de analiză a datelor mari pentru a oferi pacienților servicii medicale mai precise și mai eficiente.

Medicina personalizată se bazează pe informațiile biologice și datele clinice unice ale fiecărui pacient pentru a adapta cel mai potrivit plan de tratament. Un domeniu cheie este analiza genomică. Prin secvențierea și analiza completă a genomului unui pacient, oamenii de știință pot identifica variantele genetice asociate cu boala.

EvolutionaryScale folosește tehnologia AI pentru a analiza rapid și precis cantități mari de date genomice pentru a descoperi potențiali factori de risc de boală.

Această metodă poate ajuta medicii să diagnosticheze boala în stadiile incipiente și să ia măsuri preventive. De exemplu, prin analizarea mutațiilor genelor BRCA1 și BRCA2 la pacienții cu cancer de sân, riscul acestora poate fi prezis, permițând screening-ul și intervenția precoce.

Astăzi, EvolutionaryScale este în fruntea integrării biologiei și inteligenței artificiale, dedicată programării și optimizării sistemelor biologice prin inovare și explorare continuă. Mai multe progrese tehnologice pot fi realizate în viitor, creând un viitor mai inteligent și mai sănătos pentru omenire.