Napsal: Heart of the Metaverse

EvolutionaryScale, špičková výzkumná laboratoř umělé inteligence v biologii, nedávno oznámila, že obdržela více než 142 milionů USD v počátečním financování a vydala přelomový model umělé inteligence ESM3. Jaké jedinečné nápady má tato rok stará společnost v oblasti AI life sciences? Jaké technologické průlomy má nový velký proteinový model?

Před týdnem, kdy byla Meta v plném proudu na stopě Vincent Video, obdržel proteinový tým EvolutionaryScale, který byl rozpuštěn, více než 142 milionů dolarů v počátečním kole. Tato finanční částka je v celku směšně vysoká biotechnologický obor.

V srpnu loňského roku Meta oficiálně oznámila, že její tým Meta-FAIR pro skládání proteinů byl rozpuštěn. Tento čistě "věda + AI" projekt neumožní Meta rychle získat zisky a rozhodnutí Meta zaměřit se na komercializaci AI se zdá být rozumné.

Tento nedoceněný tým však ve skutečnosti praštil Metu do tváře za pouhý rok. Jejich nejnovější ESM3 je považován za přelomový generativní model umělé inteligence v oblasti biologie, který otevírá nové možnosti pro biologické programování.

01. 1 minutový přehled projektu

1. Název projektu: EvolutionaryScale

2. Datum založení: červenec 2023

3. Představení produktu:

Vývoj velkého jazykového modelu pro vytváření nových proteinů a dalších biologických systémů - ESM, v současnosti iterovaný na ESM-3.

4. Tým zakladatelů:

  • Hlavní vědec: Alexander Rives (PhD v oboru počítačových věd, New York University, bývalý vědec Facebook AI)

  • Tom Sercu

  • Sal Candido

5. Finanční situace:

Dokončeno počáteční kolo financování ve výši až 142 milionů $ 25. června 2024. Kolo vedli Nat Friedman a Daniel Gross a Lux ​​Capital za účasti Amazonu, NVentures (oddělení rizikového kapitálu Nvidie) a andělských investorů.

02. Snaha o týmovou práci a konzistentní koncepty

Pokroky v umělé inteligenci vytvořily nebývalé příležitosti pro biovědecký výzkum, včetně návrhu funkčních biomolekul, zejména proteinů. Použití umělé inteligence na proteinový design může nejen zlepšit efektivitu a úspěšnost proteinového designu, ale také pomoci lidstvu vyřešit některé z výzev, kterým čelí rychlou reakcí na propuknutí infekčních chorob.

Alexander Rives a další viděli mezeru v designu proteinů a rozhodli se vyvinout velké modely založené na hlubokém učení, čímž podpořili design proteinů na průmyslové úrovni do „éry plně automatické inteligentní generace“.

Tak vznikla EvolutionaryScale. Jedná se o špičkovou výzkumnou laboratoř AI se zaměřením na oblast biologických věd a je odhodlána spouštět rozsáhlé jazykové modely v popředí biologie.

Zajímavé je, že všech osm členů zakládajícího týmu společnosti pocházelo z oddělení Meta’s FAIR (Fundamental Artificial Intelligence Research). Navzdory frustraci ze světového giganta sociálních médií se základní členové původního týmu nevzdali, místo toho rychle vstoupili na nové bojiště a začali vyvíjet model nové generace na základě výsledků původního týmu.

Velké modely EvolutionaryScale podporují výzkum a vývoj v oblastech, jako je zdraví a environmentální věda, neustále zkoumají škálovatelnost biologie a podporují průlomový vědecký výzkum. Jedním z nejvýznamnějších výsledků je průlom v technologii skládání proteinů, modely ESM odhalily struktury stovek milionů metagenomických proteinů a pomohly vědcům na celém světě simulovat a porozumět proteinům.

EvolutionaryScale si klade za cíl řídit vývoj technologie umělé inteligence v oblasti designu proteinů prostřednictvím otevřených a bezpečných výzkumných metod.

Na tomto základě společnost jako signatář vedla více než 160 globálních zainteresovaných stran z akademického, vládního a soukromého sektoru, aby společně vyvinuli tuto technologii a zajistili, že je bezpečná a spolehlivá, čímž dosáhne vize přínosu pro lidské zdraví a společnost.

Alexander Rives a jeho tým se nikdy nezastaví kvůli pocitu odpovědnosti vést pokročilou technologii AI v biologickém světě.

Již dříve EvolutionaryScale vydala rozsáhlý jazykový model ESM1, který je považován za první transformační jazykový model pro proteiny a byl vytvořen zakládajícím týmem EvolutionaryScale při práci v Meta's FAIR oddělení. ESM2, vylepšený model ESM1, má 15 milionů parametrů a funguje lépe než starší model ESM1b (který má 650 milionů parametrů).

Minulý týden EvolutionaryScale vydala svůj nejnovější model ESM3 AI, což je obrovský krok směrem k budoucnosti biologie. Díky síle tohoto modelu je možné urychlit objevy s rozšířenými aplikacemi, které upřednostňují tvorbu proteinů, které pomáhají zachycovat uhlík pro vývoj nových způsobů léčby rakoviny.

03. Průkopník v aplikaci AI v biologii

ESM3 je generativní model umělé inteligence, jehož hlavní funkcí je generovat nové proteiny. Model využívá technologii hlubokého učení k trénování pomocí velkého množství proteinových dat, aby se naučil vztah mezi proteinovou sekvencí, strukturou a funkcí.

ESM3 byl trénován pomocí více než 1 bilionu teraflopů výpočetního výkonu, což je největší známá výpočetní škála v biologii. Byl trénován na datovém souboru 2,78 miliardy proteinů z přirozené rozmanitosti Země, což mu umožnilo současně uvažovat o proteinové sekvenci, struktuře a funkci.

Hlavní pracovní postup ESM3 lze zjednodušit do následujících čtyř kroků:

  • Sběr a zpracování dat: EvolutionaryScale nejprve shromáždí velké množství biologických dat z různých zdrojů, včetně genových sekvencí, proteinových struktur, funkčních anotací atd. Data budou vyčištěna, standardizována a naformátována pro usnadnění následné analýzy a aplikace.

  • Trénink modelu: Pomocí algoritmů hlubokého učení a velkého množství výpočetních zdrojů bude EvolutionaryScale trénovat zpracovaná data k vytvoření velkého jazykového modelu, který dokáže porozumět a předvídat biologické zákony. Nejen, že jsou tyto modely vysoce přesné, jsou také schopny zvládnout složité biologické problémy.

  • Generujte nové proteiny: Prostřednictvím interaktivních výzev je ESM3 schopen generovat nové proteiny, jejichž vývoj by v přírodě trval stovky milionů let.

  • Vědecké ověření: Vytvořené nové proteiny budou ověřeny vědeckými experimenty, aby se určily jejich funkce a potenciální aplikace.

V současné době je jedním z nejpřesvědčivějších případů použití ESM3 vytvoření nového zeleného fluorescenčního proteinu (GFP).

GFP je jedním z nejkrásnějších a jedinečných proteinů v přírodě, který je zodpovědný za záři medúz a živé fluorescenční barvy korálů. ESM3 vytvořil tento nový fluorescenční protein prostřednictvím myšlenkového procesu zahrnujícího 500 milionů let evoluce. Tento proces by v přirozené evoluci trval více než 500 milionů let, ale ESM3 tento skok umožnil výpočetně.

Vydání ESM3 také způsobilo revoluci v oblasti objevování léků a syntetické biologie.

Pokud jde o objevování léků, ESM3 může generovat nové proteiny se specifickými biologickými aktivitami, které poskytují více kandidátních molekul pro screening a optimalizaci léků. Současně může ESM3 také předvídat a optimalizovat mechanismus interakce mezi léčivy a cíli, čímž poskytuje více vědecký základ pro návrh a vývoj léčiv.

Z hlediska syntetické biologie je ESM3 schopen generovat biologické systémy se specifickými funkcemi, které poskytují nová řešení v oblastech, jako je biovýroba a bioenergie. ESM3 může například generovat enzymový systém, který účinně přeměňuje oxid uhličitý na organickou hmotu, což poskytuje nový přístup k zachycování a využití uhlíku.

Model ESM3 společnosti EvolutionaryScale představuje nový milník v AI v biologii. Očekává se, že ESM3 díky svým výkonným generačním schopnostem a spolupráci s průmyslovými lídry urychlí objevování nových proteinů a navrhování biologických systémů, což přinese revoluční dopad na budoucí vývoj léků, materiálové vědy a environmentální vědy.

04. Cesta inovací v oblasti biologie

Syntetická biologie: Programování života

Syntetická biologie je důležitým směrem pro budoucí vývoj EvolutionaryScale. Navrhováním a syntézou nových genetických okruhů a biologických cest mohou vědci vytvářet organismy se specifickými funkcemi.

  • Genetické obvody jsou podobné elektronickým obvodům, ale řídí biologické procesy v buňkách.

Genové obvody umožňují přesné řízení specifické genové exprese v buňkách. Genetický obvod může být například navržen tak, aby zapínal nebo vypínal expresi specifického genu, když buňka detekuje specifický signál, jako je určitá chemická látka nebo změna prostředí.

  • Syntetické biologické dráhy zahrnují kombinaci více enzymů a metabolických drah používaných k produkci cenných sloučenin.

Prostřednictvím analýzy a návrhu umělé inteligence mohou vědci vytvořit nové metabolické cesty, které organizmům umožní syntetizovat sloučeniny, které nelze produkovat přirozeně. Mikroorganismy mohou například vyrábět farmaceutické meziprodukty, biopaliva nebo průmyslové chemikálie přepracováním svých metabolických cest.

  • Buněčná továrna je biologický systém, který využívá genetické inženýrství k modifikaci mikroorganismů tak, aby efektivně produkovaly cílové produkty v průmyslových podmínkách.

Prostřednictvím designu s pomocí AI mohou vědci modifikovat genomy mikroorganismů tak, aby vykazovaly vynikající produkční výkon za specifických podmínek. Například úpravou genů kvasinek nebo bakterií mohou vědci tyto mikroorganismy účinněji vyrábět antibiotika, enzymy nebo jiné biologické produkty.

Pokud se tato technologie bude moci nadále vyvíjet, podpoří nejen špičkový vývoj vědeckého výzkumu, ale také přinese důležité aplikační vyhlídky v oblastech, jako je medicína, ochrana životního prostředí a zemědělství.

Personalizovaná medicína založená na datech

EvolutionaryScale podporuje pokrok v personalizované medicíně prostřednictvím AI a technologie analýzy velkých dat, aby pacientům poskytla přesnější a efektivnější lékařské služby.

Personalizovaná medicína je založena na jedinečných biologických informacích a klinických datech každého pacienta, aby bylo možné přizpůsobit nejvhodnější léčebný plán. Jednou z klíčových oblastí je genomická analýza. Komplexním sekvenováním a analýzou genomu pacienta mohou vědci identifikovat genetické varianty spojené s onemocněním.

EvolutionaryScale využívá technologii AI k rychlé a přesné analýze velkého množství genomických dat za účelem odhalení potenciálních rizikových faktorů onemocnění.

Tento přístup může lékařům pomoci diagnostikovat onemocnění v raných stádiích a přijmout preventivní opatření. Například analýzou mutací genů BRCA1 a BRCA2 u pacientek s rakovinou prsu lze předpovědět jejich riziko, což umožňuje včasný screening a intervenci.

Dnes je EvolutionaryScale v popředí integrace biologie a umělé inteligence, věnuje se programování a optimalizaci biologických systémů prostřednictvím neustálých inovací a průzkumu. V budoucnu může být dosaženo více technologických průlomů, které vytvoří chytřejší a zdravější budoucnost pro lidstvo.