Konečně jsem měl příležitost objevit DeepSeek r1
Dovolte mi vysvětlit, proč inovace AI společnosti DeepSeek odvádějí lidi pryč (a možná ohrožují tržní strop Nvidie ve výši 2 bilionů dolarů) jednoduše.
1/ Nejprve několik souvislostí: V současné době je školení nejlepších modelů umělé inteligence extrémně nákladné. OpenAI, Anthropic atd. utratit více než 100 milionů dolarů jen za výpočetní techniku. Potřebují masivní datová centra s tisíci GPU za 40 000 USD. Je to jako potřebovat celou elektrárnu na provoz továrny.
2/ DeepSeek přišel a řekl "LOL, co kdybychom to udělali za 5 milionů dolarů?" A nejenom to mluvili, oni to DĚLALI. Jejich modely se v mnoha úkolech vyrovnají nebo porazí GPT-4 a Clauda. Svět AI je (jak říkají moji teenageři) otřesený.
3/ Jak? Všechno předělali odshora dolů. Tradiční umělá inteligence se vrací k zápisu každého čísla na 32 desetinných míst. DeepSeek si pomyslel: "Co kdybychom použili jen 8 desetinných míst?" Pořád je to docela přesné! » Boom – potřeba paměti o 75 % méně.
