Наконец-то у меня появилась возможность открыть для себя DeepSeek's r1
Позвольте мне объяснить простыми словами, почему инновации DeepSeek в области искусственного интеллекта поражают воображение людей (и, возможно, угрожают рыночной капитализации Nvidia в размере 2 триллионов долларов).
1/ Для начала немного контекста: в настоящее время обучение лучших моделей ИИ обходится чрезвычайно дорого. OpenAI, Anthropic и т. д. потратить более 100 миллионов долларов только на вычисления. Им нужны огромные центры обработки данных с тысячами графических процессоров стоимостью 40 000 долларов. Это как если бы для работы завода требовалась целая электростанция.
2/ DeepSeek пришел и сказал: «ЛОЛ, а что если мы сделаем это за 5 миллионов долларов?» И они не просто говорили, они это ДЕЛАЛИ. Их модели соответствуют или превосходят GPT-4 и Клода по многим задачам. Мир ИИ (как говорят мои подростки) потрясен.
3/ Как? Они переделали все сверху донизу. Традиционный ИИ возвращается к записи каждого числа с 32 знаками после запятой. DeepSeek подумал: «А что, если бы мы использовали просто 8 знаков после запятой?» Он все еще довольно точен! » Бум — требуется на 75% меньше памяти.
