Endlich hatte ich die Gelegenheit, DeepSeeks r1 zu entdecken
Ich möchte in einfachen Worten erklären, warum die KI-Innovationen von DeepSeek die Leute umhauen (und möglicherweise die Marktkapitalisierung von Nvidia in Höhe von 2 Billionen US-Dollar bedrohen).
1/ Zunächst einige Hintergrundinformationen: Derzeit ist das Training der besten KI-Modelle extrem teuer. OpenAI, Anthropic usw. Geben Sie über 100 Millionen Dollar allein für Computer aus. Sie benötigen riesige Rechenzentren mit Tausenden von GPUs im Wert von 40.000 US-Dollar. Es ist, als bräuchte man ein ganzes Kraftwerk, um eine Fabrik zu betreiben.
2/ DeepSeek kam vorbei und sagte: „LOL, was wäre, wenn wir das für 5 Millionen Dollar machen würden?“ Und sie haben nicht nur darüber geredet, sie haben es TATEN. Ihre Modelle sind bei vielen Aufgaben mit GPT-4 und Claude vergleichbar oder besser als diese. Die KI-Welt ist (wie meine Teenager sagen) erschüttert.
3/ Wie? Sie haben alles von oben bis unten neu gestaltet. Bei herkömmlicher KI wird jede Zahl auf 32 Dezimalstellen genau geschrieben. DeepSeek dachte: „Was wäre, wenn wir einfach 8 Dezimalstellen verwenden würden?“ Es ist immer noch ziemlich genau! » Boom – 75 % weniger Speicher erforderlich.
