Endlich hatte ich die Gelegenheit, DeepSeeks r1 zu entdecken

Ich möchte in einfachen Worten erklären, warum die KI-Innovationen von DeepSeek die Leute umhauen (und möglicherweise die Marktkapitalisierung von Nvidia in Höhe von 2 Billionen US-Dollar bedrohen).

1/ Zunächst einige Hintergrundinformationen: Derzeit ist das Training der besten KI-Modelle extrem teuer. OpenAI, Anthropic usw. Geben Sie über 100 Millionen Dollar allein für Computer aus. Sie benötigen riesige Rechenzentren mit Tausenden von GPUs im Wert von 40.000 US-Dollar. Es ist, als bräuchte man ein ganzes Kraftwerk, um eine Fabrik zu betreiben.

2/ DeepSeek kam vorbei und sagte: „LOL, was wäre, wenn wir das für 5 Millionen Dollar machen würden?“ Und sie haben nicht nur darüber geredet, sie haben es TATEN. Ihre Modelle sind bei vielen Aufgaben mit GPT-4 und Claude vergleichbar oder besser als diese. Die KI-Welt ist (wie meine Teenager sagen) erschüttert.

3/ Wie? Sie haben alles von oben bis unten neu gestaltet. Bei herkömmlicher KI wird jede Zahl auf 32 Dezimalstellen genau geschrieben. DeepSeek dachte: „Was wäre, wenn wir einfach 8 Dezimalstellen verwenden würden?“ Es ist immer noch ziemlich genau! » Boom – 75 % weniger Speicher erforderlich.

$FET

BTC
Created with Highcharts 9.1.1
0,786
+2.88%