J'ai Enfin eu l'Occasion de Découvrir la r1 de DeepSeek

Laissez-moi vous expliquer pourquoi les innovations en matière d'IA de DeepSeek époustouflent les gens (et menacent peut-être la capitalisation boursière de 2 000 milliards de dollars de Nvidia) en termes simples..

1/ Tout d'abord, un peu de contexte : à l'heure actuelle, la formation des meilleurs modèles d'IA est extrêmement coûteuse. OpenAI, Anthropic, etc. dépensent plus de 100 millions de dollars rien que pour le calcul. Ils ont besoin de centres de données massifs avec des milliers de GPU à 40 000 dollars. C'est comme avoir besoin d'une centrale électrique entière pour faire fonctionner une usine.

2/ DeepSeek est arrivé et a dit "MDR, et si on faisait ça pour 5 millions de dollars ?" Et ils ne se sont pas contentés de parler, ils l'ont FAIT. Leurs modèles égalent ou battent GPT-4 et Claude sur de nombreuses tâches. Le monde de l'IA est (comme disent mes adolescents) secoué.

3/ Comment ? Ils ont tout repensé de fond en comble. L'IA traditionnelle revient à écrire chaque nombre avec 32 décimales. DeepSeek s'est dit : « Et si on utilisait juste 8 décimales ? C'est quand même assez précis ! » Boom - 75 % de mémoire en moins nécessaire.

$FET

BTC
Created with Highcharts 9.1.1
0.799
+4.58%