Vamos falar sobre as novidades primeiro.
DeepSeek, um grande modelo doméstico de IA, expôs acidentalmente a versão v3. Seu desempenho é bastante poderoso nas classificações de testes multilíngues do Aider, ficando em segundo lugar com 48,4 pontos, ultrapassando o soneto Claude3.5 de uma só vez e perdendo apenas para o OpenAI. 61 pontos de o1.
Na avaliação do LiveBench, o DeepSeek v3 é o modelo de linguagem grande de código aberto mais forte e ocupa o segundo lugar entre os modelos de não inferência.
Quem desenvolveu um modelo tão incrível? Muitas pessoas podem pensar que é uma grande empresa de Internet.
errado! Este modelo foi desenvolvido pela Magic Square Quantitativamente Sim, é o mesmo Magic Square que realiza negociações quantitativas na China.
The rumor in the market is that this company has the most high-performance GPU cards in the country.
Additionally, according to media reports: Xiaomi is building a GPU cluster with tens of thousands of cards, increasing its investment in AI large models. Previously, Xiaomi already had 6,500 GPUs.
The latest core figure to join Xiaomi and lead the large model team is Luo Fuli, a key developer of DeepSeek v2.
Now everyone knows who they are trading against, calling it a nuclear-powered sickle is not an exaggeration.
To be honest, I am both happy about the progress of domestic large models and worried for the shareholders. Remember: the sell orders from 1 to 5 opposite you are likely international leading AI large models, everyone should be cautious.