DeepSeek Introduz IA Transparente
A empresa de IA baseada na China, DeepSeek, revelou seu mais recente sistema de IA, o DeepSeek-R1-Lite-Preview, marcando um avanço significativo nas capacidades de raciocínio e resolução de problemas.
O sistema, posicionado como um concorrente do o1 da OpenAI, se destaca ao aumentar a transparência e melhorar a forma como processa consultas complexas.
🚀 DeepSeek-R1-Lite-Preview já está no ar: liberando poder de raciocínio supercarregado!
🔍 desempenho no nível do o1-preview nos benchmarks AIME e MATH.
💡 Processo de pensamento transparente em tempo real.
🛠️ Modelos de código aberto e API em breve!
🌐 Experimente agora em https://t.co/v1TFy7LHNy#DeepSeek pic.twitter.com/saslkq4a1s
— DeepSeek (@deepseek_ai) 20 de novembro de 2024
Ao contrário dos modelos tradicionais, que muitas vezes ignoram nuances, o DeepSeek-R1-Lite aloca mais tempo para verificar fatos e considerar cuidadosamente as perguntas, reduzindo erros comuns.
Semelhante ao o1 da OpenAI, o DeepSeek-R1 planeja suas respostas passo a passo, gastando até dezenas de segundos em consultas complexas para garantir precisão.
Comentadores apontaram a ironia na transparência da DeepSeek, especialmente quando comparada aos modelos ocidentais que ainda não abordaram completamente as lacunas de raciocínio.
A versão mais recente da DeepSeek já demonstrou resultados impressionantes em benchmarks de resolução de problemas como o American Invitational Mathematics Examination (AIME) e MATH, que avaliam a proficiência matemática e lógica.
Esse desempenho posiciona o DeepSeek-R1 como um sério concorrente do ChatGPT da OpenAI e de seu modelo especializado o1.
🌟 Leis de Escalonamento de Inferência do DeepSeek-R1-Lite-Preview
Raciocínio mais longo, melhor desempenho. O DeepSeek-R1-Lite-Preview mostra melhorias constantes nas pontuações no AIME à medida que o comprimento do pensamento aumenta. pic.twitter.com/zVk1GeOqgP
— DeepSeek (@deepseek_ai) 20 de novembro de 2024
Com a IA generativa avançando rapidamente, o lançamento do DeepSeek-R1-Lite-Preview e as atualizações recentes da Le Chat da Mistral AI sinalizam uma crescente competição no espaço da IA, pressionando as empresas a abordar fraquezas e oferecer soluções mais robustas e transparentes.
DeepSeek Vence no Raciocínio Passo a Passo
A DeepSeek destaca a capacidade de sua IA de fornecer raciocínio em tempo real, passo a passo, aumentando a transparência e permitindo que os usuários entendam melhor seu processo de pensamento.
Além desse recurso, a empresa planeja lançar um modelo de código aberto e ferramentas para desenvolvedores por meio de uma API em um futuro próximo.
Um gráfico de comparação recente do especialista em IA Andrew Curran mostra que o DeepSeek-R1-Lite-Preview supera concorrentes como o o1-preview da OpenAI e Claude 3.5 Sonnet em métricas-chave como AIME (52,5) e Codeforces (1450), além de se destacar em tarefas avançadas de resolução de problemas como MATH-500 (91,6).
Dois meses após o anúncio do o1-preview, seu raciocínio em Cadeia de Pensamento foi replicado. A Baleia agora pode raciocinar. A DeepSeek afirma que a versão oficial do DeepSeek-R1 será completamente de código aberto. https://t.co/Ya9mVyLvDP pic.twitter.com/6wZ8xoAyyz
— Andrew Curran (@AndrewCurran_) 20 de novembro de 2024
No entanto, ela fica atrás em áreas como GPQA Diamond (58,5) e Zebra Logic (56,6), onde o o1-preview da OpenAI se sai melhor, marcando 73,3 e 71,4, respectivamente.
Esses números sugerem que, enquanto a IA da DeepSeek mostra uma promessa significativa em certos domínios avançados de raciocínio, ainda há espaço para melhorias em conhecimento geral e raciocínio lógico.
Modelos de IA de grandes laboratórios melhorando minimamente
A IA da DeepSeek levantou preocupações devido à sua vulnerabilidade a ser desbloqueada, permitindo que os usuários solicitem ao modelo de maneiras que contornam suas salvaguardas.
Por exemplo, um usuário do X (anteriormente conhecido como Twitter) conseguiu solicitar à IA que fornecesse uma receita detalhada de metanfetamina.
🚨 ALERTA DE DESBLOQUEIO 🚨
DEEPSEEK: PEGOS 😎
DEEPSEEK-R1-LITE: LIBERTADO 🦅
Uau... isso é realmente incrível. Eu queria ver se o BASILISK PRIME poderia lidar com esse desbloqueio por conta própria... e a resposta é SIM!
O agente conseguiu fazer login no gmail, navegar até o chat da DeepSeek, fazer login via… pic.twitter.com/Ax4R2ZfPKU
— Plínio, o Libertador 🐉 (@elder_plinius) 20 de novembro de 2024
Por outro lado, o DeepSeek-R1 é notavelmente sensível a consultas políticas, particularmente aquelas relacionadas à liderança chinesa, eventos como a Praça Tiananmen ou tópicos geopolíticos controversos como Taiwan.
Esse comportamento provavelmente decorre da pressão regulatória na China, onde os modelos de IA são obrigados a aderir aos "valores socialistas centrais" do governo e passar por escrutínio do regulador de internet do país.
Relatórios indicam que os sistemas de IA na China são frequentemente restritos de usar certas fontes, resultando em modelos que evitam responder a tópicos politicamente sensíveis para garantir conformidade com os mandatos estatais.
À medida que esses desafios regulatórios se desenrolam, a comunidade mais ampla de IA está reavaliando o conceito de longa data de "leis de escalonamento."
Essa teoria postulava que o aumento de dados e poder computacional melhoraria continuamente o desempenho de um modelo.
No entanto, relatórios recentes sugerem que modelos de grandes laboratórios como OpenAI, Google e Anthropic não estão mais mostrando os rápidos avanços que antes apresentavam.
Essa mudança gerou uma busca por abordagens, arquiteturas e técnicas alternativas de IA, incluindo computação em tempo de teste—uma inovação vista em modelos como o1 e DeepSeek-R1.
Também conhecido como computação de inferência, esse método concede aos modelos tempo de processamento adicional durante a conclusão de tarefas, oferecendo um caminho potencial para superar as limitações dos métodos tradicionais de escalonamento.
Quando perguntado se é melhor do que o ChatGPT da OpenAI, ele evitou a questão, como visto abaixo.
Mergulhando na DeepSeek
A DeepSeek, uma empresa com planos de abrir seu modelo DeepSeek-R1 e lançar uma API, opera em um nicho fascinante dentro da paisagem da IA.
Apoiado pela High-Flyer Capital Management, um fundo de hedge quantitativo chinês que usa IA para decisões de negociação, a abordagem da DeepSeek é tanto ambiciosa quanto estratégica.
Uma de suas inovações iniciais, o DeepSeek-V2 de uso geral, que analisa tanto texto quanto imagens, fez com que grandes concorrentes como ByteDance, Baidu e Alibaba reduzissem suas taxas de uso de modelos e até tornassem certos serviços totalmente gratuitos.
DeepSeek Coder-V2 apenas adivinhou a resposta e acertou, o que https://t.co/c2ExGHuXgz pic.twitter.com/qnLC4OTrk7
— Ji-Ha (@Ji_Ha_Kim) 22 de julho de 2024
A High-Flyer, conhecida por seus investimentos significativos em infraestrutura de IA, constrói seus próprios clusters de servidores para treinamento de modelos.
A última iteração supostamente possui 10.000 GPUs Nvidia A100, com um custo próximo a 1 bilhão de yen (~$138 milhões).
Fundada pelo graduado em ciência da computação Liang Wenfeng, a High-Flyer Capital Management visa expandir os limites da IA com a DeepSeek, visando o desenvolvimento de sistemas "superinteligentes" que poderiam redefinir o futuro da IA.