À medida que a concorrência se intensifica no campo da IA, o gigante do varejo chinês Alibaba revelou seu QwQ-32B-Preview, que supostamente supera a série o1 da OpenAI.

O modelo mais recente supostamente brilha em comparação com os modelos o1-preview e o1-mini da OpenAI em alguns benchmarks específicos, como os testes AIME e MATH, que avaliam o desempenho dos modelos de IA em quebra-cabeças lógicos e problemas matemáticos.

A Alibaba disponibilizou o QwQ-32B-Preview para download.

De acordo com o gigante do varejo, o novo modelo da Alibaba é capaz de enfrentar problemas complexos e intrincados em comparação com modelos de linguagem grandes normais (LLMs) como ChatGPT-4 e Claude 3.5.

Um artigo da Benzinga indica que o QwQ-32B-Preview é um dos poucos disponíveis sob uma licença permissiva, permitindo que os usuários o baixem e o utilizem. O modelo agora está disponível na plataforma de desenvolvimento de IA Hugging Face.

No entanto, a Alibaba lançou certos componentes do modelo para limitar a replicação total do modelo ou insights sobre seu funcionamento.

O mais recente modelo da Alibaba possui 32,5 bilhões de parâmetros, o que permite lidar com solicitações de até 32.000 palavras. Com as capacidades significativas do modelo e a acessibilidade semi-aberta, a nova entrada da Alibaba prepara o terreno para um salto transformador nas tecnologias de raciocínio em IA.

O anúncio transparente da Alibaba, que sublinha a sofisticação de seu modelo, a OpenAI manteve a contagem de parâmetros em segredo.

A chegada desse modelo ocorre em um momento em que a OpenAI está fazendo avanços significativos no setor de IA. Em outubro, a avaliação da OpenAI saltou para $157 bilhões após uma rodada de financiamento bem-sucedida.

No início desta semana, o SoftBank Group SFTBF supostamente aumentou sua participação na empresa criadora do ChatGPT através de uma recompra de ações de funcionários de $1,5 bilhão.

A OpenAI também está supostamente explorando o desenvolvimento de seu próprio navegador da web para desafiar o navegador Google Chrome da subsidiária Alphabet, após pressão do Departamento de Justiça dos EUA para se desfazer.

A Alibaba admite que o modelo também tem falhas

Embora possua algumas forças únicas, o novo modelo também tem limitações. De acordo com o grupo, o QwQ-32B-Preview apresenta problemas como mudanças inesperadas de idioma, o que pode potencialmente confundir os usuários. O modelo também tem um desempenho abaixo do esperado em tarefas que requerem raciocínio de senso comum, o que é comum em muitos sistemas de IA.

Segundo o AutoGPT, o modelo pode ficar preso em loops lógicos, atrasando as respostas.

Apesar de suas deficiências, suas capacidades de raciocínio permitem que ele verifique a si mesmo, reduzindo assim erros, mas aumentando o tempo de resolução.

Ao raciocinar sobre tarefas e planejar etapas, o modelo da Alibaba evita algumas armadilhas que afetam os sistemas de IA tradicionais. Mas essa abordagem exige tempo extra, o que pode limitar a aplicação em tempo real.

De acordo com a Benzinga, as respostas do QwQ-32B-Preview estão alinhadas com os padrões regulatórios chineses, evitando tópicos politicamente sensíveis.

Por exemplo, tópicos politicamente sensíveis como Taiwan darão respostas que estão alinhadas com a posição do governo chinês.

Além disso, solicitações sobre eventos como a Praça Tiananmen resultam em nenhuma resposta, mostrando o design cauteloso do modelo.

Embora isso possa ser ideal para o mercado chinês, também pode limitar seu apelo no mercado global. No entanto, o modelo é um passo significativo para o mundo da IA de raciocínio. Embora suas limitações possam restringir seu apelo global, seus outros componentes, como lógica e natureza semi-aberta, o tornam um grande concorrente para a OpenAI.

Segundo o AutoGPT, o QwQ-32B-Preview destaca o potencial e os desafios dessa emocionante fronteira onde laboratórios de IA ao redor do mundo estão trabalhando para refinar a tecnologia de raciocínio.

De Zero a Web3 Pro: Seu Plano de Lançamento de Carreira em 90 Dias