Ilya Sutskever, cofundador da OpenAI, destacou em 15/12 na conferência NeurIPS em Vancouver, Canadá, que o desenvolvimento da IA chegou a um ponto crítico, onde a tecnologia de pré-treinamento está enfrentando um gargalo, e no futuro, a IA se moverá em direção à superinteligência artificial (ASI).

Os dados de pré-treinamento da IA enfrentam um 'teto', a transformação é inevitável.

Sutskever afirmou na conferência que a era de pré-treinamento da IA está chegando ao fim. Ele acredita que a quantidade de dados disponíveis na internet está se aproximando de um limite, e no futuro, novas tecnologias serão necessárias para continuar impulsionando a IA em direção à próxima fase, culminando no desenvolvimento da superinteligência artificial (ASI).

Sutskever observou que, com os contínuos avanços em hardware e software, a capacidade computacional da IA aumentou significativamente, mas os dados utilizados para treinar a IA não podem ser expandidos indefinidamente. Sutskever comparou os dados ao 'combustível fóssil' da IA, afirmando: 'Os dados não crescerão indefinidamente, pois a internet é única. Os dados são como o combustível fóssil da IA, que está quase se esgotando; no futuro, será necessário encontrar maneiras de utilizar plenamente os dados existentes.'

(Nota: modelo de pré-treinamento refere-se àquele que não precisa ser treinado do zero, mas que já aprendeu conhecimentos básicos.)

Três tecnologias-chave para impulsionar o desenvolvimento da IA.

Embora Sutskever tenha destacado os problemas atuais da IA na conferência, ele também apresentou três tecnologias-chave que podem influenciar a evolução da IA para a superinteligência artificial (ASI) no futuro:

  1. IA Autônoma (Agentic AI): capaz de tomar decisões e executar tarefas de forma independente, sem intervenção humana, ajustando seu comportamento dinamicamente com base em objetivos e ambientes. Diferente do Agente de IA, que geralmente age de forma passiva ou com base em lógica fixa, necessitando de mais intervenção humana.

  2. Dados Sintéticos (Synthetic Data): utilização de IA para gerar dados simulados de alta qualidade, resolvendo o problema da escassez de dados. Por exemplo: se quisermos treinar um modelo de IA para reconhecer veículos em movimento na estrada, mas os dados de tráfego do mundo real são insuficientes, podemos usar técnicas sintéticas para 'gerar' muitos veículos e cenários simulados como substitutos.

  3. Computação de Inferência em Tempo Real (Inference Time Computing): melhora a capacidade computacional do modelo de IA, permitindo que a IA resolva problemas complexos mais rapidamente.

Sutskever acredita que essas três tecnologias podem impulsionar a tecnologia de IA atual em direção à 'superinteligência artificial' (ASI).

A onda de IA varre os mercados de blockchain e LLM.

O conceito de agentes de IA não é apenas uma preocupação na área da tecnologia; muitas moedas meme e modelos de linguagem de grande porte (LLMs) também começaram a integrar tecnologia de IA, como o agente de IA Truth Terminal, que promove a moeda meme GOAT em mídias sociais, cujo valor de mercado disparou para 600 milhões de dólares, e até mesmo Marc Andreessen, fundador da famosa empresa de capital de risco a16z, ficou bastante impressionado com o Truth Terminal.

O caso mais conhecido recentemente de agentes de IA combinando modelos de linguagem de grande porte é o modelo Gemini 2.0 lançado pela Google DeepMind. Segundo a Google, o Gemini 2.0 pode gerar diretamente imagens, texto e até converter texto em fala, além de ajustar os efeitos sonoros em diferentes idiomas, podendo também utilizar a busca do Google, execução de código e ferramentas de terceiros personalizadas pelos usuários.

Vantagens da IA autônoma, resolvendo o problema das 'alucinações' da IA.

Sutskever apontou que IA autônoma e computação de inferência em tempo real ajudam a resolver as 'alucinações' (AI Hallucinations) na formação de IA. As chamadas alucinações de IA referem-se ao fato de que, devido à falta de dados de treinamento, o modelo de IA pode produzir informações incorretas ou falsas. À medida que a nova geração de modelos de IA ainda depende dos dados gerados pelos modelos antigos, esse problema só tende a piorar.

Sutskever afirmou que, para resolver o problema das 'alucinações', a IA autônoma pode fortalecer a capacidade de raciocínio e computação em tempo real para julgar efetivamente a veracidade dos dados, melhorando a confiabilidade e a eficácia da IA.

Enfrentando o grande problema das 'alucinações' causado pela limitação dos dados de treinamento da IA, a visão de Huang, CEO da Nvidia, é um tanto diferente. Anteriormente, Huang também apontou esse problema em uma entrevista e apresentou três etapas importantes para melhorar as 'alucinações' no futuro:

  • Pré-treinamento:

    • Esta é a fase básica da IA, onde se absorvem grandes quantidades de dados do mundo real para 'aprender' e 'descobrir' vários conhecimentos, mas isso é apenas o começo e ainda não é aprofundado o suficiente.

  • Pós-treinamento:

    • Esta é a fase de reforço da IA, onde através de feedback humano, como ajuda na pontuação, e o próprio feedback da IA, usando dados sintéticos para simular mais cenários. Nesse momento, técnicas como aprendizado por reforço e aprendizado de múltiplos caminhos são incorporadas para ajudar a IA a se concentrar em aprimorar habilidades específicas, permitindo que entenda melhor como resolver problemas.

  • Escalonamento de Tempo de Teste (Test Time Scaling):

    • Esta fase pode ser entendida como a IA começando a 'pensar'. Quando enfrenta problemas complexos, a IA vai desmontando o problema passo a passo, simulando repetidamente diferentes soluções e ajustando continuamente para encontrar a melhor resposta. Jensen Huang acredita que, se der mais 'tempo de pensamento' à IA, as respostas que ela fornecer podem ser mais precisas ou de maior qualidade.

Este artigo marca o fim do pré-treinamento da IA! Cofundador da OpenAI: IA Autônoma e Dados Sintéticos aceleram a chegada da era da superinteligência artificial. Originalmente publicado em Blockchain ABMedia.