Em 21 de junho de 2024, Katie Drummond, diretora editorial global da Wired, juntou-se ao “Squawk Box” da CNBC para discutir a recente investigação aprofundada da revista sobre a startup de pesquisa de IA Perplexity. A conversa esclareceu alguns aspectos preocupantes das operações da Perplexity e levantou questões importantes sobre o futuro da IA ​​e seu impacto no jornalismo e na precisão das informações.

A ascensão da perplexidade

A perplexidade ganhou rapidamente atenção no mundo da tecnologia, garantindo investimentos significativos de figuras notáveis ​​como Jeff Bezos e obtendo uma avaliação próxima de mil milhões de dólares. Esta ascensão meteórica, no entanto, veio acompanhada de bastante controvérsia e ceticismo. A investigação da Wired teve como objetivo dissecar o que o Perplexity realmente faz, como funciona e a validade dos resultados de sua pesquisa.

Resultados da investigação: mecanismos pouco claros e respostas imprecisas

Drummond destacou que uma das principais descobertas da investigação da Wired foi a ambigüidade em torno dos mecanismos operacionais do Perplexity. Drummond afirma que a startup de IA, que se comercializa como uma ferramenta de pesquisa sofisticada, muitas vezes fornece respostas que não são apenas imprecisas, mas também potencialmente enganosas. Ela diz que os usuários relataram receber respostas que parecem carecer de síntese lógica, dependendo fortemente de uma agregação básica de dados da web sem análise ou compreensão mais profunda.

Preocupações Éticas e Legais: Raspagem e Coleta de Dados

Uma parte significativa da investigação se concentrou em como o Perplexity coleta seus dados. Drummond explicou que a Perplexity foi encontrada copiando conteúdo da controladora da Wired, Condé Nast, e de outras editoras sem a devida autorização. Apesar da implementação do protocolo robots.txt – um padrão usado para impedir que bots acessem certas partes de um site – a Perplexity supostamente usou endereços IP não divulgados para contornar essas restrições. Se isto for verdade, levanta sérias preocupações éticas e legais sobre a forma como as empresas de IA devem interagir com o conteúdo jornalístico e os limites da utilização de dados.

Vieses e a qualidade das respostas de IA

A discussão também abordou os preconceitos inerentes e a qualidade das informações fornecidas por ferramentas de IA como o Perplexity. A discussão enfatizou o problema de “entra lixo, sai lixo”. Este conceito sublinha que os resultados da IA ​​são tão bons quanto os inputs que recebem. A dependência da Perplexity em dados da Web facilmente acessíveis, que muitas vezes podem ser tendenciosos ou imprecisos, significa que as suas respostas podem refletir estas mesmas questões.

Drummond argumentou que, atualmente, a melhor maneira de obter informações precisas é ir diretamente à fonte – lendo jornalismo de meios de comunicação respeitáveis, em vez de confiar em agregações de IA. Isto realça um desafio fundamental na indústria da IA: desenvolver sistemas que possam discernir e dar prioridade a informações precisas e de alta qualidade em detrimento da miríade de fontes não fiáveis ​​disponíveis online.

A desconexão entre tecnologia e jornalismo

A conversa também abordou as implicações mais amplas da IA ​​no jornalismo. Drummond destacou que a indústria tecnológica tem sido frequentemente desligada dos valores e princípios que sustentam as notícias e o jornalismo. Ela diz que a disseminação de informações precisas e éticas às vezes se tornou um dano colateral na corrida para desenvolver as ferramentas de IA mais avançadas e valiosas.

De acordo com um artigo de Mark Sullivan para Fast Company, em resposta às alegações da Wired, o cofundador e CEO da Perplexity, Aravind Srinivas, disse que a Perplexity não depende apenas de seus próprios rastreadores da web, mas também usa serviços de terceiros para rastreamento e indexação da web. Srinivas apontou que o rastreador identificado pela Wired não era propriedade da Perplexity, mas de um provedor terceirizado não identificado devido a um acordo de confidencialidade.

Srinivas reconheceu a complexidade de impedir imediatamente o acesso do rastreador de terceiros ao conteúdo da Wired, afirmando: “É complicado”. Ele também destacou que o Protocolo de Exclusão de Robôs, estabelecido em 1994, não é uma estrutura juridicamente vinculativa e sugeriu que a ascensão da IA ​​exige uma nova forma de colaboração entre criadores de conteúdo e plataformas como a Perplexity.

Outras críticas surgiram quando a Wired demonstrou que o mecanismo de resposta do Perplexity poderia parafrasear seus artigos de maneira aproximada, às vezes de forma imprecisa. Um erro notável incluiu uma afirmação falsa sobre um policial da Califórnia cometendo um crime. Srinivas afirmou que tais resultados foram provavelmente induzidos por avisos concebidos para provocar tais respostas e enfatizou que os utilizadores normais não encontrariam estes problemas. Ele admitiu que o sistema não estava imune a erros.

Imagem em destaque via Pixabay