Pesquisadores antrópicos descobriram uma nova técnica de “jailbreaking” chamada “many-shot jailbreaking”.
Ele pode escapar das grades de segurança de #LLMs explorando o contexto expandido #Windows .
Bem selvagem.
Pesquisadores antrópicos descobriram uma nova técnica de “jailbreaking” chamada “many-shot jailbreaking”.
Ele pode escapar das grades de segurança de #LLMs explorando o contexto expandido #Windows .
Bem selvagem.