Google a dévoilé Whisk, un nouvel outil d'IA qui génère des images en utilisant d'autres images comme invites. Contrairement aux anciens outils qui s'appuient fortement sur des descriptions textuelles longues et détaillées, Whisk permet apparemment aux utilisateurs de télécharger des images pour définir le sujet, la scène et le style qu'ils souhaitent générer.
L'outil prend également en charge plusieurs images pour chacun de ces entrées, offrant aux utilisateurs une flexibilité significative pour expérimenter. Si vous n'avez pas d'image avec laquelle commencer, Google a une icône de dé qui remplit automatiquement les invites avec des visuels.
Cependant, ces images de remplacement semblent également être générées par l'IA. Les utilisateurs peuvent également ajouter un peu de texte pour affiner la sortie, mais la zone de texte est optionnelle. Whisk continue de produire des résultats sans cela, selon l'entreprise.
L'outil génère alors une image et une invite textuelle correspondante qui a été utilisée dans sa création. Si vous aimez le résultat, vous pouvez l'ajouter à vos favoris ou le télécharger. Si ce n'est pas le cas, vous pouvez le peaufiner en modifiant l'invite textuelle sous-jacente ou en générant quelque chose de totalement nouveau.
Imagen 3 alimente l'IA Whisk de Google
Google dit que Whisk est conçu pour « une exploration visuelle rapide, pas des éditions parfaites en pixels. » Donc, bien qu'il soit flexible et amusant à utiliser, il ne fournira pas des résultats impeccables à chaque fois. L'entreprise admet que l'outil peut « manquer la cible », c'est pourquoi ils permettent des modifications rapides pour une meilleure précision.
Whisk fonctionne sur le dernier modèle de génération d'images d'Imagen 3 de Google, que l'entreprise a également annoncé en même temps que l'outil. Imagen 3 alimente Whisk pour produire ses résultats générés par l'IA, et la technologie sous-jacente est censée améliorer la qualité globale des sorties.
Avec Imagen 3, Google a également introduit Veo 2, son modèle de génération vidéo amélioré. Veo 2 aurait une meilleure compréhension de la cinématographie et corrige des problèmes courants comme les caractéristiques hallucinées, par exemple, l'erreur classique de l'IA avec des doigts supplémentaires.
Le modèle est d'abord lancé sur la plateforme VideoFX de Google, qui est encore en phase de test limitée via Google Labs. L'entreprise dit que Veo 2 s'étendra éventuellement à YouTube Shorts et d'autres produits Google d'ici 2025.
Pour l'instant, l'entreprise positionne Whisk comme un outil d'exploration plutôt qu'une solution d'édition professionnelle. On verra s'il se maintient face à des concurrents comme DALL-E d'OpenAI.
Un système étape par étape pour lancer votre carrière Web3 et décrocher des emplois crypto bien rémunérés en 90 jours.