Google představil Whisk, nový nástroj AI, který generuje obrázky pomocí jiných obrázků jako výzev. Na rozdíl od starších nástrojů, které se silně spoléhají na dlouhé, podrobné textové popisy, Whisk údajně umožňuje uživatelům nahrát obrázky, aby definovali téma, scénu a styl, který chtějí generovat.

Nástroj také podporuje více obrázků pro každý z těchto vstupů, což uživatelům poskytuje značnou flexibilitu pro experimentování. Pokud nemáte obrázek, se kterým byste mohli začít, Google má ikonu kostky, která automaticky vyplňuje výzvy vizuály.

Tyto zástupné obrázky se však také zdají být generované AI. Uživatelé také mohou přidat trochu textu pro jemné doladění výstupu, ale textové pole je volitelné. Podle společnosti Whisk stále produkuje výsledky i bez něj.

Nástroj poté generuje obrázek a odpovídající textovou výzvu, která byla použita při jeho vytvoření. Pokud se vám výsledek líbí, můžete ho označit jako oblíbený nebo stáhnout. Pokud ne, můžete ho vylepšit úpravou základní textové výzvy nebo generováním něčeho úplně nového.

Imagen 3 pohání Google Whisk AI

Google říká, že Whisk je postaven pro „rychlé vizuální objevování, nikoli pixelově přesné úpravy.“ Takže i když je flexibilní a zábavné ho používat, nebude dodávat bezchybné výsledky pokaždé. Společnost přiznává, že nástroj může „minout cíl“, a proto umožňují rychlé úpravy pro lepší přesnost.

Whisk běží na nejnovějším modelu generování obrázků Google Imagen 3, který společnost také oznámila spolu s nástrojem. Imagen 3 pohání Whisk k produkci jeho výsledků generovaných AI, a základní technologie má údajně zlepšit celkovou kvalitu výstupů.

Vedle Imagen 3 Google také představil Veo 2, svůj vylepšený model generování videa. Veo 2 má údajně lepší znalosti kinematografie a opravuje běžné problémy, jako jsou halucinované rysy – například klasická chyba AI s nadbytečnými prsty.

Model se nejprve spouští na platformě Google VideoFX, která je stále v omezeném testování prostřednictvím Google Labs. Společnost říká, že Veo 2 se nakonec rozšíří na YouTube Shorts a další produkty Google někdy v roce 2025.

Prozatím společnost prezentuje Whisk jako nástroj pro objevování, nikoli jako profesionální editační řešení. Zda obstojí proti konkurentům, jako je OpenAI DALL-E, teprve ukáže čas.

Krok za krokem systém pro zahájení vaší kariéry Web3 a získání dobře placených pracovních míst v kryptoměnách za 90 dní.