W SKRÓCIE

  • Stability AI wypuściło swój najnowszy produkt, SDXL 1.0, narzędzie do generowania tekstu na obraz z ulepszoną jakością obrazu i przyjaznym dla użytkownika interfejsem.

  • Dzięki 3,5 miliardom parametrów może generować 1-megapikselowe obrazy w różnych proporcjach.

  • Model zaprojektowano w celu usprawnienia procesu generowania tekstu na obraz i zawiera funkcje dostrajające, takie jak ControlNet, pochodzące z badań Uniwersytetu Stanforda.

  • SDXL 1.0 jest zoptymalizowany pod kątem konsumenckich procesorów graficznych o pojemności 8 GB VRAM i jest równie wydajny w niedrogich instancjach w chmurze.

  • Oprogramowanie oferuje ulepszone dostrajanie, umożliwiając generowanie niestandardowych LoRA lub punktów kontrolnych przy zmniejszonym narzucie danych.

  • Społeczność AI może spodziewać się aktualizacji w najbliższej przyszłości, a SDXL 1.0 może generować zaawansowane koncepcje, takie jak skomplikowane detale lub złożone kompozycje przestrzenne.

  • Narzędzie jest open source i jest dostępne w GitHubie, co promuje przejrzystość i współpracę w ramach społeczności.

Stable Diffusion XL 1.0 (SDXL 1.0), najnowszy produkt Stability AI, został wreszcie wydany. Narzędzie to, uznawane za najnowsze osiągnięcie w dziedzinie przetwarzania tekstu na obraz, wyróżnia się lepszą jakością obrazu i przyjaznym dla użytkownika interfejsem.

Podczas gdy wiele osób w branży AI stale ulepsza swoje platformy, niedawna wersja SDXL 1.0 Stability AI pokazuje obiecujący postęp. Imponujące 3,5 miliarda parametrów modelu umożliwia szybkie tworzenie 1-megapikselowych obrazów w różnych proporcjach. Joe Penna, dyrektor stosowanego uczenia maszynowego w Stability AI, w rozmowie z TechCrunch podkreślił możliwości modelu. Podkreślił, jak można go dostosować oraz jak można dostosować koncepcje i style obrazu, korzystając z podstawowych wskazówek dotyczących przetwarzania języka naturalnego. Dzięki tym funkcjom zadania użytkowników mogą być łatwiejsze, a jednocześnie postępować zgodnie z jasnymi instrukcjami tworzenia skomplikowanych projektów.

Wydaje się, że sztuczna inteligencja stabilna rozwiązała wyzwania dominujące w sektorze sztucznej inteligencji, szczególnie dotyczące generowania tekstu. Warto zauważyć, że wiele nowatorskich modeli zamiany tekstu na obraz często nie radzi sobie z zadaniem generowania czytelnego tekstu, zwłaszcza w przypadku skomplikowanych stylów, takich jak kaligrafia. Jednakże SDXL 1.0 wykazał się biegłością w zaawansowanym generowaniu tekstu.

Tym, co jeszcze bardziej wyróżnia SDXL 1.0, jest jego konkurencyjna pozycja w stosunku do innych głównych konkurentów, takich jak Midjourney i usługa Adobe Firefly. Nowy model podkreśla ulepszone procesy udoskonalania obrazu, co skutkuje bogatszymi kolorami, doskonałym oświetleniem i większym kontrastem. Dodatkowo włączenie funkcji dostrajania ułatwia generowanie obrazów dostosowanych do indywidualnych potrzeb.

Podczas opracowywania SDXL 1.0 wykorzystano usprawnione podejście szkoleniowe, korzystając z dużej bazy parametrów, co pozycjonuje go jako idealną podstawę dla różnych narzędzi i możliwości. Opisując jego atrybuty, Emad Mostaque, dyrektor generalny Stability AI, stwierdził, że SDXL 1.0 został starannie opracowany, aby usprawnić proces generowania tekstu na obraz. Zostało to dodatkowo wzbogacone o ControlNet, wywodzący się z badań Uniwersytetu Stanforda, ułatwiający ulepszone możliwości dostrajania i komponowania.

Godną uwagi cechą modelu SDXL 1.0 jest jego konstrukcja zorientowana na użytkownika. W przeciwieństwie do konieczności stosowania długich podpowiedzi w celu uzyskania pożądanych wyników, model umożliwia użytkownikom wydawanie złożonych, wieloczęściowych dyrektyw, zwięźle oddając intencję za pomocą mniejszej liczby słów niż we wcześniejszych modelach. Obecnie ten innowacyjny model jest dostępny za pośrednictwem wielu platform, w tym usług Amazon Bedrock i Amazon SageMaker Jumpstart.

Zwiększona wydajność konsumenckich procesorów graficznych i zaawansowane funkcje dostrajania

Obraz wygenerowany w formacie SDXL 1.0

Zaprojektowany z myślą o kompatybilności, SDXL 1.0 jest zoptymalizowany pod kątem konsumenckich procesorów graficznych o pojemności 8 GB VRAM i jest równie wydajny w niedrogich instancjach w chmurze.

Funkcje i kompatybilność:

Premiera SDXL 1.0 pokazuje zaangażowanie Stability w zapewnianie użytkownikom wydajnych i dostępnych rozwiązań AI. Jednym z kluczowych wniosków płynących z ogłoszenia jest zdolność oprogramowania do bezproblemowego działania na standardowych konsumenckich procesorach graficznych. Dla użytkowników oznacza to potencjał optymalnej wydajności bez konieczności stosowania wysokiej klasy lub specjalistycznego sprzętu.

Ulepszenia w zakresie dostrajania:

Stabilność zawiera funkcje w SDXL 1.0, które upraszczają proces ponownego uczenia modeli dla unikalnych zbiorów danych. Obecny model umożliwia generowanie niestandardowych LoRA lub punktów kontrolnych przy zmniejszonym narzucie danych, co toruje drogę do bardziej wydajnego i szybszego dostosowywania modelu do konkretnych potrzeb. Co więcej, jest to wskazówka na przyszłość, ponieważ zespół AI ds. stabilności jest w trakcie opracowywania zaawansowanych elementów sterujących dla struktur, stylów i kompozycji specyficznych dla zadań. W szczególności na horyzoncie widać T2I/ControlNet, specjalizujący się w SDXL. Chociaż udoskonalenia te pozostają w fazie przed wersją beta, społeczność AI i użytkownicy mogą spodziewać się aktualizacji w najbliższej przyszłości.

Renderowanie zaawansowanych koncepcji:

SDXL 1.0 prezentuje swoją zdolność do generowania koncepcji, które wcześniej stanowiły wyzwanie dla modeli obrazu. Obejmuje to renderowanie skomplikowanych szczegółów, takich jak dłonie i tekst, lub nawet bardziej złożonych kompozycji przestrzennych, takich jak sceny przedstawiające kobietę w tle ścigającą psa na pierwszym planie. Ta funkcja jest szczególnie istotna, ponieważ wskazuje na skok w zdolności oprogramowania do interpretowania i renderowania zróżnicowanych i wieloaspektowych scenariuszy.

Dostępność otwartego oprogramowania:

Dla programistów i entuzjastów zainteresowanych głębszym zgłębianiem, Stability udostępniło wagi i kod SDXL 1.0 w GitHub. Posunięcie to nie tylko promuje przejrzystość, ale także zachęca do wspólnego rozwoju i innowacji w społeczności.

Wypróbuj to:

Dla tych, którzy chcą przetestować możliwości SDXL 1.0, Stability zintegrowało go z platformami takimi jak DreamStudio i ClipDrop. Dodatkowo interaktywne sesje i potencjalne demonstracje są dostępne na Discordzie, dzięki czemu użytkownicy mogą na własnej skórze doświadczyć funkcji narzędzia.