Technologia

Google wprowadza Whisk: rewolucyjny sposób na remiksowanie obrazów z użyciem technologii Gemini i Imagen 3

2024-12-16

Autor: Michał

Google zaprezentowało nowy projekt o nazwie Whisk, który zachwyca swoją innowacyjnością i potencjałem. Choć narzędzie jest na razie dostępne tylko dla użytkowników w Stanach Zjednoczonych i ma charakter eksperymentalny, to może wkrótce stać się kluczowym elementem ofert AI dostępnych na rynku.

Whisk, co w tłumaczeniu oznacza 'trzepaczka', umożliwia użytkownikom remiksowanie obrazów w zupełnie nowy sposób. Zamiast skomplikowanych opisów tekstowych, jak to ma miejsce w Gemini z Imagen 3, narzędzie pozwala na przeciąganie i dodawanie obrazów do swojej kompozycji. Użytkownik może stworzyć niecodzienne dzieła sztuki za pomocą trzech podstawowych elementów: obiektu, tła i stylu.

Obiekt pełni rolę 'głównego bohatera' tworzonych treści. Użytkownicy mogą wybierać zdjęcia przedstawiające ludzi, przedmioty czy zwierzęta jako obiekt, po czym dodają tło - może to być zdjęcie krajobrazu, abstrakcyjna grafika lub obrazek z ich własnej galerii. Na końcu można zdefiniować styl dzieła - na przykład w estetyce anime, co można jeszcze uzupełnić krótkim opisem tekstowym.

Co ciekawe, po inicializacji kompozycji, użytkownicy mogą dodawać szczegółowe informacje na temat zamiarów dotyczących obiektu, takie jak jego zachowanie, sposób ubioru czy inne detale, które pomogą w osiągnięciu pożądanego efektu. W tym momencie Whisk generuje kilka wersji obrazów, które można dalej edytować. Cały proces oparty jest na technologii Gemini, wspieranej przez generator obrazów Imagen 3.

Google zaznacza, że Whisk wychwytuje tylko kluczowe cechy z wybranego obrazu, co oznacza, że końcowy wynik może różnić się od początkowej wizji użytkownika. Takie różnice mogą obejmować wysokość, wagę, fryzurę czy odcień skóry, co otwiera możliwość dalszej personalizacji i dopasowania obrazu do własnych preferencji.

Podczas wczesnych testów, artyści i twórcy, którzy mieli okazję sprawdzić Whisk, opisywali go jako zupełnie nowe narzędzie kreatywne, które może zmienić sposób, w jaki tworzymy wizualne treści. Cała aplikacja została zaprojektowana z myślą o szybkim tworzeniu grafik, a nie o skomplikowanej edycji pixel po pixel.

Whisk jest dostępny na stronie labs.google/whisk dla użytkowników w USA. Pozostaje mieć nadzieję, że niedługo narzędzie to trafi również do Europy, a być może szybciej, niż się spodziewamy. Jakie nowe możliwości otworzy przed nami Google? Śledź nasze aktualności, aby być na bieżąco!