Google idzie jak burza. Niedawno pochwalił się ulepszonym modelem agenta AI Gemini 2.0, a tym razem zaprezentował nowe lub ulepszone narzędzia AI, które służą do generowania filmów lub obrazów. Mowa o Veo 2, Imagen 3 oraz Whisk.
Pierwsze wersje Veo oraz Imagen pojawiły się na początku 2024 roku. Od tego czasu Google obserwowało, jak wykorzystywane były narzędzia, np. przez klientów korporacyjnych czy twórców YouTubowych, którzy tworzyli kreatywne tła w swoich produkcjach wideo.
Zobacz również
Veo 2: najnowocześniejsze narzędzie AI wideo od Google
Veo 2 tworzy filmy w jeszcze wyższej jakości niż dotychczasowa wersja narzędzia. Posiada bogaty zakres tematów oraz styli. W porównaniach ocenianych przez ekspertów, Veo 2 osiągnął najwyższe wyniki w porównaniu z wiodącymi modelami.
Veo 2 lepiej rozumie fizykę świata rzeczywistego, niuanse ruchów, ekspresji człowieka, co wpływa na jego szczegółowość i ogólny realizm. Narzędzie rozumie język kinematografii. Jeśli zapytasz go o gatunek, określisz, gdzie ma znajdować się obiektyw, zasugerujesz efekty kinematograficzne, Veo 2 je dostarczy. Dodatkowo, zastosuje rozdzielczość do 4K, a wygenerowane filmy będą dłuższe niż dotychczas. Veo 2 również rzadko generuje niechciane obiekty (np. dodatkowe palce), dzięki czemu wyniki są jeszcze bardziej realistyczne.
Przykłady możliwości generowania filmów przez Veo 2. Filmy nie zostały dodatkowo zmodyfikowane:
Agenci AI typu Operator w marketingu: szanse i zagrożenia [OPINIE]
Podobnie jak w przypadku pozostałych modeli generowania obrazów i materiałów wideo od Google, wyniki Veo 2 zawierają niewidoczny znak wodny SynthID, który pomaga je zidentyfikować jako wygenerowane przez sztuczną inteligencję, co ma zmniejszyć ryzyko dezinformacji i błędnej atrybucji.
Słuchaj podcastu NowyMarketing
Imagen 3: najnowocześniejsze narzędzie AI do generowania obrazów od Google
Google ulepszyło również ich model generowania obrazu Imagen 3, który akrualnie generuje jaśniejsze, lepiej skomponowane obrazy. Narzędzie może renderować zróżnicowane style artystyczne z większą dokładnością (od fotorealizmu do impresjonizmu, od abstrakcji do anime).
Model Imagen 3 będzie dostępny w stu krajach w ImageFX, narzędziu Google do generowania obrazów z Google Labs.



Whisk: nowy eksperyment Google Labs
Whisk to eksperyment od Google Labs, który pozwala wprowadzać istniejące już obrazy, wybrać tematykę i styl, by powstała zupełnie nowa grafika. Whisk jest aktualnie wprowadzany na rynek w USA.
źródło: Google, opracowanie: Agata Drynko