OpenAI przedstawia Sorę, czyli narzędzie generujące wideo na podstawie tekstu

OpenAI przedstawia Sorę, czyli narzędzie generujące wideo na podstawie tekstu
Wykorzystanie sztucznej inteligencji wkracza na nowy poziom. OpenAI przedstawia nowe narzędzie o nazwie Sora, które daje możliwość wygenerowania klipu wideo na podstawie tekstu.
O autorze
2 min czytania 2024-02-16

Sora to nowy model SI, który wychodzi spod rąk OpenAI. Dzięki wykorzystaniu AI możliwe będzie wygenerowanie pliku wideo, powstałego na podstawie tekstu. Klipy stworzone przez sztuczną inteligencję będą mogły trwać maksymalnie minutę.

Model będzie w stanie przetworzyć tekst na wideo, które może składać się ze złożonych scen z kilkoma postaciami. Użytkownicy będą mogli określić szczegółowy wygląd postaci, czy opisać, co powinno znaleźć się w tle. Ponadto, możliwe będzie podanie sposobu poruszania się. Model ma rozumieć nie tylko dokładne polecenie tekstowe, ale również to, jak w realnym świecie „istnieją” podane w opisie obiekty. Sora powinna także doskonale interpretować i odzwierciedlać emocje.

Źródło: OpenAI

Poza możliwością generowania wideo na podstawie tekstu, model będzie mógł ożywić istniejący nieruchomy obraz, przez zmianę go na wideo. Model ma również umożliwić rozbudowanie istniejącego filmu, rozbudowanie go lub uzupełnienie brakujących klatek.

LinkedIn logo
Na LinkedInie obserwuje nas ponad 100 tys. osób. Jesteś tam z nami?
Obserwuj

Słabe strony Sory

OpenAI wskazuje jednak, że model nie jest idealny i są rzeczy, których może nie odzwierciedlić w idealny sposób. Problemy występują chociażby ze związkiem przyczynowo-skutkowym. Przykładowo, Sora może wygenerować wideo, na którym osoba gryzie ciasteczko, ale potem ciasteczko może nie mieć śladu ugryzienia. Ponadto, zdarzało się, że model mylił szczegóły przestrzenne, np. mieszał lewą i prawą stronę lub nie był w stanie idealnie odwzorować opisanego w tekście ruchu kamery.

Źródło: OpenAI

Słuchaj podcastu NowyMarketing

Faza testowa Sory

Sora jest w fazie testów. Jej możliwości sprawdzają m.in. artyści wizualni, projektanci oraz filmowcy. Wszystko po to, by ulepszyć model w sposób, który będzie najlepszy dla osób pracujących w branży kreatywnej.

NowyMarketing logo
Mamy newsletter, który rozwija marketing w Polsce. A Ty czytasz?
Rozwijaj się

Narzędzie jest sprawdzane nie tylko pod względem możliwości technicznych, ale także bezpieczeństwa. Klasyfikator tekstów OpenAI ma odrzucać teksty, które naruszają zasady użytkowania, np. mówią o przemocy, mają charakter seksualny, zawierają nienawistne obrazki, przedstawiają wizerunek gwiazd czy wykorzystują IP innych osób.

Niebawem dostęp do Sory uzyskają także pierwsi partnerzy.

Zdjęcie główne: OpenAI

PS Pierwsza w Polsce reklama TV wygenerowana w całości przez AI

Pojawiła się pierwsza reklama TV wygenerowana przez AI. Chodzi o kampanię promującą środek na erekcję od firmy Adamed Pharma.

PS2 A zrób sobie ten animatik. W kwadrans. Bo czemu nie? [PORADNIK]

Kręcenie reklam telewizyjnych (czy kinowych) to impreza dosyć kosztowna. Dlatego przed przystąpieniem do produkcji i postprodukcji, aby ograniczyć ryzyko wtopy, wielu marketerów decyduje się na wstępne testowanie pomysłów w badaniach konsumenckich. Badanie można przeprowadzić, pokazując ludziom, np. kolejne obrazy ze storyboardu i opowiadając, co dzieje się w filmie. Można też przygotować coś bardziej zaawansowanego – tzw. animatik.