Sora to nowy model SI, który wychodzi spod rąk OpenAI. Dzięki wykorzystaniu AI możliwe będzie wygenerowanie pliku wideo, powstałego na podstawie tekstu. Klipy stworzone przez sztuczną inteligencję będą mogły trwać maksymalnie minutę.
Model będzie w stanie przetworzyć tekst na wideo, które może składać się ze złożonych scen z kilkoma postaciami. Użytkownicy będą mogli określić szczegółowy wygląd postaci, czy opisać, co powinno znaleźć się w tle. Ponadto, możliwe będzie podanie sposobu poruszania się. Model ma rozumieć nie tylko dokładne polecenie tekstowe, ale również to, jak w realnym świecie „istnieją” podane w opisie obiekty. Sora powinna także doskonale interpretować i odzwierciedlać emocje.
Zobacz również
Źródło: OpenAI
Poza możliwością generowania wideo na podstawie tekstu, model będzie mógł ożywić istniejący nieruchomy obraz, przez zmianę go na wideo. Model ma również umożliwić rozbudowanie istniejącego filmu, rozbudowanie go lub uzupełnienie brakujących klatek.
Słabe strony Sory
OpenAI wskazuje jednak, że model nie jest idealny i są rzeczy, których może nie odzwierciedlić w idealny sposób. Problemy występują chociażby ze związkiem przyczynowo-skutkowym. Przykładowo, Sora może wygenerować wideo, na którym osoba gryzie ciasteczko, ale potem ciasteczko może nie mieć śladu ugryzienia. Ponadto, zdarzało się, że model mylił szczegóły przestrzenne, np. mieszał lewą i prawą stronę lub nie był w stanie idealnie odwzorować opisanego w tekście ruchu kamery.
#NMPoleca: Jak piękny design zwiększa konwersję w e-commerce? Tips & Tricks od IdoSell
Źródło: OpenAI
Słuchaj podcastu NowyMarketing
Faza testowa Sory
Sora jest w fazie testów. Jej możliwości sprawdzają m.in. artyści wizualni, projektanci oraz filmowcy. Wszystko po to, by ulepszyć model w sposób, który będzie najlepszy dla osób pracujących w branży kreatywnej.
Narzędzie jest sprawdzane nie tylko pod względem możliwości technicznych, ale także bezpieczeństwa. Klasyfikator tekstów OpenAI ma odrzucać teksty, które naruszają zasady użytkowania, np. mówią o przemocy, mają charakter seksualny, zawierają nienawistne obrazki, przedstawiają wizerunek gwiazd czy wykorzystują IP innych osób.
Niebawem dostęp do Sory uzyskają także pierwsi partnerzy.
Zdjęcie główne: OpenAI
PS Pierwsza w Polsce reklama TV wygenerowana w całości przez AI
Pojawiła się pierwsza reklama TV wygenerowana przez AI. Chodzi o kampanię promującą środek na erekcję od firmy Adamed Pharma.
PS2 A zrób sobie ten animatik. W kwadrans. Bo czemu nie? [PORADNIK]
Kręcenie reklam telewizyjnych (czy kinowych) to impreza dosyć kosztowna. Dlatego przed przystąpieniem do produkcji i postprodukcji, aby ograniczyć ryzyko wtopy, wielu marketerów decyduje się na wstępne testowanie pomysłów w badaniach konsumenckich. Badanie można przeprowadzić, pokazując ludziom, np. kolejne obrazy ze storyboardu i opowiadając, co dzieje się w filmie. Można też przygotować coś bardziej zaawansowanego – tzw. animatik.