Meta zaprezentowała Voicebox, czyli nowe narzędzie AI zamieniające tekst na mowę

Meta zaprezentowała Voicebox, czyli nowe narzędzie AI zamieniające tekst na mowę
16 czerwca br. Meta pochwaliła się w mediach społecznościowych nowym narzędziem, które służy m.in. zamianie tekstu na mowę. Voicebox umożliwia także edytowanie nagrania oraz wygenerowanie wypowiedzi z wykorzystaniem próbki głosu od konkretnej osoby. Model jest wielojęzyczny.
O autorze
1 min czytania 2023-06-19

Voicebox wykorzystuje nowe podejście do uczenia się i jest oparty o model językowy LLaMA. Dotychczas tego rodzaju narzędzia były szkolone na dużej ilości danych, ale jedynie takich, które zostały specjalnie do tego przygotowane. Voicebox jest przeszkolony wyłącznie na niefiltrowanym dźwięku. Były to przede wszystkim publicznie dostępne audiobooki w różnych językach (angielskim, francuskim, hiszpańskim, niemieckim, polskim i portugalskim). Dzięki temu technologia jest w stanie wyprodukować bardziej konwersacyjne treści.

Voicebox posiada bardzo podstawowe funkcje, takie jak zamiana tekstu na mowę czy odczytanie fragmentu w różnych wariantach głosowych, w tym z wykorzystaniem własnego głosu. Ciekawą opcją jest możliwość edytowania dźwięku, np. usunięcia niepotrzebnych szumów w tle za pomocą wydania odpowiedniej komendy. Dodatkowo, Voicebox może okazać się także przydatny w tłumaczeniach, ponieważ narzędzie jest w stanie z łatwością odczytać dany fragment w kilku różnych językach.

Meta na ten moment nie udostępnia modelu, ponieważ zdaje sobie sprawę z ryzyka związanego z użyciem go w niewłaściwym celu.

– Podobnie jak w przypadku innych potężnych nowych innowacji w zakresie sztucznej inteligencji, zdajemy sobie sprawę, że ta technologia niesie ze sobą potencjał niewłaściwego użycia i niezamierzonych szkód. W naszym artykule szczegółowo opisujemy, w jaki sposób zbudowaliśmy wysoce skuteczny klasyfikator, który potrafi odróżnić autentyczną mowę od dźwięku generowanego za pomocą Voicebox, aby złagodzić te potencjalne przyszłe zagrożenia – dodają badacze Meta.

LinkedIn logo
Na LinkedInie obserwuje nas ponad 100 tys. osób. Jesteś tam z nami?
Obserwuj

PS Meta stworzyła narzędzie AI do generowania muzyki „MusicGen”

„MusicGen” umożliwia generowanie muzyki na podstawie tekstowych podpowiedzi lub melodii. Został przeszkolony na 20 000 godzin muzyki. Model nie jest jeszcze dostępny, ale można skorzystać z jego demo.

PS 2 Meta testuje chatbot AI na Instagramie

Meta chce wprowadzić czat AI na Instagramie, o czym poinformował w swoich mediach społecznościowych Alessandro Paluzzi.

Słuchaj podcastu NowyMarketing

NowyMarketing logo
Mamy newsletter, który rozwija marketing w Polsce. A Ty czytasz?
Rozwijaj się