Konferencja Google I/O 2024: zaprezentowano model Gemini 1.5 Flash i inne nowości

Konferencja Google I/O 2024: zaprezentowano model Gemini 1.5 Flash i inne nowości
14 maja 2024 roku odbyła się konferencja Google I/O, podczas której zaprezentowano szereg nowości z dziedziny AI. Wśród nich znalazły się m.in. aktualizacje modeli AI Gemini, w tym również nowa wersja 1.5 Flash.
O autorze
2 min czytania 2024-05-16

Gemini 1.5 Flash to dziś najszybszy i najbardziej ekonomiczny model AI od Google. Co więcej, rozwiązanie jest już bezpośrednio dostępne dla użytkowników Gemini Advanced w 35 językach – w tym również po polsku!

Modele Gemini i Gemma w nowych wersjach

Model pojawił się na rynku zaledwie kilka miesięcy po wprowadzeniu pierwszego natywnie multimodalnego rozwiązania Gemini 1.0 w trzech rozmiarach: Ultra, Pro i Nano. Tym razem Gemini 1.5 Flash oferuje użytkownikom możliwość obniżenia kosztów i ograniczenia opóźnień względem poprzednich wersji rozwiązania. Mówiąc wprost, Gemini 1.5 Flash okazuje się wyjątkowo przydatny podczas tworzenia podsumowań, korzystania z aplikacji do czatowania, generowania napisów do obrazów i filmów, a nawet wyodrębniania danych z długich dokumentów i tabel.

Podczas konferencji zaprezentowano również aktualizację modelu Gemma, należącego do rodziny otwartych modeli Google. Twórcy obu rozwiązań podkreślają, że nieustannie pracują nad dalszym udoskonalaniem opisywanych rozwiązań.

LinkedIn logo
Na LinkedInie obserwuje nas ponad 97 tys. osób. Jesteś tam z nami?
Obserwuj

Veo i Imagen 3 – generowanie filmów i obrazów na nowym poziomie

Wśród nowinek technologicznych zaprezentowanych podczas Google I/O 2024 pojawiły się również rozwiązania dedykowane twórcom filmowym. Veo i Imagen 3 to nowe wersje modeli służących do generowania obrazów i filmów video. Imagen 3 pozwala na przekształcanie poleceń tekstowych bezpośrednio w obrazy, dzięki czemu staje się to łatwiejsze i bardziej efektywne niż kiedykolwiek.

Prace nad Veo 3 pozwoliły na ulepszenie technik związanych z nauką rozumienia treści filmu, renderowaniem obrazu i dźwięku w wysokiej rozdzielczości, jak również symulowaniem wyglądu otaczającego nas świata.

Słuchaj podcastu NowyMarketing

NowyMarketing logo
Mamy newsletter, który rozwija marketing w Polsce. A Ty czytasz?
Rozwijaj się

Music AI Sandbox i AI Overview

Kolejną nowością jest, stworzony we współpracy z muzykami i producentami muzycznymi, zestaw narzędzi muzycznych opartych na AI. Mowa o Music AI Sandbox, umożliwiającemu użytkownikom m.in. tworzenie nowych sekcji instrumentalnych.

Szukającym sposobu na uporządkowanie wyników wyszukiwania z pewnością przypadnie do gustu rozszerzenie AI Overview. Szybkie generowanie streszczeń opartych na hasłach wpisanych w wyszukiwarkę Google, a także możliwość upraszczania języka, w którym zostały stworzone, to kolejne zalety rozwiązań ogłoszone podczas konferencji.

Co więcej? Choćby wyszukiwanie już nie tylko przy pomocy słów, ale także zdjęć, a nawet filmów nakręconych przez użytkowników. Znalezienie odpowiedzi na dręczące nas pytania nigdy nie było tak łatwe, jak dziś. A przedstawiciele Google nie ustają w tworzeniu planów na przyszłość.

Gemini (nareszcie) zintegrowane z Androidem

Od niedawna model Gemini jest też dostępny również dla użytkowników urządzeń z systemem Android. Wszystko dzięki asystentowi AI w pełni zintegrowanemu z tym oprogramowaniem. To ważny krok w rozwoju modeli opartych na sztucznej inteligencji, ponieważ liczba ich użytkowników korzystających z Androida stale wzrasta.

Zdjęcia: mat. pras.