- Co to jest voice commerce? Czy to naprawdę powrót do korzeni i na czym polega rewolucyjność tego nowego-starego wynalazku?
- Voice commerce jest częścią e-commerce, na podobnej zasadzie, na jakiej e-commerce należy do szeroko rozumianego handlu: commerce.
- Voice commerce jest czymś więcej niż wyspecjalizowaną formą sprzedaży dóbr: to zupełnie nowe doświadczenie zmieniające sposób, w jaki korzystamy z handlu elektronicznego.
Handel elektroniczny zmienił nasze podejście do handlu w ogóle. Zalet sprzedaży internetowej jest wiele i oczywiście wiele z nich jest ze sobą powiązanych, ale pierwsza, najbardziej oczywista, to możliwość dokonania zakupu bez wychodzenia z domu.
Jest to z pewnością wygodna opcja – choćby dla bardziej leniwych konsumentów, ale korzyści, jakie z niej płyną, jest znacznie więcej, niż się pozornie wydaje. Choroba, pandemia, czy gips na nodze dzięki zakupom online przestają być straszne (względnie). Skorzystały na tym także osoby starsze i mniej mobilne. Jeśli produkt, którego szukamy, jest raczej trudno dostępny, a mieszkamy w mniejszej miejscowości, e-commerce także przychodzi na ratunek. Nie można zignorować wymiernych korzyści płynących z rewolucji naszych zwyczajów konsumenckich,, ale czy przypadkiem wygoda, do której tak łatwo się przyzwyczaić, nie spowodowała że… kupujemy więcej? Pod wpływem jeszcze bardziej ulotnego impulsu, wyświetlonej, świetnie stargetowanej reklamy, czy też chęci poprawy humoru lub zwykłej nudy?
Zobacz również
A teraz wyobraźmy sobie, że nabywanie rzeczy przez internet stało się jeszcze prostsze. Że zamiast przeklikiwania się przez kolorowe zagadki wystarczy słowo, wypowiedziane na głos życzenie, które spełni nasz osobisty asystent, dostępny zawsze pod ręką. Taka przyszłość czeka nas wraz z rozwojem sektora voice commerce.
Technologia ta nie jest póki co powszechna w Polsce, jednak dynamicznie się rozwija. Wystarczy wspomnieć, że zaledwie dwa lata temu skuteczność realizacji zapytań skierowanych do Google Assistant była o dobrych kilka punktów procentowych niższa. O tym jednak powiemy nieco więcej w dalszej części tekstu.
O co więc chodzi z tym voicem?
Od zarania dziejów ludzie porozumiewali się za pomocą głosu. Dlaczego dopiero teraz coś tak prozaicznie brzmiącego jak głosowy handel jest czymś wyjątkowym, wręcz rewolucyjnym? Problem tkwi w formie interakcji, czyli głosie właśnie. Komunikowanie się za jego pomocą jest prozaicznie wręcz proste.
#NMPoleca: Jak piękny design zwiększa konwersję w e-commerce? Tips & Tricks od IdoSell
Interfejsy
Zabawnym faktem jest to, że ewolucja interfejsów jest odwróceniem „ewolucji” naszych interakcji ze światem zewnętrznym. Bo zaczynając od mowy, przez pismo obrazkowe, hieroglify i inne formy komunikatów wizualnych, przeszliśmy do komunikacji pisemnej.
Słuchaj podcastu NowyMarketing
Gdy powstały komputery, zaczęliśmy natomiast od interfejsu tekstowego, następnie we względnie krótkim czasie przeszliśmy do interfejsów graficznych.
Na interfejsy głosowe przyszło nam poczekać nieco dłużej, bo napotkaliśmy przeszkodę, której nie dało się rozwiązać za pomocą dostępnej technologii i techniki. Rozwój skutecznego przetwarzania naturalnej mowy (a także transkrypcji werbalnych komunikatów na pisane) umożliwiły dopiero głębokie sieci neuronowe. Wydaje się to nieco nielogiczne, natomiast taki stan rzeczy wyjaśnia Paradoks Moraveca.
To nie jest tak, jak ci się zdaje
Wspomniany paradoks opisuje odwróconą zależność między możliwościami komputerów, a ludzką, zdroworozsądkową oceną ich potencjału.
Innymi słowy, naturalne czynności, które wykonujemy niejednokrotnie zupełnie bezwiednie (rozpoznawanie twarzy, chwytanie przedmiotów, czy właśnie mowa), są niezwykle trudne do zaprogramowania (które, jeśli mówimy o sztucznej inteligencji, powinniśmy poprawnie nazwać), a jednocześnie te, które wymagają od człowieka wysiłku (ekstremalnie trudne obliczenia, gra w szachy), są dla maszyn względnie proste.
Za tą zależnością stoją po prostu lata ewolucji. Te proste czynności były „trenowane” przez tysiąclecia, w odróżnieniu od tych, które są dla ludzkości „czymś nowym”.
eWolucja eHandlu
Podobną ewolucję przechodził także handel „elektroniczny”, chociaż jego początki sięgają czasów dalece wyprzedzających jakiekolwiek użycie prądu. Pierwotny handel wymienny odbywał się poprzez pierwszych rzemieślników, kupców, handlarzy ostatecznie tworząc commerce.
W renesansie powstał pierwszy e-commerce, chociaż nie do końca zasługuje on na miano elektronicznego. Aldo Manuzio wydaje katalog książek, których sam był wydawcą (interfejs tekstowy?). Kilkaset lat później takie katalogi zyskały popularność, tworząc kolejną kategorię handlu – sprzedaż wysyłkową.
Na realną rewolucję przychodzi nam czekać kolejne kilkaset lat, gdy sprzedaż internetowa zdominowała wysyłkową, umożliwiając jeszcze wygodniejsze dokonanie transakcji. Wystarczy interesujący nas przedmiot dodać do koszyka, wykonać przelew i voila! Produkt trafia do nas po kilku dniach.
Na tym etapie jesteśmy już całkiem blisko 2021 roku. Technologie sztucznej inteligencji są już bardzo rozwinięte, moce obliczeniowe komputerów, umożliwiające ich sprawne działanie – coraz większe. Kolejna rewolucja jest już naprawdę blisko.
Hej Google, jakie knajpy są otwarte jutro po 18?
Voice commerce to zupełnie nowa jakość. Nie mam tu na myśli po prostu ciekawostki – tego, że możemy robić zakupy, wykonując tylko kilka ruchów i wydając kilka komend. Potęgę głosowych interfejsów zrozumiałem dopiero, kiedy, wchodząc do domu, zapytałem Google Home, jakie knajpy są otwarte w moim rodzinnym Oświęcimiu, jednocześnie zdejmując buty gdzieś w obejściu. Dopytałem o inne szczegóły i alternatywy, kończąc akcję, zanim wszedłem już w pełni „po domowemu” do pokoju.
Przykład związany już bezpośrednio z e-commerce. Wyobraź sobie sytuację w kuchni, w trakcie której wyrabiasz ciasto na pizzę. „Alexa, zamów mleko”. Właśnie Ci się skończyło, a dobrze wiesz, że jeśli nie zapiszesz tego teraz, przypomnisz sobie w momencie, kiedy parująca kawa będzie czekała na finalny składnik. Następnego dnia Twoje zakupy czekają przed drzwiami.
Dlaczego należy obserwować voice commerce
W marketingu nie ma zazwyczaj łatwych odpowiedzi, jednak tym razem jest inaczej. W Polsce to w dalszym ciągu raczkująca technologia. Za granicą, a w szczególności w Stanach to naturalny kierunek rozwoju commerce, nawet pomimo tego, że z poszczególnych usług i usprawnień przyszło korzystać w czasie, gdy Alexa czy Asystent Google byli nieco mniej… ogarnięci.
Codzienne zakupy
Wspomniałem wcześniej o zakupach podstawowych produktów. Prime Now pierwotnie uruchomiono w Nowym Jorku. Dzięki tej usłudze podstawowe produkty (stan na rok 2014 to około 25 000 pozycji, czyli całkiem sporo) dostarczane były klientowi w ciągu… 2 godzin. Dodatkowo, jeśli potrzeba jest niezwykle paląca, użytkownicy mogą za opłatą skromnych 8 dolarów przyspieszyć czas dostawy do jednej godziny.
Często podawany jest także przykład z pizzą, która jest chyba symbolem fast foodu na dostawę, czyli, z całym szacunkiem, ale symbolem lenistwa. Od maja 2017 roku to lenistwo ma dodatkowe paliwo, bo głosowe zamówienia są wspierane przez Domino’s Pizza, Pizza Hut, ale także Grubhub oraz Seamless (odpowiedników polskiego Pyszne.pl).
Co z trudniejszymi zamówieniami?
Innymi słowy, co z pozostałymi e-commerce? Znany i dający do myślenia jest przypadek, również z 2017 roku, w którym prezenter lokalnych wiadomości użył na wizji zdania (również omawiając temat voice commerce) „I love the little girl, saying 'Alexa ordered me a dollhouse’”. W efekcie czego posiadający głośniki Amazona obywatele oglądający poranny program… również zamówili wspomniany domek dla lalek.
To nie jest jedyny przykład drobnych wpadek sztucznej inteligencji biorącej się za przetwarzanie ludzkiej mowy, ale pamiętajmy, że mówimy o wydarzeniach z 2017. Od tamtego czasu poziom asystentów czy szerzej mówiąc, głosowych interfejsów znacznie wzrósł.
W roku 2017 skuteczność wykrywania intencji (czyli poprawnej interpretacji tego, co do maszyny mówimy) wynosiła dla asystentów odpowiednio: Asystent Google 81%, Siri 52%, Alexa 64%, Cortana 56%. To samo badanie dało w roku 2019 rezultat: Google Assistant 93%, Siri 83%, Alexa 80%.
Walcząc z Goliatem
Mamy rok 2021 i przetwarzaniem naturalnej mowy zajmuje się wiele, wiele firm, także tych z Polski (edrone, żeby daleko nie szukać). Każda z nich podchodzi do zagadnienia inaczej i skupia się na innym aspekcie użycia sztucznej inteligencji w tym celu. Pandemia tylko przyspieszyła transformację i gwarantuję Ci, że o voice będziesz słyszeć tylko więcej i więcej.