A gdyby Big Data miała mózg Lucy…?

A gdyby Big Data miała mózg Lucy…?
W ubiegłym roku publiczność kinowa ekscytowała się filmem „Lucy” w reżyserii Luca Bessona. Tytułową rolę zagrała w nim – jak zwykle zjawiskowa – Scarlett Johansson. Wskutek wchłonięcia zaszytego w ciele narkotyku, mózg Lucy zaczął pracować na pełnych obrotach i przekraczać kolejne granice ludzkiej..
O autorze
12 min czytania 2015-12-23

…percepcji oraz cielesności. Dzięki integracji z cyfrowymi zasobami Internetu, Lucy stała się urzeczywistnieniem wszechwiedzy. Niekontrolowaną siłę dało jej Big Data, a ściślej: umiejętność konwersji chaotycznych internetowych zbiorów danych w Smart Data. A gdybyśmy i my wykorzystywali dziś Big Data w stu procentach, podobnie jak filmowa Lucy wykorzystywała swój mózg?

Jaki procent mózgu (Big Data) wykorzystujemy obecnie?

Swego czasu niezwykłą popularnością cieszył się pseudo-naukowy mit, wedle którego statystyczny człowiek używa zaledwie 10 proc. możliwości swojego mózgu. Pozostałe 90 proc. to rezerwuar możliwości, których ludzie – ze względu na jakieś trudno wytłumaczalne lub tajemnicze ograniczenia swojej natury – nie są w stanie spożytkować. Innymi słowy: wszyscy jesteśmy ukrytymi geniuszami, tylko nie potrafimy w pełni wykorzystać mocy obliczeniowej naszego mózgu, który jest trochę jak Śpiąca Królewna: leży i pachnie. Jak uaktywnić tę smacznie-sobie-śpiącą część naszego mózgu? I kim jest Książę, który byłby w stanie tego dokonać? Dla bessonowskiej Lucy tym księciem był Internet (Big Data).

Problem podobny do tego, z którym dawniej borykali się biolodzy, dziś mają analitycy internetowi. Zmagają się z aktywowaniem wszystkich możliwości, jakie daje internetowy mózg, czyli Big Data. Badacze danych zachodzą w głowę: co zrobić, żeby zrozumieć więcej cyfrowych hieroglifów i wyłowić z nich sens? Jaki algorytm opracować, żeby Big Data sama się dekodowała? Co zrobić, żeby z danych czerpać więcej wymiernych korzyści? Jak zwiększyć moce przerobowe analityki internetowej w sytuacji, gdy tylko w ciągu sekundy przez Internet przepływa kilkanaście petabajtów danych? I wreszcie: jak efektywnie pracować na surowych danych i przekształcać je w takie, które dostarczą branży marketingowej oraz biznesowi jasnych wytycznych – i to najlepiej w mgnieniu oka oraz za pomocą kilku kliknięć? Najkrócej rzecz ujmując: jak sprawić, żeby mózg Internetu zaczął pracować na pełnych obrotach?

W żargonie analitycznym te wszystkie pytania sprowadzają się do następującej tezy: jak przekształcić surowe dane w Smart Data? Co by się stało, gdybyśmy faktycznie byli w stanie spożytkować wszystkie dostępne w Sieci dane?

LinkedIn logo
Dziękujemy 90 000 fanom na LinkedInie. Jesteś tam z nami?
Obserwuj

Mózg (w) Sieci danych

Czy w końcu przestaniemy śnić sen o stuprocentowym wykorzystywaniu danych – i obudzimy się w rzeczywistości, w której – dzięki Big Data – będziemy mogli zdziałać absolutnie wszystko? Czy taki scenariusz w ogóle może stać się faktem?

Póki co rzeczywistość skrzeczy. Według obliczeń IDC wykorzystujemy około 20 proc. całego dostępnego wolumenu Big Data, który Oracle szacuje już na ponad 6 ZB (Zettabajtów). Żeby uzmysłowić sobie wielkość tej liczby, należałoby dopisać do niej aż 21 zer. Przy dobrych wiatrach, jak twierdzi IDC, do 2020 roku wespniemy się na poziom 30 proc. To wbrew pozorom gigantyczny skok, ponieważ wolumen danych w Sieci wzrośnie wówczas aż do 45 ZB. Wiedza o jednym mieszkańcu naszej planety będzie równowartością 5,2 GB danych. Te 30 proc. brzmi zatem jak Złoty Graal analityki internetowej. Tym bardziej, że ilość danych w Sieci rośnie w lawinowym tempie: Big Data z roku na rok powiększa swój rozmiar o ponad 40 proc. W ciągu sekundy globalna Sieć powiększa się o około 30 GB danych. Mniej więcej tyle „ważył” cały Internet 20 lat temu. W ciągu kwadransa Internet rozrasta się średnio o 20 biliardów bitów danych. Analogową równowartością tej liczby byłyby wszystkie dzieła składające się na kanon literatury światowej. Bez cienia przesady możemy więc określić nasze czasy mianem „epoki danych” czy cyfrowego potopu.

Słuchaj podcastu NowyMarketing

Biznes ma zatem na wyciągnięcie ręki gigantyczną ilość informacji, które może zmonetyzować. Dane są dziś bowiem nie tylko zasobem przedsiębiorstwa, lecz jego cyfrowym kapitałem, który można spieniężyć. Deloitte w raporcie „Analytics Trends 2015” wymienia monetyzację danych jako jeden z najważniejszych trendów rozwijanych w biznesie w najbliższych latach. Podkreśla przy tym, że firmy coraz częściej wykorzystują własne dane nie tylko jako zasób, lecz właśnie jako kapitał. Jak szacuje IDC globalny rynek Big Data do końca 2015 roku przekroczy próg 125 mld USD. Z kolei Boston Consulting Group w raporcie „The Value of Our Digital Identity” twierdzi, że wartość anonimowych danych zgromadzonych o internautach z Unii Europejskiej, w 2020 roku zbliży się do okrągłego biliona EUR. Oznacza to, że cyfrowe ślady pozostawione przez Europejczyków w Sieci będą równoważne finansowo około 8 proc. PKB krajów całej Wspólnoty. Cyfrowa ekonomia na naszych oczach staje się faktem.

NowyMarketing logo
Mamy newsletter, który rozwija marketing w Polsce. A Ty czytasz?
Rozwijaj się

Za przetwarzanie Big Data w Smart Data odpowiadają badacze danych, pracujący na platformach DMP (Data Management Platform). Napisałem celowo: badacze danych, a nie platformy DMP, żeby nikt nie myślał, że już teraz maszyny odwalają całą robotę za analityków danych. Ain’t gonna happen, mate! To człowiek odpowiada i będzie odpowiadał za to, jak rozwijał się będzie rynek analityki danych – i ile z nich będziemy potrafili wykorzystać. To właśnie w Polsce stworzono największą taką platformę w tej części świata: behavioralengine.com. Swoim zasięgiem obejmuje blisko 20 mln realnych użytkowników i ponad 70 mln urządzeń. Gromadzi anonimowe dane o zachowaniach i preferencjach praktycznie każdego polskiego internauty. Dziennie przetwarza ponad 5 TB danych i monitoruje ponad pół miliona witryn www. Na tę platformę DMP składa się ponad 70 mln profili użytkowników, podzielonych na ponad 100 segmentów i 5 000 atrybutów. Oznacza to, że polscy badacze danych znają cyfrowe zachowania i preferencje praktycznie każdego polskiego internauty, z zachowaniem jego anonimowości.

Zapominając na chwilę o ekonomii, statystyce i puszczając wodze fantazji: Co by było, gdybyśmy potrafili wycisnąć z danych 100 proc. ich możliwości? Co by się stało, gdyby Big Data była równoznaczna ze Smart Data? Gdyby analityka danych działała jak – nie przymierzając – mózg Lucy?

Bo fantazja, jest od tego…

W ciągu doby dociera do nas potencjalnie tyle treści, ile nasi dziadkowie konsumowali średnio przez całe swoje życie. Myliłby się jednak ten, kto przymiotnik „Big” w Big Data utożsamiałby wyłącznie z gigantyczną ilością danych. „Big” w tym terminie oznacza przede wszystkim to, co możemy z tymi danymi realnie zdziałać i jak możemy je wykorzystać. W takich okolicznościach mówi się o Big Data jako „Smart Data”.

Smart Data to ten wycinek wielkich zbiorów danych, z którego można zrobić jakiś pożytek, ponieważ zawarte są w nim w cenne wskazówki oraz jasne wytyczne. Słowem: sensowne informacje. „Inteligentne Dane” pozwalają porządkować reklamy w przeglądarkach i dopasowywać je do zainteresowań konkretnych internautów. Optymalizują procesy biznesowe w firmach, rozbudowując funkcjonalności systemów typu ERP i CRM. Pozwalają również prognozować przyszłe scenariusze. Aktualnie na ustach świata jest właśnie analityka predyktywna, która dzięki Smart Data jest w stanie przewidywać np. kryzysy finansowe na światowych rynkach, katastrofy ekologiczne czy turbulencje polityczne w różnych państwach. Korzysta z niej choćby amerykańska CIA. Korzystają z niej również organizacje porządku publicznego, Trzeci Sektor (NGO), czy naukowcy.

W niedalekiej przyszłości dane będą generowały całe miasta. Internet Rzeczy sprawi, że Smart Cities, dzięki technologii beaconów, będą wysyłać swoim mieszkańcom informacje np. o promocjach w pobliskich sklepach czy restauracjach. W tym wypadku w grę wchodzi jednak nie tylko komercyjne wykorzystanie danych. Z dobrodziejstw IoT (Internet of Things) będą mogły skorzystać również instytucje oświaty i kultury, które „beaconując” historycznie kluczowe elementy miasta, jak budynki, pomniki, muzea, kina, teatry, filharmonie itd. – ułatwią turyście korzystającemu ze smartfona podróżowanie po Smart City i czerpanie informacji o historii danego miejsca. To tylko namiastka tego, co nas czeka w przyszłości, jeśli Smart Data będzie dla nas

Spróbujmy teraz pobujać w obłokach danych i zarysować kilka scenariuszy, w których pokazujemy, jak wraz ze wzrostem procentowym wykorzystania potencjału Big Data zmienia się nasza rzeczywistość. Nie tylko ta cyfrowa.

Co by było, gdybyśmy wykorzystywali Big Data w…

W 20 proc. W takim stopniu według IDC wykorzystujemy dziś potencjał Big Data, czyli tyle „inteligentnych danych” znajduje się obecnie w obrocie. Pozwala nam to na lepsze targetowanie treści reklamowych w Sieci, czyli dopasowywanie komunikatów do zainteresowań i preferencji internautów. To tzw. reklama behawioralna, bazująca na zainteresowaniach i preferencjach użytkowników Sieci. Dzięki temu zamiast wyświetlać każdemu internaucie ten sam komunikat – reklama zasilana przez dane zgrabnie dopasowuje się do profilu konkretnego użytkownika. W ten sposób prawdopodobieństwo dostrzeżenia tej reklamy i kliknięcia w nią zdecydowanie wzrasta, a konwersja w porównaniu z tradycyjnymi bannerami masowymi jest nawet kilkunastokrotnie wyższa.

W 30 proc. Tyle danych według szacunków IDC będziemy wykorzystywać do 2020 roku. Jeśli komuś wydaje się, że to wciąż mało, to powinien pamiętać, że Internet będzie wówczas zdecydowanie większy niż obecnie. Składał się będzie z ponad 45 ZB danych. To oznacza, że na 1 mieszkańca Ziemi przypadnie ponad 5,2 GB danych. Gdyby poziom wykorzystania cyfrowych informacji zakodowanych w ciągu danych sięgał 30 proc., to głównym beneficjentem byłby biznes. Dzięki temu bowiem mógłby nie tylko lepiej targetować reklamy w Sieci, lecz również trafniej rozpoznać profil swojego klienta, a także zrobić użytek z danych, do których wcześniej nie miał dostępu lub nie wiedział jak je analizować (tzw. Dark Data). Jak twierdzi firma badawcza Gartner, dzięki Big Data do 2020 roku aż 80 proc. procesów biznesowych w firmach zostanie zmodernizowanych. Z kolei InsightExpress donosi, że 8 na 10 polskich menedżerów IT deklaruje, że Big Data stanowiło będzie trzon strategii ich przedsiębiorstw w ciągu najbliższych pięciu lat. Biznes czuje, że czeka go cyfrowa rewolucja.

40-60 proc. Big Data w biznesie. Głównym beneficjentem wzrostu Smart Data pozostaje biznes. Dzięki znacznemu przyrostowi inteligentnych danych CIO w firmach otrzymują wyraźne wskazówki, pozwalające na rozbudowę systemów ERP czy CRM o dane z zewnętrznych platform DMP i weryfikację strategii biznesowej przedsiębiorstwa. Co więcej: zintegrowane danych z wewnątrz firmy z danymi z zewnętrznej platformy DMP pozwoli jej na uzyskanie całkiem nowej perspektywy. IDC podaje, że już teraz 70 proc. dużych firm korzysta z danych o użytkownikach gromadzonych i przetwarzanych przez zewnętrzne platformy Big Data. Do końca 2019 roku tym tropem mają pójść już wszystkie duże organizacje. W ankiecie „18th Global CEO Survey” przeprowadzonej przez PwC aż 80 proc. prezesów firm określiło analitykę i przetwarzanie danych jako istotne działania z punktu widzenia strategii przedsiębiorstwa. W „The Industrial Insights Report for 2015” 3 na 4 firmy (75 proc.) przyznają, że odnotowały wzrost przychodów, właśnie dzięki wykorzystaniu analityki danych. Co więcej – „Internet Trends Report 2015” pokazuje, że wdrożenie analityki Big Data do procesów biznesowych czy projektów prowadzonych przez firmę, pozwoliło jej na znaczące zredukowanie kosztów operacyjnych: koszty utrzymania infrastruktury IT w skali roku zmniejszyły się u tych firm o 33 proc, podobnie jak koszty przechowywania danych przedsiębiorstwa, które spadły o 38 proc. Big Data jest już jak rozpędzony pociąg, do którego firmy muszą wskoczyć jak najszybciej, żeby nie zostać z biletem na peronie. Część firm już zdaje sobie z tego sprawę. CapGemini w swoim raporcie „Big & Fast Data: The Rise of Insight-Driven Business” donosi, że na ponad 1 000 przebadanych przedsiębiorstw aż 2/3 z nich zdaje sobie sprawę, że jeśli zaniedba wdrożenie nowych narzędzi biznesowych z zakresu analityki danych, to straci konkurencyjność na rynku. Bez dwóch zdań – to dane zdecydują o przyszłości biznesu. To dzięki nim będziemy mogli mówić o „Big Business”.

60-80 proc. – Big Data jako Good Data. Big Data już teraz rewolucjonizuje marketing polityczny i personalizuje medycynę, pozwalając na zindywidualizowane leczenie. Zacznijmy od polityki. Przykładem są kampanie prezydenckie w USA, gdzie badacze danych wykonują tytaniczną pracę, przekształcając Big Data w Smart Data. Dostarczają w ten sposób politykom precyzyjnych wskazówek, dotyczących zachowań i preferencji wyborców w konkretnych miastach i stanach. Zgodnie z tymi instrukcjami sztab polityka „dopasowuje” później program wizyty kandydata, a także poruszane przez niego kwestie. Tak marketing polityczny uprawiał Barack Obama, którego sztab „górników danych” (data miners) i „żniwiarzy danych” (data harvesters) testował każdej doby blisko 66 tysięcy symulacji scenariuszy kampanii politycznej. Szukał takiej korelacji danych, która zapewniłaby Obamie optymalny scenariusz. Analitycy Obamy „przeskanowali” bazy wyborców z chirurgiczną precyzją. Po mistrzowsku zarządzali Internetowymi ruchami wyborców, przekierowując ich na strony na Facebooku (33 mln polubień) czy kanał YouTube (240 tys. subskrybentów i 246 mln odsłon), a także stosując polityczny audience targeting na Amazonie. Jakby tego było mało założyli jeszcze stronę mybarackobama.com, funkcjonującą na zasadach sieci społecznościowej, skupiającej głównie młodych sympatyków Obamy i spełniającej funkcję potencjalnej bazy wolontariuszy kampanii. Według Sashy Issenberga, amerykańskiego dziennikarza śledzącego pracę sztabu Obamy, Big Data zgromadzona przez sztab Baracka Obamy była aż dziesięciokrotnie większa niż ta zebrana przez konkurencyjnego kandydata, Mitta Romneya. W 2012 roku obamowscy „ludzie od Big Data” zgromadzili aż 5 razy więcej danych niż w wyborach w 2008 roku. Obama, najprawdopodobniej jako pierwszy polityk na świecie, przeprowadził marketing z użyciem danych zakrojony na tak gigantyczną skalę. Być może to właśnie on jest pierwszym prezydentem Big Data.

Z kolei w medycynie wykorzystanie Smart Data na poziomie 80 proc. jest wielkim marzeniem. N iemniej już teraz są powody do zadowolenia. Światowi giganci IT wykorzystują dane gromadzone przez siebie oraz przez zewnętrzne platformy Big Data, podejmując działania z zakresu CSR. Z badań Forrester wynika, że 56 proc. decydentów w firmach (zwłaszcza IT) przyznaje, że analityka danych pozwala przedsiębiorstwom usprawniać ich decyzje biznesowe, wliczając w to używanie danych do „czynienia dobra”, czyli działań noszących znamiona społecznej odpowiedzialności biznesu. Ten coraz popularniejszy trend określa się już jako „Good Data” czy – szerzej – „Big Data for social good”. Przykłady? Począwszy od skuteczniejszego prowadzenia kampanii filantropijnych, poprzez działania na rzecz ochrony środowiska, wspierania lokalnych społeczności czy ścigania przestępców. Anonimowe dane behawioralne zawarte w strumieniu Big Data, pozwalają zrozumieć analitykom wzorce zachowań większych grup ludzi, a następnie wykorzystać je czy też ukierunkować na uzyskanie pozytywnego wpływu na społeczeństwo. Najbardziej spektakularnym przykładem jest tutaj Global Pulse. To agenda ONZ, która stosuje analitykę Big Data do przewidywania spadków koniunktury na światowych giełdach oraz wykorzystywania analityki danych w akcjach humanitarnych. Dzięki temu rządzący są wcześniej alarmowani o nadciągających zmianach czy tąpnięciach na rynkach, przez co zyskują cenny czas na podjęcie działań prewencyjnych czy post-kryzysowych, umożliwiających rozprawienie się z problemami.

Inny światowy potentat – Google – chce wykorzystać Big Data do walki z malarią. Ta choroba dziesiątkuje dziś młodą Afrykę, powodując każdego roku śmierć około 400 tysięcy dzieci. Szef organizacji non-profit No More Malaria, Martin Edlund, powtarza jednak uparcie, że malaria zostanie pokonana właśnie dzięki „komórkom”, tzn. smartfonom i Big Data. Nie jest to bynajmniej jakieś senne marzenie – w Afryce sieci telekomów posiadają dziś ponad miliard aktywnych subskrybentów, nawet w najodleglejszych zakamarkach kontynentu. Dzięki specjalnej aplikacji Afrykańczycy żyjący na terenach szczególnie zagrożonych malarią mogą wysyłać informacje dotyczące ich stanu zdrowia, zaś walczący z chorobą – informację o aktualnie przyjmowanych lekach, postępach kuracji czy rozprzestrzenianiu się choroby w okolicy. No More Malaria otrzymała od Google 600 tys. USD na rozwijanie tej technologii.

Ban Ki-moon, Sekretarz Generalny ONZ, mówi dziś wprost o rewolucji związanej z Big Data i wzywa do wypracowania nowych metod wykorzystywania danych w celu monitorowania zrównoważonego rozwoju i śledzenia postępu gospodarczego.

Polityka i medycyna mają zatem wielką chrapkę na Big Data.

80-90 proc. – Big Data w Smart Cities. Big Data wybuduje informatyczną infrastrukturę miast. Smart city ma być Songdo w Korei Południowej, która od podstaw buduje pierwsze w dziejach świata smart city z prawdziwego zdarzenia. Songdo powstaje na 500 mln ton piasku, usypanego na sztucznej wyspie. Koszt inwestycji sięga ponad 35-40 mld USD. „Najinteligentniejsze miasto świata” swoją inteligencję zawdzięczało będzie naszpikowaniu technologią milionów sensorów zaprojektowanych przez Cisco i obecnych wszędzie, gdzie tylko to możliwe: na ulicach, w szkołach, biurowcach, szpitalach, fabrykach i w „zwykłych” domach. To z tych miejsc sensory będą wysyłały dane np. o korkach, bezpieczeństwie w szkole, kondycji elementów konstrukcyjnych biurowców, „Miasto przyszłości” ma stać się nową koreańską stolicą biznesu, oddaloną od Seulu o nieco ponad godzinę drogi autobusem. Prace są już na półmetku: ukończono ponad 60 proc. projektu. Oprócz spektakularnego Songdo weźmy pod lupę jeszcze dwa aktualne przykłady wykorzystania IoT. Pierwszy to Los Angeles. Miasto aniołów wykorzystuje dane wysyłane przez czujniki magnetyczne umieszczone na ulicach oraz sensory monitorujące ruch. Trafiają one do systemu komputerowego, który kontroluje 4,5 tys. świateł i decyduje, jak pokierować ruchem w mieście, rozładowując korki. Dzięki niemu natężenie ruchu w Los Angeles zmalało o około 16 proc. W Polsce Smart Cities to wprawdzie pieśń przyszłości, ale pierwsze jaskółki – jak w przypadku Słupska – są już widoczne.

100 proc. – Smart Świat. Cyfrowa utopia. Ta granica jest nieosiągalna: hieroglify danych nie zdołają odkodować się „same z siebie”, ponieważ do tego potrzebna jest akurat praca ludzkiego mózgu, który wyśledzi powiązania między elementami łańcucha danych i rozpozna zależności między nimi. Gdyby Big Data zrównała się ze Smart Data i wszystko zostałoby już odgadnięte, to my, badacze danych, nie mielibyśmy co robić, ponieważ każdy bit danych byłby już sensownym bitem – niosącym jakąś informację, wskazówkę przekaz. Tymczasem język danych wymaga nieustannego przekładu, wysiłku translatorskiego.

Korzystać a być wykorzystywanym

W filmie Bessona w pewnym momencie to już nie Lucy korzystała z mózgu, tylko mózg korzystał z Lucy. W przypadku Big Data ten czarny scenariusz nam nie grozi. Bez obaw – analityka danych nie sprawi, że staniemy się cyborgami. Raczej pomoże nam być „bardziej ludzkimi”. Tyczy się to zwłaszcza wykorzystania Big Data w medycynie czy walce z problemami współczesnego świata, takimi jak terroryzm czy przepaść ekonomiczna między krajami rozwiniętymi a rozwijającymi się.

Nawet w analityce Big Data, przy personalizowaniu reklam w Sieci czy tworzeniu cyfrowych profili zachowań użytkowników, nie wszystko leży w „cyfrowych rękach” platformy DMP, lecz właśnie w „analogowych dłoniach”, umiejętnościach badaczy danych. To oni nadal będą musieli głowić się, czysto po ludzku, nad wynajdywaniem powiązań między bitami danych, szukaniem zależności, opisywaniem algorytmów. To ich mózgi będą napędzały tę cyfrową machinę. Big Data zatem nigdy nie będzie myśleć za nas. I nie ma podstaw by twierdzić, że scenariusz znany z filmu Bessona stanie się rzeczywistością. Dane nie zawładną mózgiem analityków danych i nie zaczną myśleć za nich. To tworzywo, które jest na tyle inteligentne, na ile inteligentny jest jego twórca.

Big Data rozszerzy granice naszego myślenia, pozwalając mu wkraczać na nowe, niezbadane wcześniej tereny. Już teraz granica między światem cyfrowym a analogowym zaciera się z dnia na dzień. Życie digitalizuje się w zawrotnym tempie, a Big Data wnika w każdy jego aspekt. Dane dają „big picture”: są jak miliony dodatkowych par oczu, które pozwalają oglądać rzeczywistość z nieograniczonej liczby punktów widzenia. Widzieć wszystko i wszędzie.

Dlatego potencjał Big Data trzeba dostrzegać nie tylko w horyzoncie biznesowym. To idea, która pomaga, ratuje i rozwija również organizacje Trzeciego Sektora. I to chyba w tym tkwi największy, choć jeszcze nie w pełni wykorzystany, potencjał danych, Smart Data, tego „mózgu Lucy”, który współtworzą badacze danych z całego świata.