Big Data vs. Michał Pazdan – jak polski obrońca zawstydził analityków danych

Big Data vs. Michał Pazdan – jak polski obrońca zawstydził analityków danych
Michał Pazdan. To nie jest imię i nazwisko piłkarza. To nazwa firmy. Po serii znakomitych występów podczas EURO Michał Pazdan wyrobił sobie markę. Aktualny gracz Legii Warszawa stał się dobrem narodowym i niekwestionowanym bohaterem niejednego spotkania biało-czerwonych.
O autorze
7 min czytania 2016-06-30

Zdjęcie: Profil Michała Pazdana na Facebooku

Zawstydził nie tylko defensywę niemiecką, szwajcarską, ukraińską czy północno-irlandzką. Czołowy polski defensor ośmieszył również… analityków Big Data. Ci ostatni w swoich predykcjach wykorzystujących dane nie dawali Polsce większych szans na zawojowanie tegorocznych mistrzostw Europy w piłce nożnej. Pazdan wyciął ich równo z murawą.

Wślizg od tyłu

Wielki turniej. Wielkie nadzieje. Wielkie nazwiska. A wśród tych ostatnich – to jedno, szczególne, które trafiło na usta niemalże wszystkich Polaków po fazie grupowej: „Pazdan”. Polski obrońca swoimi fenomenalnymi występami zrobił w sieci furorę. Internauci mianowali go Ministrem Obrony Narodowej. Nad Wisłą zapanowała Pazdanomania. Z obiektu drwin i pewniaka do prześmiewczych memów pokroju Kung Fu Pazdan – zawodnik z numerem 2 na koszulce w jednej sekundzie stał się synonimem heroizmu. „Pazdan” pozwolił nam myśleć, że w obronie jesteśmy mocni. Zmienił też język internautów. Dzisiaj „przypazdanić” – nie oznacza już: „zepsuć”, „sknocić”, „zmarnować”, lecz: „powstrzymać”, „zgasić”, „wygrać pojedynek”. Pazdaldo, Pazdinho, Pazdavaro, Pazdamos – to tylko niektóre przydomki, jakich dorobił się środkowy defensor orłów. Doczekał się nawet własnej piosenki: „Pazdan Boy”, stylizowanej na disco polowym szlagierze „Tarzan Boy”. A oto fragment: „Bum tarararara, EURO nadal trwa! Kogo chcesz dziewczyno? Ja wiem – Pazdana!” Całość odsłuchacie tutaj. Pazdan zawładnął też Facebookiem. W mediach społecznościowych szaleje akcja: „Jeśli Polska wygra EURO – obcinam się na Pazdana”. Postawa obrońcy Legii, tak samo jak postawa całej polskiej jedenastki, musiała zaskoczyć niejednego kibica. Oczywiście in plus.

Na minus zaskoczyła natomiast analityków Big Data z całego świata, którzy teraz pewnie chowają głowę w piasek, patrząc na to, co Michał Pazdan wyczynia na boisku. Wielu z nich nie dawało polskiej reprezentacji choćby cienia szansy na wyjście z grupy, nie mówiąc już o zdobyciu tytułu mistrzowskiego. Tak mówiły im ponoć Big Data, czyli wielkie zbiory danych pozostawiane przez internautów w sieci, które wykorzystali w swoich predykcjach. Fajnie, modnie, nowocześnie. Branża wpisała się w trend, bo w końcu samo IDC prognozuje, że rynek aplikacji wykorzystujących analitykę predyktywną, wliczając w to uczenie maszynowe (machine learning), będzie rósł o 65 proc. szybciej, niż rynek aplikacji nieposiadających takich funkcji. Sęk w tym, że wszystkie te „inteligentne predykcje” nie wzięły pod uwagę tego, że Michał Pazdan jest w życiowej formie. Mówiąc brutalnie: Pazdan zaorał Big Data. A oto dowody.

LinkedIn logo
Na LinkedInie obserwuje nas ponad 100 tys. osób. Jesteś tam z nami?
Obserwuj

Według analityków Big Data z Bisnode Data Analytics Labs, naszą piętą achillesową miała być… dziurawa linia obrony! Z danych zgromadzonych przez Bisnode wynikało, że Polska obrona jest najsłabszą spośród wszystkich drużyn występujących na francuskim EURO. W ocenie badaczy danych Polska zasłużyła na notę 1/10. Lepsi od naszych obrońców byli nawet ich koledzy z Rosji (6/10), Ukrainy (8/10), Rumunii (9/10) czy Albanii (3/10). Rzeczywistość zweryfikowała te prognozy: reprezentacje rzekomo lepsze w defensywie od naszej kadry, rozstały się z mistrzostwami już w fazie grupowej, tracąc bramki w hurtowych ilościach. Odpowiednio wpuściły: 6, 5, 4 i 3 gole. Cóż – jaki kraj, taki Pazdan.

Tymczasem polska obrona okazała się nad wyraz szczelna. W grupie nie tylko nie przegraliśmy ani jednego meczu. My nie straciliśmy nawet jednej bramki! Zachowaliśmy czyste konto jako jedna z raptem 3 drużyn na całej imprezie, obok Włoch i Niemiec. Skarcił nas dopiero Xherdan Shaqiri. Internet znalazł jednak odpowiedź, dlaczego Pazdan nie upilnował Szwajcara: „Zrobił to specjalnie. Chciał pokazać, że też jest człowiekiem”.

Słuchaj podcastu NowyMarketing

Zresztą – zobaczcie sami, jak sklasyfikowano nas w rankingu analityków z Bisnode.

NowyMarketing logo
Mamy newsletter, który rozwija marketing w Polsce. A Ty czytasz?
Rozwijaj się

Jakim cudem popełniono tak katastrofalny błąd? Kto dostrzegł w formacji firmowanej przez Pazdana i spółkę dziury jak w szwajcarskim serze? Co poszło tu nie tak? Metodologia? Nieodpowiedni dobór i zakres danych? Ich rozdzielczość? A może dane były po prostu nieaktualne i nie odzwierciedlały życiowej formy Pazdana? Może badacze danych zapomnieli, że Big Data trzeba przecież najpierw oczyścić z cyfrowego bełkotu? A przecież IDC upominało wielokrotnie: blisko 90 proc. danych w dzisiejszym Internecie to Dark Data (chaotyczne, nieuporządkowane dane, które same z siebie nic nie mówią), a około 10 proc. danych w mediach społecznościowych – to Dirty Data, które wcale nie są dziełem ludzi, lecz np. botów. Odnoszę wrażenie, że nikt nie wziął tej przestrogi na serio, lecz wszyscy, chwytając real-time marketing za rogi, rzucili się na EURO ze względu na medialność tematu. Wpakowali do jakiegoś algorytmu wszystko, co mieli pod ręką licząc, że algorytm „wypluje” coś super-sensownego, prawdę objawioną. Czy tak faktycznie było? Nie wiem, nie mam bladego pojęcia. Wiem natomiast jedno: szczerze współczuję badaczom danych, którzy stali za wszystkimi nietrafionymi predykcjami na EURO. Wiem, że chcieliście dobrze, ale po takich – nazwijmy rzeczy po imieniu – analitycznych wtopach termin „analityka predyktywna” naraża się dzisiaj na śmieszność. Laik słysząc o spektakularnych wpadkach technologii wykorzystujących Big Data – patrzy na cały ten rynek z politowaniem. W analityce Big Data widzi to, co przed EURO widziano w Michale Pazdanie i zadaje sobie pytanie: „Czy ja wiem… czy oby na pewno toto potrzebne?”.

Potrzebne. Spróbujcie wyobrazić sobie polską defensywę podczas EURO bez Michała Pazdana.

Potraficie? Pewnie nie byłoby tak różowo, jak teraz.

To teraz już wiecie, jak wyglądałby świat biznesowy bez analityki predyktywnej. Big Data w predykcjach biznesowych to naprawdę WIELKA rzecz. Sęk tkwi jedynie w tym, aby mieć dostęp do dobrych, sprawdzonych, aktualnych i rzeczowych danych. I przede wszystkim: wiedzieć, jak z nich korzystać oraz – w przypadku biznesu – jak je monetyzować.

Żółta kartka dla analityków

W dość zgodnej opinii wygłaszanej przed EURO 2016 przez fachowców od Big Data, Polska miała być łatwym kąskiem i dostarczycielem punktów dla mocniejszych teamów. Bisnode Data Analytics Labs szacowało, że największe szanse na zwycięstwo (21,3 proc.) ma broniąca tytułu Hiszpania. 

„Nasze modele i ich wyniki były wielokrotnie testowane i okazały się być wiarygodne. Dlatego też możemy przewidywać że Hiszpania, jako dwukrotny obrońca tytułu, ma największe szanse na zdobycie tytułu również w tym roku” – mówił Andreas Psaros, Interim Commercial Lead Big Data Analytics Lab, Bisnode. 

Cóż. Błędy się zdarzają. Tak się bowiem złożyło, że gracze z Półwyspu Iberyjskiego odpadli już w 1/8, ulegając dwoma bramkami z piłkarzami z Włoch. Drugą, nieznacznie mniejszą szansę na mistrzowski tytuł (około 20 proc.), analitycy danych z Bisnode dawali Anglii. Drugi błąd. Synowie Albionu pożegnali się z turniejem również w 1/8, sensacyjnie ulegając Islandii, która okazała się czarnym koniem tych mistrzostw. Szanse na zwycięstwo Polski przed rozpoczęciem turnieju analitycy Bisnode oszacowali na… 0,4 proc. Wyżej oceniono reprezentacje Rumunii, Austrii, Rosji czy Turcji. Tak, zgadliście: wszystkie te zespoły spakowały walizki już po trzecim meczu grupowym. Aktualnie Bisnode szacuje, że Polska ma aż 2,4 proc. szans na zwycięstwo. Mniejsze ma tylko Islandia: 1,2 proc. Czuję w kościach, że jeszcze się zdziwimy…

Oczywiście nie tylko Bisnode przestrzelił w swoich predykcjach z użyciem Big Data. Zrobił to również Goldman Sachs, który postanowił pobawić się wielkimi zbiorami danych i też wysnuł swoje prognozy meczowe, biorąc pod uwagę 4719 meczów międzynarodowych, rozegranych przez reprezentacje od 1958 roku, a także ratingu Elo, który ma swoje zastosowanie przede wszystkim w ocenie graczy szachowych.

Według analityków danych z banku Goldman Sachs Polska ma 43. proc szans na grę w półfinale EURO. To i tak całkiem sporo. Jednak zdecydowanie mniej optymistycznie analitycy oceniają możliwość zdobycia przez Polaków najcenniejszego trofeum: mamy raptem 8 proc. szans na taki sukces. Przed fazą grupową analitycy typowali raptem 1,5 proc. Tak samo nisko bank ocenił szanse na tytuł… reprezentacji Italii. Na najwyższym stopniu podium Goldman Sachs widzi Francuzów, którym przyznaje dziś aż 33,3 proc. szans na awans. Francuzi byli typowani na zwycięzcę jeszcze przed rozpoczęciem fazy grupowej, notując 23,1 proc. W finale Les Bleus spotkają się z Belgami i wygrają 2:1. Przed EURO Goldman Sachs twierdził, że rywalem Pogby i spółki będzie Hiszpania. Jeśli Francja zawiedzie, to w drugiej kolejności do pucharu EURO stoją Niemcy. Jak będzie? 

Drabinkę turniejową Goldman Sachs można już w sumie wyrzucić do kosza. W 1/8 według analityków danych z Goldman Sachs zagrać miały m.in. Ukraina, Rosja i Rumunia, które swoją przygodę z EURO zakończyły już na ostatnich miejscach w fazie grupowej. Również kształt całej drabinki wziął w łeb. Polska, po (szczęśliwym) awansie z trzeciego miejsca w grupie, miała przegrać mecz w 1/8 z gospodarzami turnieju, Francuzami. W rzeczywistości zajęliśmy drugie miejsce w grupie i odprawiliśmy z kwitkiem Szwajcarów po rzutach karnych. 

Autorskie predykcje meczowe opublikowały również Yahoo Sport i Tumblr. Nie twierdziły jednak nigdzie wprost, że to „predyktywna analityka Big Data”, choć faktycznie wykorzystywały wielkie zbiory danych, pozostawione przez internautów na forach sportowych. Mówimy tu o naprawdę wielkich liczbach. Jakich? 24 miliony blogów na Tumblr, obejmujące ponad 20 miliardów (sic!) postów o EURO 2016 z pierwszych pięciu miesięcy tego roku, wymienianych między użytkownikami platformy Yahoo. I – co zaskakujące – te predykcje meczowe są o niebo skuteczniejsze! Przykładowo: mechanizm Yahoo wytypował poprawnie wyniki 2 z 3 meczów grupowych Polaków (1-0 z Irlandią Północną i 1-0 z Ukrainą). Pomylił się w meczu z Niemcami (typował 1-0 dla naszych Zachodnich sąsiadów, a mecz zakończył się bezbramkowym remisem). Trafnie natomiast określił wynik spotkania w 1/8 ze Szwajcarią. W przypadku kształtu finalnej drabinki turniejowej zdarzyło mu się jednak kilka wpadek, m.in. obecność Ukrainy czy Czech, które w swoich grupach zajęły ostatnie miejsca. 

Mam ogromne wątpliwości, czy to, co zostało zaprezentowane przez niektóre firmy, rzeczywiście można określić mianem „predyktywnej analityki Big Data”. Celowałbym raczej w jakiś inteligentny algorytm wnioskujący na mimo wszystko relatywnie małej liczbie danych, uwzględniający np. bezpośrednie pojedynki drużyn X i Y, aktualną pozycję w rankingu FIFA, wyniki meczów z ostatnich lat. I tyle. Takie działania, jakkolwiek godne pochwały, dzielą od prawdziwej analityki predyktywnej całe lata świetlne. 

Tak jak lata świetlne dzielą postawę Michała Pazdana przed EURO do postawy Michała Pazdana „turniejowego”, stanowiącego filar naszej defensywy.

Pazdan jak firewall

Jeśli Michał Pazdan miałby swój odpowiednik produktowy w świecie IT, to byłby to chyba firewall. Nasz defensor nie wpuszcza w pole karne żadnych elementów obcych. Nie wpuścił Mullera, ani Yarmolenki, ani Lafferty’ego. Tak jak dobry firewall nie wpuszcza na nasz komputer trojanów, spyware’u czy wirusów.

Pazdan jest jak ściana ognia. Jeśli kiedykolwiek w Cloud Technologies stworzymy własnego firewalla, to nazwiemy go właśnie „Pazdan-Wall”. Zakasamy rękawy i zrobimy co w naszej mocy, aby twarzą kampanii promującej ten produkt był nasz obrońca. Obiecuję.

A tymczasem – wracamy do regularnej i żmudnej pracy nad Big Data. Do naszego treningu na cyfrowym boisku, które nazywacie Internetem. Do pracy nad tym, aby nasze dane z dnia na dzień były świeże, jakościowe i dopracowane w najdrobniejszych detalach.

Tak jak gra Michała Pazdana, która z meczu na mecz jest coraz lepsza.