Martin Kasarda je pedagóg a publicista
Seth Stephen-Davidowitz: Každý klame. Lindeni 2019. Preklad K. Rossow.
Veľké dáta neklamú, len zrkadlia to, čo si skutočne myslí a čo robí tá časť populácie, ktorá je myšou a klávesnicou ako pupočnými šnúrami prepojená s internetom.
Seth Stephen-Davidowitz vo svojej knihe Každý klame totiž analyzuje správanie sa digitálnej populácie a odhaľuje vďaka dátam, že nie je všetko tak, ako si myslíme, ako predpokladáme a ako nás o tom často presviedčajú prieskumné agentúry.
Dozviete sa v nej, aké slová najčastejšie používajú muži a aké ženy, či je rasizmus naozaj len okrajovou záležitosťou (nie je), alebo čo najčastejšie vyhľadávajú indickí muži a ženy na pornografických stránkach. Alebo či sa dajú podľa správania sa ľudí na internete odhadnúť výsledky volieb, či pravdepodobnosť výskytu útoku na mešitu.
Čo sú vlastne Big Data
Ak ste kedysi pred rokom 1998 vyhľadávali cez prvé internetové vyhľadávače čokoľvek, tak základom vyhľadávania bolo jednoduché matematické pravidlo – čím viac sa dané slovo na stránke vyskytovalo, tým bolo pre vyhľadávač relevantnejšie a na prvých miestach sa vyskytovali stránky s najväčším počtom týchto slov.
Toto pravidlo sa ľahko obchádzalo: stačilo, ak autori stránky napísali do kódu stránky opakovane slovo a stránka stúpala. Autor knihy Každý klame uvádza, že napríklad pornostránky kódovali do svojej ponuky jedno z najčastejšie používaných "mužských" slov – auto. Ak ste šli hľadať v roku 1997 na internet "car", veľmi pravdepodobne ste sa okamžite dostali na pornostránky.
Potom prišiel Google a svet sa zmenil. Dokonca nielen ten internetový, ale aj náš, reálny.