Szalona era Big Data

na kolorowej grafice wykresy, buźki i laptop

O pułapkach myślenia i datafikacji w otwartej nauce

Wiemy już, że umysł ludzki cechuje się pewnym ograniczeniem, sprawiającym, że jest on niedoskonały w rekonstrukcji minionych stanów wiedzy oraz poglądów, które uległy zmianie (D. Kahneman, Pułapki myślenia. O myśleniu szybkim i wolnym, Media Rodzina, Poznań 2012). Jest on również podatny na systemowe błędy. Już tacy jesteśmy – zmieniając pogląd, prawie zawsze natychmiast o nim zapominamy. Ponadto, nasze wybory są skutkami decyzji, które podejmujemy intuicyjnie lub też całkiem inaczej, bo w sposób racjonalny. Różnimy się bardzo i to jest potrzebne światu równie mocno jak bioróżnorodność. Może to nas także zainteresować w kontekście otwierania nauki. Dlaczego? Spróbujmy zmienić poglądy na bardziej otwarte. Zróbmy to w sposób intuicyjny lub racjonalny. W niniejszym komentarzu do otwartej nauki przedstawię rozważania na temat datafikacji, która jest narastającym procesem tworzenia cyfrowych reprezentacji kolejnych obszarów świata rzeczywistego oraz czerpania wartości z pozyskanej w ten sposób informacji (por.: V. Mayer-Schönberger, K. Cukier, Big Data: A Revolution That Will Transform How We Live, Work and Think, Eamon Dolan/Houghton Mifflin Harcourt, New York 2013).

Dane mają różne oblicza, jednym z nich jest ich gwałtowny przyrost. Jak podają badaczki z DeLab UW (K. Śledziewska, R. Włoch, Gospodarka cyfrowa. Jak nowe technologie zmieniają świat, Wydawnictwo Uniwersytetu Warszawskiego, Warszawa 2020, s. 64), „(…) wolumen danych przyrasta w tempie wykładniczym, podwajając się co trzy lata. Nic w tym dziwnego, w ciągu jednej minuty wysyłanych jest 188 mln mejli (nie tylko przez ludzi, ale i boty spamujące), powstaje 350 tys. tweetów, wyszukiwarka Google jest używana 3,8 mln razy, a Skype 180 tys. razy” (warto to zresztą zobaczyć: http://www.internetlivestats.com/one-second/ data dostępu: 19 grudnia  2021 r.). Ten szalony wzrost może zachwycać entuzjastów danych, ale powinien również dawać do myślenia. Zresztą to liczby sprzed dwóch lat. Datafikacja lub danetyzacja jako kwantyfikowanie i przekładanie wszelkich elementów rzeczywistości na dane, by móc je poddać agregowaniu i algorytmizacji, niesie za sobą konsekwencje społeczne i ekonomiczne. Otwiera perspektywy nowych modeli funkcjonowania gospodarek (https://www.researchgate.net/publication/304581716_Spoleczne_Zagrozenia…, data dostępu: 19 grudnia 2021 r.). Może być również zagrożeniem dla młodego pokolenia, co powinno stanowić przedmiot troski wielu osób, a nie jedynie Grety Thunberg. Podobnie dążenie do zawężania obszarów, które nie zostały jeszcze zewidencjonowane, jest swoistą drogą do budowy wielkiej Big Data. Fenomen quantified self, polegający na ciągłym mierzeniu parametrów własnego organizmu (poza sytuacjami zagrożenia życia i zdrowia), mnie osobiście trochę przeraża, ale przecież jest coraz bardziej powszechny, nie tylko wśród sportowców.

Datafikacja dotyka życia ludzkiego w wielu aspektach – relacjach, zachowaniach, w tym konsumenckich, bywa źródłem broni politycznej. „Produkcji danych sprzyja także etos narcyzmu i ekshibicjonizmu w dzisiejszej kulturze, pęd do demonstrowania najdrobniejszych szczegółów życia – choćby za pośrednictwem serwisów społecznościowych” (Ł. Iwasiński, Społeczne zagrożenia danetyzacji rzeczywistości, Uniwersytet Warszawski, Warszawa 2016, s. 138). Być może faktycznie, jak chcą V. Mayer-Schönberger i K. Cukier, istnieje mierzalny komponent wszystkiego, ale podejmując decyzje, zawsze można skupić się na tym, co pożyteczne. Oczywiście, nie jest to proste .

Dzieląc występujące w wielkiej mnogości dane ze względu na typ wytwórcy i właściciela, znajdujemy wśród nich również dane badawcze obejmujące rejestry (wyniki liczbowe, zapisy tekstów i dźwięków, obrazy i notatniki), czyli wszystkie te, które są powszechnie akceptowane przez społeczność naukową jako odpowiednie do przeprowadzania badań i używane jako pierwotne ich źródła. Ponieważ nauka jest podmiotem wrażliwym i tworzą ją jeszcze ludzie, to tylko oni mogą ją zmieniać. Pora połączyć początek ze środkiem. Wspominając znowu Davida Kahnemana, trzeba podkreślić, że uproszczone reguły postępowania (heurystyki) pozwalają nam wyjaśniać, dlaczego jedne zagadnienia są odbierane przez opinię publiczną jako znaczące, inne zaś są lekceważone. Potrzebujemy przykładów, aby zapamiętywać i „oswajać” nowe. Idąc zatem tym tropem, zauważmy, że potrzebujemy „oswajać” otwartą naukę. Oto przykłady, z którymi warto się zapoznać, ale które trudno jest analizować. Wspominane już przeze mnie w felietonach o otwartej nauce wskazania Royal Society z 2012 r. (https://royalsociety.org/topics-policy/projects/science-public-enterpri…, data dostępu: 19 grudnia  2021 r.) przypominają o konieczności zmian i pokazują przykłady kumulowania wiedzy za pośrednictwem otwierania danych.

Podobnie, International Science Council w swoim najnowszym stanowisku, zawartym w Science as a Global Good, podkreśla wymierne korzyści z uprawiania i otwierania nauki. Nabiera ono szczególnego znaczenia obecnie w walce z COVID-19. Idąc za tym przesłaniem, zauważmy, że: „Wiedza jako najpotężniejsze z dóbr publicznych była inspiracją, bodźcem i czynnikiem, na którym zbudowano większość ludzkiego materialnego, społecznego i osobistego postępu. Gdy opublikowane twierdzenie opiera się w całości lub w części na dowodach empirycznych, dowody te muszą być jednocześnie dostępne do zbadania”. W przeciwnym razie twierdzenie jest niezgodne z tezami naukowymi (por.: https://council.science/wp-content/uploads/2020/06/ScienceAsAPublicGood…, data dostępu: 19 grudnia 2021 r.).

Teoria perspektywy (prospect theory) Davida Kahnemana i Amosa Tversky’ego oraz niechęć ludzka do ponoszenia strat nie zawsze pozwalają nam widzieć przyszłych korzyści wynoszonych z nauki. Celowo wybrałam jako motyw niniejszego artykułu myśli Davida Kahnemana – wybitnego laureata Nagrody Nobla w dziedzinie ekonomii. W końcu jesteśmy w Szkole Głównej Handlowej w Warszawie, zatem uprawiajmy naukę dla innych, a nie tylko dla siebie!


dr AGNIESZKA KAMIŃSKA, Centrum Technologii Informatycznych i Infrastruktury SGH