Reklama
Polityka_blog_top_bill_desktop
Polityka_blog_top_bill_mobile_Adslot1
Polityka_blog_top_bill_mobile_Adslot2
Kultura 2.0 - Cyfrowy wymiar przyszłości Kultura 2.0 - Cyfrowy wymiar przyszłości Kultura 2.0 - Cyfrowy wymiar przyszłości

2.01.2012
poniedziałek

Noworoczne czepialstwo – cz. 1: Big Data

2 stycznia 2012, poniedziałek,

Dawno nie zaglądałem na bloga danah boyd. W ramach grudniowego remanentu zajrzałem i proszę, trafiłem na tekst, który idealnie punktuje to, co od dłuższego czasu rozpala moją wyobraźnię i od nieco krótszego jest źródłem rozczarowania. Chodzi o analitykę kulturową i fantazje związane z tym, że w Sieci na badaczy czekają ogromne zbiory powiązanych ze sobą danych, które dadzą nam bezprecedensowy wgląd w życie społeczne.

Na początku jednak małe zastrzeżenie: to nie tak, że analiza „wielkich danych” jest w ogóle bez sensu i to na pewno ślepa uliczka (żeby się uwiarygodnić wspomnę, że z Alkiem jesteśmy właśnie po zamknięciu pierwszego w życiu dużego, realizowanego m.in. z Justyną Hofmokl, projektu statystycznego – tradycyjnego, ankietowego, ale jednak). Raczej: nowa trasa, pierwsze widoki całkiem niezłe, ale równocześnie – to nie tak, że wcześniej jechaliśmy w złym kierunku. Zwłaszcza, że i tutaj szybko robi się wyboiście.

A dlaczego wyboiście? O tym piszą danah boyd i Kate Crawford w tekście „Six Provocations for Big Data”, dzieląc się swoimi wątpliwościami. Jest ich wiele – począwszy od wzrostu ryzyka apofenii, czyli szukania powiązań tam, gdzie ich nie ma (w końcu przy dużej liczbie danych i analizie komputerowej zawsze coś można wykazać). Ale najpoważniejsze działa (dylematy?) to sześć tytułowych argumentów. Są proste, ale celne:

1. Zmiana definicji wiedzy związana z automatyzacją badań. Bo przecież zmiana narzędzia zbierania danych, na podstawie których budujemy teorię, zmienia tę teorię. W kierunku, który stwarza nowe możliwości, ale może też niepokoić, co najlepiej ilustruje przywoływany (trochę manipulacyjnie, bo autor nie jest „akademikiem”, a „internetowy intelektualista” to temat na osobny wpis) w tekście cytat z Chrisa Andersona: „Liczby mówią same za siebie”. Nie, nie mówią – i chyba nie wszyscy chcemy, żeby mówiły.

2. Iluzja obiektywności i dokładności. Kolejny cytat – tym razem z Latoura: „Socjologię ogarnęła obsesja dążenia ku staniu się nauką ilościową”. Ale przecież interpretacja danych jest subiektywna. Co więcej, subiektywny jest wybór tego, co stanowi dane. „Czyszczenie” tabel z wynikami. Nie, to nie jest „obiektywna prawda” – choć oczywiście łatwiej niż w wypadku innych metod, często eksponujących własną subiektywność, tak te wyniki sprzedać. Kuszące i niebezpieczne.

3. Więcej nie zawsze znaczy lepiej – także w wypadku danych. Morze danych sprawia, że na drugi plan schodzi metodologia. Pojawia się też ryzyko uniwersalizacji wniosków, co – jak dobrze wiemy z polskiego podwórka – często prowadzi do absurdów, bardzo bliskich znanemu „amerykańscy naukowcy odkryli”. Dlatego Autorki podkreślają, że liczą się nie tylko Big Data – także „small data”. Historie pojedynczych osób. Głębszy wgląd. W ogromnych tabelach łatwo to zgubić.

4. Nie wszystkie dane są równie ważne. Kontekst ma znaczenie. Dane z dwóch serwisów społecznościowych można podobnie przetwarzać i porównywać, ale równocześnie – to są różne serwisy i ich specyfika może być różna.

5. Dostępność danych nie sprawia, że korzystanie z nich jest etyczne.

6. Ograniczony dostęp do danych kreuje nowe podziały. Dostęp do wszystkich mają tylko wielkie firmy internetowe. Badacze – tylko do części. Jedni do większej, inni – mniejszej. To musi rodzić pytania o kryjące się za tym strategie i wywierany przez nie wpływ. O ryzyko wejścia w korporacyjną logikę danych poufnych, ale też o współpracę dużych ośrodków akademickich z biznesem.

Waga tych argumentów jest różna, nie brak w nich też „ogólnej słuszności”, z którą zgodzi się każdy i z której niezbyt wiele wynika. Ale równocześnie wydaje mi się, że to wszystko jest – tak, patos – bardzo ważne. I nie da się tego sprowadzić do walki różnych uczelnianych frakcji, albo do fetyszyzacji statystyki lub – szerzej – technologii. Ideałem byłoby znalezienie „trzeciej drogi”. Łatwo powiedzieć.

Reklama
Polityka_blog_bottom_rec_mobile
Reklama
Polityka_blog_bottom_rec_desktop