W komentarzach do poprzedniego wpisu o crowdsourcingu MW wspomniał o projekcie The Commons z serwisu Flickr – rzeczywiście ciekawym, bo opartym na partnerstwie tłumu i instytucji pamięci: te drugie udostępniają swobodnie zdjęcia ze swoich archiwów, a tłum tworzy wartość dodaną poprzez ich opisywanie. Nie chodzi tylko o wyręczenie archiwistów – jest szansa, że rozproszona mądrość tłumu wie coś o zdjęciach, czego nie wie instytucja (i tu już, jak wspominałem zeszłym razem, mówimy o czymś innym niż crowdsourcing).
Przeglądałem w międzyczasie blog o crowdsourcingu – jego autor, tłumacząc się czemu tak mało miejsca poświęcił Google’owi, stwierdza, że o googlowskim crowdsourcingu można by napisać osobną książkę. Rzeczywiście Google uparcie korzysta i wykorzystuje tłum – za koronny przykład podaje się fakt, że mądrość systemu PageRank opiera się na rozproszonej mądrości internautów, którzy najpierw w inteligentny sposób linkują, a potem równie inteligentnie wybierają linki z oferty wyszukiwarki. A Google obserwuje i poprawia (zapewne jeszcze z ludzką pomocą) swoje algorytmy. Jednak przypadek Google’a – dlatego o nim wspominam – teź, w subtelny sposób, nie jest dla mnie crowdsourcingiem. Bo wtedy za taki należałoby uznać dowolną formę „data miningu” danych wygenerowanych przez dużą grupę osób.
Więc znów grozi nam rozmycie pojęcia – aby je sprecyzować proponuję dodać jeszcze jeden warunek: crowdsourcing traktuje tłum i jego członków jak ekspertów, gdy powszechnie są uważani za amatorów. I aktywnie prosi ich o ekspertyzę.
Obiecałem jednak kolejny przykład.
W specjalnym dodatku pisma „Nature”, zatytułowanym „Big data”, jest artykuł Sue Nelson „The Harvard computers”. Opisuje w nim kobiety, które pod koniec XIX wieku były zatrudniane w obserwatorium na Uniwersytecie Harvarda w roli komputerów. Tak już od początków XVIII wieku nazywano po angielsku ludzi przetwarzających informację – komputery z artyku zajmowały się przede wszystkim analizą zdjęć astronomicznych. Te „amatorki”, pozornie wykonujące powtarzalne zadania na potrzeby naukowców, okazywały się być z czasem ekspertkami, uznawanymi w środowisku i odpowiedzialnymi za istotne odkrycia. Badania prowadzone przez Henriettę Swan Leavitt nad Cefeidami pozwoliły wypracować później metodę oceniania odległości do gwiazd, a ostatecznie udowodnić rozszerzanie się wszechświata.
Pytanie, gdzie w tym wszystkim tłum? Nelson pokazuje, że XIX-wieczne komputery były prababkami współczesnego crowdsourcingu astronomicznego: szeregu projektów zatrudniających zdalnie tłum do wykrywania wzorów. Przykładowo, 23 000 uczestników projektu Stardust@Home przeanalizowało 40 milionów zdjęć w poszukiwaniu śladów pyłu gwiezdnego zebranych na sfotografowanych płytkach kolektora. (To zresztą przykład szalony, skoro jeden uczestnik przejrzał średnio 2 000 zdjęć!).
Koło się zresztą zamyka – w ramach projektu DASCH astronomowie z Harvardu chcą zeskanować całe archiwum fotograficzne obserwatorium – pół miliona zdjęć zrobionych na przestrzeni 100 lat – i nasłać na nich, zdalnie, astronomów amatorów.
Podoba mi się ten przykład, bo dobrze pokazuje profesjonalność pozornych amatorów, z której wynika wartość crowdsourcingu. To także ciekawy przykład wzajemnej wymiany ról przez ludzi i komputery. Ale o tym więcej w kolejnym, trzecim przykładzie.
16 października o godz. 16:54 35992
„Więc znów grozi nam rozmycie pojęcia – aby je sprecyzować proponuję dodać jeszcze jeden warunek: crowdsourcing traktuje tłum i jego członków jak ekspertów, gdy powszechnie są uważani za amatorów. I aktywnie prosi ich o ekspertyzę.”
W nawiązaniu do Google – ok, może trudno powiedzieć, że proszą oni kogokolwiek o ekspertyzę (tzn. tworzenie linków), natomiast jeśli polegają na czyjejś opinii (tłumów tworzących linki, coraz częściej są to blogerzy), to chyba jednak w pewnym sensie traktują ich jak profesjonalistów. Na zasadzie – mamy do Was zaufanie, że wybierzecie dobrze, więc jako całość traktujemy Was jak profesjonalistów.
17 października o godz. 8:21 35993
@Karol
Ja to widze troche inaczej – Google nie zbiera informacji o dobrych wyborach, tylko takich wyborach, jacy dokonuja ludzie. Nie wiadomo wiec, czy sa to wybory „dobre” (niejako obiektywnie) – wiadomo tylko, ze podobaja sie uzytkownikom. A to jednak roznica.
17 października o godz. 13:32 35996
@Alek
Mam nadzieję, że za bardzo nie namieszam, ale:
Trzeba w tym momencie zapytać o to, co oznacza „dobry” wybór. Pisząc „niejako obiektywnie”, mam wrażenie, że odwołujesz się do klasycznej definicji prawdy. Tzn. oceniasz wybory ludzi według miary wziętej z zewnątrz (z jakiejś tam rzeczywistości).
Natomiast mi wydaje się, że Google działa według logiki prawdy pragmatycznej – to co podoba się ludziom, jest również prawdziwe. Albo ściślej – coś jest prawdziwe, ponieważ podoba się ludziom.
I rzeczywiście jest to duża różnica. Może to za dużo powiedziane, ale Google rzeczywiście nie uważa użytkowników za profesjonalistów w tradycyjnym znaczeniu tego słowa (tutaj się zgadzam), on idzie znacznie dalej – algorytm Google sprzyja redefiniowaniu tego, co uważamy za prawdę, a także zmienia zakres pojęcia „profesjonalizm” (skoro o kolejności wyników decydują „nieprofesjonalne” masy, a nie tradycyjne autorytety w danej dziedzinie).
19 października o godz. 11:54 35998
@Karol, takie podejście może czasem wieść w ślepy zaułek ludzkiej pomysłowości – że wspomnę tylko o sławnym przypadku „siedziby szatana” które to zapytanie w google wiedzie do pewnej strony… Wszyscy zapewne wiedzą, o jaką sprawę chodzi, a jeśli nie – niech wpiszą w wyszukiwarkę to zagadnienie i obejrzy sobie pierwszą proponowaną stronę…
20 października o godz. 19:37 36004
@Misiael
Oczywiście. Ten system ma swoje plusy i minusy. Osoby w rodzaju Jenkinsa czy Castellsa pokazują raczej plusy, natomiast Postman powiedziałby pewnie o infantylizacji informacji.
Proponuję artykuł z First Monday na ten temat, niestety tylko po angielsku – http://www.uic.edu/htbin/cgiwrap/bin/ojs/index.php/fm/article/view/1287/1207
23 października o godz. 9:58 36024
@Karol
zupelnie sie zgadzam z pragmatyczna, a nie obiektywna prawda. ale chodzilo mi raczej o to, ze Google nikogo nie pyta o zdanie – np. pokazujac 10 roznych stron i proszac o ich rankowanie; a jedynie podglada ludzkie zachowania – co moim zdaniem crowdsourcingiem nie jest, bo brak elementu: „prosze, zrob cos dla mnie”
27 października o godz. 12:55 36867
„24-letni Marek W. odpowie przed sądem stworzenie programu do pozycjonowania, który powodował iż na obraźliwe hasła wpisywane do wyszukiwarki pojawiała się oficjalna strona głowy państwa.”
http://www.internetstandard.pl/news/170929.html
25 listopada o godz. 16:55 40215
@Alek
Google uruchomił właśnie usługę WikiSearch, która, zdaje się, zmierza w kierunku tego, o czym była mowa w poście. Pozbierałem moje uwagi na ten temat do kupy i opublikowałem na moim blogu – http://kultgoogle.pl/?p=68
Zapraszam.