Reklama
Polityka_blog_top_bill_desktop
Polityka_blog_top_bill_mobile_Adslot1
Polityka_blog_top_bill_mobile_Adslot2
Kultura 2.0 - Cyfrowy wymiar przyszłości Kultura 2.0 - Cyfrowy wymiar przyszłości Kultura 2.0 - Cyfrowy wymiar przyszłości

28.12.2007
piątek

0xdb

28 grudnia 2007, piątek,

Kolejna drobnostka, ale ciekawa. W Niemczech stworzono bazę danych o nazwie 0xdb, będącą katalogiem filmów zbudowanym w dużej mierze w oparciu o dane wyssane z serwisów p2p:

The core idea behind the 0xdb is that file-sharing networks can not only be used to download digital works, but also to just retrieve information about them. Even though most movies in the 0xdb are copyrighted, and many of them are practically inaccessible for legal reasons, the monitoring of peer-to-peer traffic allows the 0xdb to identify and index these materials.

Projekt jest ciekawy, bo sonduje granice dozwolonego użytku (w tym wypadku przede wszystkim prawa do cytowania) – dowodząc, że można w jego ramach zrobić całkiem dużo. Przypomina mi się projekt, o którym opowiadał kiedyś John Wilbanks z Science Commons: data miningu legalnie dostępnych streszczeń artykułów naukowych (których pełne wersje są zastrzeżone) w celu wysysania z nich przydatnych informacji / wiedzy.

Jeszcze jedna, konkretna rzecz, którą robią twórcy 0xdb, jest warta uwagi – otóż wykorzystują oni podpisy do filmów jako dane pozwalające przeszukiwać pełnotekstowo treść produkcji.

In many cases, people don’t just share movies, but also subtitle files. Since these files contain the full dialogue along with the corresponding time codes, it is quite simple to make a movie searchable, and then to map the textual results of such a search to the corresponding images.

To klasyczny przykład na „użycie nieprzewidziane przez twórców” – jakich w internecie pełno. Tu mam wątpliwość, czy korzystanie z takich nieautoryzowanych list dialogowych jest legalne (a przynajmniej w jakim zakresie?). Jedno jest pewne – taka wyszukiwarka rzuca nowe światło na kwestię podpisów: nagle okazuje się, że piraccy tłumacze przy okazji wykonują cenną pracę archiwizacyjną.

Reklama
Polityka_blog_bottom_rec_mobile
Reklama
Polityka_blog_bottom_rec_desktop

Komentarze: 1

Dodaj komentarz »
  1. hmmmm – trochę niebezpieczna baza, szczególnie dla tych, którzy szerują workprinty, pliki typu advance i inne pre-relases. Coś mi się widzi, że za chwilę powstaną softy zabezpieczające przed dodaniem do niej 🙂
    A z nieco innej beczki, dośc podobną rolę spełnia taki niewielki sofcik, jak Ant Movie Catalog (reklama mode on:), który po wprowadzeniu do bazy tytułu, rezysera, roku czy jakiejkolwiek informacji związanej z filmem, ściąga ze wszystkich filmowych serwisów dane na temat szukanego obrazu – i to dokładnie wszystki, łacznie z szytbkościa klatek w poszczególnych ripach itd, itp. Tak właściwie od kiedy go znalazłem, to przestałem katalogowac filmy w czymkolwiek innym, tudziez zaglądac na imdb, bo on sam te wszystkie dane – łącznie z postanmi z for, sam ściąga i umieszcza w opisie filmu. Rewelacyjna zabawka, no i nie wygląda na napakowaną spywarem, jak ta baza opisywana 🙂