logo Archiwum Główne Akt Dawnych w Warszawie
Central Archives of Historical Records in Warsaw
Tabulatorium Actorum Antiquorum Varsoviense Maximum
AGAD  Home  >  BIP - AGAD  >  Zasób  >  Inwentarze  >  Genealogia  >  Metodyka  >  Działalność  >  Inne  >
Artykuły:
Abby Smith - Dlaczego przekształcać na postać cyfrową?
Tatiana Nikolova-Houston - Jak pokonałam przepaść technologiczną celem ratowania słowiańskich rękopisów
Stuart D. Lee - Czy dyskretyzacja jest warta zachodu?

Eric Ketelaar - Being Digital in People's Archives - "Cyfrowe życie" w Archiwum dla ludzi

Stuart D. Lee


[Stuart D. Lee jest dyrektorem Learning Technologies Group na Uniwersytecie Oksfordzkim i wicedyrektorem Humanities Computing Unit. Posiada doktorat z literatury średniowiecznej. Jest członkiem oksfordzkiego Wydziału Anglistyki, gdzie prowadzi wykłady z edytorstwa elektronicznego. Prowadzi projekt dyskretyzacji rękopisów poety Wilfreda Owena (http://info.ox.ac.uk/jtap) i zarządzał finansowanymi przez Fundację Mellona badaniami nad dyskretyzacją zbiorów oksfordzkich (http://www.bodley.ox.ac.uk/scoping). Jest autorem książki "Obrazowanie cyfrowe: podręcznik praktyczny".]
Tekst ten publikujemy w internecie za zgodą Autora oraz wydawcy periodyku Computers in Libraries.]



Czy dyskretyzacja jest warta zachodu?




  Warto od czasu do czasu dokładnie i krytycznie przyjrzeć się temu, co robimy, co do tej pory udało nam się osiągnąć, a zwłaszcza tym działaniom, które pochłonęły wiele naszego czasu. Jeśli wolno mi coś zasugerować, gra jest warta świeczki, choć na pewno będziecie musieli stanąć twarzą w twarz z wieloma kłopotliwymi pytaniami. Sam doświadczałem tego na różne sposoby podczas pisania tego artykułu. Po dziesięciu latach pracy jako informatyk na Uniwersytecie w Oksfordzie, z czego cztery ostatnie poświęciłem szczególnie tworzeniu obrazów cyfrowych rzadkich rękopisów, postawiłem sobie wreszcie najtrudniejsze pytanie: czy dyskretyzacja jest warta zachodu?

  Pamiętając o wszystkich zachwytach (żeby nie wspominać już o pieniądzach) wokół cyfrowych obrazków (które są, jak śmiem twierdzić, najpopularniejszą formą dyskretyzacji, z jaką wszyscy mamy do czynienia), zaczynam czuć się jak małe dziecko krzyczące, iż król jest nagi, ośmielając się nawet sugerować tego typu pytanie. A jednak, czy rzeczywiście dysretyzacja jest warta zachodu? Wszyscy to robią, poczynając od największych bibliotek narodowych, a kończąc na najmniejszych instytucjach; a jeśli już nie na co innego, to spójrzcie choćby na te śliczne obrazki, które można sobie pooglądać w internecie. A jednak pamiętajcie o historii "Nowych szat cesarza"! Samo to, że tłum uważa coś za właściwe, nie oznacza wcale, że tak właśnie jest. Od czasu do czasu ktoś musi zatrzymać ten pochód i wskazać na kilka oczywistych faktów lub przynajmniej sprawić, abyśmy sami zadali sobie pytanie: co my właściwie robimy? Jak już wspomniałem, pozwala to oczyścić atmosferę.

  Zanim przejdziemy dalej należy uściślić, co rozumiem pod pojęciem "dyskretyzacja". Najprostsza definicja mogłaby być taka, iż jest to konwersja medium analogowego na nośnik cyfrowy (stąd też w wielu opracowaniach "konwersja" i "dyskretyzacja" używane są zamiennie). Oryginalnym nośnikiem czy materiałem źródłowym może być drukowany tekst lub obraz, lecz nie powinniśmy zapominać, że mogą to być również materiały audiowizualne lub innego typu. Niemniej jednak rzut oka na projekty realizowane w bibliotekach ujawnia, iż dla większości ludzi dyskretyzacja równa się tworzeniu cyfrowych obrazów, czyli innymi słowy tworzeniu statycznego cyfrowego faksymile jedostki źródłowej, za którą można przyjąć rękopis, fotografię, slajd, czasopismo, obraz, monografię, materiały egzaminacyjne itd.

  No dobrze, teraz, kiedy już wiemy, co rozumiem pod pojęciem dyskretyzacji, należy zastanowić się, czy w ogóle warto to robić? Podejrzewam, że gdybyście zadali to pytanie komukolwiek, kto poświęcił takiemu projektowi dłuższy okres czasu, odpowiedź brzmiałaby kategrycznie "nie", biorąc pod uwagę wszystko, co poszło źle, wszystkie załamania systemów, wszystkie obrazy, które musiały być powtórnie przeskanowane, wszystkich dostawców, którzy zawiedli i tak dalej.

  Jednak taka subiektywna odpowiedź zupełnie nie jest dla nas przydatna. Aby w pełni odpowiedzieć na to pytanie musimy być tak obiektywni jak to tylko możliwe i przyjrzeć się również korzyściom, jakie te projekty przynoszą, a tu już zupełnie szybko zderzamy się z pojęciem "wartości pieniądza". To jednak według mnie nie jest takie proste, ponieważ najczęściej koszty i osiągane korzyści są trudne do oszacowania w kategoriach dolarów i centów, czy też funtów i pensów. Jednakże terminologia, której tutaj użyłem, jest stosowna. Innymi słowy powinniśmy przyjrzeć się kosztom dyskretyzacji, korzyściom, jakie ona przynosi, a wreszcie, co najważniejsze, porównać dyskretyzację i z innymi możliwościami, jakie wchodzą w grę.

  Tak więc, czy dyskretyzacja jest tego wszystkiego warta?

Przykładowe oszacowanie kosztów

  Wiele instytucji prowadzących własne projekty dyskretyzacyjne sporządziło kosztorysy poniesionych wydatków. Możecie również przyjrzeć się cennikom komercyjnych firm zajmujących się skanowaniem, aby zorientować się, z jakimi sumami mamy do czynienia. Kiedy zaczynam się im przyglądać, uświadamiam sobie dwa zasadnicze problemy: 1. Liczba możliwych trudności i wariantów, które muszą być brane pod uwagę (ponieważ to one określają ostatecznie poziom kosztów) jest oszałamiająca; 2. Istnieje uzasadnione podejrzenie, iż dane te nie przedstawiają faktycznych kosztów projektu. W mojej ostatniej książce poświęconej obrazom cyfrowym przyjąłem jednostkowe koszty dyskretyzacji pojedynczego dokumentu (tj. strony lub fotografii), zaczerpnięte z raportów różnych instytucji i zaprezentowałem ich wartość uśrednioną (zobacz tabelka "Przykładowe koszty dyskretyzacji").

  Możemy tu zobaczyć jednostkowe koszty dyskretyzacji dokumentu, lecz zmieniają się one (por. poszczególne kolumny) w zależności od formy dokumentu źródłowego i specyfikacji przyjętej podczas konwersji (na przykład wyższe dpi, czyli wyższa jakość). Jednakże to tylko część prawdy. Raporty i studia podsumowujące zakończone projekty dyskretyzacyjne konsekwentnie podkreślają fakt, iż koszty konwersji to tylko około 1/3 kosztów całego projektu [Puglia, Steven. "The Costs of Digital Imaging Projects." RLG DigiNews (http://www.rlg.org/preserv/diginews), vol. 3, no. 5, Oct. 15, 1999]. Kiedy policzymy wszystkie czynniki, takie jak zgromadzenie materiałów źródłowych, uregulowanie kwestii praw autorskich, przygotowanie urządzeń, sprawdzanie jakości wyników, ostateczną redakcję, katalogowanie, udostępnianie, magazynowanie i tak dalej, prawdziwe koszty dyskretyzacji mogą wzrosnąć trzy- lub czterokrotnie. Innymi słowy, rzeczywiste koszty zeskanowania i udostępnienia jednej strony A4 czarno-białego druku jakości 300 dpi mogą sięgnąć 54 centów.

Jakie są korzyści?

  Jakie są więc korzyści z dyskretyzacji? Zagadnienie to zostało zbadane dogłębnie w innym miejscu, lecz w skrócie można wymienić: dążenie do poszerzania dostępności, konserwację oraz realizowanie strategicznych celów (tj. podnoszenia rangi instytucji realizującej projekt) itd. Wspomniane jako pierwsze polepszanie dostępności dokumentu, jest najczęściej cytowaną korzyścią z dyskretyzacji. Elektroniczne faksymile dokumentu, dla przykładu, może być teoretycznie kopiowane i dystrbuowane w nieskończoność bez utraty jakości (jeśli zachowane są odpowiednie standardy). Co ważniejsze, pojedyncza kopia może zostać umieszczona na serwerze (najczęściej internetowym) i może być oglądana i kopiowana przez ogromną liczbę użytkowników (liczba ta może osiągnąć setki tysięcy) równocześnie z całego świata (w zależności od ograniczeń dostępu i technologii serwera).

  Czystą korzyścią takiego systemu jest uwolnienie dokumentu (choć to tylko faksymile) od ograniczeń tradycyjnego systemu udostępniania. Weźmy dla przykładu cyfrowy obraz karty cennego rękopisu. Tradycyjnie użytkownik może uzyskać dostęp do oryginalnego dokumentu jedynie wtedy, kiedy ma odpowiednie uprawnienia oraz zachodzi tego uzasadniona potrzeba. Co bardzo istotne - czytelnik musi udać się do miejsca fizycznego przechowywania dokumentu, co wymaga podróżowania, czasu i/lub pieniędzy. Jednakże w momencie, kiedy elektroniczne faksymile dokumentu zostaje umieszczone na serwerze i nie ogranicza się dostępu do niego, każdy może obejrzeć obrazek w komfortowych warunkach swojego biura, domu czy szkoły. Ten przykład prowadzi nas do cytowanej jako druga korzyści z dyskretyzacji, czyli konserwacji. Choć konserwacja obiektów cyfrowych jest dyskusyjna sama w sobie, powyższy scenariusz zakłada, iż oryginał może być rzadziej dotykany, lub przynajmniej kuratorzy dostają kolejny powód, aby ograniczyć do niego dostęp.

Próba porównania

  Przeanalizujmy dyskretyzację jako metodę alternatywną dla innych możliwości. Najprościej byłoby przeanalizować koszty i korzyści wynikające z utworzenia cyfrowej kopii dokumentu oraz zestawienie wyniku tej analizy z nakładami, jakich wymaga dokument oryginalny. Najłatwiej byłoby to obliczyć w stosunku do udostępniania. (Mógłbym na przykład udowodnić, iż bardzo trudno jest zmierzyć realizację zamierzonych celów lub policzyć szkody wynikłe z zaniechania konserwacji.) Biorąc pod uwagę udostępnianie możemy zbudować prosty przykład oparty na statystykach czytelniczych.

  Weźmy dziesięciostronicowy artykuł (w stosunku do którego kwestia praw autorskich została uregulowana), w którym nie zastosowano grafiki i kolorowego druku. Według naszej tabeli koszty dyskretyzacji wyniosą 1,80 dolara (10 stron po 18 centów), jednak nasze faktyczne koszty wyniosą około 3 razy tyle, w granicach 5,40 dolara. Za tę cenę jednakże otrzymujemy cyfrowe faksymile artykyłu, które możemy umieścić w sieci i udostępniać czytelnikom. A teraz zastanówmy się, co będzie się działo, jeśli nie zeskanujemy tego artykułu i będziemy chcieli udostępniać go w tradycyjny sposób więcej niż jednemu czytelnikowi w tym samym czasie. Jedynym oczywistym wyjściem będzie tu (opócz wykupienia drugiej prenumeraty) wykonanie jego fotokopii. Nawet nie biorąc pod uwagę czasu, jaki będzie potrzebny pracownikom do wykonania niezbędnych czynności, można powiedzieć, iż pełna kopia artykułu kosztować będzie w granicach 30 centów. A teraz zestawmy te dwa scenariusze. Krótko mówiąc jasnym jest, iż jeśli dokument w sieci przeczyta 19 użytkowników, już jest to dla nas oszczędność (19 fotokopii kosztowałoby 5,70 dol.). Innymi słowy jeśli technologia pozwala zeskanować dokument i dystrybuować go w sieci komputerowej oraz jeśli na dokument ten istnieje sensowne zapotrzebowanie, udostępnianie go w postaci cyfrowej szybko zaczyna przynosić oszczędności.

  Sprawa zacznie się komplikować, kiedy będziemy chcieli porównać dyskretyzację (tworzenie dokumentu) z gromadzeniem (nabycie dokumentu). Inaczej mówiąc, wiele bibliotek czy innych instytucji staje przed wyborem: zaangażować się w projekt dyskretyzacji czy też przeznaczyc pieniądze na inną działalność, jak choćby tradycyjne gromadzenie. Wiadomo, iż jedynie dla "prestiżu" prowadzenia własnego projektu "digitalizacji" biblioteki zbyt często wybierają wplątywanie się w takie ryzykowne imprezy nie zadając sobie nawet pytania, czy przyniesie to im (a co ważniejsze - ich czytelnikom) nową jakość, lepszą niż tradycyjne metody gromadzenia. Innymi słowy "digitalizacja" zajmuje często uprzywilejowaną pozycję w planach rozwoju, co z pewnością nie miałoby miejsca, gdyby wyobrażenia o niej były bliższe prawdy.

  I znów musimy zaprezentować alternatywne scenariusze do porównania, przy czym będę musiał tu odwołać się do mojej znajomości rynku w Wielkiej Brytanii, w szczególności w odniesieniu do wyższej edukacji. Jednym z najważniejszych zasobów dla wyższych uczelni jest tu Web of Science, która zawiera różnorodne indeksy cytowań ISI. Każdego dnia realizowane są tu zapytania niemal ze wszystkich dziedzin wiedzy. Dzięki budżetowemu finansowaniu uniwersytetów, instytucja może wykupić roczną subskrypcję Web of Science za około 14500 dolarów. Oczywiście jest to koszt powtarzający się, ale z drugiej strony średnie statystyki wskazują, iż uniwersytety notują rocznie około 21 tysięcy połączeń użytkowników z tą bazą (a pod każdą sesją oczywiście może się ukrywać po kilka pozytywnych rezultatów wyszukiwań).

  Kiedy jednakże weźmiemy pod rozwagę zainwestowanie pewnej sumy pieniędzy w dyskretyzację, zaczniemy widzieć, dokąd prowadzi nas ten przykład. Dla wyrazistości zajmijmy się skrajnym przypadkiem - rzadki, bezcenny rękopis, który musi zostać zeskanowany w tak wysokiej jakości, jak to jest tylko możliwe. Patrząc na naszą tabelę kosztów widzimy, iż dyskretyzacja pojedynczej strony kosztować będzie w granicach 4,82 dol. Tak więc dyskretyzacja nawet niewielkiego rękopisu, liczącego około 200 stron, kosztować będzie około 964 dolarów, a wliczając wszystkie dodatkowe koszty generowane podczas dostarczania tak przygotowanego obiektu do użytkownika, cena ta może osiągnąć 3000 dolarów za wolumin. Porównajmy teraz oba scenariusze. Jeśli mamy do wydania 14500 dolarów, możemy za te pieniądze zeskanować w najlepszej jakości i udostępnić pięć rzadkich rękopisów lub też wykupić roczną subskrypcję Web of Science. Zatem pytanie, które powinniśmy sobie zadać, brzmi: co będzie bardziej korzystne dla czytelników? Z jednej strony mamy możliwość zaprezentowania pięknej, kunsztownej strony internetowej, pełnej zachwycających obrazków, która jednak w rzeczywistości zainteresuje jedynie małą grupę studentów. Z drugiej zaś możemy uzyskać dostęp do potężnego narzędzia wyszukiwawczego kryjącego wszelkie obszary tematyczne. Jest to skrajny przykład, jednakże "wartość" dyskretyzacji poddana musi zostać w wątpliwość.

  Przykład ten jest oczywiście wyolbrzymiony. Jeśli wybierzemy dokument, którego zeskanowanie będzie tańsze, a zapotrzebowanie nań większe (np. materiały egzaminacyjne), równowaga zostanie szybko przywrócona. Co więcej nie powiniśmy zapominać, iż dyskretyzacja przynosi pewne dodatkowe korzyści w postaci zastrzyku nowego sprzętu czy podnoszenia kwalifikacji personelu. Z drugiej jednakże strony nie ulega wątpliwości, iż wiele już rozpoczętych projektów "digitalizacji" koncentruje się na rzadkich, unikalnych jednostkach, o niezaprzeczalnej wartości estetycznej, jednakże z nielicznymi wyjątkami mają one niewielkie znaczenie dla większości czytelników. Pytanie brzmi: Czy te pieniądze mogłyby zostać wydane korzystniej?

Jak brzmi ostateczna odpowiedź?

  Szczerze mówiąc nie znam odpowiedzi ponadto, iż każdy przypadek powinien być rozpatrywany oddzielnie. Chciałbym tylko na zakończenie zwrócić uwagę na koniecznść rozpoczęcia dyskusji na ten temat. Kiedy patrzymy na koszty dyskretyzacji musimy nie tylko po prostu porównywać je z alternatywną możliwością jej zaniechania. Musimy również brać pod uwagę inne obszary rozwoju zbiorów, które mogą dać lepsze rezultaty dla naszych czytelników. We wstępie do mojej książki nazwałem lata 90. XX wieku "dekadą dyskretyzacji" i w samej rzeczy jest to prawda i w wielu wypadkach powód do radości. Teraz jesteśmy starsi, mądrzejsi i mamy więcej doświadczeń w zakresie dyskretyzacji. Mamy więc możliwość ocenić korzyści, jakie przynosi ona w rzeczywistości. Przede wszystkim jednak nie powinniśmy zapominać, że naszym głównym celem jest wychodzić naprzeciw oczekiwaniom czytelników i zapewniać im dostęp do tych zasobów, które są im naprawdę potrzebne.

Prztykładowe koszty dyskretyzacji

A = sugerowana specyfikacja
B = średni koszt jednostkowy
C = pojedyncza strona (czarno-biała)
D = podwójna strona-wolumin (czarno-biała)
E = pojedyncza strona (kolor)
F = mikrofilm 35mm (czarno-biały)
G = fotografia 5x4 cala lub rękopis mniejszy niż A3
H = slajd 35mm (kolorowy)
I = negatyw




  C D E F G H I
A= 300 dpi
1-bit
B&W
400 dpi
1-bit
B&W
300 dpi
8-bit
Color
400 dpi
8-bit
Grayscale
600 dpi
24-bit
Color
2700 dpi
24-bit
Color
2700 dpi
8-bit
Grayscale
B= $0.18 $0.88 $1.31 $0.73 $4.82 $3.21 $2.34


Tłumaczenie: Piotr Tafiłowski

Plan pracy Pracowni Naukowej AGAD w 2010 r.
Czas zwykły
od poniedziałku do piątku od 9.00 do 19.00
Wietrzenie Pracowni Naukowej
odbywa się w godzinach:
12.15 – 12.30
17.00 – 17.15
Czas skrócony
2 kwietnia, piątek (Wielki Piątek) od 9.00 do 12.00
31 grudnia, piątek 9.00 do 12.00
Zamknięta
5 kwietnia, poniedziałek
3 maja, poniedziałek
3 czerwca, czwartek (Boże Ciało)
4 czerwca, piątek
1 listopada, poniedziałek (Wszystkich Swiętych)
11-12 listopada, czwartek-piątek
24 grudnia, piątek (Wigilia)
Kontakt telefoniczny
(+ 48)(22) 831-54-91 w. 429 (Pracownia Naukowa)
(+ 48)(22) 831-54-91 w. 427
(+ 48)(22) 831-54-91 w. 446
W sierpniu Pracownia Naukowa jest zamknięta.