Dla opracowania materiałów w niniejszej edycji istotne były następujące przesłanki:
- zadeklarowany w projekcie Archiwum Filomatów – edycja cyfrowa sposób przygotowania dokumentów (nasz projekt był w całości i w niemałej kwocie sfinansowany przez Narodowy Program Rozwoju Humanistyki), a więc udostępnienie fotografii i metryk wszystkich dokumentów z czterech archiwów, krytyczne opracowanie utworów literackich oraz wykonanie transliteracji i transkrypcji materiałów tekstowych wyłącznie ze zbioru lubelskiego.
- normy tradycyjnie przyjmowane w tego typu edycjach w polskiej tradycji wydawniczej,
- zasady uzgodnione przez zespół edytorski projektu Archiwum Filomatów, sformułowane na podstawie naszych doświadczeń oraz przekonań co do powinności wydawniczych obowiązujących w tego typu przedsięwzięciach.
Na podstawie tych założeń określiliśmy prezentowane poniżej reguły przygotowania niniejszej publikacji cyfrowej.
I. Model edycji
Wybierając sposób opracowania edytorskiego, skłoniliśmy się ku modelowi edycji dokumentacyjnej jako najlepiej odpowiadającemu naszemu przedsięwzięciu.
Pierwotnie Archiwum Filomatów stanowiło jeden prywatny zbiór dokumentów. Obecnie materiały te są rozproszone w czterech archiwach znajdujących się w Polsce i na Litwie. Każda z placówek uporządkowała dokumenty filomackie w sposób sobie właściwy. Uznaliśmy za niemożliwe zrekonstruowanie całego zbioru w jego najstarszym kształcie. Uważamy, że ani nie jest to dziś możliwe, ani też potrzebne. Stąd decyzja, że będziemy iść zgodnie z porządkiem, który zastaliśmy w każdym z tych archiwów. Szliśmy więc sygnatura za sygnaturą, karta po karcie, tak jak udostępniano nam potrzebne dokumenty.
Wybór tego modelu w równie znacznym stopniu wziął się z zaplanowanego przez nas i zatwierdzonego przez grantodawcę planu pracy. Fakt ten miał również niemały wpływ na zasady przygotowania edycji. Zobowiązaliśmy się do umieszczenia zdjęć wszystkich stron dokumentów z historycznego Archiwum Filomatów oraz do opracowania metryk dla każdego z nich. Zakres transliteracji i transkrypcji jest mniejszy, nie dotyczy wszystkich dokumentów (o czym mowa przy przedstawieniu zasad transliteracji i transkrypcji). Także w związku z tym uznaliśmy model edycji dokumentacyjnej za najodpowiedniejszy dla naszych zamierzeń.
Wreszcie, ważną przesłanką przy doborze koncepcji edycji były dotychczasowe doświadczenia cyfrowego edytorstwa. Trudno nie zauważyć, że najwięcej energii badawczej włożono właśnie w cyfrowe edycje dokumentacyjne. Nie oznacza to, że uważamy cyfrowe edycje o charakterze idealizującym (np. tradycyjne edycje krytyczne zrealizowane w sieci) za niemożliwe, niepotrzebne czy nieinteresujące. Uważamy, że cyfrowa edycja dokumentacyjna daje jednak badaczom najwięcej możliwości. Tak naprawdę jest to świetne narzędzie badawcze. Stąd nasz wybór tego modelu wydania.
W niektórych miejscach, o czym dalej, zaproponowaliśmy niemniej uzupełnienie perspektywy dokumentacyjnej o perspektywę dziełową. Rzecz tę rozwiniemy nieco niżej.
II. Wybór środowiska kodowania oraz narzędzi do publikacji
Nasza edycja została przygotowana przy użyciu kilku języków programowania (głównie Java Angular, w którym wprowadzaliśmy modyfikacje do narzędzia wizualizacyjnego) i formatów wymiany danych komputerowych (json), ale kluczowy dla opracowania dokumentów jest dla nas język znaczników XML. Przygotowując naszą pracę, nie tworzyliśmy jednak biblioteki niezbędnych tagów XML od podstaw, ale wykorzystaliśmy standard edytorski rozwijany dla tego typu projektów od lat osiemdziesiątych – Text Encoding Initiative. Wybór ten podyktowany był następującymi przesłankami:
- TEI XML to system dość rozbudowany, pozwalający ogarnąć wielość problemów edytorskich,
- jest to standard ogólnie dostępny,
- TEI XML stanowi podstawę dla wielu narzędzi potrzebnych (a niekiedy wręcz niezbędnych) przy przygotowaniu czy wizualizacji edycji cyfrowych, przy czym wiele tych rozwiązań to narzędzia open source i dostępne bezpłatnie,
- powszechność stosowania standardu TEI do kodowania edycji cyfrowych sprawia, że wyniki naszych prac mogą być (i faktycznie były) prezentowane i dyskutowane na licznych forach akademickich i programistycznych,
- używanie jednego, powszechnie akceptowanego standardu w różnych projektach umożliwia ich późniejsze łączenie oraz ułatwia przeprowadzanie badań.
Spośród udostępnionych narzędzi do prezentacji edycji cyfrowych wahaliśmy się między wyborem rozwiązania TEI Publisher oraz Edition Visualization Technology (EVT). Oba narzędzia mają charakter open source i są dostępne bezpłatnie. Ostatecznie po licznych testach zdecydowaliśmy się na wykorzystanie EVT. Jest to narzędzie lepiej prezentujące opracowane przez nas materiały.
Ostatecznie, można powiedzieć, że nasza edycja została zakodowana w TEI XML, ale w takiej wersji tego standardu, która była wymagana przez EVT.
Narzędzie EVT zostało przez nas poddane pewnym modyfikacjom, aby lepiej odpowiadało potrzebom przewidzianego odbiorcy. Z tego powodu m.in. spolszczyliśmy konieczne elementy EVT.
III. Sposób przygotowania fotografii
Wszystkie fotografie zostały wykonane przez wyspecjalizowane pracownie działające na terenie przebadanych przez nas archiwów, a jeżeli takiej jednostki organizacyjnej w jakimś archiwum nie było, zostało to przez kierownictwo konkretnej placówki zlecone firmie oferującej takie usługi. Żadne ze zdjęć prezentowanych w naszej edycji nie zostało wykonane przez nas. Przygotowanie tych fotografii sfinansowano ze środków grantowych. Jedynym ośrodkiem, który nie pobrał opłaty za fotografie, była nasza rodzima placówka – Biblioteka Uniwersytecka KUL. W tym przypadku pokryliśmy jednak koszty konserwacji papieru oraz zakupu bezpiecznych dla papieru materiałów, w które cały lubelski zbiór został na nowo przepakowany.
Gdy sporządzaliśmy listę stron do digitalizacji, ze względu na wysokie koszty usług fotograficznych w placówkach archiwalnych pominęliśmy w archiwach poza Lublinem strony wakatowe. Było ich w niektórych miejscach bardzo wiele, niekiedy więcej niż stron zapisanych.
IV. Metryki
Wszystkie strony dokumentów zostały przejrzane i opisane przez nasz zespół. Sporządzono dokładne metryki, w których opisano właściwości fizyczne wszystkich interesujących nas materiałów: liczbę kart w danej sygnaturze, rodzaj i format papieru, znaki wodne na papierze oraz inne znaki szczególne kart, jak uszkodzenia czy ślady po złożeniu. Informacje te stanowiły następnie podstawę opracowania (stanowiących część naszej edycji) informacji o dokumentach, zawartych w kodzie w elemencie <msDesc>.
Oprócz informacji o sygnaturze i tytule danej części zbioru czytelnik znajdzie w metrykach informacje o autorach i tytułach (lub incipitach) poszczególnych dokumentów w sygnaturze, numerach kart, informacje o języku zapisów i dane o ewentualnym druku danego dokumentu czy dzieła. Pisownia tytułów dzieł i incipitów została w metrykach zmodernizowana.
W numeracji kolejnych kart i stron szliśmy za oznaczeniami archiwistów. Numeracja ta ma charakter ciągły dla każdej sygnatury, bez względu na to, czy w danej sygnaturze znajduje się jeden dokument, czy kilka dokumentów; karta 1 występuje więc w każdej sygnaturze tylko raz, choćby w danej teczce było wiele różnych materiałów mających swoje pierwsze strony. Nie nadawaliśmy tym materiałom swoich numerów. Jeśli więc na przykład między kartą 11 a 12 znajdowała się dodatkowa karta, którą zapomniano ponumerować, opatrzono ją numerem 11a – utrzymywaliśmy tę numerację.
W niektórych sytuacjach (tak jest m.in. w zbiorze lubelskim) na zdjęciach znajdują się karty nienumerowane, obwoluty dokumentów czy przekładki. Tym elementom nadawaliśmy odmienną numerację, również stosując numerację ciągłą dla całej sygnatury. Było to potrzebne, aby ułatwić nawigację w dokumencie.
Oznacza to, że w EVT numeracja:
k. 1 r.
k. 1 v.
k. 2 r.
...
dotyczy oryginalnych dokumentów z danej sygnatury, a współwystępująca w tym samym okienku nawigacyjnym numeracja:
01
02
03
...
odnosi się do kart (lub stron) wprowadzonych do zbioru przez archiwistów (okładki, obwoluty itp.).
V. Zasady transliteracji
Zgodnie z założeniami projektu zbiory warszawskie i wileńskie na tym etapie realizacji projektu są dostępne wyłącznie jako fotografie i metryki. Przetransliterowaliśmy zapisy z dokumentów ze zbioru lubelskiego.
Transliterując, szliśmy najwierniej, jak można, za zapisem z dokumentu. Nie transliterowaliśmy żadnych zapisów pochodzących od archiwistów, w tym zapisów na okładkach i obwolutach. Są one bardzo czytelne i odbiorcy naszej edycji na pewno nie potrzebują w tym zakresie żadnej pomocy. Z tego samego powodu nie transliterowaliśmy maszynowych kopii dokumentów z Archiwum Filomatów.
W transliteracji zachowaliśmy podział na rządki pisma (element <l>) zgodny z tym, co w oryginalnym dokumencie. Dla dopisków w świetle między wersami nie używaliśmy nowego <l>, ale oznaczaliśmy to jako dopisek w wersie, do którego taki fragment został dodany.
Wszystkie dopiski zakodowaliśmy w transliteracji jako elementy <add>. Ze względu na obszerność naszego projektu na tym etapie jego realizacji zrezygnowaliśmy z definiowania w tym tagu miejsca, w którym znajdował się dopisek. Tylko w nielicznych przypadkach doprecyzowaliśmy tę cechę, dodając atrybut @place i przypisując mu odpowiednią wartość. Wszystkie dopiski zostały w narzędziu EVT zaznaczone na zielono, aby ułatwić ich identyfikację.
Wszystkie usunięcia tekstu zakodowaliśmy w transliteracji jako element <del>. Również ze względu na obszerność naszego projektu na tym etapie jego realizacji zrezygnowaliśmy z definiowania w tym tagu sposobu, w jaki dokonało się to usunięcie. Tylko w nielicznych przypadkach doprecyzowaliśmy tę cechę, dopisując atrybut @rend i przypisując mu odpowiednią wartość. Wszystkie skreślenia zostały w narzędziu EVT oznaczone za pomocą przekreślenia, aby ułatwić ich identyfikację.
W sytuacjach, gdy bezpośrednio na danym fragmencie został napisany później inny tekst (mogła to być korekta jednej litery, ale mogła to być też dłuższa poprawka), w kodzie edycji nie wstawialiśmy spacji pomiędzy </del> a następującym po nim elemencie <add>. Na przykład w miejscu:
t<del>y</del><add>e</add>m
zapis oznacza, że litera y została poprawiona na e, a w ten sposób tym zmieniono na tem.
Jeżeli dany fragment został dodany, a następnie przekreślony, oznaczyliśmy go jednocześnie za pomocą dwóch powyższych elementów. W wizualizacji taki zapis widoczny jest jako przekreślenie na zielonym tle.
<add><del>tam</del></add>
W miejscach trudnych do szybkiego zlokalizowania posłużyliśmy się dostępną w EVT funkcją powiązania tekstu z konkretną strefą na obrazie. Staraliśmy się uporządkować graficznie transliterację tak, aby jak najwierniej odpowiadała temu, co widać na zdjęciu. Nie zawsze było to możliwe i wtedy właśnie bardzo przydatne okazywało się kodowanie stref pisma, dających się podświetlić na obrazach i powiązanych z konkretnymi fragmentami transliteracji.
W miejscach nieczytelnych użyliśmy znaku [—], zawsze z taką sama liczbą kresek w nawiasie, bez względu na to, ile znaków znajduje się w nieczytelnym fragmencie.
W transliteracji staraliśmy się być jak najbliżej form, które widzieliśmy w oryginalnym dokumencie. Z tego powodu używaliśmy znaków jak najbardziej zbliżonych do znaków rękopiśmiennych. I tak:
w miejscu długiego małego s stosowaliśmy ſ (U+017F),
w miejscu ligatury długiego małego s oraz z stosowaliśmy ß (U+00DF),
w miejscu długiego małego s z ogonkiem stosowaliśmy ʃ (U+0283).
Zachowaliśmy pisownię łączną i rozłączną oraz pisownię wielkich i małych liter zgodną z tym, co widzieliśmy w oryginalnym zapisie. Niekiedy mieliśmy duże wątpliwości co do konkretnych znaków (np. czy jest to wielkie P, czy małe p, czy jest to rzymskie I, czy arabskie 1) i ich połączeń. Zawsze jednak proponowaliśmy w transliteracji konkretną lekcję, a czytelnik ma możliwość sprawdzenia naszych decyzji na towarzyszącym transliteracji zdjęciu.
Tekst transliteracji znajduje się w kodzie w elemencie <orig>.
VI. Zasady transkrypcji
Na tym etapie prac nad edycją przetranskrybowaliśmy wyłącznie teksty ze zbioru lubelskiego. Jest to zgodne z założeniami projektu. Nie transkrybowaliśmy późniejszych odpisów dzieł, przygotowanych na potrzeby poprzednich edycji Archiwum (maszynopisy i kopie z okresu prac nad tymi wydaniami). W sytuacjach, gdy dane dzieło znajdowało się w danej teczce w różnych odpisach, transkrypcja towarzyszy tylko jednej z tych wersji. Nie transkrybowaliśmy też tekstów obcojęzycznych, np. rosyjskich lub białoruskich, zapisanych cyrylicą.
W transkrypcji staraliśmy się wprowadzić jak najmniej ingerencji. Za nieprzekraczalną granicę naszych modernizacji uznaliśmy fonetykę. Staraliśmy się zakonserwować lub odtworzyć to, co uznaliśmy za oryginalną, właściwą danemu dziełu warstwę brzmieniową utworu, choćby nawet dzisiaj jakiś dźwięk nie był już do zrealizowania przez odbiorcę. Uznaliśmy, że ma to swój walor, choćby badawczy.
I tak na przykład w lubelskiej sygnaturze Rkp1034, w Pieśni o Lechu znajduje się rym wrozy (czyli wróży) / założy. Nie można więc zmieniać o na ó, bo rym zniknie. Podobnie w tej samej sygnaturze w wierszu [Pod rozłożystym bukiem siedział Włodek] jest rym bodła / źrodła, ale i źródła / wiodła, a w sygnaturze Rkp1035: zorze / roże, góry / spory. Regulowanie takiej pisowni do form, z którymi osłuchany jest współczesny czytelnik (a nawet więcej: do form, które taki czytelnik jest w stanie zrealizować brzmieniowo), uznaliśmy za naruszenie oryginalnej brzmieniowej warstwy tekstów przygotowywanych przez nas do publikacji.
Przy czym dopuszczaliśmy, że w miejscu rymowym mogło wystąpić wyraźne współbrzmienie, niekoniecznie rym dokładny. Konserwowaliśmy więc w rymach dzisiaj niewystępujące litery, nawet jeśli nie tworzyły one dokładnego rymu, choćby w takich miejscach: wzgorze / zórze, fletni / zetni (czyli zetnij), roże / może, Balbiani / najranij, ni mam / trzymam, biskupóm / słupóm, mowi / rozumowi, kopytem / grzbitem. W utworach filomackich są rymy: która / figura, gorą / pióro, struktury / gory.
Takie podejście do warstwy brzmieniowej utworu stoi w wyraźnej opozycji do dotychczasowej tradycji wydawniczej. Jan Czubek zmieniał np. poliwkę na polewkę, a we fragmencie Rzucay lutnią a drzym woli, / Nic tu gdy się człek mozoli poprawiał na: wolej.
Nasza decyzja zaowocowała niekiedy oczywistymi niekonsekwencjami. Na przykład w sygnaturze Rkp1035 zachowaliśmy oboczności w jednym wersie: Oń jest, uń się schował.
Dodawaliśmy znaki diakrytyczne w zmiękczonych głoskach, np. swiat zmienialiśmy na świat. Jednak z sz nigdy nie robiliśmy ś, dlatego zostawiliśmy np. czesznik.
Transkrypcja została przez nas otagowana jako <reg>.
VII. Tekst ustalony
Oprócz transliteracji i transkrypcji zaproponowaliśmy w kilku miejscach widok Tekst ustalony. Transliterując i transkrybując, szliśmy za porządkiem kart w danej sygnaturze. Niekiedy jednak te karty zostały umieszczone w teczce w złej kolejności i były źle ponumerowane przez archiwistów. Niepoprawna kolejność była najprawdopodobniej zawiniona już przez samego autora lub kopistę. W sytuacjach, gdy mieliśmy do czynienia właśnie z kopiami dzieł literackich, struktura kodu w EVT (kolejne rządki pisma, którym odpowiadał element <l>, w którym znajdowały się z elementy <orig> i <reg>) nie pozwalała zapoznać się z właściwie uporządkowanym tekstem. W takich miejscach pojawia się w odpowiednim okienku opcja Tekst ustalony, w którym kolejne części utworu zostały wstawione w odpowiednie miejsce.
VIII. Komentarze
Komentarze zostały przez nas ograniczone do najniezbędniejszych. W przeważającej mierze mają one charakter językowy. Niektóre pomagają zlokalizować utwór czy dokument, o którym mowa w danym miejscu. Funkcję komentarzy o charakterze osobowym przejął towarzyszący każdej sygnaturze indeks osobowy, w którym oprócz lokalizacji miejsca w dokumencie, w którym mowa o danej postaci, znajduje się krótka informacja biograficzna o niej.
Komentarze zlokalizowane są wyłącznie w transliteracjach, gdyż ten sposób opracowania zapisu przewidziany został dla wszystkich części Archiwum Filomatów.
Komentarze zostały przez nas otagowane jako <note>.
IX. Kod źródłowy
Wszystkie pliki związane z niniejszą edycją zostały udostępnione w serwisie github. Wśród opublikowanych tam materiałów znajdują się m.in. pliki XML oraz JSON, zmodyfikowana wersja narzędzia EVT2, a także powstałe w trakcie realizacji projektu narzędzia wspomagające i usprawniające przygotowanie edycji cyfrowej.
