Jan Szczepanski skrev:
> Alltsedan 1826 ger sällskapet Gesellschaft für ältere deutsche > Geschichskunde ut källmaterial till tysk, schweizisk och > österrikisk historia i serien Monumenta Germaniae Historica. Till > dags dato har över 350 volymer publicerats.
För digitaliseringen står Bayerische Staatsbibliothek (BSB) i München, som är det ena av två nationella digitaliseringscentra finansierade av DFG, Deutsche Forschungsgemeinschaft. (Det andra ligger i Göttingen.) BSB har tidigare gjort sig berömda genom digitaliseringen av Allgemeine Deutsche Biographie (55 band, 1875-1910), den tyska motsvarigheten till SBL.
Spridningen på två nationella centra, och 1990-talets ännu mer spridda DFG-satsning på tiotals regionala digitaliseringsprojekt, är kanske naturliga i den tyska förbundsfederalismen, en markering gentemot den centralistiska traditionen från Preussen, "tyska riket" och DDR. Fransmännen har koncentrerat sina satsningar till nationalbiblioteket i Paris och digitaliseringsprojektet Gallica. Bortsett från skillnaden mellan länderna, blir intrycket från Europa som helhet en splittring på många små projekt, något som ifrågasätts i franske riksbibliotekarien Jean-Noël Jeanneneys debattinlägg i Le Monde av 22 januari, där tanken på en samlad europeisk satsning förs fram som ett sätt att balansera den amerikanska dominansen (den här gången representerad av Google). Men ingen tror väl att Gallica vill flytta till München, så en viss splittring och "intern" konkurrens (inom EU) får vi nog leva med. Må bästa bibliotek vinna! Vad nu tävlingen går ut på. Enbart ära? Eller en reserverad stol i framtidens förgyllda himmel?
Som förkämpe för Internet (gentemot alternativen) är jag stormförtjust över att BSB lägger ut MGH på Internet och inte säljer CDROM eller investerar miljoner i en ny tryckt utgåva som ingen har råd med. (Tänk om SBL kunde göra likadant! Tack för Libris webbsök och SAOB på nätet!) Och jag noterar att digitaliseringen av ADB och MGH varken kräver abonnemang eller särskilda plugins, utan det är bara att surfa [a5] på. Det har andra digitaliseringsprojekt (inte minst i det här landet) att lära av.
Men med detta sagt, finns också mycket kritiskt att framföra, eller ska vi säga: Det är gott om utrymme för förbättringar. Och riktigt tydligt blir det i fortsättningen av Jans inlägg, där han vant navigerar nätet och väver samman hänvisningar med sin berättelse:
> reaktion på franska revolutionen och Napoleons europeiska projekt. > http://sv.wikipedia.org/wiki/Heinrich_Friedrich_Karl_vom_und_zum_Stein > > MGH har varit mönsterbildande för andra länders utgivning av källmaterial. > http://runeberg.org/nfbr/0547.html
Både Wikipedia och Projekt Runeberg har en URL-struktur som gör att man kan maila en länk direkt till rätt sida. Försök leta på något intressant i ADB eller MGH och maila länken till en kollega. Det låter sig inte göras! BSB har byggt två webbplatser utan möjlighet för publiken att göra länkar till enskilda delar av innehållet. Det kunde vara ett ursäktligt misstag 1994, men inte 2004. Speciellt inte efter att jag varit på besök hos BSB i München sommaren 2003 och påtalat problemet. Hallå? Vakna!
Min andra anmärkning är frånvaron av sökbar OCR-text. Att digitalisera med faksimilbilder är en nödvändighet ur textkritisk synvinkel. Men sedan kan man välja att ta med en sökbart text eller inte. Och både i ADB och MGH saknas sökbar text. Åter igen ett dubbelfel från BSB. För ADB skyller man på att frakturtexten är svår att OCR-tolka, men för MGH håller inte denna ursäkt. För den forskare som vet att det efterforskade materialet finns i MGH, i en viss volym och på en viss sida, räcker det givetvis att gå till rätt webbplats, klicka rätt antal gånger, och komma fram till den läsbara texten. Men om hon vill citera ett stycke i sin avhandling? Då blir det till att skriva av för hand. Och för oss andra, som undrar om Civitas Lincopensis in Ostro Gothia omnämns någonstans i de tyska urkunderna, så blir det till att bläddra från sidan 1. Det är lika jobbigt som på biblioteket, enda skillnaden är att biblioteket har kommit närmare tack vare Internet.
Projekt Runebergs OCR-text till Nordisk familjebok är inte perfekt, men vem som helst har möjligheten att korrekturläsa den, och alla sökmotorer har en god chans att indexera texten. En Google-sökning på "monumenta germaniæ" i svenska texter ger 39 träffar, varav 10 inom Projekt Runeberg och Nordisk familjebok.
Nu är det ju tack och lov så att Internet är fullt av frivilliga, som inte vill något hellre än att förbättra världen. Om bara BSB digitaliserar sidorna ur ADB och MGH, så kan ju någon annan ladda ner bilderna och OCR-tolka dem och hjälpa till att göra texten sökbar. Sådana frivilliga har visserligen redan betalat skatt för att BSB ska utföra detta, men vem orkar i längden vara långsint? Låt oss alla hjälpas åt för att förbättra tillgången till det digitaliserade kulturarvet! Men här stångar entusiasten sin panna blodig. De inscannade faksimilbilderna av ADB visas inte i full upplösning, som duger för OCR, utan i en avsiktligt förminskad version som nätt och jämnt är läsbar på skärmen. Den som på ort och ställe erbjuder sig att hjälpa till, blir nekad tillgång till de högupplösta digitala bilderna. Kanske har detta ändå ändrat sig vad gäller MGH. Här går det att zooma in "150 %" i bilderna och det borde vara möjligt att OCR-tolka dessa. Men då klickar man på länken "Copyright" på MGH-sajten och läser:
Alle Urheber- und Verwertungsrechte am hier veröffentlichten Material liegen bei den Eigentümern. Die Verwertung der Inhalte und Abbildungen und deren Vervielfältigung oder Verbreitung ist nur mit vorheriger schriftlicher Zustimmung der Rechteinhaber erlaubt, soweit sich aus dem Urheberrechtsgesetz nichts anderes ergibt. Insbesondere ist eine Einspeicherung oder Verarbeitung in Datensystemen ohne Zustimmung der Bayerischen Staatsbibliothek und Monumenta Germaniae Historiae unzulässig und strafbar.
De avslutande orden betyder "otillåtlig och straffbar", och detta gäller all vidare databearbetning av det digitala materialet utan uttryckligt samtycke från BSB -- utöver vad som stadgas upphovsrättslagen. Det är tveksamt om detta har stöd i lagen, men det är en viljeförklaring från institutionens ledning. Alltså: Om jag laddar ner sidorna för att på ideell basis OCR-tolka dem och göra den gamla och **upphovsrättsfria** texten sökbar, så kommer BSB ändå att använda Förbundsrepublikens skattemedel till att jaga mig till domstol. Tack så mycket för hjälpen!
Så länge digitaliseringsprojekt kan bedrivas på det här viset, är jag övertygad om att vi behöver konkurrens och pluralism. Att satsa på storskaliga, centralistiska digitaliseringsprojekt -- som riskerar att skötas på det här sättet -- vore *renodlad* galenskap. Hellre ser vi lite dubbelarbete, där olika projekt digitaliserar samma text på nytt. Någon som har ett exemplar av ADB över?
Sammanfattning: Digitaliseringsprojekt bör, utöver vad BSB gör, tillämpa följande tre riktlinjer:
1. Skapa en URL-struktur som underlättar "djup" länkning.
2. Skapa en sökbar och öppet tillgänglig OCR-text.
3. Gör det digitala materialet öppet tillgängligt, så att alla kan hjälpa till att förädla det vidare. Det är illa nog att upphovsrättslagen sätter snäva gränser, men bibliotek bör underlätta tillgången och inte ytterligare försvåra den.
Trevlig helg!
-- Lars Aronsson ([log in to unmask]) Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/
|