LISTSERV mailing list manager LISTSERV 15.5

Help for BIBLIST Archives


BIBLIST Archives

BIBLIST Archives


View:

Next Message | Previous Message
Next in Topic | Previous in Topic
Next by Same Author | Previous by Same Author
Chronologically | Most Recent First
Proportional Font | Monospaced Font

Options:

Join or Leave BIBLIST
Reply | Post New Message
Search Archives


Subject:

Re: Sanctus amor patriae dat animum

From:

Lars Aronsson <[log in to unmask]>

Reply-To:

BIBLIST - Topics in Nordic research library user services <[log in to unmask]>

Date:

Fri, 18 Mar 2005 17:15:51 +0100

Content-Type:

TEXT/PLAIN

Parts/Attachments:

Parts/Attachments

TEXT/PLAIN (1 lines)


Jan Szczepanski skrev:

> Alltsedan 1826 ger sällskapet Gesellschaft für ältere deutsche
> Geschichskunde ut källmaterial till tysk, schweizisk och
> österrikisk historia i serien Monumenta Germaniae Historica. Till
> dags dato har över 350 volymer publicerats.

För digitaliseringen står Bayerische Staatsbibliothek (BSB) i
München, som är det ena av två nationella digitaliseringscentra
finansierade av DFG, Deutsche Forschungsgemeinschaft. (Det andra
ligger i Göttingen.) BSB har tidigare gjort sig berömda genom
digitaliseringen av Allgemeine Deutsche Biographie (55 band,
1875-1910), den tyska motsvarigheten till SBL.

Spridningen på två nationella centra, och 1990-talets ännu mer
spridda DFG-satsning på tiotals regionala digitaliseringsprojekt, är
kanske naturliga i den tyska förbundsfederalismen, en markering
gentemot den centralistiska traditionen från Preussen, "tyska riket"
och DDR. Fransmännen har koncentrerat sina satsningar till
nationalbiblioteket i Paris och digitaliseringsprojektet Gallica.
Bortsett från skillnaden mellan länderna, blir intrycket från
Europa som helhet en splittring på många små projekt, något som
ifrågasätts i franske riksbibliotekarien Jean-Noël Jeanneneys
debattinlägg i Le Monde av 22 januari, där tanken på en samlad
europeisk satsning förs fram som ett sätt att balansera den
amerikanska dominansen (den här gången representerad av Google). Men
ingen tror väl att Gallica vill flytta till München, så en viss
splittring och "intern" konkurrens (inom EU) får vi nog leva med. Må
bästa bibliotek vinna! Vad nu tävlingen går ut på. Enbart ära?
Eller en reserverad stol i framtidens förgyllda himmel?

Som förkämpe för Internet (gentemot alternativen) är jag
stormförtjust över att BSB lägger ut MGH på Internet och inte
säljer CDROM eller investerar miljoner i en ny tryckt utgåva som
ingen har råd med. (Tänk om SBL kunde göra likadant! Tack för
Libris webbsök och SAOB på nätet!) Och jag noterar att
digitaliseringen av ADB och MGH varken kräver abonnemang eller
särskilda plugins, utan det är bara att surfa [a5] på. Det har andra
digitaliseringsprojekt (inte minst i det här landet) att lära av.

Men med detta sagt, finns också mycket kritiskt att framföra, eller
ska vi säga: Det är gott om utrymme för förbättringar. Och
riktigt tydligt blir det i fortsättningen av Jans inlägg, där han
vant navigerar nätet och väver samman hänvisningar med sin
berättelse:

> reaktion på franska revolutionen och Napoleons europeiska projekt.
> http://sv.wikipedia.org/wiki/Heinrich_Friedrich_Karl_vom_und_zum_Stein
>
> MGH har varit mönsterbildande för andra länders utgivning av källmaterial.
> http://runeberg.org/nfbr/0547.html

Både Wikipedia och Projekt Runeberg har en URL-struktur som gör att
man kan maila en länk direkt till rätt sida. Försök leta på
något intressant i ADB eller MGH och maila länken till en kollega.
Det låter sig inte göras! BSB har byggt två webbplatser utan
möjlighet för publiken att göra länkar till enskilda delar av
innehållet. Det kunde vara ett ursäktligt misstag 1994, men inte
2004. Speciellt inte efter att jag varit på besök hos BSB i
München sommaren 2003 och påtalat problemet. Hallå? Vakna!

Min andra anmärkning är frånvaron av sökbar OCR-text. Att
digitalisera med faksimilbilder är en nödvändighet ur textkritisk
synvinkel. Men sedan kan man välja att ta med en sökbart text eller
inte. Och både i ADB och MGH saknas sökbar text. Åter igen ett
dubbelfel från BSB. För ADB skyller man på att frakturtexten är
svår att OCR-tolka, men för MGH håller inte denna ursäkt. För
den forskare som vet att det efterforskade materialet finns i MGH, i
en viss volym och på en viss sida, räcker det givetvis att gå till
rätt webbplats, klicka rätt antal gånger, och komma fram till den
läsbara texten. Men om hon vill citera ett stycke i sin avhandling?
Då blir det till att skriva av för hand. Och för oss andra, som
undrar om Civitas Lincopensis in Ostro Gothia omnämns någonstans i
de tyska urkunderna, så blir det till att bläddra från sidan 1. Det
är lika jobbigt som på biblioteket, enda skillnaden är att
biblioteket har kommit närmare tack vare Internet.

Projekt Runebergs OCR-text till Nordisk familjebok är inte perfekt,
men vem som helst har möjligheten att korrekturläsa den, och alla
sökmotorer har en god chans att indexera texten. En Google-sökning
på "monumenta germaniæ" i svenska texter ger 39 träffar, varav 10
inom Projekt Runeberg och Nordisk familjebok.

Nu är det ju tack och lov så att Internet är fullt av frivilliga,
som inte vill något hellre än att förbättra världen. Om bara BSB
digitaliserar sidorna ur ADB och MGH, så kan ju någon annan ladda
ner bilderna och OCR-tolka dem och hjälpa till att göra texten
sökbar. Sådana frivilliga har visserligen redan betalat skatt för
att BSB ska utföra detta, men vem orkar i längden vara långsint?
Låt oss alla hjälpas åt för att förbättra tillgången till det
digitaliserade kulturarvet! Men här stångar entusiasten sin panna
blodig. De inscannade faksimilbilderna av ADB visas inte i full
upplösning, som duger för OCR, utan i en avsiktligt förminskad
version som nätt och jämnt är läsbar på skärmen. Den som på
ort och ställe erbjuder sig att hjälpa till, blir nekad tillgång
till de högupplösta digitala bilderna. Kanske har detta ändå
ändrat sig vad gäller MGH. Här går det att zooma in "150 %" i
bilderna och det borde vara möjligt att OCR-tolka dessa. Men då
klickar man på länken "Copyright" på MGH-sajten och läser:

  Alle Urheber- und Verwertungsrechte am hier veröffentlichten
  Material liegen bei den Eigentümern. Die Verwertung der Inhalte und
  Abbildungen und deren Vervielfältigung oder Verbreitung ist nur mit
  vorheriger schriftlicher Zustimmung der Rechteinhaber erlaubt,
  soweit sich aus dem Urheberrechtsgesetz nichts anderes ergibt.
  Insbesondere ist eine Einspeicherung oder Verarbeitung in
  Datensystemen ohne Zustimmung der Bayerischen Staatsbibliothek und
  Monumenta Germaniae Historiae unzulässig und strafbar.

De avslutande orden betyder "otillåtlig och straffbar", och detta
gäller all vidare databearbetning av det digitala materialet utan
uttryckligt samtycke från BSB -- utöver vad som stadgas
upphovsrättslagen. Det är tveksamt om detta har stöd i lagen, men
det är en viljeförklaring från institutionens ledning. Alltså: Om
jag laddar ner sidorna för att på ideell basis OCR-tolka dem och
göra den gamla och **upphovsrättsfria** texten sökbar, så kommer
BSB ändå att använda Förbundsrepublikens skattemedel till att jaga
mig till domstol. Tack så mycket för hjälpen!

Så länge digitaliseringsprojekt kan bedrivas på det här viset, är
jag övertygad om att vi behöver konkurrens och pluralism. Att satsa
på storskaliga, centralistiska digitaliseringsprojekt -- som riskerar
att skötas på det här sättet -- vore *renodlad* galenskap.
Hellre ser vi lite dubbelarbete, där olika projekt digitaliserar
samma text på nytt. Någon som har ett exemplar av ADB över?

Sammanfattning: Digitaliseringsprojekt bör, utöver vad BSB gör,
tillämpa följande tre riktlinjer:

  1. Skapa en URL-struktur som underlättar "djup" länkning.

  2. Skapa en sökbar och öppet tillgänglig OCR-text.

  3. Gör det digitala materialet öppet tillgängligt, så att alla
     kan hjälpa till att förädla det vidare. Det är illa nog att
     upphovsrättslagen sätter snäva gränser, men bibliotek bör
     underlätta tillgången och inte ytterligare försvåra den.

Trevlig helg!


--
  Lars Aronsson ([log in to unmask])
  Projekt Runeberg - fri nordisk litteratur - http://runeberg.org/


Back to: Top of Message | Previous Page | Main BIBLIST Page

PermalinkSEGATE.SUNET.SE

CataList Email List Search Powered by the LISTSERV Email List Manager