För sju år sedan, i september 2004, beskrev datortidningen Wired den unge Aaron Swartz, då 18 år, så här:
WHO: Aaron Swartz, an 18-year-old computer whiz who in 2000 helped develop the popular Web-content distribution software RSS.
MORE GEEK CRED: In addition to editing the specs for RSS, Swartz built the Web site for warchalking, the short-lived graffiti approach to locating Wi-Fi hot spots. He's also an adviser on metadata issues for Creative Commons, Stanford law professor (and Wired columnist) Lawrence Lessig's copyright think tank.
http://www.wired.com/wired/archive/12.09/start.html?pg=5
Det var alltså som 14-åring som Swartz gjorde sig ett namn med RSS, dataformatet för att följa bloggar. Jag har under åren stött på honom inom flera projekt för öppna data, som MusicBrainz.org och OpenLibrary.org, där han gjort viktiga insatser. Han har även publicerat åsikter om hur Wikipedia borde styras och kandiderat (men ej blivit vald) till styrelsen för Wikimedia Foundation. Nu senast har han varit gäststudent på Harvard och medgrundare till nätaktivistprojektet Demand Progress. Han är nu 24 år.
En mer uppdaterad biografi finns förstås i Wikipedia, http://en.wikipedia.org/wiki/Aaron_Swartz
Igår, den 19 juli, kom nyheten om att han blivit åtalad för dataintrång, för att ha laddat ner 4 miljoner dokument från JSTOR och för att ha berett sig tillgång till nätet hos MIT (den tekniska högskolan, Massachusetts Institute of Technology) och för att ha förfalskat sin identitet.
Detta har rapporterats i Library Journal, http://www.libraryjournal.com/lj/home/891366-264/open_information_activist_indicted_for.html.csp
New York Times, http://www.nytimes.com/2011/07/20/us/20compute.html?scp=1&sq=aaron%20swartz&st=cse
och många andra ställen. Sök bara på hans namn.
De flesta bibliotekarier vet väl redan vad JSTOR är. Det är ett bibliotekskooperativ för att scanna äldre årgångar av vetenskapliga tidskrifter och mot abonnemang göra dem tillgängliga för bibliotek, så att varje bibliotek inte behöver bevara och lagra (Store) egna exemplar av alla tidskrifter (Journals). Abonnemanget är billigare än den egna lagringen.
JSTOR själva har gått ut med följande meddelande, http://about.jstor.org/news-events/news/jstor-statement-misuse-incident-and-criminal-case
där de lite undvikande betonar att detta är ett kriminalfall som faller under allmänt åtal och inte en civilrättslig process. Det är alltså åklagaren som driver fallet och JSTOR bara samarbetar med polisutredningen.
Skadan av intrånget ligger i att datorerna blev överbelastade men förstås också i att om JSTOR-dokumenten skulle bli fritt tillgängliga, så kunde abonnemangsintäkterna gå förlorade. Många av nyhetskommentarerna liknar intrånget vid att "låna hem för många böcker från biblioteket" och ska det verkligen vara brottsligt? Här märker man en dubbelhet i JSTOR:s natur. Är JSTOR ett bibliotek som är öppet för alla, eller ett filmbolag som jagar piratkopierare? Kanske båda samtidigt.
Den mest intressanta läsningen i sammanhanget, är själva åtalet, http://scr.bi/qfky2q
där punkterna 11-33 (sid. 3-9) beskriver i detalj hur åklagaren anser att Aaron Swartz har gått tillväga. Det skulle nog gå att omarbeta till ett filmmanus.
Bortsett från intrånget i MIT:s datanät och fifflandet med falska användarnamn, är metoden att ladda ner stora mängder data från webbsajter inte något okänt eller främmande. Det är exakt vad Google ägnar sig åt när de indexerar hela världens webbsajter. Det finns verktyg för det i form av fri programvara som vem som helst kan prova. Några populära verktyg heter Wget och Curl, men man kan också skriva sina egna verktyg.
Några minns kanske att jag under en tid tillhandahöll alla Sveriges lagtexter inom Projekt Runeberg. Det var under några år i mitten av 1990-talet efter att Riksdagen hade beslutat att lagdatabasen Rixlex skulle vara fri men innan den fanns tillgänglig som webbsajt, utan bara som terminalfönster (telnet). Jag laddade då ner alla dokument, tillsammans 70 megabytes, och omvandlade dem till HTML-sidor. För detta behövde jag inte göra något intrång eller annat olagligt, men säkert kände sig Rixlex-ansvariga lite förnärmade. Förhoppningsvis skyndade jag på webbversionen av Rixlex litegrann.
Jag vet inte vad Aaron Swartz, om nu åtalet stämmer, hade tänkt använda JSTOR-dokumenten till. Men alla som argumenterar för mer Open Access måste ju hålla med om att en databas som JSTOR borde vara öppen och fritt tillgänglig för alla. Det är förstås ingen ursäkt för att ta lagen i egna händer, men det ligger ändå något av "civilt motstånd" över handlingen.
Det här dilemmat, "är vi ett bibliotek eller förlag?", är något som varje digitaliseringsprojekt och större offentlig webbsajt bör tänka över. Svårast har organisationer som SAB, BTJ, Riksarkivet med SVAR, Lantmäteriet och SMHI, där hela verksamheten har byggts upp som en butik som säljer sina varor. När allt fler svenskar tar sina väderupplysningar gratis från den norska vädertjänsten, måste man fråga sig varför vi ska behålla SMHI. Det kanske kan läggas ner.
-- Lars Aronsson ([log in to unmask]) Aronsson Datateknik - http://aronsson.se
|