Main Content

Wegwijs bij revolutie in geschiedschrijving Ewoud Sanders maakt gids voor digitale archieven

  • 20 oktober 2011
  • Jurryt van de Vooren

Door de explosieve toename van digitale archieven is een revolutie gaande in de geschiedschrijving. Nooit eerder waren zo veel bronnen zo makkelijk te raadplegen. Taalhistoricus Ewoud Sanders maakte hiervoor een zoekgids, omdat deze nieuwe ontwikkeling aan veel historici voorbij lijkt te gaan.

Ewoud Sanders is één van de pioniers in het digitale zoeken, naast mensen als Eric Hennekam en Henk van Ess. Sanders legde recent zijn ervaringen vast in het boekje ‘Eerste Hulp Bij e-Onderzoek’, een gezamenlijke uitgave van de universiteitsbibliotheken van Leiden en Amsterdam en de Koninklijke Bibliotheek. Het is een hulp bij het zoeken in de jungle aan digitale bronnen. Alhoewel dit boekje specifiek op studenten is gericht, kan iedereen hiermee zijn voordeel doen. Het is hier gratis te downloaden.

‘Er was een tijd,’ schrijft Sanders in zijn openingswoord, ‘dat het een letterenstudent heel veel tijd kon kosten om zijn of haar onderzoeksgegevens bij elkaar te sprokkelen. Je moest ervoor naar een bibliotheek of archief, soms verspreid over het land, waar je vertrouwd moest raken met kaartenbakken, registers, inventarissen, de microfilmlezer en het kopieerapparaat. Uren, dagen en soms zelfs weken bladeren in oude kranten, tijdschriften of andere bronnen en toch met slechts een klein stapeltje kopieën naar huis gaan – het was geen uitzondering.’

Door alle gedigitaliseerde archieven is die situatie volgens Sanders nu volkomen anders: ‘Die onvoorstelbare hoeveelheid bronnen maakt niet alleen nieuwe onderzoeksvragen mogelijk, maar vereist ook een nieuwe aanpak om die bronnen te bevragen en te doorzoeken, en nieuwe manieren om de gevonden informatie te verwerken.’ Tot zijn schrik ontbrak het bij zowel studenten als docenten aan de nodige kennis om hiermee te kunnen werken, waarna hij deze gids maakte.

Geen sentimenteel gedoe

Sanders gaat nog veel verder dan alleen professioneel zoeken op internet. In 2005 nam hij het besluit om een eigen digitalisatieproject te starten. Hiervoor versnijdt hij zijn boekenverzameling, wat hij in 2007 toelichtte: ‘Je legt een boek onder een snijmachine, je snijdt - rats! - de rug eraf en je legt de losse bladen vervolgens in een scanner, die, afhankelijk van de kwaliteit, zo’n honderd pagina’s per minuut digitaliseert. Vervolgens laat je die pagina’s lezen door een zogenoemd ocr-programma, een programma voor automatische tekenherkenning. Op deze manier kun je een boek van 250 pagina’s binnen tien minuten omzetten in een op woordniveau doorzoekbare pdf.’

Sanders berooft dus willens en wetens het boek van zijn kaft om daarna de losse pagina´s te digitaliseren. Na jarenlang werk heeft hij zo een gigantische collectie opgebouwd, die is opgeslagen in zijn computer. Met zoekopdrachten kan hij op jacht naar de oorsprong en ontwikkeling van woorden. Met één klik op het toetsenbord spit het zoeksysteem alle pagina’s door om de resultaten in een mooi overzicht weer te geven.

Jan Luitzen nam al snel dit voorbeeld over. Hij is als taalkundige bijzonder geïnteresseerd in sportgeschiedenis en ging ook zijn collectie te lijf met een stevig mes. In de afgelopen jaren heeft hij enkele taalwoordenboeken gemaakt, waarbij hij gebruik heeft gemaakt van zijn gedigitaliseerde boeken. Hiermee was hij één van de weinigen die Sanders volgde, want deze manier van werken roept vooral weerzin op in de traditionele wereld van historici. Het verwijt hierbij is dat je in een boek geen mes mag zetten, want dat is cultuurvernietiging. Onzin, aldus Sanders en Luitzen.

‘Dat zou het zijn,’ schreef Sanders, ‘als je hiermee unieke exemplaren van boeken vernietigde, danwel het enige exemplaar dat van een titel bewaard is gebleven. Maar als je van dubbele exemplaren gebruikmaakt, dan is de beschuldiging van cultuurbarbarij wat mij betreft - hoe zeg ik dat subtiel? - sentimentele flauwekul.’

Niet vreemd dus dat voor deze twee het digitaliseren niet snel genoeg kan. Hoe groter het aanbod in een zoeksysteem, hoe waardevoller het wordt. Als krantenarchieven, boekbestanden en de vele andere geschreven bronnen zo worden gebundeld, wordt die collectie steeds krachtiger. Historici, taalwetenschappers of toevallige geïnteresseerden kunnen dan op zoek naar elk gewenst onderwerp.

Het is daarom fijn om te weten dat nu ook in Twente een gigantische hoeveelheid kranten en foto´s wordt gedigitaliseerd. Deze revolutie gaat dus nog wel even door.