Main Content

25 miljard woorden gedigitaliseerd Kranten vanaf 1618 onder de scanner

  • 10 augustus 2006
Zoom

De Koninklijke Bibliotheek is begonnen aan een wereldwijd uniek project: de Databank Digitale Dagbladen. De komende jaren worden acht miljoen pagina’s gescand van Nederlandse kranten vanaf 1618, ofwel 25 miljard woorden. De financiering hiervan is met steun van het Nationaal Programma Investeringen in Grootschalige Onderzoeksfaciliteiten, geïnitieerd door het kabinet Balkenende II. Het wordt de grootste operatie wereldwijd ooit op dit gebied.

25 miljard woorden gedigitaliseerd

In het enorme digitaliseringsproject worden landelijke, regionale en koloniale dagbladen onder handen genomen. Zoals de KB meldt: ‘Dagbladen zijn een waardevolle bron voor onderzoek naar het functioneren van de samenleving, de politiek en de economie van een land. Ook geven kranten een goed beeld van de ontwikkelingen door de tijd op het gebied van kunst, literatuur, wetenschap en taal. De kwetsbaarheid van het materiaal en de enorme hoeveelheden papier waren tot nu toe de belangrijkste beperkingen bij het gebruiken van kranten als onderzoeksobject. Massadigitalisering biedt hiervoor een oplossing.’

Daardoor wordt de toegankelijkheid van de Nederlandse dagbladen vergroot. Het project is ook goed voor de houdbaarheid van de dagbladen, omdat er nooit meer vieze en ondeskundige vingers op het papier komen. Het belangrijkste van deze klus is niet zozeer de scans zelf, maar het ontwikkelen van een goed zoeksysteem.

Ondanks de enorme omvang wordt niet de complete krantenverzameling gescand. Van de ruim zeven (!) kilometer aan dagblad zal de komende vijf jaren één strekkende kilometer worden gedigitaliseerd. In 2008 worden de eerste resultaten zichtbaar op internet. De KB heeft al enkele projecten achter de rug, zoals een digitalisatie van kranten tussen 1910 en 1945.

Ook buiten de KB is ervaring opgedaan, zoals met Het Illegale Parool. Ook deze is nu te bestuderen via internet.

ZWAK PROTEST

PCM en het Telegraaf-concern reageren nog niet al te enthousiast op het KB-plan. De Telegraaf laat weten zelf al te zijn begonnen aan het digitaliseren om er geld mee te verdienen. Het concern stelt het KB daarom voor om te beginnen met titels, die inmiddels niet meer bestaan. PCM beraadt zich nog op een standpunt.

In het buitenland zijn al regelmatig aanvaringen geweest tussen uitvoerders van vergelijkbare scanprojecten en uitgevers. Google bijvoorbeeld heeft inmiddels gemerkt dat het niet zonder enige maatschappelijke tegenstand kan overgaan tot het digitaliseren van bibliotheken, om die via internet toegankelijk te maken. Keer op keer komt het tot problemen over copyright en auteursrechten.