In archieven, oude (universiteits-)bibliotheken en religieuze bibliotheken zijn nog veel oude handschriften te vinden die tot de verbeelding spreken. Vooral omdat ze onbereikbaar leken: alleen toegankelijk voor ingewijden en oppassen met licht, lucht en vooral: witte handschoenen aan! 

Belangrijke bibliotheken, archieven en musea zijn massaal bezig bijzondere handschriften, oude drukwerken en kunstwerken digitaal te ontsluiten. Werken die tot de verbeelding spreken als de dode zee-rollen, de Gutenberg bijbel, Griekse werken die ons denken hebben beïnvloed… allemaal beschikbaar via het web!

Vaticaan en Oxford

In het Polonsky Foundation Digitization Project werken de  bibliotheek van het Vaticaan en Bodleian Library van Oxford University samen om deze geschreven grondvesten van westerse cultuur (1,5 miljoen pagina’s) te scannen en vrij beschikbaar te stellen. Inmiddels zijn diverse varianten van de bijbel beschikbaar: van Griekse en Hebreeuwse manuscripten tot de vroegste gedrukte bijbels (inclusief de Gutenberg bijbel). De bibliotheken hebben handschriften in hun bezit die terug gaan tot de 7e eeuw. Naast Bijbelse en religieuze teksten bevat de collectie onder andere teksten van Homerus en Sophocles en middeleeuwse wetenschappelijke teksten op het gebied van astronomie, medicijnen en filosofie.

Scannen maakt niet vindbaar

Met alleen het inscannen van al die geschriften ben je er nog niet. Je moet natuurlijk ook kunnen vinden wat je zoekt. Wat dat betreft hebben Google Books en het Krantenarchief van de Koninklijke Bibliotheek (KB) het relatief makkelijk. Doordat in drukwerk de letters eenvormiger zijn dan bij geschreven tekst, kan de scanner letters herkennen. Met OCR (Optical Character Recognition) wordt er daadwerkelijk tekst gescand in plaats van een plaatje met letters. De KB heeft uitgebreid beschreven hoe het scannen van hun archief werkt en welke problemen ze daarbij tegen komen. Zodra je handschriften of afbeeldingen gaat scannen is OCR onmogelijk. Veel van de ingescande geschriften zijn dus in essentie plaatjes. De grote uitdaging voor bibliotheken en archieven is dus om deze plaatjes makkelijk vindbaar te maken. Zij gaan van oudsher anders om met het vindbaar maken van tekst: bibliothecarissen denken in boeken en onderwerpen, archivarissen in data.

Bibliotheken

Bibliotheken catalogiseren boeken en teksten al eeuwen op auteur en “meta-tags avant la lettre”. Elk boek kreeg zijn eigen sleutelwoorden en deze stonden in de kaartenbak. Zo zijn ook de catalogi van de Vaticaanbibliotheek en de Bodleian Library ingedeeld. Dat maakt het als leek heel lastig wat te vinden in deze specialistische bibliotheken. Wie is de auteur van de bijbel? Ik heb ooit wel Latijn gehad, maar verder dan Servus in hortus est (de slaaf is in de tuin) kom ik niet, laat staan dat ik zoekwoorden kan formuleren in een specialistische bibliotheek als die van het Vaticaan.
Een mooi voorbeeld van ouderwets zoeken in de digitale wereld is de Collectie Soeterbeeck (onderdeel van de bijzondere collecties van de Radboud Universiteit). In deze online kloosterbibliotheek kun je zoeken in Kast III, Kast IV en Kast V. Gelukkig staat op de pagina een foto van de bibliotheek, waarop je kunt zien wat welke kast is. Bij nadere bestudering blijken de werken via de site op verschillende (religieuze) sleutelwoorden ontsloten te zijn. Je krijgt door die kasten wel een gevoel van pre-google, pre-database, pre-microfiche en pre-kaartenbak zoeken en dat past prima bij deze bibliotheek!

Archieven

Voor archieven is de exacte inhoud van teksten altijd veel belangrijker geweest dan voor bibliotheken. Gebruikers willen immers relatief snel een specifieke persoon kunnen vinden die in het archief zit. Als ik mijn stamboom uitzoek, wil ik zoeken op mijn achternaam en dan resultaten vinden. Het kan mij dan niet schelen of het oorspronkelijk geschreven, getypt of digitaal is. Bij het Stadsarchief Amsterdam, Regionaal Archief Leiden en vele anderen kan dat inmiddels en zoek je gelijk in meerdere boeken en kaartenbakken. De zoekresultaten zijn allemaal gekoppeld aan handschriften, je kunt vaak direct de bron lezen. De archieven hebben handschriften dus ingescand, en de plaats waarop een naam geschreven staat gekoppeld aan een database waarin alle gegevens opgenomen zijn.
Er zijn nog veel handgeschreven bronnen die ontsloten moeten worden. Een bijzonder initiatief is het project Vele handen. Het doel van deze crowdsourcingwebsite is gegevens digitaal vindbaar maken. Vrijwilligers helpen door ingescande handschriften over te typen, ingescande pagina’s te koppelen aan gegevens in een database, foto’s te taggen en ze voeren teksten op preparaten in. Een breed publiek kan zo deze oude bronnen doorzoeken.

Naast alle nieuwe content die dagelijks verschijnt, komt ook steeds meer oude content op het web beschikbaar. Of alles even goed vindbaar is, dat is de vraag, maar geldt dat niet voor alle content? De waarde van de Gutenberg bijbel zit hem vooral in het feit dat ik weet dat hij bestaat en dat de boekdrukkunst aan de wieg stond van democratisering van kennis. Ik hoef de Gutenberg bijbel niet zelf in te kunnen zien. Dat deze bijzondere collecties en archieven online komen is vooral van belang voor wetenschappers en deskundigen. Voor ons is het misschien een moment van bezinning op ons plekje in de lange traditie van content creators op deze aardkloot.


Geschreven door