Amsterdamse akten minutieus doorzoekbaar

Voor het eerst zijn complete teksten van historische notariële akten online beschikbaar en doorzoekbaar. Waar voorheen alleen te zoeken was op hoofdkenmerken als persoonsnamen en locaties, kan nu op elk woord en elk detail gezocht worden. Transkribus Read&Search maakt daarmee nieuwe vormen van onderzoek mogelijk. Omdat alle woorden van 17e en 18e-eeuwse notariële teksten beschikbaar en dus vindbaar zijn kan een speld in een hooiberg binnen enkele seconden gevonden worden en kunnen bij het analyseren van grote hoeveelheden teksten zich patronen aftekenen.

Deze zoekfunctie in de complete tekst is een bijzondere prestatie. Dergelijke oude handschriften vergen veel kennis en vaardigheden van de lezer, in dit geval van de computer. Een extra uitdaging vormen de vele schrijfvariaties van letters en afkortingen, doorgedrukte inkt en beschadigingen aan het papier. Daarnaast zijn er notarissen en klerken die de computer uitdagen met slordigheden, doorhalingen en krabbels tussen de regels of in de marge.

Het afgelopen jaar zijn in het VeleHanden-project Crowd Leert Computer Lezen hele grote stappen gemaakt in de techniek van machine learning voor het lezen van historische notariële documenten. Hiervoor zijn de Handwritten Text Recognition (HTR) tools van Transkribus gebruikt. Deze tools zijn toegepast op meer dan 15.000 handgeschreven bladzijden uit het archief van de Amsterdamse Notarissen van het Stadsarchief Amsterdam. Die zijn eerst door mensenhanden getranscribeerd en gecorrigeerd. Vervolgens zijn ze als basis gebruikt om computermodellen te trainen, zodat die de letters en woorden vervolgens helemaal zonder menselijke tussenkomst kunnen herkennen. De eerste resultaten zijn indrukwekkend en met Transkribus Read&Search voor iedereen te zien en gebruiken.

Aan de verschillende schrijfwijzen van het woord ‘Amsterdam’ is te zien hoe uiteenlopend de handschriften zijn die de computer zich eigen moet maken. Foto: Stadsarchief Amsterdam.

​Het zoeken door teksten met Handwritten Text Recognition (HTR) brengt allerlei nieuwe mogelijkheden met zich mee voor het zoeken naar verhalen uit de Amsterdamse geschiedenis. Van de chique bewoners van het Trippenhuis tot de arme stedelingen in de sloppen van het stadseiland Marken. Van onbekende schilderijen door Rembrandt tot de namen van slaafgemaakten tijdens de grote opstand in Berbice (1763). Een paar voorbeelden van vondsten uit de nieuwe HTR-zoekomgeving zijn gepubliceerd op Alle Amsterdamse Akten.

Bron: Stadsarchief Amsterdam

Publicatiedatum: 19/03/2021

Aanvullingen

Vul deze informatie aan of geef een reactie.

Plaats een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *

Vereiste velden zijn gemarkeerd met *. Het e-mailadres wordt niet gepubliceerd.