Deze zoekfunctie in de complete tekst is een bijzondere prestatie. Dergelijke oude handschriften vergen veel kennis en vaardigheden van de lezer, in dit geval van de computer. Een extra uitdaging vormen de vele schrijfvariaties van letters en afkortingen, doorgedrukte inkt en beschadigingen aan het papier. Daarnaast zijn er notarissen en klerken die de computer uitdagen met slordigheden, doorhalingen en krabbels tussen de regels of in de marge.
Het afgelopen jaar zijn in het VeleHanden-project Crowd Leert Computer Lezen hele grote stappen gemaakt in de techniek van machine learning voor het lezen van historische notariële documenten. Hiervoor zijn de Handwritten Text Recognition (HTR) tools van Transkribus gebruikt. Deze tools zijn toegepast op meer dan 15.000 handgeschreven bladzijden uit het archief van de Amsterdamse Notarissen van het Stadsarchief Amsterdam. Die zijn eerst door mensenhanden getranscribeerd en gecorrigeerd. Vervolgens zijn ze als basis gebruikt om computermodellen te trainen, zodat die de letters en woorden vervolgens helemaal zonder menselijke tussenkomst kunnen herkennen. De eerste resultaten zijn indrukwekkend en met Transkribus Read&Search voor iedereen te zien en gebruiken.
Het zoeken door teksten met Handwritten Text Recognition (HTR) brengt allerlei nieuwe mogelijkheden met zich mee voor het zoeken naar verhalen uit de Amsterdamse geschiedenis. Van de chique bewoners van het Trippenhuis tot de arme stedelingen in de sloppen van het stadseiland Marken. Van onbekende schilderijen door Rembrandt tot de namen van slaafgemaakten tijdens de grote opstand in Berbice (1763). Een paar voorbeelden van vondsten uit de nieuwe HTR-zoekomgeving zijn gepubliceerd op Alle Amsterdamse Akten.
Bron: Stadsarchief Amsterdam
Publicatiedatum: 19/03/2021
Vul deze informatie aan of geef een reactie.