Trefwoorden
Stadsarchief Amsterdam wil eeuwenoude handgeschreven documenten toegankelijk maken voor een groot publiek. Het heeft hiervoor het project Crowd Leert Computer Lezen gelanceerd. Hierin werken vrijwilligers aan de tekstherkenning van oude handschriften. Uiteindelijk wil het Stadsarchief bereiken dat iedereen kan ‘googelen’ op elk woord in oude handgeschreven documenten.
Het Stadsarchief koppelt voor de automatische handschriftherkenning technologie van het platform Transkribus aan het crowdsourcing-platform VeleHanden. Dat geeft honderden mensen tegelijk de mogelijkheid de computer te trainen én te corrigeren. In het project leest de computer scans, waarna vrijwilligers de scans en de door de computer gemaakte transcripties bekijken en waar nodig corrigeren. Hierna worden de scans met de correcte transcriptie opnieuw ingelezen in de computer. Hoe meer scans met transcripties er in het computerbestand zitten, des te beter herkent de computer vergelijkbare teksten op volgende scans. Zo ‘leert’ de computer als het ware lezen.
De technologie van Transkribus is in Europees verband ontwikkeld aan de Universiteit van Innsbrück. Volgens het Stadsarchief leest de computer de handgeschreven teksten van bijvoorbeeld de zeventiende-eeuwse notaris Hendrik Schaef dankzij deze technologie al met slechts 5% procent Character Error Rate (ofwel: voor 95% foutloos). De inzet van vrijwilligers moet de computer nog slimmer maken.
Lees verder op historiek.nl