Trefwoorden
Het project verloopt voorspoedig, de 6 miljoen kaarten worden in een hoog tempo gescand.
Per dag worden 200 dozen met elk 830 kaarten gescand en gecontroleerd, met de ambitie op te schalen naar 300 dozen per dag. Op dit moment is al meer dan een miljoen kaarten gescand. Het CBG is verder bezig met pilots waarbij de snelheid en kwaliteit van mogelijke opties voor metadatering worden onderzocht. Een combinatie van OCR en controle via crowdsourcing lijkt momenteel veelbelovend. Het gaat om het metadateren van de belangrijkste velden op de kaarten met prioriteit 1: de familienaam, voornamen, geboortedatum, geboorteplaats, overlijdensdatum en overlijdensplaats. Het CBG streeft naar 100% correcte metadatering, maar vanuit de Begeleidingsgroep is aangegeven dat dit in de praktijk onhaalbaar is, 99% is al heel erg mooi. Deze Begeleidingsgroep met vertegenwoordigers uit het archievenveld is op 1 september weer bijeen geweest en was enthousiast over de voortgang en verdere plannen van het CBG. Ook de KVAN ondersteunt dit grote project nog steeds van harte en blijft meedenken over het vervolg inclusief de financiering daarvan.
Begin 2022 zal volgens planning het scannen gereed zijn, en een deel van de metadatering. Dan moet de keuze gemaakt zijn over de wijze van metadatering, die belangrijk is voor de plannen om te gaan matchen tegen bestanden van archiefinstellingen. Daar is het immers allemaal om te doen: wanneer eigen bestanden van archiefinstellingen kunnen worden gematcht met dit grote bestand gegevens van overledenen, wordt duidelijk welke informatie wel en niet openbaar kan worden. Immers, de privacywetgeving geldt in principe alleen voor persoonsgegevens van levende personen.
Op dit moment is het plan, dat 2022 gebruikt zal worden voor metadatering en pilots met matchen, en dat het matchen op grote schaal in 2023 werkelijkheid zal zijn. Via de KVAN en de Begeleidingsgroep blijft het archiefwezen nauw betrokken.