Home | Best practice nutsvoorziening – Het geluid van Groningen
Best practice nutsvoorziening - Het geluid van Groningen
Gepubliceerd op: 08 - 04 - 2025
Trefwoorden
nutsvoorziening
transitie
best practices
In 2023 schreef René Duursma een projectplan met als doel de audiocollectie van de Groninger Archieven te ontsluiten. Hoewel veel van dit materiaal al jaren geleden is gedigitaliseerd, bleef de collectie grotendeels ontoegankelijk. Onder de naam Het geluid van Groningen wordt daar nu iets aan gedaan. Op wekelijkse basis worden cassettes en/of magneetbanden gedigitaliseerd. Hoe is dit project van de grond gekomen?
De bulk van de audiobestanden komt voort uit een groot digitaliseringstraject uit de periode 20042006. Stichting GAVA (Stichting Groninger Audio Visueel Archief, later opgegaan in Groninger Archieven) beheerde destijds de AVcollectie Groningen, bestaande uit onder andere duizenden magneetbanden en compactcassettes van RTV Noord. Waarom is dat materiaal al die jaren blijven liggen en niet ontsloten? Daarop zijn meerdere antwoorden mogelijk, waarvan de belangrijkste auteursrechten en prioriteit zijn. De rechten van de audio liggen bij RTV Noord, waardoor we de collectie niet zomaar konden publiceren. Hier door zakte de collectie direct op de prioriteitenlijst. De personele inzet die nodig was om de collectie op een redelijk niveau te ontsluiten, kon niet worden vrijgemaakt.
Er bestond wel een tekstdocument met basisgegevens van de collectie, wat voldoende was om bij incidentele aanvragen handmatig te zoeken en aanvragers te bedienen. Dit strookte echter niet met onze visie: zoveel mogelijk mensen bedienen met een online doorzoekbare database waarin je direct kunt kijken en luisteren. Daarom bleef deze collectie zachtjes op de achtergrond jengelen…
Speech to text
We zijn in 2006, in verband met deze en andere oral history collecties, al eens in gesprek geweest met de TU Twente, die destijds werkte aan automatische ontsluiting van audio via software. Zij hadden met succes een speech van koningin Wilhelmina omgezet in tekst, maar het kostte de software enorm veel tijd om haar dictie aan te leren. Bovendien moest de tekst eerst handmatig in de software worden ingevoerd om de machine te voeden. Prachtig pionierswerk, maar nog veel te vroeg voor een productieomgeving. Inmiddels hebben alle grote techbedrijven ter wereld wel een vorm van speechtotextsoftware ontwikkeld via LLM’s (Large Language Models). In 2022 en 2023 zag ik hier inspirerende voorbeelden van in Parijs, tijdens de Frame Expert en Frame Advancedcursussen. Deze cursussen voor AVarchivarissen, ontwikkeld en aangeboden door FIAT/IFTA, tonen de nieuwste ontwikkelingen en processen in de archiefwereld bij de grotere omroeparchieven van Europa. De cursussen vinden plaats bij en worden gegeven door INA (Institut National de l’Audiovisuel), met medewerking van Beeld en Geluid uit Nederland.
Duidelijk is dat AI de afgelopen vijf jaar een steeds grotere rol is gaan spelen in deze archieven en dat het kantelpunt van experiment naar productie inmiddels is gepasseerd. Voor een klein archief als het onze is dat cruciaal, want experimenteren is interessant, maar zonder implementatie mogelijkheden krijg ik er geen draagvlak voor. Daar is simpelweg geen ruimte en budget voor. Ik wil hierbij specifiek het bedrijf Limecraft uit Gent noemen. Wat zij in 2022 in Parijs lieten zien, was al zo geavanceerd dat we het direct in gebruik hadden kunnen nemen. Deze software wordt vooral gebruikt voor film en documentaireproducties en is in meerdere talen beschikbaar. In gesprek met medeoprichter Maarten Verwaes, die echt de tijd nam om me een en ander uit te leggen, werd duidelijk hoe goed en slim de software was die zij rondom de LLM’s hadden gebouwd. Op basis van deze informatie ben ik verder gaan kijken naar andere online modellen, zoals die van Azure, IBM en DeepL. Overigens worden al deze systemen ook door Limecraft gebruikt. Daarnaast zag ik al snel dat we met STT (speechtotext) een grote groep mensen zouden kunnen bereiken die we nu niet bedienen: de ongeveer anderhalf miljoen doven en slecht horenden in Nederland. Zij kunnen straks radio gaan ‘lezen’ op onze website.
Speerpunten
Helaas was dit systeem zonder subsidieaanvraag onmogelijk voor ons te betalen, gezien de hoeveelheid uren aan materiaal die we hadden liggen. Vandaar het projectplan Het geluid van Groningen, met de volgende speerpunten:
• Rechten. De rechten moesten worden geregeld met RTV Noord. Bij een dergelijk groot project moet het publiek ervan kunnen profiteren. Dat proces verliep vlot, omdat RTV Noord direct de meerwaarde zag van diepe ontsluiting, zowel voor eigen gebruik als voor het publiek. Na publicatie krijgt het publiek toegang tot bijna tachtig jaar regionale geschiedenis, in het Gronings en Nederlands.
• Inzetbaarheid. Naast audio kan ook video worden getranscribeerd. Er moest een keuze worden gemaakt voor een vergelijkbaar archief met duidelijk uitgesproken teksten. De keuze viel op het omroeparchief van OOG TV, de lokale tvomroep van de stad Groningen.
• Bereik en inzet van vrijwilligers. We moesten onderzoeken in hoeverre we vrijwilligers konden werven om de automatisch gegenereerde transcripties te controleren op fouten. Algemeen bekend is dat LLM’s op dit moment niet beschikken over de culturele achtergrondkennis en verfijning die mensen uit de regio wél hebben. Bovendien herkent de machine namen nog lang niet altijd correct. Menselijke controle is voor ons archief en onze collectie onontbeerlijk.
• Redactie. Er moest een redactiesysteem komen waarmee specifieke onderwerpen aan geïnteresseerde vrijwilligers kunnen worden toegewezen. Admins kunnen vrijwilligers voorzien van op hun interessegebied toegespitste audio opnames, wat de betrokkenheid bij het project vergroot.
• Stakeholders. We moesten de stakeholders in kaart brengen en benaderen: wie in de regio Groningen zou een bijdrage kunnen leveren of profiteren van dit project? Uiteraard de om roepen zelf, maar ook andere archieven en instellingen zoals het Centrum voor Groninger Taal en Cultuur (CGTC). CGTC werkt ook aan speechtotext, specifiek voor het Gronings. Via CGTC is Martijn Bartelds begonnen aan een PhD aan de Universiteit van Stanford in Californië. Wij leveren Groningstalig materiaal aan hem en hij deelt zijn bevindingen met ons. Uit een project van Meemoo in Vlaanderen, waarin meerdere organisaties samenwerkten, is gebleken dat het identificeren en betrokken houden van stakeholders cruciaal is voor succes.
• Privacy assessment. Er moet een verwerkersovereenkomst worden afgesloten met de leverancier. Bij het gebruik van materiaal worden verzonden dat niet al publiek beschikbaar is of beschikbaar moet worden.
• Compliant data. De output van het systeem moet voldoen aan standaarden zoals XML, VTT, SRT en JSON, zodat import en export in onze systemen mogelijk is.
• Vervolg. Als het Nederlands een succes wordt, moet er een vervolg komen voor het Groningstalige deel van de collectie.
• Impact op de organisatie. Het projectplan moet de organisatie helpen haar doelstellingen te realiseren. Het mag tijdelijk tijd wegnemen van andere werkzaamheden, maar moet op de lange termijn voordeel opleveren. Het doel is de workflow op te nemen in de dagelijkse werkzaamheden.
Publieksbereik
Na het schrijven van het projectplan en het overtuigen van de directie om hiermee aan de slag te gaan, moesten we onderzoeken waar we financiering konden aanvragen. Maar eerst volgde voor mij nog de tweede Frame Advancedweek. Waar Frame Expert zich richtte op technische achtergronden, draaide Frame Advanced om publieksbereik. Tijdens deze week zag ik een presentatie van Virginia Bazán Gil, destijds adjunctdirecteur van het archief van de Spaanse omroep RTVE (inmiddels directeur). Zij liet zien hoe haar journalisten konden profiteren van diverse AIoplossingen, ontwikkeld door Ugiat, een instituut gelieerd aan de Universiteit van Barcelona.
Ugiat is een bedrijf dat zich normaal gesproken richt op beeld herkenningssoftware voor de Formule 1 industrie. Zij ontwikkelden algoritmes die logo’s in beeld kunnen herken en en registreren hoe lang ze zichtbaar zijn. Dat is voor sponsors natuurlijk belangrijk om te weten. Voor de Spaanse omroep RTVE hebben ze echter diverse oplossingen ontwikkeld waarmee de toegang tot het archief grotendeels zonder menselijke tussenkomst functioneerde. Nu moet gezegd worden dat Spaans een relatief eenvoudige taal is voor STT, dankzij de grammaticale structuur en de grote hoeveelheid beschikbare teksten. Maar het was indrukwekkend wat Virginia en dr.Francesc Tarrés lieten zien.
Kort daarna maakte ik een afspraak om online met FrancescTarrés te verkennen wat zij voor ons konden betekenen. Ze hadden nog nooit iets gebouwd voor een organisatie als de onze, maar in mijn ogen verschilde dat niet wezenlijk van wat ik tijdens de presentaties had gezien. We hadden wekelijks online contact en begrepen elkaar snel. Een essentiële voorwaarde voor een geslaagd project is immers ‘dezelfde taal’ spreken. Het is cruciaal om helder te formuleren wat je wilt, waarom en hoe je dat wilt, zowel op detailniveau als in het grotere geheel.
Softwareengineer Diana Vidal schoof vaak aan, waardoor problemen en oplossingen op meerdere niveaus konden worden besproken. Ook onze applicatiebeheerders werden al snel in de ‘loop’ gebracht over ingests en experts, zodat we niet voor verrassingen kwamen te staan. De ingests in Mais Flexis, ons contentbeheersysteem, moesten bovendien als export naar onze website, www.filmbankgroningen.nl. Zowel intern als extern moesten er dus nog enkele puntjes op de i worden gezet.
Ik ging direct in gesprek met onze staf over de kosten. Het bleek namelijk mogelijk om voor een aanzienlijk lager bedrag een systeem op te zetten dat voor ons goed zou werken. De directie reageerde voortvarend en besloot het project op te nemen in de lopende begroting. Daardoor konden we snel doorpakken.
Technische hobbels
De eerste oplevering was al behoorlijk goed, maar lange gesprekken (oral history) bleken problematisch. Ze waren te groot voor de cache van de server waarop gewerkt werd. Daar naast werd muziek soms niet als muziek herkend, maar als getallen, en werd tekst in sommige gevallen geïnterpreteerd als muziek. Ook kwam het incidenteel voor dat er onverwachts een vertaling naar het Engels verscheen in plaats van Nederlands. Het opnieuw uploaden van de bestanden bood vaak soelaas. In een enkel geval moesten de softwareengineers tweaken aan de parameters. Inmiddels is versie 3 van de software online en beschikbaar voor andere, bij NORAA (Nationaal Overleg Regionale Audio visuele Archieven) aangesloten, kleinere archieven. Ook hierin toont de leverancier zich weer bijzonder schappelijk. Het is mooi om te zien wat er mogelijk is voor kleinere archieven wanneer een bedrijf als Ugiat het belang van de publieke zaak en nonprofitinitiatieven serieus neemt.
Besluit
We zijn volop bezig: de eerste resultaten staan online en zijn nu ook toegankelijk voor doven en slechthorenden. We hebben vermeld dat de transcripties zijn gegenereerd door AIsoftware en gecontroleerd door mensen. De uitgebreide samenvattingen zijn gemaakt met ChatGPT en eveneens door mensen nagekeken. We zijn erg tevreden met het resultaat. De grootste uitdaging is nu het werven, instrueren en behouden van vrijwilligers buiten het gebouw. Hiervoor moet het platform nog verder worden ontwikkeld, maar we zien dat met vertrouwen tegemoet.
Kennis delen
Dit is onderdeel van een reeks waarin best practices gedeeld worden. Om dat nog meer te stimuleren organiseert KVAN ook een aantal evenementen. Tijdens deze bijeenkomsten leren we de mensen achter de praktijkverhalen kennen. Met oog voor het proces en waardering voor het feit dat succes vaak gepaard gaat met misstappen. Oftewel: leren door te doen. Jullie zijn van harte uitgenodigd om deze evenementen bij te wonen. Wil je weten wanneer? Houd kvan.nl in de gaten of abonneer je op de nieuwsbrief via kvan.nl/aanmeldennieuwsbrief. Sinds kort is er ook een Instagramkanaal, specifiek voor het programma
Nutsvoorziening: @nuts.voorziening. Blijf op de hoogte via een van deze kanalen.
Heb je vragen over het programma Nutsvoorziening? Mail dan naar nutsvoorziening@kvan.nl. Laten we samen werken aan een wendbare archiefsector die voorbereid is op de veranderende informatie behoeften. De toekomst wacht niet.