Dit artikel is geschreven door de werkgroep Datasheets voor digitaal cultureel erfgoed.
Sinds september 2022 ondersteunen de Europeana Research Community en de EuropeanaTech Community een werkgroep voor datasheets voor datasets over digitaal cultureel erfgoed. De werkgroep behandelt een kritieke kwestie voor instellingen voor cultureel erfgoed die digitale collecties beheren, d.w.z. dat zij hergebruikers van gegevens de context bieden die nodig is voor het hergebruik van gegevens.
De werkgroep heeft zich met name gericht op datasheets als gestandaardiseerd publicatieformaat voor het documenteren van datasets (bijvoorbeeld corpora van gedigitaliseerde boeken en kranten, bibliografische datasets, gedigitaliseerde kunstwerken), met als doel instellingen voor cultureel erfgoed en andere gegevensverstrekkers te ondersteunen bij het beschrijven van hun dataactiva op een manier die in overeenstemming is met de FAIR-beginselen en een efficiënte integratie in hergebruikworkflows mogelijk maakt. Deze focus heeft ook geleid tot inspanningen om een “verzameling als gegevens”-benadering in de gemeenschappelijke Europese gegevensruimte voor cultureel erfgoed te bevestigen, wat concreet tot uiting komt in de ontwikkeling van de workflow “verzamelingen als gegevens”, waarin documentatie wordt behandeld als een van de tien stappen die worden voorgesteld voor het samenstellen van datasets.
Na de realisatie van hun datasheetsjabloon – versie 1 in september 2023 en de presentatie ervan op evenementen in heel Europa, hebben de leden van de werkgroep dit jaar een reeks workshops georganiseerd om het sjabloon te testen en te verfijnen met professionals en onderzoekers die geïnteresseerd zijn in digitale curatie binnen en buiten het Europeana-initiatief. Deze reeks omvatte een workshop met mensen die werken aan soortgelijke initiatieven in Europa (zoals gegevensenveloppen bij de KNAW ⁇ De Koninklijke Nederlandse Akademie van Wetenschappen) en een goed bezochte workshop open voor het publiek, ingebed in het programma van de bijeenkomst van het Europeana Aggregators’ Forum in het voorjaar.
Deze aanpak – gevoed door de geest van de Europeana-gemeenschappen die gebaseerd zijn op kennisdeling en bottom-upontwikkeling van de sector cultureel erfgoed – heeft geleid tot de publicatie van het datasheetsjabloon – versie 2 in juli 2025.
Wat is er nieuw in versie 2?
Het nieuwe gegevensbladsjabloon is gestructureerd in zes secties, waarin technische en ethische aspecten worden gecombineerd waarmee in de documentatie rekening moet worden gehouden: titel, beschrijving, verspreiding, samenstelling, gegevensverzamelingsproces, voorbeelden en overwegingen voor het gebruik van de gegevens. Hoewel de kerndoelen van het sjabloon hetzelfde blijven, brengt versie 2 verschillende structurele verbeteringen met zich mee. De bijgewerkte versie beschikt over een modulaire informatiearchitectuur die is onderverdeeld in drie niveaus van diepte, met een minimale reeks verplichte velden. Met dit ontwerp kan het sjabloon beter tegemoetkomen aan de diversiteit en complexiteit van digitale erfgoedcollecties en zinvol worden gebruikt in zeer verschillende soorten datasets, waarbij duidelijk wordt aangegeven wat bekend, onbekend en niet van toepassing is.
Naast deze structurele updates zet versie 2 de eerste stappen naar machineleesbaarheid, in lijn met de huidige ontwikkelingen rond de gemeenschappelijke Europese dataruimte voor cultureel erfgoed. Velden die in het sjabloon als verplicht zijn aangemerkt, zijn in kaart gebracht in het toepassingsprofiel van de datacatalogus Woordenschat voor dataportalen in Europa (DCAT-AP), een specificatie voor het beschrijven van datasets van de publieke sector in Europa. Afstemming op deze standaard maakt vindbaarheid in dataportalen en compatibiliteit met geautomatiseerde workflows mogelijk, terwijl de primaire focus van het sjabloon op menselijke leesbaarheid en bruikbaarheid behouden blijft.
Wat is de volgende stap en hoe kunt u meedoen?
De werkgroep blijft het model verfijnen, waarbij de nadruk ligt op interoperabiliteit en de vaststelling ervan wordt vergemakkelijkt. De huidige prioriteiten zijn onder meer een algemene afstemming op DCAT-AP en het verzamelen van nieuwe use cases, terwijl een opensource-instrument wordt ontwikkeld ter ondersteuning van het creëren van documentatie voor datasets, die tegen volgend jaar zal worden afgerond en beschikbaar zal worden gesteld in open source. Het datasheetsjabloon - versie 2 zal als basis dienen om minimumvereisten vast te stellen voor het delen van datasets via de komende datacatalogus van de gemeenschappelijke Europese dataruimte voor cultureel erfgoed.
Verken het gegevensbladsjabloon - versie 2, probeer het uit in uw eigen context en deel uw feedback door een e-mail te schrijven naar [email protected]! Uw bijdragen zullen helpen bij het vormgeven van de volgende stappen in dit community-driven project.
Ontmoet de werkgroep ter plaatse of online op Fantastic Futures 2025
Vertegenwoordigers van de werkgroep zullen deze updates presenteren op de Fantastic Futures 2025-conferentie, georganiseerd door AI4LAM en georganiseerd in de British Library op 3-5 december 2025, in een bliksemsnelle toespraak waarin versie 2 wordt benadrukt binnen een groep initiatieven die gericht zijn op het documenteren van datasets: Schrijf het op! Bevordering van verantwoord hergebruik van gegevens over cultureel erfgoed met interoperabele gegevenssetbeschrijvingen. Dit is gepland op 4 december, om 16:00 GMT / 17:00 CET.
Tickets voor online aanwezigheid zijn nu gratis beschikbaar - registreer u nu.
