Grundsätze und Standards

Seit 2019 harmonisiert CLARIAH-DE die komplementären Entwicklungen und Ergebnisse der Infrastrukturprojekte CLARIN-D und DARIAH-DE zu interoperablen und nachnutzbaren Datenbeständen. Ermöglicht wird dies durch die Abstimmung von Standards für die Erstellung, Aufbereitung und Archivierung von Daten und Werkzeugen.

Die Forschungsinfrastruktur von CLARIAH-DE ist den FAIR-Prinzipien – Findable, Accessible, Interoperable, Reusable – verpflichtet. Diese Prinzipien stellen bestimmte Anforderungen an Forschungsdaten sowie die dazugehörigen Metadaten, um die Nachhaltigkeit von Datenobjekten zu gewährleisten und sowohl die manuelle als auch die automatisierte Nutzung der Daten zu begünstigen.

Diese Anforderungen umfassen ein weites Spektrum technischer Aspekte wie die Gewährleistung von Interoperabilität durch die Nutzung ausführlich und nachvollziehbar dokumentierter Datenstandards bis zu der Anforderung einer eindeutigen Lizenzierung von Datenobjekten.

Die FAIR-Prinzipien sind ein fester Bestandteil der Initiativen zum Forschungsdatenmanagement an wissenschaftlichen Einrichtungen – ein zeitgemäßer Umgang mit Forschungsdaten erfolgt FAIR.

Innerhalb von CLARIAH-DE steht die Erfüllung der FAIR-Prinzipien durch sprach- und textbasierte Forschungsdaten im Mittelpunkt. Hierfür bietet CLARIAH-DE Werkzeuge an, die das standardkonforme Erstellen von und Arbeiten mit digitalen Forschungsdaten erleichtern, wie die virtuelle Forschungsumgebung TextGrid, die einen besonderen Fokus auf die Arbeit mit TEI-XML-Dokumenten legt.

Auch stellt CLARIAH-DE Repositorien zur Verfügung, deren Datenobjekte nach gängigen Standards bereitgestellt werden. Dies schließt auch die Metadaten ein, die nach etablierten Standards wie beispielsweise METS/MODS oder Dublin Core kodiert sind. Für die Arbeit mit textuellen Forschungsdaten setzt CLARIAH-DE auf TEI-XML. Im Umgang mit Bildobjekten sowie deren Metadaten empfiehlt CLARIAH-DE auch den Einsatz von IIIF-Technologien.

Ein weiterer Arbeitsbereich von CLARIAH-DE ist die Entwicklung und der Einsatz von Standards für spezifische Anwendungsszenarien. Hierzu gehört beispielsweise das Basisformat des Deutschen Textarchivs (DTABf) und seine Derivate als Subset des TEI-Standards für die Integration textueller Forschungsdaten in interoperable Textkorpora.

Über die eigene Arbeit mit und an den genannten und weiteren Standards hinaus beteiligt CLARIAH-DE sich aktiv an einer Reihe von Gremien und Organisationen, welche die Weiterentwicklung dieser Standards betreiben. Auch fördert CLARIAH-DE die Verwendung der Standards, indem es Forscherinnen und Forscher zu technischen und organisatorischen Fragen im Umgang mit diesen berät.