Open Data Format
Offenes, nicht-proprietäres Format für den Austausch von Forschungsdaten und Metadaten für den Einsatz mit den gängigen Statistikprogrammen.
Während des Forschungsdaten-Lebenszyklus werden zahlreiche Dokumente erstellt, die den Forschungsprozess dokumentieren (z. B. Fragebogen, Codebook, Replikationscode der Datenanalyse). Im Idealfall ist jedes dieser Dokumente auffindbar, zugänglich, interoperabel und nachnutzbar. Diese Kriterien können durch den Einsatz von Metadaten bei der Organisation des Forschungsprozesses erfüllt werden. Zum aktuellen Zeitpunkt nutzen Sozialwissenschaftler*innen für die Analyse ihrer Daten jedoch unterschiedliche und zum Teil proprietäre Software, die Metadaten auf unterschiedliche Art und Weise verarbeitet. Zudem ist ein Teil der Metadaten nur über PDF-Dokumente und Webseiten zugänglich.
Wir entwickeln ein offenes, nicht-proprietäres, mehrsprachiges und mit Metadaten angereichertes Datenformat, das mit den gängigen Statistik-Programmen genutzt werden kann und gleichzeitig Zugang zu den Metadaten ermöglicht. Die Datenprodukte werden direkt durch Metadaten beschrieben, sind leichter zugänglich, interoperabel und die Metadaten werden wiederverwendet. Andere Communities, die ebenfalls Metadaten verwenden, werden angesprochen, um deren Anforderungen in Bezug auf Software oder Metadaten-Schema zu berücksichtigen. Dadurch wird die Benutzerbasis für das neue Datenformat integriert und erweitert. Spezifikation und Software, einschließlich des Quellcodes, werden als FLOSS-Software unter Lizenz (z. B. CC, MIT, LGPL) bereitgestellt, wodurch die Produkte in verschiedenen Kontexten leicht verwendbar sind.
- Eine erste Version der Spezifikation (https://git.soep.de/opendata/specification) steht seit 2022 bereit.