Wie gelingt gute Datenqualität?

Drittes Fachforum Open Data 2022 durchgeführt

Das letzte Fachforum im Jahr 2022 beschäftigte sich mit einem Dauerbrenner im Bereich Open Data: Wie kann die Verwaltung qualitativ gute Daten bereitstellen?

Bis heute ist die Verwaltungslandschaft geprägt von unterschiedlichsten Datenqualitäten, Rahmenbedingungen und Wissensstände. Um im Rahmen des Fachforums für eine einheitliche Definition von Datenqualität zu sorgen, legte zunächst Thilak Mahendran, Leiter des CCOD, theoretische Bedingungen für qualitativ hochwertige Daten dar. Dabei stellte er heraus, dass die Qualität von Daten maßgeblich von der Anwendung abhängt, mit der diese Daten verarbeitet werden. Eine generelle Definition guter Datenqualität sei deshalb nicht zielführend.
Sehr wohl aber seien Merkmale und Standards im Bereich Open Data auszumachen, die als Qualitätskriterien von offenen Daten dienen können. Darunter fiel beispielsweise die dauerhafte Erreichbarkeit von Daten durch URI sicherzustellen, ebenso wie die Konsistenz und Vollständigkeit zu beachten.

Nach dieser Einführung eröffnete Dr. Andreas Illert die Vorträge des Fachforums mit einem Impuls zur Qualität offener Geodaten. Anders als bei Open Data sei der Auftrag zur Qualität dort gesetzlich verankert und müsse dabei stetig mit den Nutzenden abgestimmt werden.
Dabei unterschied Dr. Illert ein Soll-Bild für Geodatenqualität. Dieses werde durch Datenspezifikationen erreicht. Sein Appell: Informationen für Nutzende bereitstellen, um gegenseitiges Vertrauen aufzubauen. Bei der proaktiven Bereitstellung von Daten, finde die Nutzung jedoch anonym statt, weshalb es neue Wege brauche, um Feedback zu ermöglichen.
Als Positivbeispiel für eine gelungene Zusammenarbeit, stellte Dr. Illert OpenStreetMap genauer vor. Ein System zur Selbstkontrolle ermögliche eine intensive Kommunikation mit und zwischen Nutzenden. Gepaart mit der Möglichkeit, eigene Karten zu erstellen und zu pflegen, entstehe eine bessere Datenqualität und die Möglichkeit, Aktualisierung sehr schnell umzusetzen.

Einen ähnlich starken Apell für die aktive Einbindung von Datennutzenden gab es von Thomas Tursics. Ein Feedback-Kanal sei wichtig, um Fehler melden zu können. Als Beispiel nannte Thomas die Validierung von Bahnhöfen der deutschen Bahn. Diese stellte eine Karte mit den Standorten der Bahnhöfe bereit. Die Community konnte nicht nur Bahnhöfe taggen, sie validierte diese Daten auch gleichzeitig. Auf diese Weise ließ sich das Projekt in unter einer Woche erfolgreich abschließen. Ein Vorgang, der sonst deutlich mehr Zeit in Anspruch nehmen würde.
An einem weiteren Beispiel machte Thoms deutlich, dass die Struktur von Daten und Metadaten eine zentrale Bedeutung für deren Verwendbarkeit hat. So habe jede Schule in Berlin eine eigene ID. Das System, in dem die Schuldaten verfügbar gemacht werden, nutzt hingegen eine andere ID. Solche Strukturen können eine dauerhafte Nutzung von Daten, z.B. in Anwendungen erschweren.

In der anschließenden Diskussion wurden zum einen Möglichkeiten diskutiert, wie man Feedback-Kanäle für die Nutzenden aufbauen könne. Zum anderen, wie man auf sich ändernde Formatierungen reagieren könne, z.B. durch Versionierung in maschinenlesbarer Form.

An dieser Stelle bedanken wir uns noch einmal bei den Redner*innen und allen Teilnehmenden der Veranstaltung für die konstruktiven und gewinnbringenden Vorträge und Gespräche.

Für das CCOD ist der Abschluss des dritten Fachforums 2022 der Planungsauftakt für den Runden Tisch Open Data 2022. Wir freuen uns auf ein Wiedersehen mit Praktikern aus der Bundes- und Landesverwaltung im Dezember.

Diese Seite

Stand 31.10.2022