Open Data: Rohstoff für die Informationsgesellschaft

Open Data: Rohstoff für die Informationsgesellschaft

cc-by: Armel Le Coge & Cyril Lage

Inhaltsverzeichnis

Open Data steht auf der politischen Agenda in Deutschland. Nach den Erfolgen der Open Data Initiativen in den USA und Großbritannien beginnen nun auch deutsche Verwaltungen und Politik sich mit dem Thema „offene Daten“ zu befassen. Die von Barack Obama initiierte Open Government Policy gilt als Wegbereiter für Reformen im öffentlichen Sektor. Sie hat zum Ziel Politik und Verwaltung für Bürger, Zivilgesellschaft und Wirtschaft zu öffnen und diese an staatlichen Entscheidungsprozessen zu beteiligen. Eine Säule der Open Government Policy bildet der Zugang zu Daten des öffentlichen Sektors. Open Data beschreibt den Vorgang digitale Informationen des öffentlichen Sektors uneingeschränkt zur freien Nutzung und Verbreitung zugänglich zu machen. Daten werden in einem offenen Format mit offener Lizenz zur Verfügung gestellt. Von diesem Prozess ausgenommen sind sicherheitsrelevante Daten, Geschäftsgeheimnisse sowie Daten mit Personenbezug.

Die öffentlichen Verwaltungen des Bundes, der Länder und Kommunen produzieren einen großen Teil an nicht-personenbezogenen Daten in Deutschland. Der potenzielle Wert der erhobenen Daten wird von den öffentlichen Verwaltungen, häufig aufgrund mangelnder Ressourcen, nicht ausgeschöpft. In den Augen der Open Data Befürworter bleibt ein Datenschatz vergraben und damit Chancen für mehr Transparenz, Partizipation und Kollaboration in unserer Gesellschaft.

Chancen von Open Data: Transparenz – Partizipation – Kollaboration

Die Open Data Initiative steht für mehr „Transparenz“, „Partizipation“ und „Kollaboration“ auf Bundes-, Länder- und Kommunaler-Ebene.: Durch die Bereitstellung der Datenbestände öffentlicher Verwaltungen wird mehr Transparenz geschaffen, was aus Sicht der Wirtschaft, Forschung und Zivilgesellschaft in Deutschland längst überfällig ist. Die Datensilos von Verwaltung und Politik stellen wichtige Quellen politischer Meinungsbildung und Partizipationsmöglichkeiten dar. Offene Daten versprechen mehr Transparenz im Handeln von Verwaltung und Politik, was das Vertrauen der Menschen in den Staat und seinen Verwaltungen stärkt und Chancen für eine differenzierte, demokratische Willensbildung bietet .

Die Bereitstellung und Nutzung Offener Daten mit Lokalbezug kann zu einer Stärkung des bürgerschaftlichen Engagements in öffentlichen Fragen beitragen. Öffentliche Entscheidungsprozesse werden durch die Veröffentlichung von behördlichen Arbeitsdaten für Außenstehende nachvollziehbar gemacht. Dadurch wird es den BürgerInnen erleichtert einen Diskurs auf Augenhöhe mit Politik und Verwaltung zu führen und ermöglicht auf diesem Weg echte Teilhabe.

Rohdaten sind für die breite Masse oftmals ungeeignet. Die Bedeutung liegt vielmehr in der Aufarbeitung der der Rohdaten durch Dritte (z.B. klassische Medien, Blogger etc.), die durch Offene Daten ermöglicht wird. Eine gesellschaftlich breite Nutzung der vorhandenen Daten ist für die Verwaltungen nicht nur aus finanzhaushälterischer Sicht vorteilhaft. Die Weiterverwendung und –verbreitung legitimiert und verankert die umfangreiche und aus Steuergeldern finanzierte Erhebung nicht-personenbezogener Daten in Deutschland. . Im Web entstehen zahlreiche Non-Profit Projekte und viele Menschen sind bereit unentgeltlich Know-how zur Verfügung zu stellen und gemeinnützige Online-Projekte auf die Beine zu stellen.
Offene Daten können Menschen mit dem entsprechenden Wissen befähigen Dienste, die liegen nicht im Zuständigkeitsbereich des Staates liegen oder von diesem finanziell nicht geleistet werden können, zur Verfügung zu stellen. (z.B. „Wheelmap.org “ oder „Und was atmest Du so? “).

Innovation – Effizienz

Das Internet bietet viel Spielraum für Synergieeffekte in der Zusammenarbeit von öffentlichen Verwaltungen und Dritten. Bereits vorhandene Daten können zu entsprechenden Themen beliebig zusammengestellt werden, was einen Mehrwert für alle Beteiligten darstellt. Kreative Köpfe können die komplexen Daten der öffentlichen Verwaltung in visuell ansprechende und verständliche Informationsträger verwandeln, wodurch es Verwaltungen ermöglicht wird zu bestimmten Themen schnell und effizient Auskunft zu erteilen – sowohl verwaltungsintern, gegenüber der Politik, als auch gegenüber den BürgerInnen und der Wirtschaft. Aufwand und Redundanz bei Anfragen können dadurch reduziert werden, was viel Zeit und Geld spart. Finanzschwache Start-Up-Unternehmen können Anwendungen auf Grundlage von hochwertigen Datenerstellen ohne hohe Beträge in Lizenzen investieren zu müssen.

Herausforderungen an Politik und Verwaltung: Rechtliche Voraussetzungen für Offenheit

Von zentraler Bedeutung bei der Öffnung von Datenbeständen aus dem öffentlichen Sektor sind einheitliche, klare und einfache Nutzungsbedingungen. Rechtliche Unsicherheiten bzgl. der Weiterverwendung und Weiterverbreitung von Daten hindern den Öffnungsprozess (Abb.1). Creative Commons (CC) ist eine Organisation, welche hier vorbeugen möchte, indem sie vorgefertigte Lizenzverträge anbietet. Open Data heißt, dass die in Frage kommenden Datenbestände ohne Nutzungsbeschränkungen allgemein und frei zur Verfügung gestellt und entsprechend mit einer offenen Lizenz versehen werden. Ziel einer offenen Lizenz ist es, Restriktionen gegenüber einer Weiternutzung gering zu halten bzw. ganz aufzuheben.
Die CC-Lizenzen sind modulartig aufgebaut und bestehen aus kurzen und einfachen Lizenzverträgen, die der Rechtsinhaber durch das entsprechende Symbol im Werk kenntlich macht. Lizenzen sollten einfach und knapp gehalten werden. Eine Bereitstellung der Daten unter Creative Commons Lizenzen bieten sich hier aus Gründen der Einfachheit und der internationalen Verbreitung an. Die CC-Lizenzen sind jedoch für Werke entwickelt worden, nicht für Datensammlungen. Hier bleibt auf die Veröffentlichung der CC 4.0 Lizenzen zu hoffen, die rechtlich Datenbanken abdecken. Alternativ ist die Verwendung der weniger verbreiteten Open Data Commons Attributions-Lizenz (ODC-By) möglich.

Eine gebührenfreie Weiterverwendung der Daten zu kommerziellen Zwecken ist nicht nur wünschenswert, sondern zwingend, will man Open Data auch als Impuls für wirtschaftliche Aktivitäten verstehen (Abb. 1). Das wichtigste Argument der Open Data-Befürworter ist in diesem Zusammenhang, dass im Auftrag des Staates erhobene Daten aus Steuergeldern finanziert werden und damit dem Steuerzahler gehören. Daten, die von staatlichen Stellen ohnehin gesetzlich erhoben werden, sollen der Allgemeinheit zur Verfügung stehen. Eine gebührenpflichtige Nutzung, und sei die Gebühr noch so gering, hindert kapitalschwache Innovatoren und vergrößert den Kreis derer, die von der Nutzung ausgeschlossen werden.

Abb. 1 - OpenData-Genese

Abb. 1 OpenData-Genese

Knackpunkt: Finanzierung

Entscheidend im derzeitigen Open Data-Diskurs ist die Frage nach der Finanzierungsregelung für datenhaltende Stellen, die ihre Daten an die Wirtschaft verkauft haben. Open Data kann das einstige Geschäftsmodell von einigen öffentlichen Stellen erodieren, die ihre Daten an die Wirtschaft veräußern. Zukünftig besteht die Möglichkeit Einnahmen über „Freemium- und „Affiliate-Modelle zu generieren. Bürokratieabbau und Effizienzsteigerung in den Prozessen, sowie die Kollaboration mit den Communities und der Wirtschaft können Einsparungen für die Staatskasse bedeuten. Hier ist eine Umlage der finanziellen Mittel erforderlich.
Die Herausgabe auf rechtlich eindeutiger Basis ist wichtiger als die Bereitstellung der Datenbestände in der günstigsten Repräsentationsform. Dritte können für die technische Aufbereitung von technisch suboptimal aufbereiteten Daten des öffentlichen Sektors sorgen, wenn diese unter einer freien Lizenz veröffentlicht werden.

Technische Voraussetzungen für Offenheit

Neben den lizenzrechtlichen Fragen stellt die Öffnung der Daten des öffentlichen Sektors eine Reihe technischer Anforderungen an die Datenbereitsteller. Die Repräsentationsform der Rohdaten (Datenformat, Schnittstelle) sowie ihre Auffindbarkeit und Beschreibung (Adresse, Metadaten) spielen eine entscheidende Rolle. Die Daten sollen bevorzugt in Formaten oder Schnittstellen bereitgestellt werden, welche als offen gelten, um die Unabhängigkeit von privatwirtschaftlichen Unternehmen zu gewährleisten. Im Bereich der Standardisierung von Datenbeständen muss das Rad nicht neu erfunden werden. Für die meisten Anwendungen existieren offene Standards, die sich in der Praxis bereits bewährt haben. Offene und maschinenlesbare Datenformate bilden die Grundlage für Softwareentwickler. Sie können Dienste entwickeln, die auf offene Inhalte zugreifen, prozessieren und diese für einen bestimmten Zweck ausgeben lassen.

Datenveredlern reicht die Veröffentlichung von Daten nicht. Sie müssen Veränderungen an den bestehenden Datensätzen vornehmen und diese auch effizient weiterverarbeiten können. Oft liegen Tabellen im PDF-Format vor, die zum Lesen am Bildschirm geeignet sind, für eine automatisierte Weiterverarbeitung jedoch eine große Hürde darstellen. Um gezielt Daten abzufragen und maschinell zu verarbeiten, spielt die Maschinenlesbarkeit von Daten eine wichtige Rolle. Unter der Maschinenlesbarkeit von Daten wird das Format verstanden, in dem Daten abgespeichert worden sind. Bestimmte Datenformate sind maschinell leichter zu verarbeiten als andere. Diese etablierten offenen Formate sollen bevorzugt gebraucht werden, um die einfache Weiterverarbeitung der Daten zu gewährleisten.

Ein weiterer Aspekt ist die Auffindbarkeit der Daten: Die veröffentlichten Daten sollten mit Metadaten beschrieben werden und indizierbar sein, um von Suchmaschinen gefunden zu werden. Diese Anforderungen sind abhängig von der  zweckmäßigen Repräsentationsform der Daten. Die Daten sollten weiterhin diskriminierungsfrei bereitgestellt werden. Das bedeutet, dass keine Personen durch künstliche Restriktionen von der Benutzung der Daten ausgeschlossen werden. Dies wäre z.B. der Fall, wenn die Daten nur über eine Registrierung, eine Mitgliedschaft bzw. ein autorisiertes Login abrufbar sind oder nur mit dezidierten Anwendungen auf sie zugreifen können. Jede Person soll zu jeder Zeit auf die Daten zugreifen, ohne Auskunft über ihre Identität oder sonstige Rechtfertigungen geben zu müssen. Der Zugriff auf die Daten soll ohne Registrierung oder sonstiger Verifikation anonym möglich sein.

Staatliche veröffentlichte Daten sollen dem Anspruch genügen, möglichst vollständig zu sein, und die ganze Spannweite an Daten beinhalten, die zu einem Thema erhoben und verarbeitet wurden. Dies beinhaltet idealerweise auch die Veröffentlichung von Rohdaten inklusive der dazugehörigen Metadaten, sowie Formeln zur Berechnung der Daten.

Für Fachdaten sollten Dokumentationen bereitliegen, die sich auf deren fachliche Verwendung der Daten  beziehen. Weiterhin sollen, ähnlich dem Anspruch des wissenschaftlichen Arbeitens, die Art der Datenerfassung, sowie die genuinen Quellen der veröffentlichten Informationen publiziert werden. Die Veröffentlichung von Regierungs- und Verwaltungsdaten sollte so zeitnah wie möglich geschehen. Bei Daten, deren Gebrauch eine hohe Aktualität erfordert, wie z.B. bei Verkehrsdaten wären Aktualisierungen in Echtzeit sinnvoll. Die Daten sollten zudem nachhaltig bereitgestellt werden, d.h. die Daten würden dauerhaft in Archiven zur Verfügung stehen. Aktualisierungen oder Änderungen sollten nachvollziehbar sein. Informationen, die als Datenstrom versendet werden und nicht archiviert werden, sind in diesem Zusammenhang die zweite Wahl. Weiterhin ist es sinnvoll, die Lizenzform in den Metadaten der zu lizenzierenden Datei zu hinterlegen, damit Suchmaschinen diese indizieren können und die Lizenz der Datei unabhängig von der Webseite ausfindig gemacht werden kann.

Spannungsfelder im Open Data-Diskurs

In Zukunft könnten Behörden und Verwaltungen ihre Daten proaktiv veröffentlichen. Alle Daten sollten veröffentlicht werden, die keinen Beschränkungen (z.B. Datenschutz) unterliegen. Das nicht-veröffentlichen von Daten muss eine Ausnahme sein und nachvollziehbar begründet werden. Anspruchsgrundlagen für den Zugang des Bürgers zu Informationen finden sich in den Informationsfreiheitsgesetzen. Das Informationsfreiheitsgesetz sieht vor, dass jede Person einen Rechtsanspruch auf den Zugang zu behördlichen Daten, ohne Begründung des Interesses, hat und ihr der entsprechende Zugang gewährleistet werden muss. Informationsfreiheitsgesetze oder auch Spezialgesetze (Umweltinformationsgesetz, Geodatenzugangsgesetz etc.) sind aber nur bedingt geeignet, um Open Data in Deutschland zu etablieren.

Abb. 2 - Spannungsfelder Open Data

Abb. 2 – Spannungsfelder Open Data

Eine Änderung der Verwaltungskultur kann weder durch ein Gesetz auferlegt, noch allein durch Einsatz kollaborativer Software oder sonstiger IT herbeigeführt werden. Die Betriebssysteme der öffentlichen Verwaltungen brauchen intrinsische Anreize um einen inklusiven und offenen Umgang mit Daten zu fördern. Angestellte im öffentlichen Dienst brauchen dafür aber auch eindeutige Gesetzesgrundlagen und Direktiven, nach denen sie ihr Handeln begründen oder rechtfertigen können. Hier gilt es organisationsübergreifende und einheitliche Richtlinien zu finden und im Zweifelsfall gesetzgeberisch zu handeln, wo rechtliche Unklarheiten bestehen. Eine einheitliche, international kompatible, einfach verständliche und offene Lizenz abzustimmen, ist der erste Schritt in eine Zukunft vernetzter Datenbestände und hochpotenter Datensammlungen, deren Informationen als Grundlage für technischen und gesellschaftlichen Fortschritt betrachtet werden können.

Damian Paderta
Damian Paderta
Webgeograph & Digitalberater