Open Data Guru

Ein neuer Datensatz ist nicht immer ein neuer Datensatz

Eine kleine Bestandsaufnahme nach einem Monat "Open Data Guru".

 

Ich bin mit dem Portal "Open Data Guru" gestartet, um jeden Tag einen neuen Datensatz aus einem Open Data Portal zu zeigen. Die Vielfalt der Daten, die Vielfalt der Themen wollte ich zeigen. Mir war und ist bewusst, dass ich dabei auch auf eine Vielfalt an Problemen stoßen werde. Eine davon ist die Frage: Was ist ein neuer Datensatz und wie bekomme ich das heraus.

Die Open Data Portale sind technisch gesehen Meta-Daten-Portale. Die meisten Daten liegen gar nicht im Portal selbst, sondern nur ein paar Informationen zu dem Datensatz selbst. Und diese Daten werden größtenteils per Hand in das System gepflegt. Also was soll der Redakteur in das Feld "Datum der Erstellung" reinschreiben?

Eine naheliegende Variante ist das "heutige" Datum. Das wird tatsächlich am häufigsten eingetragen und kommt meiner Arbeitsweise sehr entgegen. Es gibt aber auch Daten, die bereits in anderen Systemen (zum Beispiel in einem Geodaten-Portal) existieren und "nur" noch geöffnet werden. Diesen Daten wird teilweise das Datum der Erstellung im Ursprungssystem gegeben. Es gibt Daten, die werden zu einem Zeitpunkt aus verschiedenen Quellen zusammengetragen. Das Datum der Erstellung dieser Daten (also nicht der Veröffentlichung) wird ebenfalls manchmal angegeben.

 

 

In den Metadaten gibt es mehrere Datum-Felder und in den Datenportalen werden nicht alle angezeigt. Hinzu kommt eine nicht immer leicht zu verstehende Nutzung der Felder in den Portalen selbst. So ist der Datensatz mit der Karte von Preussen am 11.11.2019 veröffentlicht worden, also relativ neu. Bei der Sortierung nach den neusten Datensätzen landet dieser Datensatz allerdings an letzter Stelle – das Änderungsdatum steht bei 1939.

Die Datenportalsysteme scheinen auch ein Problem beim updaten von Daten aus anderen Portalen zu haben. Das Deutschlandportal zeigt u. a. alle Daten aus dem Portal aus Köln an. Leider verschwindet die Stadt Köln immer mal wieder aus dem Deutschlandportal. Als Beispiel verschwindet der Datensatz "3d-stadtmodell-koeln" am 4. Januar von govdata, taucht am 6. Januar wieder auf, verschwindet am 8. Januar und erscheint am 14. Januar wieder im Portal. Vom 31. Januar bis 1. Februar und von gestern bis heute war er ebenfalls verschwunden und tauchte wieder neu auf.

Österreich
Exakt 100 Polizeidienststellen sind beheimatet in Wien

Eine Landespolizeidirektion, 85 Polizeiinspektionen und 14 Stadtpolizeikommandos verteilen sich über die Hauptstadt.

Deutschland
Liebe Gäste, es muss weiter gehen, irgendwas geht immer...

... und wir wollen für Euch da sein und unsere Mitarbeiter weiter beschäftigen.

Deutschland
Das Trinkwasser in Moers ist nicht für Säuglinge geeignet

Die Werte für Natrium liegen über dem empfohlenen Wert von 20 mg/l.

Deutschland
Wir pflanzen jeden Tag eine handvoll neuer Bäume dank ihrer Spenden

Auszubildende und Firmen im Auftrag des Berliner Bezirkes Steglitz-Zehlendorf pflanzen täglich neue Bäume.

Deutschland
Bei jeder vierten öffentlichen Toilette kann bereits per App bezahlt werden

In Berlin stehen derzeit rund 250 öffentliche Toiletten bereit, 73 % davon barrierefrei nutzbar.