Ich bin mit dem Portal "Open Data Guru" gestartet, um jeden Tag einen neuen Datensatz aus einem Open Data Portal zu zeigen. Die Vielfalt der Daten, die Vielfalt der Themen wollte ich zeigen. Mir war und ist bewusst, dass ich dabei auch auf eine Vielfalt an Problemen stoßen werde. Eine davon ist die Frage: Was ist ein neuer Datensatz und wie bekomme ich das heraus.
Die Open Data Portale sind technisch gesehen Meta-Daten-Portale. Die meisten Daten liegen gar nicht im Portal selbst, sondern nur ein paar Informationen zu dem Datensatz selbst. Und diese Daten werden größtenteils per Hand in das System gepflegt. Also was soll der Redakteur in das Feld "Datum der Erstellung" reinschreiben?
Eine naheliegende Variante ist das "heutige" Datum. Das wird tatsächlich am häufigsten eingetragen und kommt meiner Arbeitsweise sehr entgegen. Es gibt aber auch Daten, die bereits in anderen Systemen (zum Beispiel in einem Geodaten-Portal) existieren und "nur" noch geöffnet werden. Diesen Daten wird teilweise das Datum der Erstellung im Ursprungssystem gegeben. Es gibt Daten, die werden zu einem Zeitpunkt aus verschiedenen Quellen zusammengetragen. Das Datum der Erstellung dieser Daten (also nicht der Veröffentlichung) wird ebenfalls manchmal angegeben.

In den Metadaten gibt es mehrere Datum-Felder und in den Datenportalen werden nicht alle angezeigt. Hinzu kommt eine nicht immer leicht zu verstehende Nutzung der Felder in den Portalen selbst. So ist der Datensatz mit der Karte von Preussen am 11.11.2019 veröffentlicht worden, also relativ neu. Bei der Sortierung nach den neusten Datensätzen landet dieser Datensatz allerdings an letzter Stelle – das Änderungsdatum steht bei 1939.
Die Datenportalsysteme scheinen auch ein Problem beim updaten von Daten aus anderen Portalen zu haben. Das Deutschlandportal zeigt u. a. alle Daten aus dem Portal aus Köln an. Leider verschwindet die Stadt Köln immer mal wieder aus dem Deutschlandportal. Als Beispiel verschwindet der Datensatz "3d-stadtmodell-koeln" am 4. Januar von govdata, taucht am 6. Januar wieder auf, verschwindet am 8. Januar und erscheint am 14. Januar wieder im Portal. Vom 31. Januar bis 1. Februar und von gestern bis heute war er ebenfalls verschwunden und tauchte wieder neu auf.