Der deutsche Horaz im Geo-Browser
Grundlage der Datenvisualisierung war ein Verzeichnis der Briefe an Karl Wilhelm Ramler, laut Wikipedia auch der „deutsche Horaz“ genannt. Der Kollege hat eine sehr gut strukturierte Excel-Tabelle. Nun nur mal schnell eben im DARIAH Geo-Browser visualisieren. „Nur mal schnell eben“ klappt in 1% der Fälle. Diesmal nicht.
Datierungen
Erste Erkenntnis: wenn keine Datierung vorhanden ist, kann der Brief schlecht in einer Timeline dargestellt werden. Aber gemeinsam kamen wir zu dem Entschluss, trotzdem den Test zu starten, da zu etwa 90% der Briefe eindeutige Datierungen vorlagen. Der DARIAH-Geo-Browser braucht Angaben in ISO-Norm, kein Problem. Einfach nur die Spalte als Datum formatieren und dann die Anzeige in YYYY-MM-DD wandeln.
Der folgende Tweet zeigt die erste Hürde:
Laut #Excel ist der 31.12.1899 nicht als Datum interpretierbar. Erst ab dem 1.1.1900 beginnt die Zeitrechnung in Excel. Ratet mal, welcher Idiot 2 Stunden brauchte, um das herauszufinden. Ich wollte doch nur schnell die Daten für einen Toolinput vereinheitlichen. pic.twitter.com/ZomEbwUgYT
— Swagunke (@swagunke) 23. Januar 2019
Aber kein Problem, nachdem die Ursache bekannt war, ging es ja voran. Meine Lösung war nicht sonderlich schön, aber ich hatte nach drei kleinen Schritten das korrekte Datumsformat.
Ortsangaben
Es gibt sehr gute Gründe, die Ortsnamen zu verwenden, die „der deutsche Horaz“ kannte. Sehr viele gute Gründe, die ich eigentlich nicht hören möchte, da der GEO-Browser im Data Sheet Editor eine wunderbare Funktion hat, mit der man Geodaten mithilfe des Getty Thesaurus of Geographic Names oder Open Street Map ergänzen kann. Hier erhält man die besten Ergebnisse, wenn man heutige Ortsbezeichnungen wählt. Auch nicht weiter kompliziert, etwa 70% konnten erkannt werden. Davon wurde auch der größte Teil korrekt zugeordnet. Schwierige Ortsangaben sind Namen wie „Burg“, ein recht häufiger Ortsname.
Das war alles in einer halben Stunde erledigt und hatte den schönen Nebeneffekt, dass ich über einige schöne Orte nachgedacht habe, an denen ich bereits war und sehr gerne wieder hinfahren würde, insbesondere: Liepāja.
Ergebnis und Fazit
„Nur mal schnell eben“ klappte hier nicht. Aber die Erkenntnis, dass es nach ein paar Korrekturschritten klappte und eine Visualisierung der Daten entstand, die alle Beteiligten zufrieden stellte, war das Wichtigere. Das Ergebnis teile ich gerne, wenn mein Kollege seinen Beitrag publiziert hat.
Was würde ich beim nächsten Mal anders machen? Wenn mein Kollege bereits vorher den DARIAH-Geo-Browser und den Getty Thesaurus of Geographic Names gekannt hätte, hätte er vielleicht bereits bei der Datenerzeugung darauf geachtet, die Ortsangaben dementsprechend vorzubereiten. Bedeutet für mich: immer mal wieder Tools vorstellen.
Und die elende Fehlersuche mit der Datumsformatierung in Excel wird mir auch nicht wieder passieren. 🙂
3 Gedanken zu “Nur mal schnell eben Daten visualisieren.”