Nur mal schnell ein Datum eintragen

Wenn man als DH-Mitarbeiter*in bereits zu Beginn eines Forschungsprojekts mit an Bord ist, kann man sicherstellen, dass nur saubere Daten entstehen. So der erste Gedanke. Die Realität sieht anders aus, da jedes unserer Datenmodelle nur eine abstrahierte Version der Wirklichkeit darstellt. Ein Beispiel: Felder, die Datierungen enthalten.

In meinem aktuellen Fall handelt es sich um eine digitale Edition, die hauptsächlich Briefe enthält. Meine Wünsche bei der Einzelerfassung der Briefe:

  • Standardisiert, bitte nach YYYY-MM-DD.
  • Plausibilitätsüberprüfung, damit niemand etwas falsches einträgt.
  • nur Werte zulassen, die dem Schema entsprechen, damit niemand etwas einträgt wie „vermutlich Anfang 1818 oder 1828, undeutlich“.

Nach einer Stunde: Natürlich wird schnell klar, dass ein zweites Feld benötigt wird, welches genau diese Informationen aufnehmen kann, die zunächst unstrukturiert sind. Also zwei Datenfelder, eines für eine Datierung, das andere für Anmerkungen zur Datierung.

Nach einem Tag: Was machen wir mit Briefen, die nicht datiert sind? Wenn wir das Feld nicht ausfüllen, kann es ja auch heißen, dass sich noch niemand darum gekümmert hat. Okay, wir müssen bei Nullwerten unterscheiden zwischen property inapplicable und value at present unknown.

Nach einer Woche: Wir haben eine wachsende Zahl von Sonderfällen. So datiert eine Verfasserin ihren Brief auf den 30.02.1820 und lacht wahrscheinlich über unsere Plausibilitätsüberprüfung. Andere Beispiele helfen uns auch, unser Datenmodell genauer zu beschreiben. So gibt eine Verfasserin einen Zeitraum als Datierung an, keinen Zeitpunkt und führt somit zu der Frage: Welches Datum erfassen wir eigentlich?

Aus anderen Projekten weiß ich, wie unterschiedlich mit solchen Sonderfällen umgegangen wird. Das wichtigste wird jedoch sein, über diese Fälle zu reden, eine Entscheidung zu treffen und diese zu dokumentieren. In unserem Fall in unserem Projekt-Wiki. Dafür ist es perfekt geeignet, da es auch alle Änderungen mitspeichert. Ich weiß also, ab wann wir eine bestimmte neue Regel eingeführt haben und kann „alte“ Datensätze gezielt überprüfen.

Warum ist mein Modell nicht perfekt?

  1. Zum Zeitpunkt eines ersten Entwurfs kenne ich nicht alle Daten. Ich sehe nur die Spitze des Eisbergs und stelle Vermutungen auf („Ein Brief enthält ein Datum.“).
  2. Jedes Modell muss angepasst werden, wenn ich mehr und mehr meines Eisbergs kartiere („Ein Brief kann ein Datum enthalten.“).
  3. Alle Sonderfälle kann ich nicht in mein Modell aufnehmen. Dann wäre es kein Modell mehr. Dann wäre es ein Abbild der Wirklichkeit.

Wir sind mit diesen Problemen bei Datumsfeldern auch nicht allein. Selbst in der Corona-Warn-App wurde kein TIMESTAMP, sondern eine Zahl verwendet, wie Alvar C.H. Freude in einer Code-Review herausgestellt hat:

Fazit: Erhalte ich tatsächlich nur saubere Daten, wenn zu Beginn jemand beteiligt ist, der sich mit Datenmodellierung auskennt? Nein ich erhalte:

  • einen großen Teil an Daten, der meinem Modell entspricht,
  • ein stetig verbessertes Modell,
  • eine Dokumentation, die diese Entscheidungen der Modellanpassung nachweist,
  • Sonderfälle, die nicht in mein Modell passen,
  • meine eigenen Fehler.

(Nebenbemerkung: Mein schönstes Beispiel aus dem nicht-wissenschaftlichen Bereich: Durch einen Mitarbeiter-Fehler in einer Behörde wurde ich leider verheiratet und sollte im Online-Portal das Datum einer Hochzeit angeben. Es war ein Pflichtfeld und ich kam nicht weiter. Die Hotline-Mitarbeiterin meinte nur: Den Zustand „verheiratet“ kann ich nicht ändern. Tragen Sie einfach „99.99.9999“ als Datum ein. Dann wird ja jeder merken, dass das gar nicht stimmt. Meine Frage: Aber gibt es da denn keine Überprüfung? Das Datum liegt doch in der Zukunft? Ihre Antwort: Unser System denkt nicht, keine Angst.)


Banner: By unknown artists, 1480s – British Library, Additional MS 18851 calendar scenes, Public Domain, https://commons.wikimedia.org/w/index.php?curid=18090292

Ein Gedanke zu “Nur mal schnell ein Datum eintragen

  1. Maria Scherrers schreibt:

    Liebe Swantje,

    und selbst wenn man sich geeinigt hat, welche Felder man braucht und wie man sie ausfüllt, hält das Datum noch eine Tücken bereit. Rupert Shepherd von der British National Gallery hat sich einige Gedanken zu verschiedenen Daten in verschiedenen Kalendern gemacht:
    https://rupertshepherd.info/tag/dates
    Echt interessant.

    Gefällt 1 Person

Hinterlasse einen Kommentar

Diese Seite verwendet Akismet, um Spam zu reduzieren. Erfahre, wie deine Kommentardaten verarbeitet werden..