Geokodierung und Disambiguierung

Die gesammelten Daten beziehen sich auf zentrale Ereignisse in den Lebensläufen mehrerer im Kurfürstentum Mainz tätiger Domherren. Die erste Geokodierung (v1) wurde mit dem QGIS-Plug-In MMQIGS und der Open Street Map / Nominatim API für Geodaten durchgeführt. Für die 281 Ortseinträge in der Eingabedatei fand die Geokodierungs-API zunächst 1641 Ergebnisse, wobei nicht eindeutige Ortsnamen mehreren alternativen Koordinaten zugeordnet wurden. Dieses Problem tritt im Allgemeinen bei der Geokodierung europäischer Städte auf, die "koloniale Zwillinge" in Nordamerika, Südafrika oder Australien haben.

Rohdaten der ersten Geokodierung: Domherren_v1.geojson

Verbesserte Geokodierung basierend auf der erweiterten CSV Tabelle

Für den zweiten Geokodierungstest mussten die Eingabedaten angereichert und bereinigt werden. Um die automatische Ortszuordnung zu verbessern, wurde eine separate Tabellenspalte namens modern_region eingeführt, um anzugeben, in welchen modernen Ländern (z. B. Deutschland und Frankreich) die Orte liegen sollten. In Fällen, in denen das Land nicht klar war, wurde Europa hinzugefügt, um zumindest Orte in Übersee auszuschließen.

Im MMQGIS-Bedienfeld konnten sowohl die city als auch die country Felder nun mit Eingabedaten gefüllt werden, um bessere Geokodierungsergebnisse zu erhalten (siehe QGIS-Screenshot oben). Von den 281 Tabelleneinträgen konnten schließlich 215 mit einem eindeutigen geographischen Ort verknüpft werden. Die Einträge, die nicht geokodiert wurden, enthielten von Anfang an keine Ortsinformationen.

Darüber hinaus wurden die vier Datumsspalten (before, after, start, end), die den Zeitrahmen der Ereignisse in der ursprünglichen CSV-Tabelle angeben, zu einer einzigen Spalte display date zusammengeführt, um die spätere Erstellung einer zeitlich möglichst feinteilig kategorisierten Karte zu vereinfachen. Die detaillierteren Datumsangaben wurden jedoch für die Anzeige in den Kartenbeschriftungen beibehalten.

Darüber hinaus wurden die Häufigkeiten aller Ortsnennungen gezählt und in eine weitere zusätzliche Spalte eingetragen. Diese Angaben können als weight verwendet werden, um bei der Erstellung einer Karte festzulegen, in welcher Größe Punktgeometrien dargestellt werden sollen.

Lokalisieren aufgelöster Einrichtungen und zerstörter Gebäude

Ein Problem, das auch durch die Anreicherung der Daten nicht gelöst werden konnte, ist jedoch, dass viele frühneuzeitliche (religiöse) Einrichtungen heute nicht mehr existieren und die mit diesen Einrichtungen verbundenen Gebäude zerstört wurden. Da moderne Geokodierungs-APIs keine historischen Geodaten enthalten, müssen die Standorte solcher Orte aus Primärquellen und Sekundärwerken rekonstruiert werden. Im Fall unseres Mainzer Datensatzes konnten weder die Google- noch die Geonames-APIs die Standorte der ehemaligen Stifte St. Viktor und Mariengreden zuordnen. Die Zuordnung der ungefähren Geodaten war dank der Informationen möglich, die das Institut für Geschichtliche Landeskunde an der Universität Mainz veröffentlicht hat:

Stift St. Victor

Liebfrauen - Maria ad gradus - Mariengreden

Laden Sie gerne unsere aktualisierte Datentabelle im CSV Format herunter oder verwenden Sie den Datenexport mit Koordinaten im GeoJSON Format (v6).