This is an old revision of the document!
OpenStreetMap (OSM) ist ein freier Geodatensatz der durch eine global agierende Community gehalten, verwaltet und aktualisiert wird. Der Datensatz ist semantisch, geometrisch und räumlich sehr heterogen. Ursprünglich als “freies Straßennetz” gedacht, umfasst OSM heute Daten aus einer Vielzahl thematischer Bereiche auf der ganzen Welt. In diesem Projekt wird der gesamte OSM-Datensatz auf seine Eigenschaften untersucht. Ziel ist es Aussagen über die Qualität und vor allem über die Nutzbarkeit im Zusammenhang mit Anwendungsgebiet und eingesetzter Software treffen zu können.
Christopher Braune (GFZ/Cegit): cbraune@gfz-potsdam.de
Aufgaben/Ziele:
Verwendete Software:
Allgemeine Informationen zum OpenStreetMap-Projekt
Allgemeine Information zu den OSM-Daten
Datenquellen (Links):
Datenqualität ohne die Berücksichtigung der Lagegenauigkeit
Die qualitative Untersuchung soll unabhängig von der Lagegenauigkeit vorgenommen werden. Diese Herangehensweise erscheint ungewöhlich für raumbezogene Daten. Beispielsweise ist aber die Lageganauigkeit für die Nutzung in Navigationsgeräten weniger relavant. In diesem Bereich muss ohnehin die Standortgenauigkeit des eigenen GPS-Signals beachtet und Ungenauigkeiten automatisiert ausgeglichen werden. Hinzu kommt, dass kein vergleichenbaren Datensatz existiert. Es ist daher lediglich möglich Ausschnitte aus dem OSM-Datensatz auf die Lagegenauigkeit vergleichend zu untersuchen (z. B. das Starßennetz). Objekte die ausschließlich in OSM erfasst sind, bleiben somit unberücksichtigt.
Feststellung und Dokumentation der Qualität von Geodaten
Um die Qualität von Daten im Allgemeinen und die von Geodaten im Speziellen festzustellen, müssen eindeutige und aussagekräftige Kriterien definiert werden. Die ISO 19113 (2002) „Geographic information – Quality principles“ als auch die PAS 1071 (PAS… Publicly Available Specification) „Qualitätsmodell für die Beschreibung von Geodaten“ wurden zu diesem Zweck verfasst.
Ziel dieses Abschnitts ist es, Kriterien zu finden und zu definieren um die OSM-Daten bewerten zu können.
Der Vergleich zwischen der ISO 19113 (oder allgemeiner ISO 19xxx-Famile) und der PAS 1071 zeigt, dass beide Dokumente eine andere Zielstellung verfolgen. Die International Organization for Standardization (ISO) richtet den Fokus auf die Beschreibung von Geodaten und die Art und Weise der Dokumentation von Datenqualität. Die Formulierungen sind abstrakt, wenig anwendungsbezogen aber allgemein gültig. In der PAS 1071 wird der Inhalt der ISO 19113 aufgegriffen. Jedoch liegt der Fokus etwas mehr auf die Anwendung bestimmter Richtlinien. Die PAS enthält ein Schema für den Umgang mit Geodatenqualität. Als Resultat dieses Schemas wird eine Art von Geodatenqualitätskatalog definiert. Dieser hat das Ziel eine einheitliche Basis sowohl für den Nutzer als auch für den Hersteller der Geodaten zur Verfügung zu stellen. Die PAS 1071 kann als praktische Ergänzung zur ISO 19113 angesehen werden.
ANMERKUNG: Eine PAS wird durch das Deutsche Institut für Normung verabschiedet. Es handelt sich aber nicht um eine Norm! Für den Inhalt ist daher nicht das DIN sondern lediglich der Verfasser verantwortlich (im Falle der PAS 1071: CEGI Center for Geoinformation GmbH, Dortmund).
Das GDI-NI (Geodateninfrastruktur-Niedersachsen) nennt fünf Qualitätsmerkmale welche objektiv messbar sind:
FRAGE: Wie kann eine Untersuchung eines kompletten OSM-planetfiles (XML-Daten) erfolgen?
ANSATZ: osmar-package für GNU R → Definition einer bounding box nötig! Potentielle Verwendung für die Betrachtung von einzelnen Rasterzellen.
PROBLEME:
Die XML-Daten sollen mit Hilfe einer relationalen Datenbank effizienter verarbeitet, gespeichert und untersucht werden. Es wird ebenfalls möglich sein die Daten effizient zu aktualisieren.
Ziel ist eine Host-Client-Infrastruktur zu realisieren die genügend Performance für eine effiziente Analyse bietet. Die Wahl viel auf eine PostgreSQL-Datenbank mit PostGIS-Erweiterung. Diese ist frei verfügbar und unterstützt die spezifischen Eigenschaften von Geodaten (wie Geometrie und SRS).
Hardware:
Notwendige Software-Pakete - Host:
Notwendige Software-Pakete – Client:
Optionale Software-Pakete – Client:
osm2pgsql vs. osmosis Beide Tools bieten die Möglichkeit die OSM-Daten aus einem planet-file heraus in eine relationale Datenbank zu überführen. Zu diesem Zweck beinhalten beide Tools Vorlagen für Relationenschemata die zuvor in einer erstellten Datenbank erzeugt werden müssen.
Beide Tools wurden getestet. Obwohl osm2pgsql gewisse Vorteile bietet, fiel die Entscheidung zugunsten von osmosis. Die Relationenschemata von osm2pgsql wirken sich nachteilig auf den angestrebten Untersuchungsprozess aus. Eigenschaften wie user und timestamp entfallen vollständig. Dem gegenüber steht osmosis. Dieses Tool bietet insgesamt mehr Optionen und deutlich stärker normalisierte Relatinenschemata. Außerdem lehnen sich diese Schemata stärker an die Struktur der originalen OSM-Daten an, nodes, ways und relations bleiben als Typen erhalten.
Ein weiterer wichtiger Faktor ist der Umgang mit den tags. Bei osm2pgsql können die tags lediglich im sogenannten hstore Datenformat gespeichert (aktuelle Version von osm2pgsql vorrausgestzt!). Damit wird ein entsprechendes Attribut mit key⇒value-Verkettungen gefüllt. Diese Möglichkeit steht auch in osmosis zur Verfügung (erste Variante). Da jedoch die SQL-Operatoren für das hstore-Datenformat äußerst begrenzt sind, ist die zweite Variante von osmosis am besten geeignet. Die tags werden in separaten Tabellen und getrennten Attributen im string-Datenformat gespeichert. Über die osm_id können diese den eigentlichen Objekten zugeordnet werden. Nachteilig ist dadurch, dass Datenbankanfragen verschachtelter und somit komplexer formuliert werden müssen.
Stand:
Es wird nach einer vermuteten Korrelation zwischen der Bevölkerungsdichte und der OSM-Punktdichte gesucht. Die Bevölkerungsinformationen der SEDEC liegen im Rasterdatenformat vor. Sowohl die Bevölkerungsdichte als auch die absoluten Bevölkerungszahlen (Stand 2000) sind verfügbar. Mit Hilfe einer Rasterdatenverschneidung sollte es möglich sein einen Zusammenhang zwischen diesen beiden Größen herzustellen.
Um die Untersuchung durchzuführen, ist notwendig die OSM-Daten in Rasterdaten umzuwandeln. Demnach muss ein Punktdichte-Raster erzeugt werden. Die OSM-Daten werden dafür aus der PostGIS-Datenbank bezogen. Das Tabellenschema von Osmosis (Variante 2 - simple) enthält als Geometrietyp lediglich Punkte. Diese Punkte erzeugen über Relations alle anderen Geometrietypen. Für Untersuchung der möglichen Korrelation zwischen Bevölkerung und OSM-Objektdichte genügen demnach die Punkte aus der Postgis-Datenbank.
Die Rasterberechnungen sollen auf auf dem Cluster-Rechner durchgeführt werden. Als Software für diese Berechnungen wird GRASS GIS angestrebt.
Angestrebte Auswertungsverfahren:
Stand:
Was ist die “Dunkle Materie” ungetagter Geometrielemente? Wie verändert sich Diese über die Zeit? Die Bezeichnung “ungetagt” bezieht sich dabei auf die semantischen Eigenschaften von Objekten!
Datenstand: xx.02.2013 (nicht genau datiert) * OSM-points * 24,3% der Punkte enthalten keine Tags (Gesamtanzahl für Berlin-Brandenburg: 224044) * OSM-lines * 1,5% der Linien enthalten keine Tags (Gesamtanzahl für Berlin-Brandenburg: 365100) * OSM-polygons (geschlossener Linienzug) * 1,0% der Polygone enthalten keine Tags (Gesamtanzahl für Berlin-Brandenburg: 525744)
Datenstand: 18.03.2013 * OSM-points * 52,7% der Punkte enthalten keine Tags (Gesamtanzahl für Berlin-Brandenburg: 356010) * OSM-lines * 1,5% der Linien enthalten keine Tags (Gesamtanzahl für Berlin-Brandenburg: 361003) * OSM-polygons (geschlossener Linienzug) * 1,1% der Polygone enthalten keine Tags (Gesamtanzahl für Berlin-Brandenburg: 522141)
Export der “dunklen Materie” in KML/KMZ.
Datenstand: 12.04.2013 * OSM-points * 69,3% der Punkte enthalten keine Tags (Gesamtanzahl für Berlin-Brandenburg: 547411) -> Große Veränderung über die Zeit * OSM-lines * 1,5% der Linien enthalten keine Tags (Gesamtanzahl für Berlin-Brandenburg: 356026) -> Anteile nahezu identisch * OSM-polygons (geschlossener Linienzug) * 1,1% der Polygone enthalten keine Tags (Gesamtanzahl für Berlin-Brandenburg: 518480) -> Anteile nahezu identisch
Mögliche Ursachen für die “Dunkle Materie”
Aufgrund der hohen Anzahl dieser Objekte liegt die Vermutung nahe, dass es sich um einen systematischen Fehler bei der Untersuchung handelt. Die XML-Daten konnten nicht direkt untersucht werden. Daher wurden sie in ein relationales Schema überführt. Es ist möglich, dass bei dieser Konvertierung tags ignoriert wurden. Die Nutzung des QGIS Plugins erlaubt die konkatenierte Übernahme der tags in ein relationales Attribut des Typs string. Bei der Recherche bezüglich des Tools osm2pgsql wurde deutlich, dass unbekannte tags ignoriert und folglich nicht übernommen werden. Im Falle von osm2pgsql führt dies sogar zum Ausschluss des Objekts. Dieses Verhalten des QGIS Plugins konnte bisher nicht durch eine Dokumentation belegt werden.
Stand:
Untersuchung der Nutzbarkeit für verschiedene Anwendungen/Anwender oder Trennung aufgrund verschiedener Objektklassen (z. B. separaierter Untersuchung von Staatsgrenzen)
PAS 1071 (2007), Qualitätsmodell für die Beschreibung von Geodaten, CEGI Center for Geoinformation GmbH, Dortmund sowie Deutsches Institut für Normung (DIN)
ISO 19113 (2002) International Standard - Geographic information - Quality principles
GDI-NI (Geodateninfrastruktur-Niedersachsen), abgerufen: November 2013 http://www.geodaten.niedersachsen.de/portal/live.php?navigation_id=27216&article_id=91941&_psmand=28
Neis, P., D. Zielstra, and A. Zipf (2011), The Street Network Evolution of Crowdsourced Maps: OpenStreetMap in Germany 2007–2011, Future Internet, 4(1), 1–21, doi:10.3390/fi4010001. [online] Available from: http://www.mdpi.com/1999-5903/4/1/1 (Accessed 9 January 2012)
Thomas Schlesinger and Manuel J. A. Eugster, osmar: OpenStreetMap and R, September 10, 2012, preprint of the article “osmar: OpenStreetMap and R” accepted for publication on 2012-08-14 by the R-Journal.
F. Ramm, J. Topf, 2010, OpenStreetMap: Die freie Weltkarte nutzen und mitgestalten
Quantum GIS - Benutzerhandbuch, Version 1.5.0 ’Tethys’, Link: http://download.osgeo.org/qgis/doc/manual/qgis-1.5.0_user_guide_de.pdf
Zurück zur Startseite