Allgemeine Herausforderungen bei der räumlichen und raum-zeitlichen Prognose
Großmaßstäbliche, hochauflösende Kartierung unserer Umwelt und anderer räumlicher Prozesse, wie z. B. Infektionskrankheiten, anhand geowissenschaftlicher Daten aus verschiedenen Quellen (z. B. Erdbeobachtungen, Luftbilder, mobile Sensoren, Bürgerwissenschaft) sowie Verständnis der dazu beitragenden Quellen.
Allgemeine Herausforderungen, die wir lösen, sind:
• Datenassimilation und Informationsintegration:
Durch die Integration von Geodaten aus verschiedenen Quellen können Hindernisse überwunden werden, die bei der Verwendung von Daten aus einer einzigen Quelle auftreten; dies erfordert die Assimilierung von Daten mit unterschiedlichen Trägern und aus verschiedenen Quellen.
• Räumliche und räumlich-zeitliche Heterogenität:
Räumlich und räumlich-zeitlich variierende Beziehungen zwischen Prädiktoren und Reaktion. Wann und wo die Beziehung variiert, hängt möglicherweise nicht nur von der geografischen Entfernung ab, sondern auch von anderen Faktoren (z. B. ist die Beziehung zwischen der Luftverschmutzungskonzentration und der Verkehrsbelastung bei verschiedenen Kraftstoffen und Motortypen unterschiedlich). Wie könnten wir die Regionen finden, in denen sich die Beziehung ändert?
• Optimierung der räumlichen und raum-zeitlichen Vorhersagemethoden:
Es gibt eine Vielzahl von räumlichen und raum-zeitlichen Vorhersagemethoden, aber wie können wir sie am besten nutzen? Gibt es einen formalen Arbeitsablauf zur Optimierung der Methodenauswahl bei 1) unterschiedlichen Zielen (z. B. warum erstellen wir eine Karte der Luftverschmutzung, dient sie der Gesundheitsuntersuchung, der Risikobewertung oder der Stadtplanung, bleibt die optimale Methode dieselbe?) und 2) bei unterschiedlichen räumlichen und raumzeitlichen Skalen? Wie können wir die Modellauswahl und -entwicklung unter Berücksichtigung von Modellinterpretierbarkeit, Vorhersagegenauigkeit und Unsicherheitsbewertung optimieren?
• Modellvalidierung und Quantifizierung der Unsicherheit:
1) Was sind die Stärken und Grenzen der derzeitigen Methoden zur Unsicherheitsbewertung von Modellen des maschinellen Lernens?
2) Wenn wir Stichproben aus externen Testsätzen ziehen könnten, wie würden wir das Stichprobenverfahren gestalten? Wie unterscheidet sich das Stichprobenverfahren, wenn verschiedene Methoden (Geostatistik, lineare Modelle, baumbasiertes maschinelles Lernen, tiefe neuronale Netze) eingesetzt werden?
3) Könnte die Nachbarschaftsinformation von Prädiktoren zur Quantifizierung der Modellunsicherheit beitragen
|