Benutzer-Werkzeuge

Webseiten-Werkzeuge


javagraticule3d:least-squares-adjustment:outliers

Prüfung auf Modellstörungen

Zum Aufdecken von Modellstörungen nutzt JAG3D zwei Teststrategien. Zum einen wird mit Tprio eine auf den a-priori Varianzfaktor bezogene Testgröße bestimmt und zum anderen mit Tpost eine a-posteriori varianzbezogene Testgröße zur Prüfung ermittelt. Beide Verfahren sind als allgemeine multiple Tests formuliert, deren kritische Werte wahlweise nach der B-Methode oder mittels Šidák-Korrektur für Fisher-verteilte Testgrößen aufeinander abgestimmt werden.

Eine allgemeine Prüfung des funktionalen und stochastischen Modells erfolgt über den Globaltest TG

Eq: T_{G} = \frac{\hat\sigma_0^2} {\sigma_0^2} \sim F_{f,\infty}

mit der zu prüfenden Nullhypothese

Eq: \hat\sigma_0^2  \leq \sigma_0^2 | H_0

und der Alternativhypothese

Eq: \hat\sigma_0^2  \gt \sigma_0^2 | H_A

Da es sich bei diesem Test nur um eine globale Prüfung des mathematischen Modells handelt, können im Falle einer Verwerfung nur allgemeine Gründe wie

  • Vorhandensein von Beobachtungsfehlern (Ausreißern),
  • Fehlerhaftes funktionales Modell oder
  • Stochastisches Modell zu optimistisch

genannt werden. Eine konkrete Lokalisierung von möglichen Ausreißern ist hingegen nicht möglich, sodass das Durchführen von Einzeltests unumgänglich ist und daher primär zur Analyse und Bewertung herangezogen werden sollte.

Die i-te a-priori bezogene Testgröße ergibt sich für den m-dimensionalen multiplen Test aus

Eq: T_{prio,i} = \frac{\mathbf{\nabla_i^TQ_{\nabla\nabla,i}^{-1}\nabla_i}} {m\sigma_0^2} \sim F_{m,\infty}

und für den a-posteriori bezogenen Test aus

Eq: T_{post,i} = \frac{\mathbf{\nabla_i^TQ_{\nabla\nabla,i}^{-1}\nabla_i}} {m\hat{\sigma'_i}^2} \sim F_{m,f-m}

Der geschätzte a-posteriori Varianzfaktor der Gesamtausgleichung ist aufgrund einer Modellstörung verzerrt. Aus diesem Grund wird die Verbesserungsquadratsumme Ω um den Einfluss der möglichen Modellstörung reduziert.

Eq: \hat{\sigma'_i}^2 = \frac{\Omega - \mathbf{\nabla_i^TQ_{\nabla\nabla,i}^{-1}\nabla_i}} {f-m}

Die zur i-ten Beobachtung geschätzte Modellstörung ist hierbei i mit zugehöriger Kofaktormatrix Q∇∇,i.

Analog zum Globaltest lassen sich auch die geschätzten Varianzfaktoren der Beobachtungsgruppen, die aus der Varianzkomponentenschätzung resultieren, auf Modellkonformität prüfen. Anstelle des a-posteriori Varianzfaktors der Gesamtausgleichung wird hierbei auf den geschätzten Varianzfaktor der jeweiligen Gruppe zurückgegriffen.

Hinweis: In der geodätischen Literatur wird häufig für den a-priori Einzeltest die normierte Verbesserung (NV) und für den a-posteriori Einzeltest der t-Test beschrieben. Hierbei handelt es sich um Spezialfälle der in JAG3D implementierten Testverfahren für m=1. Eine Übertragung kann jedoch aus den Beziehungen der Fisher-Verteilung zur Normal- bzw. Student-t-Verteilung leicht abgeleitet werden für m=1:

Eq: NV = \sqrt{T_{prio}}

bzw.

Eq: t-Test = \sqrt{T_{post}}

Für m>1 gilt dies jedoch nicht!

Teststatistik

Soll die Irrtumswahrscheinlichkeit α nicht auf alle Teststatistiken einheitlich angewendet werden, so unterstützt JAG3D wahlweise eine Anpassung von α mittels Baardas B-Methode oder der Šidák-Korrektur.

Abstimmung von Einzel- und Globaltest mittels B-Methode

Das Konzept zur Abstimmung von Global- und Einzeltest geht auf die Postulate von Baarda (1968) zurück. Allgemein gilt für die Abstimmung zweier (oder mehrerer) Teststatistiken, dass beim Zutreffen der Alternativhypothese die abgestimmten Teststatistiken mit gleicher Wahrscheinlichkeit verworfen werden.

Eq: \lambda(\alpha_1, 1-\beta_1, 1, k_1) = \lambda(\alpha_2, 1-\beta_2, 2, k_2) = ... = \lambda(\alpha_f, 1-\beta_f, f, k)

Die Abstimmung basiert auf einer einheitlichen Testgüte β1= β2= … = βf, weshalb diese Methode in der Literatur auch als B-Methode (bzw. β-Methode) bezeichnet wird. Werte für den Nichtzentralitätsparameter λ bei unterschiedlichen Freiheitsgraden f und Irrtumswahrscheinlichkeiten α können für k = ∞ u.a. Nomogrammen aus Baardas Arbeiten entnommen oder über Online-Rechner ermittelt werden.

Bei der Netzausgleichung in JAG3D erfolgt die Abstimmung aller kritischer Werte wahlweise auf den eindimensionalen a-priori varianzbezogenen Test Kprio,ṁ=1,k=∞ oder dem Globaltest Kglobal = Kprio,ṁ=f,k=∞ der Fisher- bzw. F-Verteilung. Durch Vorgabe einer Irrtumswahrscheinlichkeit α und einer Teststärke 1-β liegt der Nichtzentralitätsparameter λ fest, sodass α(ṁ,m) auf alle übrigen m-dimensionalen a-priori und a-posteriori bezogenen kritischen Werte geschlossen werden kann.

Eq: \alpha(m,k)=\alpha(\alpha_{\dot m},1-\beta,\dot m,\infty,m,k)

Für die Abstimmung auf den Individualtest ist ṁ=1 zu setzen und bei der Abstimmung auf den Globaltest ist ṁ=f.

Šidák-Korrektur

Beim Durchführen des klassischen Datasnoopings wird das Beobachtungsmaterial (die Stichprobe) parallel auf eine Reihe von Hypothesen überprüft. In der Statistik spricht man in diesem Fall von einem multiplen Testproblem. Dies führt zur sogenannten Alphafehler-Kumulierung, dem Anstieg der Wahrscheinlichkeit für einen Fehler 1. Art. Mittels der Šidák (1967)-Korrektur

Eq: \alpha_{lokal}=1-(1-\alpha_{global})^{1/p}

lässt sich die Irrtumswahrscheinlichkeit der gesamten Hypothesenfamilie αglobal auf die einzelnen lokalen Hypothesen αlokal portionieren. Hierbei entspricht p der Anzahl der Hypothesen. In JAG3D ergibt sich p aus der Anzahl aller prüfbaren Beobachtungen und dem Globaltest. Eine Beobachtung gilt als prüfbar, wenn sie einen Redundanzanteil von r>0 aufweist. Durch Vorgabe eines αlokal und Umkehrung der Šidák-Korrektur lässt sich wahlweise auch das globale αglobal-Nivau ableiten.

Der Nichtzentralitätsparameter λ wird durch das vorgegebene α und β festgelegt und analog zum ermittelten αlokal einheitlich bei allen m-dimensionalen Teststatistiken zugrunde gelegt. Hierdurch ändert sich die Testgüte der einzelnen Teststatistiken in Abhängigkeit der Freiheitsgrade m und k.

Eq: \beta(m,k)=\beta(\beta,\lambda,p,\infty,m,k)

Keine Abstimmung

Erfolgt keine Abstimmung zwischen den Teststatistiken, so wird die vorgegebene Irrtumswahrscheinlichkeiten α und die Teststärke 1-β auf alle Hypothesen einheitliche angewendet. Der Nichtzentralitätsparameter λ

Eq: \lambda(m,k)=\lambda(\alpha,1-\beta,m,k)

hängt hierbei von den Freiheitsgraden m und k der jeweiligen Teststatistik ab.

Dimensionen der Teststatistik

Die Irrtumswahrscheinlichkeiten, die Macht des Tests und die Quantile der Teststatistik werden in Abhängigkeit der beiden Freiheitsgrade m und k auf der Ergebnisseite des Dateneditors und im Standardreport ausgegeben. Die nachfolgende Tabelle weist den einzelnen Beobachtungstypen den entsprechenden m-dimensionalen Test zu.

m Typ
1 Terrestrische Beobachtungen, Höhenpunkte
2 2D-GNSS-Basislinien, Lagepunkte
3 3D-GNSS-Basislinien, Raumpunkte

Der Freiheitsgrad k gibt an, ob es ein a-priori varianzbezogenen Test ist (k = ∞) oder ein a-posteriori varianzbezogenen (k = f-m).

Analog zum globalen Test werden auch die einzelnen Varianzfaktoren der Beobachtungsgruppen, die aus der Varianzkomponentenschätzung resultieren, auf Modellverträglichkeit geprüft. Hierzu wird der Redundanzanteil der jeweiligen Gruppe (m = rG, k = ∞) genutzt.

javagraticule3d/least-squares-adjustment/outliers.txt · Zuletzt geändert: 06.09.2014 13:13 von Michael Loesler