Entscheidungen treffen
mit mathematischer Statistik


Zusammenfassung der Grundlagen

Mathematische Modelle werden in vielen Wissenschaften, in Wirtschaft, Verwaltung und Technik benutzt. Vielfach ist uns die Anwendung mathematischer Verfahren so vertraut, dass wir diese Verfahren als Teil der benutzten Wissenschaft ansehen. Beispiele dafür sind Definitionen und Zusammenhänge in der Physik wie z.B. Geschwindigkeit und Beschleunigung. Stets muss aber überprüft werden, ob die Anwendung mathematischer Verfahren tatsächlich angemessen oder passend ist. Dieselbe Situation tritt auf, wenn Verfahren der mathematischen Theorie Stochastik auf Probleme außerhalb der Mathematik angewendet werden. Dabei müssen z.B. folgende Fragen entschieden werden:
Kann eine untersuchte Größe als Zufallsvariable X angesehen werden ? Diese Frage kann eigentlich nur auf Grund unserer allgemeinen Lebenserfahrung entschieden werden (Beispiel: Würfelergebnisse).

Welche Verteilung hat die angenommene Zufallsvariable X ? Hierbei wird ebenfalls überprüft, ob nach unserer Erfahrung der untersuchte Prozess bestimmte, erforderliche Eigenschaften hat (Beispiel: Liegen die Bedingungen für eine Binomialverteilung vor ?).

Nachdem diese Fragen geklärt sind, kann man versuchen, durch Experimente Aussagen über bestimmte Parameterwerte einer Verteilung zu gewinnen. Diese Experimente bestehen oft darin, dass mithilfe einer zufälligen Stichprobe Realisierungen der Zufallsvariablen X gewonnen werden. Die Auswertung dieser Stichprobenergebnisse liefert dann (möglicherweise) die gesuchten Entscheidungen.

Die Berechtigung, aus einer endlichen Stichprobe abgesicherte Aussagen über eine unbekannte Grundwahrscheinlichkeit p einer Binomialverteilung zu treffen, liegt ebenfalls in einer grundlegenden Lebenserfahrung, die man zunächst naiv (d.h. ohne Bezug auf eine wissenschaftliche Theorie) so formulieren kann:

Werden Binomialexperimente n-fach wiederholt durchgeführt, so stabilisieren sich die relativen Häufigkeiten x/n immer näher bei einem Wert, dem (evtl. unbekannten) p. Das wird auch als empirisches Gesetz der großen Zahlen bezeichnet.
Die relative Häufigkeit kann also als Schätzung für den unbekannten p-Wert angesehen werden. Innerhalb der Stochastik kann diese Aussage in der Form der Streuungsungleichung präzisiert werden:

Es konvergiert also nicht p gegen x/n, sondern die Wahrscheinlichkeit konvergiert gegen 0, dass eineAbweichung von p zu x/n größer als (> 0, beliebig klein) auftritt. x/n konvergiert in Wahrscheinlichkeit gegen p.

Man kann also erwarten, dass die Werte x/n ‘nahe’ beim Erwartungswert p liegen.

Mit diesen Voraussetzungen und Präzisierungen zur Stabilisierung von x/n kann nun ein Entscheidungsverfahren für einen bestimmten Wert von p angegeben werden.

Ein Hypothesentest für den Wert p einer Binomialverteilung

Es wird eine Annahme für den Wert p getroffen: p=p 0. Diese Annahme heißt 0-Hypothese H0 .

Es wird ein Stichprobenumfang n gewählt.

Für die Binomialverteilung mit n und p0 wird die Wahrscheinlichkeitsfunktion (oder das Histogramm) benutzt, um ein symmetrisches Intervall um p0 zu bestimmen, so dass 95% (oder 90% oder 99%) aller x/n-Werte in dieses Intervall fallen. Damit ist die Wahrscheinlichkeit, nicht in diesen Bereich zu fallen, =1 - 95%. heißt Irrtumswahrscheinlichkeit.

Nun wird eine zufällige Stichprobe vom Umfang n genommen.

Liegt der gefundene x/n-Wert außerhalb des Intervalls um p0, so fällt er in den Ablehnungsbereich und die Hypothese H0 wird verworfen. Damit meint man, dass die Stichprobenergebnisse stark gegen die Annahme p = p0 sprechen.
(Anmerkung: Genau an dieser Stelle wird also die Stabilisierungseigenschaft (s.o.) von x/n benutzt !)
p wird einen Wert haben, der kleiner ist (wenn x/n im linken Ablehnungsteil liegt) oder größer (wenn x/n im rechten Teil des Ablehnungsbereichs liegt. Allerdings kann diese Entscheidung gegen H0 fehlerhaft sein, denn auch bei Gelten der 0-Hypothese könnte der beobachtete Wert x/n in den Ablehungsbereich fallen - mit einer Wahrscheinlichkeit von . Deshalb wird diese Wahrscheinlichkeit ja Irrtumswahrscheinlichkeit genannt. Fällt der x/n-Wert in das Intervall um p0 , so sagt man, dass der Wert mit der 0-Hypothese verträglich ist .

Das Ziel eines solchen Tests ist die Ablehnung einer Hypothese, denn nur im Ablehnungsfall gibt es eine kleine Irrtumswahrscheinlichkeit. Beim Formulieren einer 0-Hypothese sollte man das berücksichtigen.

Folgende Schritte sind zur Durchführung eines Binomialtests für p erforderlich:

1.   Es wird gesichert, dass eine Binomialverteilung vorliegt,
2.   eine 0-Hypothese für p wird formuliert,
3.   eine Irrtumswahrscheinlichkeit wird vorgegeben (0,1 0,05 oder 0,01)
4.   ein Stichprobenumfang n wird gewählt,
5.   ein Entscheidungsintervall wird berechnet,
6.   ein Stichprobenwert x/n wird gewonnen,
7.   es wird geprüft, ob die 0-Hypothese verworfen werden kann (x/n außerhalb des Entscheidungsintervalls).

Beispiel

Die Wahrscheinlichkeit für die Augenzahl 1 sollte beim Würfel 1/6 betragen.
Bei einem bestimmten Würfel hat man Anlass zu vermuten, dass diese Wahrscheinlichkeit nicht 1/6 ist. Zur Überprüfung wird ein Hypothesentest durchgeführt.

1.   Man kann von einer Binomalverteilung für X ausgehen, wenn mehrmals gewürfelt wird.
2.   Man vermutet, dass p ungleich 1/6 gilt, also wird gesetzt H0: p = 1/6. (!)
3.   Als Irrtumswahrscheinlichkeit wird gesetzt = 0,01.
4.   Als Stichprobenumfang wird gewählt n = 300.
5.   Mit Derive und Probieren bestimmt man das Entscheidungsintervall:

Es sind die Werte x für die Binomialverteilung berechnet worden. Der Ablehnungsbereich ist für diese x gegeben durch alle x<50-16 und alle x>50+16. Für x/n erhält man also die Intervalle x/n<34/300 und x/n>66/300.

6. und 7.   Eine Stichprobe liege vor mit x=30, also x/n=30/300. Der Wert fällt in das untere Ablehnungsintervall. Die 0-Hypothese wird mit der Irrtumswahrscheinlichkeit 0,01 abgelehnt.

Man entscheidet mit der Irrtumswahrscheinlichkeit , dass der Würfel nicht korrekt ist.

Einseitige und zweiseitige Tests

Der obige Test ist ein zweiseitiger Test, da Abweichungen von H0 (p = p0) nach beiden Seiten (zu kleiner oder zu großer x/n-Wert) zur Ablehnung von H0 führen können. Ist man nur daran interessiert zu prüfen, ob die Abweichung in einer Richtung zu groß ist, spricht man von einem einseitigen Test.

Beispiel für einen einseitigen Test
Jemand behauptet, Ergebnisse von Münzwürfen vorhersagen zu können. Man wird sagen, dass er dazu deutlich mehr richtige Vorhersagen machen muss, als sich bei zufälliger Vorhersage ergeben würden. Bei zufälliger Vorhersage wird man mit der Wahrscheinlichkeit p=1/2 die richtige Vorhersage treffen, d.h. x/n wird bei großem n nahe bei 1/2 liegen.

Setzt man (ziemlich willkürlich) für einen Hellseher eine Vorhersagewahrscheinlichkeit von 0,7 an, so kann in einem Münzwerfen-Experiment getestet werden, ob ein Hellseher am Werk ist:

Das Münzenwerfen ist ein Bernoulliexperiment
wird als 0.01 gewählt
Es werden n = 1000 Versuche gemacht
Als H0 wird p =0,7 gewählt
Zum Ablehnungsbereich für H0 gehören alle x, die kleiner sind als ein x-Wert a, so dass gilt P(X < a) < 0,01 bei Annahme von p = 0,7.

Derive liefert:

Ein allgemeinerer Ansatz:
Bei diesem Ansatz geht man vom ‘normalen’ Menschen aus, der mit der Wahrscheinlichkeit 1/2 richtige Vorhersagen machen wird.

Es wird H0 (p = 1/2 ) gesetzt.
Als Ablehnungsbereich werden die größten x-Werte gewählt, d.h. es werden so viele der größten x-Werte zusammengefasst, bis ihre Wahrscheinlichkeit > ist. Fällt ein Wert in diesen Bereich, kann die Hypothese p =1/2 mit der Irrtumswahrscheinlickeit abgelehnt werden. In diesem Fall kann man hellseherische Fähigkeiten akzeptieren.

Mit Derive kann die Grenze des Ablehnungsbereichs berechnet werden:

Es ergibt sich ein überraschend niedriger a-Wert.