Zufallsvariablen und Verteilungen


Bei der Berechnung von Wahrscheinlichkeiten lag bisher i.a. ein außermathematisches Zufallsexperiment vor. Es erfolgte dann eine Übersetzung in die Mathematik durch Wahl einer passenden Menge . Unter bestimmten Annahmen konnten dann Wahrscheinlichkeiten für Untermengen von bestimmt werden.
Es zeigt sich, dass die Berechnungen zu den Zufallsexperimenten
'Würfeln mit einem Würfel' oder
'Ziehen einer Kugel mit Rücklegen aus einer Urne mit 6 Kugeln' oder
'Drehen eines Glücksrades mit 6 gleichgroßen Sektoren'
auf gleichwertige Mengen und gleiche Wahrscheinlichkeiten für Elementarereignisse führen.
In allen Fällen kann man die Elementarereignisse auf Zahlen abbilden und dann diesen Zahlen die Wahrscheinlichkeiten für die zugeordneten Elementarereignisse zuordnen.
Das haben wir im Prinzip schon oft getan bei Würfelwahrscheinlichkeiten: Für P("Augenzahl ist 3") oder P({3}) könnte man auch P(3) schreiben.

Diese strukturellen Übereinstimmungen verschiedener Zufallsexperimente und die Möglichkeit, den Elementarereignissen Zahlen zuzuordnen, zeigen einen Weg, wie man Zufallsexperimente in die mathematische Theorie der Stochastik integrieren kann. Damit gewinnt man den Anschluss an vorhandene mathematische Methoden und die Untersuchung von Zufallsvorgängen kann komplett innerhalb der Mathematik erfolgen.
Die Zuordnungsmöglichkeit von Elementarereignissen zu reellen Zahlen führt zum Begriff der Zufallsvariablen.

Zufallsvariablen

(a) Eine Zufallsvariable X ist eine reelle Funktion (!), die auf der Menge der Elementarereignisse erklärt ist.
Jedem Elementarereignis wird also eine Zahl zugeordnet. Man nennt diese Zahlen Realisierungen der Zufallsvariablen X.
An Stelle der bisher üblichen Formulierungen P({1}) oder P("die Zahl 1 würfeln") wird jetzt mit der Zufallsvariablen X geschrieben P(X=1) oder kürzer P(1), d.h. man überträgt die Wahrscheinlichkeiten von den zufälligen Elementarereignissen auf die zugehörigen Realisierungen von X (Man beachte die exotische Schreibweise P(X=1) gesprochen: „Die Wahrscheinlichkeit für die Realisierung 1 von X").

Ein beliebiges zufälliges Ereignis A ist die Vereinigung von Elementarereignissen, also liefert die Funktion X als Werte eine zugehörige Menge von reellen Zahlen. Umgekehrt bilden zu jedem reellen Zahlenintervall (,x) die Elementarereignisse, die X in dieses Intervall abbildet, ein zufälliges Ereignis A.

(b) Zu jedem Intervall (,x) gehört ein Ereignis A.
Die Wahrscheinlichkeit dieses Ereignisses A wird übertragen auf das Intervall und man schreibt anstelle von P(A) nun P(X<x) (Die Wahrscheinlichkeit, dass X einen Wert < x annimmt).

(a) und (b) ergeben zusammen die komplette Definition einer Zufallsvariablen.

In der Stochastik verwendet man oft etwas andere Bezeichnungen, als sie bei Funktionen sonst üblich sind.

Beispiel: Wird für den Würfel die übliche Zufallsvariable X gewählt, die den Augenzahlen die natürlichen Zahlen zuordnet, kann für P("Augenzahl ist < 4") nun
P(X<4) geschrieben werden.

Verteilungsfunktion

Durch Kombinationen von Wahrscheinlichkeiten der Form P(X<x) kann man alle Wahrscheinlichkeiten für alle zufälligen Ereignisse erfassen. Das gesamte Zufallsexperiment kann mithilfe von X und diesen Wahrscheinlichkeiten beschrieben werden. Eine komplette Mathematisierung von Zufallsvorgängen ist damit gelungen.

Beispiel:
Die Würfelwahrscheinlichkeit
P({3,4,5} kann in folgender Weise ausgedrückt werden:
P(X< 6) – P(X< 3)

Wegen der Bedeutung von P(X<x) wird damit eine spezielle Funktion definiert:

Die Funktion F mit F: x P(X<x) , D=IR heißt Verteilungsfunktion von X

Untersuchung einer speziellen Verteilungsfunktion:

Die Verteilungsfunktion F der Zufallsvariablen X für einen Würfel

Einige Werte:
F(1) = P(X<1) = 0
F(2) = P(X<2) = P(X=1) = P(1) =1/6
F(2,5) = P(X<2,5) = P({1,2}) =2/6
F(15) = P(X<15) = P({1,2,3,4,5,6}) =1

Der Graph der Funktion:



In der Verteilungsfunktion einer Zufallsvariablen steckt gewissermaßen die gesamte Information über einen Zufallsvorgang – hier ist es das Zufallsexperiment 'Werfen mit einem Würfel'.
Hat man zu einem Zufallsexperiment die Verteilungsfunktion ermittelt, kann man alle Wahrscheinlichkeitsberechnungen mit dieser Funktion durchführen.

Sämtliche Verteilungsfunktionen haben bestimmte, charakteristische Eigenschaften, die sich aus dem Zusammenhang mit Wahrscheinlichkeiten ergeben.

 

Allgemeine Eigenschaften von Verteilungsfunktionen

0 F(x) 1 für alle x
F(x) wächst monoton

Neben der Verteilungsfunktion kann für die bisher aufgetretenen Zufallsvorgänge auch eine zweite Funktion zur kompletten Charakterisierung des Zufallsvorgangs benutzt werden.

 

Die Wahrscheinlichkeitsfunktion

Es wird eine Zufallsvariable X mit ihren Realisierungen x gewählt. Damit wird die Wahrscheinlichkeitsfunktion P definiert:

P: x P(x), D = IR.

Der Graph der Funktion für die Zufallsvariable des Würfels

Für fast alle x ist P(x) = 0;
Nur für die x, die Realisierungen von X sind, gibt es Werte > 0.

Der Graph fällt fast überall mit der x-Achse zusammen. Nur bei den einzelnen Realisierungen 1,2,... liegen Punkte oberhalb der Achse.

Allgemeine Eigenschaften einer Wahrscheinlichkeitsfunktion

0 P(x) 1 für alle x
Die Summe aller P(x) ist 1

 

Zusammenhang zwischen Verteilungsfunktion F und Wahrscheinlichkeitsfunktion P


Durch Aufsummieren von P(x)-Werten erhält man also die Werte der Verteilungsfunktion. Als Differenz von jeweils zwei passenden F(x)-Werten erhält man einen P(x)-Wert.          

Es werden nun Verteilungsfunktionen untersucht, die für viele Anwendungsfälle benutzt werden können.

Beispiel:
X sei die Zufallsvariable des Würfels.

F(4) = P(1)+P(2)+P(3) und
P(3) = F(4)-F(3)

(Man hätte hier auch schreiben können:
P(3) = F(3,25)-F(2,9) )

Gleichverteilungen

X habe die Realisierungen x1 , x2 , ...,xn. Gilt für alle xi P(xi) = 1/n, so hat X eine Gleichverteilung mit n Realisierungen.
(X vom Würfel ist ein Beispiel mit n = 6)

 

Binomialverteilungen

p sei eine gegebene 'Grundwahrscheinlichkeit' . X habe die Realisierungen 0,1,2,...,n. Für diese Realisierungen gilt


Die restlichen Werte der Wahrscheinlichkeitsfunktion sind 0.

Binomialverteilungen treffen für Zufallsexperimente mit den folgenden Eigenschaften zu:

Es werden n stochastisch unabhängige Zufallsversuche durchgeführt.

Die Wahrscheinlichkeit, dass bei einem solchen Versuch ein bestimmtes Ereignis eintritt, sei p.

Gesucht ist die Wahrscheinlichkeit, dass bei diesen n Versuchen das Ereignis genau x-Mal eintritt.

1. Anwendungsbeispiel:
Beim 7-maligen (n = 7) Würfeln mit einem Würfel (p = 1/6) ist die Wahrscheinlichkeit dafür gesucht, dass in genau 3 (x = 3) Würfen eine "2" geworfen wird. Mit der Binomial-Wahrscheinlichkeitsfunktion ergibt sich

2. Anwendungsbeispiel:
In vielen Fällen wird die Binomialverteilung benutzt, obwohl die Voraussetzungen dafür eigentlich nur 'annähernd' gegeben sind.

In einer Schachtel mit 50000 Schrauben befinden ich 800 defekte. Zufällig werden nacheinander 50 Schrauben entnommen. Wie groß ist die Wahrscheinlichkeit, dass hierbei genau 2 defekte Schrauben gefunden werden ?

Anpassung an eine Binomialverteilung:

Als 'Grundwahrscheinlichkeit' für defekte Schrauben wird p = 800/50000 = 0,016 angenommen.

Es wird angenommen, dass p konstant bleibt (die Versuche werden als stochastisch unabhängig angenommen).

Es werden n = 20 'Versuche' unternommen. Gesucht ist die Wahrscheinlichkeit für x = 2 defekte Schrauben.

Bei genauerer Betrachtung sieht man, dass die Versuche nicht stochastisch unabhängig sind, denn die Schrauben aus der Stichprobe werden nach ihrer Überprüfung nicht zu den 50000 Schrauben zurückgelegt. Somit ändert sich der Anteil defekter Schrauben bei jeder Schraubenentnahme, die Grundwahrscheinlichkeit p ändert sich. Da diese Änderungen bei dem geringen Umfang der Stichprobe aber nur klein sind, wird dennoch mit der Binomialverteilung – und dem konstanten p = 0,016 – gerechnet.