Mittelwert, Streuung und Verteilung

Auch in natur- und ingenieurwissenschaftlicher Vorgängen ist es grundsätzlich nicht möglich, fehlerfrei zu messen. Die Abweichungen der Messwerte von den wahren Werten wirken sich auf ein Messergebnis aus, so dass dieses ebenfalls von seinem wahren Wert abweicht und einiges über den Messvorgang ausgesagt werden kann, beispielsweise ob systematische (z.B. fehlerhaftes Messgerät) oder zufällige Fehler vorliegen. Im folgenden werden einige Möglichkeiten zur Fehlerangabe beschrieben:

Betrachtung des Mittelwertes

Die einfachste Art mit unterschiedlichen Einzelergebnissen fertig zu werden, ist, ihren Mittelwert, also z.B. den Mittelwert der Eigenschaften von Molekülen, zu betrachten. Der Mittelwert einer Stichprobe x, …, xi ist definiert als das arithmetische Mittel der Stichprobenwerte. Weiterhin ist i die Anzahl der Stichproben:

oder 
Beispiel:  Drei Messwerte: x1 = 1, x2 = 2 und x3 = 3. Damit ist der Mittelwert bestimmt zu (1+2+3) : 3 = 2

Dieser Mittelwert allein ist aber häufig nicht brauchbar. Man benötigt also eine weitere Größe, die Streuung der Einzelwerte:

Die Streuung dient als Beurteilung der Treffsicherheit einer Prognose oder der Güte einer Messung (Messung von  Zuverlässigkeit und Fehleranfälligkeit, hohe Streuung bedeutet hohe Anfälligkeit).

Die Abweichungen der (Mess)Werte vieler natur- und ingenieurwissenschaftlicher Vorgänge vom Mittelwert lassen sich durch die Normalverteilung entweder exakt oder wenigstens in sehr guter Näherung durch die Normal- oder Gauß-Verteilung beschrieben.

Regeln zur Angabe von Ergebnissen

Beim Rechnen mit naturwissenschaftlichen Größen gelten Grundregeln für die Ergebnisse:

  • Die Anzahl der Nachkommastellen (besser: der zu zählenden Stellen) bestimmt die Genauigkeit des Ergebnisses, dessen letzte Stelle gerundet wird.
  • Erhält man einen Wert aus einer Multiplikation oder Division anderer Werte, so hat der Zahlenwert des Ergebnisses höchstens so viele zählende Stellen, wie der Zahlenwert mit der geringsten Anzahl zählender Stellen, sofern keine Fehlerangabe gemacht wird.

Mittelwert, Streuung und Verteilung – Testfragen/-aufgaben

1. Was ist der Mittelwert in der Statistik?

Der Mittelwert ist der Durchschnittswert einer Datenmenge. Er wird berechnet, indem man die Summe aller Werte durch die Anzahl der Werte teilt.

2. Wie kann man die Streuung in einer Statistik interpretieren?

Die Streuung gibt Aufschluss über die Verteilung der Werte. Ein hoher Streuwert bedeutet, dass die Werte stark voneinander abweichen; ein geringer Streuwert zeigt, dass die Werte eng beieinander liegen.

3. Was ist eine normalverteilte Datenmenge?

Eine normalverteilte Datenmenge hat die Form einer Glockenkurve, bei der die meisten Werte um den Mittelwert herum liegen. Die Verteilung fällt zu den beiden Enden hin ab.

4. Was ist der Median in einer Verteilung?

Der Median ist der Wert, der genau in der Mitte einer geordneten Datenreihe liegt. Es gibt also genau so viele Werte, die größer als der Median sind, wie Werte, die kleiner sind.

5. Welchen Unterschied gibt es zwischen Mittelwert und Median?

Der Mittelwert ist durch extrem hohe oder niedrige Werte beeinflussbar, der Median hingegen nicht. Deshalb ist der Median ein robusteres Maß als der Mittelwert, wenn es um die zentrale Tendenz geht.

6. Was ist der Modus in einer Verteilung?

Der Modus ist der Wert, der in einer Verteilung am häufigsten vorkommt.

7. Was ist die Varianz in der Statistik?

Die Varianz ist ein Maß für die Streuung der Datenpunkte um ihren Mittelwert. Sie zeigt, wie stark die Werte voneinander abweichen.

8. Was ist die Standardabweichung?

Die Standardabweichung ist die Quadratwurzel aus der Varianz und gibt ebenfalls die Streuung der Datenpunkte um den Mittelwert an.

9. Was ist eine bivariante Verteilung?

Eine bivariate Verteilung ist eine Art der Verteilung, bei der zwei Variablen gleichzeitig betrachtet werden. Sie zeigt also den Zusammenhang zwischen zwei Variablen.

10. Was ist ein Histogramm?

Ein Histogramm ist eine graphische Darstellung der Häufigkeitsverteilung in einem Datensatz. Es zeigt, wie oft bestimmte Werte oder Wertebereiche in der Datenmenge vorkommen.