Warum macht man keine t-Tests? Eine erste Antwort auf diese Frage lautet: Es wären zu viele. Um alle Paare vergleichen zu können, müßten bei 5 Gruppen 4 + 3 + 2 + 1 = 10 Tests durchgeführt werden. Bei jedem von diesen bestünde eine Irrtumswahrscheinlichkeit von beispielsweise alpha = 0.05. Bei 10 Tests wäre dann die gesamte Wahrscheinlichkeit für das fälschliche Akzeptieren eines tatsächlich nicht vorhandenen Unterschiedes (also für einen alpha-Fehler) nach folgender Formel zu berechnen:
1 - (1 - a )10 = 1 - 0.9510 = 1 - 0.599 = 0.401
Mit anderen Worten, bei so vielen Tests können schon zufällig welche signifikant sein; eine gefundene Signifikanz wäre somit schwierig zu interpretieren.
Die Varianzanalyse testet für mehr als 2 Gruppen (z.B. an Versuchspersonen) "auf einen Schlag", ob signifikante Mittelwertsunterschiede vorliegen. Dem liegen folgende Hypothesen zugrunde:
Was macht die Varianzanalyse? Sie zerlegt die Varianz in den Daten in verschiedene Bestandteile, nämlich in diejenige Varianz, die innerhalb der einzelnen Treatment-Gruppen auftritt und die Varianz zwischen den verschiendenen Gruppen (die also auf das Treatment zurückzuführen ist). Da hierbei die Varianzen betrachtet werden, wurde die Bezeichnung Varianzanalyse gewählt (auf englisch ANalysis Of VAriance oder kurz ANOVA). Die Zerlegung erfolgt nach der Formel SStot = SSbt + SSwt. Dabei ist im einzelnen:
Aus diesen Werten wird ein F-Wert berechnet: ; dabei bezeichnet dfbt die Anzahl der Freiheitsgrade zwischen den Gruppen (also die Anzahl der Faktorenstufen m - 1) und dfwt die Anzahl der Freiheitsgrade innerhalb der einzelnen Faktoren (also die Differenz aus Stichprobenumfang und Anzahl der Gruppen, n - m). Ist der F-Wert signifikant, bedeutet dies, daß sich zumindest zwei der Mittelwerte signifikant unterscheiden.
Eventuell sind im Anschluß an eine Varianzanalyse mit signifikantem Ergebnis post hoc-Tests nötig, um festzustellen, um welche Mittelwerte es sich handelt (wo genau steckt der Effekt; eventuell ist außerdem eine alpha-Korrektur durchzuführen. Mehr dazu siehe Gravetter & Wallnau). In folgenden Situationen werden solche post-hoc-Tests durchgeführt:
Bei den post-hoc-Tests werden im allgemeinen paarweise Vergleiche (der Mittelwerte) durchgeführt. Durch die wiederholte Durchführung von Signifikanztests tritt aber das eingangs erwähnte Problem "zufälliger" Signifikanzen auf; es muß eine alpha-Korrektur durchgeführt werden.
Intuitive Erklärung: Folgende Gründe lassen sich für Unterschiede zwischen zwei Meßwerten aus verschiedenen Gruppen aufführen:
Bei Unterschieden innerhalb einer Gruppe fällt dagegen die erste Erklärungsmöglichkeit weg. Der F-Bruch gibt also Auskunft über die Größe des Treatment-Effekts:
Durchführung der einfaktoriellen Varianzanalyse für unabhängige Messungen:
oneway -p -s -1 6st 12st 18st 24st 30st < rats1.dat
Folgender Output wird damit erzeugt:Name N Mean SD Min Max 6st 5 10.200 2.387 7.000 13.000 12st 5 13.400 4.336 8.000 18.000 18st 5 20.400 3.362 16.000 24.000 24st 5 16.400 3.362 12.000 20.000 30st 5 12.000 3.873 7.000 16.000 Total 25 14.480 4.874 7.000 24.000 6st |<-=====(===#===)====-> | 12st | <---========(======#======)========> | 18st | <---======(=====#====)======>| 24st | <---======(=====#====)======> | 30st |<--========(=====#=====)=======> | 7.000 24.000 Weighted Means Analysis: Source SS df MS F p Between 321.840 4 80.460 6.478 0.002 ** Within 248.400 20 12.420
An dem gerade berechnetem Beispiel soll nun kurz demonstriert werden, wie man "von Hand" eine Varianzanalyse durchführen kann:
stats mean < ratstot.dat
dm "(x1 - 14.48)^2" < ratstot.dat | stats sum
stats mean < ratsbt.dat
dm "(x1 - 14.48)^2" < ratsbt.dat | stats sum
Als Ergebnis erhält man hier 64.368. Da aber in jeder Gruppe fünf Beobachtungen vorliegen, muss man diesen Wert noch mit dem Faktor fünf multiplizieren und erhält somit das Ergebnis 321.84 für die Abweichungsquadrate "zwischen den Gruppen".
SSwt = SStot - SSbt = 570.24 - 321.84 = 248.4
probdist prob f 4 20 6.4782 = 0.001635 (
probdist rand f 4 20 100 | desc -h
.Man bekommt dann:
Midpt Freq 0.190 20 ******************** 0.571 30 ****************************** 0.951 12 ************ 1.332 8 ******** 1.713 13 ************* 2.093 7 ******* 2.474 2 ** 2.854 3 *** 3.235 2 ** 3.615 0 3.996 2 ** 4.377 0 4.757 0 5.138 0 5.518 1 *
Vergleicht man die Ergebnisse beim Selberrechnen mit denen der von UNIXSTAT ausgeführten Varianzanalyse, kommt (natürlich bis auf Rundungsunterschiede) dasselbe Ergebnis heraus:
Hausaufgabe 4 rechnen.
zurück zur Hauptseite zum Seminar "Rechnergestützte Auswertung von psychologischen Experimenten"
Anmerkungen und Mitteilungen an
rainer@zwisler.de