Zweifaktorielle Varianzanalyse

Folgende Konzepte sollten zu diesem Zeitpunkt bekannt sein:

Terminologie: Faktor, Stufen eines Faktors, abhängige Variable.

Es sollte bereits eine einfaktorielle Varianzanalyse für unabhängige Gruppen durchgeführt worden sein (oneway).

Kurz wiederholen:

Warum nicht multiple t-Tests? Zufällige Signifikanzen, da sehr viele Tests.

Bedeutung eines signifikanten F-Wertes? Mindestens zwei Gruppenmittelwerte unterscheiden sich signifikant.

Post-hoc-Tests? Welche Gruppen tragen gegebenenfalls zu einem signifikanten Ergebnis bei?

Aufspaltung der Gesamtvarianz?

Ein typisches zweifaktorielles Design

Bisher lag immer eine unabhängige Variable in verschiedenen Ausprägungen (Faktorstufen) vor. Beispiel rats.dat. Fragen:

Was ist der Faktor? Dauer der Futterdeprivation.

Was sind dessen Stufen? 6, 12, 18, 24 und 30 Stunden.

Jetzt betrachten wir den Fall mit zwei unabhängige Variablen: Beispiel: Wie wirkt das Lehrprogramm Sesame Street. Die beiden unabhängigen Variablen

Regelmäßiges Schauen von Sesame Street (Ausprägungen Ja und Nein)

Sozioökonomischer Status (Ausprägungen Hoch und Niedrig)

sollen auf die abhängige Variable "Anzahl der gelernten Buchstaben" wirken.

Es wäre auch möglich, den Einfluß dieser beiden Faktoren in getrennten Studien zu untersuchen. Ein zweifaktorielles Design bietet aber zwei wesentliche Vorteile:

Ökonomie: Man benötigt weniger Versuchspersonen, da man bei jeder VP gleich zwei Variablen erheben kann.

Erkennen von Interaktionen: Nur durch gleichzeitiges Betrachten läßt sich feststellen, ob sich zwei Variablen gegenseitig beeinflussen (Vorliegen von Wechselwirkungen).

Folgendes Ergebnis für unser oben genanntes Beispiel wäre möglich:

Hier liegen also eigentlich mehrere Graphen (einer für die hohe und einer für die niedrige soziale Schicht; zusätzlich noch einer für alle zusammen) in einem vor. Fragen:

Faktoren?

Stufen?

Abhängige Variable?

Jetzt lassen sich folgende drei Fragen beantworten:

Gibt es einen Haupteffekt von Faktor A (Schauen von Sesamstraße)? () Im Klartext: Gibt es Unterschiede zwischen den Stufen von Faktor A, wenn ich über die Stufen von Faktor B mittele (hat also das Lernprogramm einen Effekt, unabhängig davon, aus welcher Schicht der Betrachter kommt)? Antwort: Ja (die mittlere Linie im Graph steigt).

Gibt es einen Haupteffekt von Faktor B (sozioökonomischer Status)? () Im Klartext: Gibt es Unterschiede zwischen den Stufen von B, wenn ich über die Stufen von A mittele (also einen Einfluß der sozialen Schicht alleine)? Antwort: Ja (die B₂ Kurve liegt immer über der B₁-Kurve).

Gibt es eine AxB-Wechselwirkung? (H₀: Der Effekt des Faktors B hängt nicht von der Stufe des Faktors A ab und umgekehrt) Allgemeiner Merksatz: Hängt der Effekt des einen Faktors davon ab, auf welcher Stufe des anderen Faktors ich mich gerade befinde? Hier: Hängt der Effekt des Lehrprogrammes Sesame Street davon ab, aus welcher sozialen Schicht die betrachtenden Kinder sind? Antwort: Ja (die Geraden würden sich bei Verlängerung schneiden; aber aus dem Graph nicht sicher zu entnehmen, da ja die eingezeichneten Punkte mit einem Standardfehler behaftet sind. Darum: Varianzanalyse rechnen).

Verständnisfrage: Wie sähe der Graph aus, wenn Schichtzugehörigkeit keinen Einfluß auf den Effekt des Programms hätte? Antwort: Linie für hohe und niedrige Schicht wären gleich.

Wie wird hier die Gesamtvarianz aufgeteilt?

SS_Total

SS_WT
SS_BT

SS_A
SS_B
SS_AxB

Die Unterteilung der Gesamtvarianz SS_Total in die Varianz innerhalb der Gruppen SS_WT und die Varianz zwischen den Gruppen SS_BT bleibt so wie bei der einfaktoriellen Varianzanalyse; der Treatmenteffekt wird jedoch weiter aufgegliedert in die Varianzen SS_A , SS_B und SS_AxB.

Daraus ergeben sich drei F-Werte: F_A, F_B und F_AxB. Diese sind alle auf Signifikanz zu prüfen.

Was braucht das Programm ANOVA?

Es werden alle Daten benötigt sowie die Informationen darüber, in welche Zelle des Designs das jeweilige Datum gehört (mit man anova genauer). Das Programm bestimmt dann selbst, ob die Daten konsistent eingegeben wurden (keine Leerzeilen) und welche Art der Varianzanalyse die richtige ist (je nachdem, ob ein Design mit oder ohne Meßwiederholungen (between and within subjects design) vorliegt, muß nämlich unterschiedlich gerechnet werden).

Von Meßwiederholung spricht man dann, wenn von der selben Versuchsperson mehrere Daten erhoben werden; der Faktor Versuchsperson wird dann von anova als RANDOM klassifiziert, der wiederholt gemessene Faktor als WITHIN und der Faktor, der zwischen den Versuchspersonen unterschiedlich ist, als BETWEEN. Diese Einteilung übernimmt das Programm anova selbstständig aufgrund der in den Daten enthaltenen Versuchspersoneninformation (üblicherweise steht deshalb in der ersten Spalte ein Versuchspersonencode, also eine Identifikation der Versuchsperson).

Ein Beispiel für eine Varianzanalyse mit Meßwiederholung wird später folgen (wahrscheinlich erst in der nächsten Stunde).

Beispiel für eine 2x3-ANOVA

Es geht um folgendes Problem: Wie wirken drei verschiedene Medikamente bei zwei Kategorien von Patienten, um psychotische Symptome zu reduzieren? Abhängige Variable ist das Rating der Verbesserung des Patienten; unabhängige Variablen sind:

Faktor A: Patientengruppe (A₁: schizophren; A₂: depressiv);

Faktor B: Medikament (B₁: Medikament1; B₂: Medikament2; B₃: Medikament3).

Die dazugehörigen Daten sind in der Datei drugs.dat zu finden. Zuerst sollte man sich diese Datei mal mit type drugs.dat | more ansehen; man erhält:

1       schizo  med1    8    
2       schizo  med1    4
3       schizo  med1    0
4       depr    med1    14
5       depr    med1    10
6       depr    med1    6
7       schizo  med2    10
8       schizo  med2    8
9       schizo  med2    6
10      depr    med2    4
11      depr    med2    2
12      depr    med2    0
13      schizo  med3    8
14      schizo  med3    6
15      schizo  med3    4
16      depr    med3    15
17      depr    med3    12
18      depr    med3    9

Die vier Spalten sind folgendermaßen zu interpretieren:

vp: Random Faktor, z.B. Patientennummer;

diag: Label, das die Stufe des Faktors A angibt;

med: Label, das die Stufe des Faktors B angibt;

bess: Datum, also Wert der abhängigen Variable.

Jetzt sollen die Dateien anova.exe und drugs.dat auf g: kopiert werden. Die Varianzanalyse kann dann durch die Eingabe der folgenden Zeile durchgeführt werden:

anova vp diag med bess < drugs.dat

Die vier Argumente, mit denen das Programm anova aufgerufen wird, geben die Bezeichnungen an, die für die Spalten des Outputfiles verwendet werden sollen (wie sollen die Variablen vom Programm bezeichnet werden?).

anova liefert dann folgenden Output:

SOURCE: grand mean
diag    med        N       MEAN         SD         SE
                  18     7.0000     4.3114     1.0162
 
SOURCE: diag 
diag    med        N       MEAN         SD         SE
schizo             9     6.0000     3.0000     1.0000
depr               9     8.0000     5.3151     1.7717
 
SOURCE: med 
diag    med        N       MEAN         SD         SE
        med1       6     7.0000     4.8580     1.9833
        med2       6     5.0000     3.7417     1.5275
        med3       6     9.0000     4.0000     1.6330
 
SOURCE: diag med 
diag    med        N       MEAN         SD         SE
schizo  med1       3     4.0000     4.0000     2.3094
schizo  med2       3     8.0000     2.0000     1.1547
schizo  med3       3     6.0000     2.0000     1.1547
depr    med1       3    10.0000     4.0000     2.3094
depr    med2       3     2.0000     2.0000     1.1547
depr    med3       3    12.0000     3.0000     1.7321
 
FACTOR:         vp       diag        med       bess 
LEVELS:         18          2          3         18
TYPE  :     RANDOM    BETWEEN    BETWEEN       DATA
 
SOURCE                SS     df             MS         F      p
===============================================================
mean            882.0000      1       882.0000    99.849  0.000 ***
v/dm            106.0000     12         8.8333
 
diag             18.0000      1        18.0000     2.038  0.179 
v/dm            106.0000     12         8.8333
 
med              48.0000      2        24.0000     2.717  0.106 
v/dm            106.0000     12         8.8333
 
dm              144.0000      2        72.0000     8.151  0.006 **
v/dm            106.0000     12         8.8333

Es ergaben sich also die folgenden Gruppenmittelwerte:

	med1	med2	med3	Mittel_med
schizophren	4	8	6	6
depressiv	10	2	12	8
Mittel_med	7	5	9	7

Graphisch läßt sich dieser Zusammenhang folgendermaßen darstellen:

Feststellung einer Interaktion: Folgender Teil des Outputs bezieht sich auf die Interaktion der beiden Faktoren diag und med (deshalb auch die Abkürzung dm):

dm 144.0000 2 72.0000 8.151 0.006 **

v/dm 106.0000 12 8.8333

Es liegt eine signifikante Wechselwirkung vor: F(2;12) = 8.151, p < 0.01 (nämlich 0.006). Die Freiheitsgrade für den F-Wert lassen sich folgendermaßen erläutern (p = Anzahl der Faktorstufen A; q = Anzahl der Faktorstufen B; N = Stichprobenumfang):

2: df_AxB = (p - 1)(q - 1)
12: df_within = N- p * q

Graphisch läßt sich die Interaktion auch zeigen: Die Differenz der Mittelwerte der schizophrenen Gruppe (6) und der depressiven Gruppe (8) beträgt -2. Wenn sich alle drei Medikamente bei den verschiedenen Krankheiten gleich auswirken, muß jeweils (also Differenz durch Anzahl der Gruppen teilen) von den Gruppenmittelwerten für Medikament1, Medikament2 und Medikament3 abgezogen werden. Es ergibt sich daraus folgende Tabelle:

	med1	med2	med3	Mittel_med
schizophren	7 - 1 = 6	5 - 1 = 4	9 - 1 = 8	6
depressiv	7 + 1 = 8	5 + 1= 6	9 + 1 = 10	8
Mittel_med	7	5	9	7

In dieser Tabelle stehen die Zellenmittelwerte, wenn der Faktor A (Patientengruppe) auf allen Stufen des Faktors B (Medikation) gleich wirken würde. In diesem Fall würde keine Interaktion der Faktoren vorliegen, was man auch an den parallelen Geraden in der graphischen Darstellung sieht:

Nebenbemerkung: Wie kann ich die SS_AxB berechnen? Die SS_AxB läßt sich als Summe der quadrierten Abweichungen der erwarteten Zellenwerte (repräsentiert durch die erwarteten Zellenmittelwerte in der zweiten Tabelle) von den tatsächlichen Zellenwerten berechnen:

SS_AxB = 3 * (6 - 4)² + 3 * (4 - 8)² + 3 * (8 - 6)² + 3 * (8 - 10)² + 3 * (6 - 2)² + 3 * (10 - 12)² =

= 144

Fortsetzung der zweifaktoriellen Varianzanalyse
In der Datei develop.dat sind Daten enthalten, mit denen sich eine Varianzanalyse mit Meßwiederholung demonstrieren läßt; diese Datei soll gelesen werden. Das Datenfile develop.dat sieht folgendermaßen aus:

Klaus		niedrig 63		
Gottfried	niedrig 210		
Erika		niedrig 94		
Judith		niedrig 219		
Miriam		niedrig 54		
Peter		niedrig 120		
Elisabeth	niedrig 195		
Klaus		mittel  112		
Gottfried	mittel  73		
Erika		mittel  314		
Judith		mittel  232		
Miriam		mittel  396		
Peter		mittel  352		
Elisabeth	mittel  409   
Klaus		hoch   	39
Gottfried	hoch   	80
Erika		hoch   	83
Judith		hoch   	115
Miriam		hoch   	76
Peter		hoch   	100
Elisabeth	hoch   	206

Der Name am Anfang jeder Zeile steht dort, um die jeweilige Person identifizierbar zu machen.

Für eine einfaktorielle Varianzanalyse mit Meßwiederholung muß das Programm anova verwendet werden (oneway ist nicht geeignet, da Meßwiederholung vorliegt). Der Vorteil einer Varianzanalyse mit Meßwiederholung besteht darin, daß die Varianz aufgrund individueller Unterschiede herausfällt (da ja für jede Person alle Meßwerte erhoben werden). Man betrachte dazu beispielsweise folgende Zeilen, in denen der erste Wert für die Bedingung niedrig, der zweite Wert für die Bedingung mittel und der dritte Wert für die Bedingung hoch (bei dem Faktor Komplexitätsgrad) steht:

Klaus: 63 - 112 - 39
Peter: 120 - 352 - 100

Beide Personen betrachten den mittleren Komplexitätsgrad am längsten; es liegen aber große Unterschiede in den absoluten Werten vor. Diese Unterschiede gehen alle in die SS_within ein. Bei einem within-subject-design wird diese Quelle der Varianz aus dem Fehlerterm herausgenommen; die Varianzen unterteilen sich dann folgendermaßen:

SS_total

SS_BT
SS_WT

~~SS_{betweenSubjects}~~ (fällt weg, erscheint auch nicht im Nenner des F-Bruchs)
SS_error = SS_WT - SS_{betweenSubjects}

Das Kommando

anova kid level time < develop.dat

liefert folgenden Output:

SOURCE: grand mean
level      N       MEAN         SD         SE
          21   168.6667   115.6137    25.2290
 
SOURCE: level 
level      N       MEAN         SD         SE
niedrig    7   136.4286    70.6136    26.6894
mittel     7   269.7143   134.8292    50.9606
hoch       7    99.8571    52.3559    19.7887
 
FACTOR:        kid      level       time 
LEVELS:          7          3         21
TYPE  :     RANDOM     WITHIN       DATA
 
SOURCE                SS     df             MS         F      p
===============================================================
mean	     597417.3333      1    597417.3333    52.022  0.000 ***
k/	      68903.3333      6     11483.8889
 
level  	     111892.6667      2     55946.3333     7.758  0.007 **
lk/	      86534.6667     12      7211.2222

Es ist zu sehen, daß das Programm anova den Faktor level korrekt als within-subjects identifiziert hat. Es besteht außerdem die Möglichkeit, daß ein Faktor within subjects und ein anderer between subjects variiert (z.B. bei Einführung einer weiteren Altersgruppe in develop.txt).

Hausaufgabe: hausauf5.txt bearbeiten.

zurück zur Hauptseite zum Seminar "Rechnergestützte Auswertung von psychologischen Experimenten"

Anmerkungen und Mitteilungen an

rainer@zwisler.de

Zweifaktorielle Varianzanalyse

Ein typisches zweifaktorielles Design

Wie wird hier die Gesamtvarianz aufgeteilt?

Was braucht das Programm ANOVA?

Beispiel für eine 2x3-ANOVA

Last modified 11-21-98