Besprechung der Übungsklausur, Teil 1:

  1. Zusammenhang gibt zwischen Extroversion und Zigarettenrauchen: Zuerst erstellt man eine Datei, in der die genannten Daten enthalten sind. Hier heißt sie ueb1_1.dat und sieht folgendermaßen aus:
    extra keine 50
    extra eine  12
    extra mehr  28 
    intro keine 50
    intro eine   8
    intro mehr   2 
    Die Variable Persönlichkeit besitzt nur nominales Niveau; bei den abhängigen Variablen handelt es sich um Häufigkeiten. Deshalb ist hier der Chi-Quadrat-Unabhängigkeitstest anzuwenden, um feststellen zu können, ob die beiden Variablen Persönlichkeit und Zigarettenkonsum voneinander abhängen. Die Nullhypothese H_0 ist dabei, daß das Rauchverhalten unabhängig von der Persönlichkeitsstruktur sei. Die Kommandozeile
     contab < ueb1_1.dat 
    liefert folgendes Ergebnis:
    FACTOR:          A          B       DATA 
    LEVELS:          2          3        150 
    
    A          count
    extra         90
    intro         60
    Total        150
    NOTE: Yates' correction for continuity applied
    	chisq       5.606667     df   1      p  0.017892
    
    B          count
    keine        100
    eine          20
    mehr          30
    Total        150
    	chisq      76.000000     df   2      p  0.000000
    
    SOURCE: A B 
               keine    eine    mehr  Totals
    extra         50      12      28      90
    intro         50       8       2      60
    Totals       100      20      30     150
    Analysis for A x B:
    	chisq      18.055556     df   2      p  0.000120
    	Cramer's V                              0.346944
    	Contingency Coefficient                 0.327777 
    Wichtig ist dabei insbesondere der Ausdruck chisq = 18.055556; d.h. die Nullhypothese muß abgelehnt werden, da die Wahrscheinlichkeit für sie p < 0.001 ist. Die Persönlichkeitsstruktur hat also einen Einfluß auf das Rauchverhalten.

  2. Zusammenhang zwischen Rauchgewohnheiten und abschreckenden Filmen: Es soll getestet werden, ob der gezeigte Film auch tatsächlich abschreckend auf die Raucher wirkt. Dazu muß man erst mal eine Datendatei im richtigen Format erzeugen. Ich nenne sie ueb1_2.dat; ihr Inhalt lautet:
    19                 15
    22                  7
    32                 31
    17                 10
    37                 28
    20                 12
    23                 23
    24                 17
    28                 19
    21                 24
    15                 11
    18                 16
    Weil vor und nach Betrachten des Films Datenpunkte erhoben werden, handelt es sich um eine abhängige Stichprobe. Falls die Daten metrisch sind, muß der t-Test für abhängige Stichproben eingesetzt werden. Dies geht folgendermaßen:
     pair < ueb1_2.dat 
    Dieses Kommando erzeugt folgenden Output:
    Analysis for 12 points:
                             Column 1         Column 2       Difference
    Minimums                  15.0000           7.0000          -3.0000
    Maximums                  37.0000          31.0000          15.0000
    Sums                     276.0000         213.0000          63.0000
    SumSquares              6806.0000        4395.0000         595.0000
    Means                     23.0000          17.7500           5.2500
    SDs                        6.4526           7.4727           4.9013
    t(11)                     12.3476           8.2283           3.7106
    p                          0.0000           0.0000           0.0034
    
         Correlation        r-squared            t(10)                p
              0.7617           0.5802           3.7174           0.0040
           Intercept            Slope
             -2.5382           0.8821
    Man erhält also als Ergebnis t(11) = 3.71 und p = 0.0034. Geht man dagegen von ordinalen Daten aus, muß ein nichtparametrischer Test eingesetzt werden. Bei dem nichtparametrischen Test kann beispielsweise derjenige nach Wilcoxon angewandt werden, der mit dem Kommando rankrel durchgeführt wird:
     rankrel < ueb1_2.dat 
    Der auf diese Weise erzeugte Output sieht folgendermaßen aus:
                 N      Min      25%   Median      75%      Max
    Cond-1      12    15.00    18.50    21.50    26.00    37.00
    Cond-2      12     7.00    11.50    16.50    23.50    31.00
    Total       24     7.00    15.50    19.50    24.00    37.00
    
    Binomial Sign Test:
    	Number of cases Cond-1 is above Cond-2:  10
    	Number of cases Cond-1 is below Cond-2:   1
    	One-tail probability (exact)            0.005859
    
    Wilcoxon Matched-Pairs Signed-Ranks Test:
        Comparison of Cond-1 and Cond-2
    	T (smaller ranksum of like signs)       3.000000
    	N (number of signed differences)       11.000000
    	z                                       2.622870
    	One-tail probability approximation      0.004360
    	NOTE: Yates' correction for continuity applied
    	Check a table for T with N = 11
    
    Friedman Chi-Square Test for Ranks:
    	Chi-square of ranks                     6.750000
    	chisq       6.750000     df   1      p  0.009375
    	Check a table for Friedman with N = 12
    
    Spearman Rank Correlation (rho) [corrected for ties]:
    	Critical r (.05) t approximation        0.575983
    	Critical r (.01) t approximation        0.707888
    	rho                                     0.727273
    Hier erhält man somit einen z-Wert von 2.62; die Wahrscheinlichkeit dafür, daß der Mittelwertsunterschied zufällig zustande kan, beträgt nur p = 0.0044.

    Bonusfrage: Wie hoch ist die Rangkorrelation nach Spearman zwischen den beiden Wertepaaren? Antwort: rho = 0.73. Was bedeutet dies? Etwa die Hälfte der Varianz im Rauchverhalten läßt sich durch das Betrachten oder Nicht-Betrachten des abschreckenden Films erklären.

  3. Deskriptive Statistiken und Prüfung der Normalverteilungsannahme: Es soll festgestellt werden, ob die 150 Reaktionszeiten normalverteilt sind. Dazu eignet sich der 1-sample-Kolmogoroff-Smirnov-Test von SPSS. Die abzulehnende Nullhypothese H_0 besteht darin, von einer Normalverteilung der Daten auszugehen. Diese ist abzulehnen, da ein z-Wert von z = 1.85 herauskommt, für den gilt z-tailed p = 0.0021. Median, Mittelwert und Varianz lassen sich als deskriptive Statistiken entweder mit SPSS oder mit dem UNIXSTAT-Programm desc errechnen. Letzteres erzeugt folgenden Output:
    ------------------------------------------------------------
     Under Range    In Range  Over Range         Sum
               0         150           0   39067.000
    ------------------------------------------------------------
            Mean      Median    Midpoint   Geometric    Harmonic
         260.447     220.000     494.500     225.734     195.950
    ------------------------------------------------------------
              SD   Quart Dev       Range     SE mean
         152.608      78.500     895.000      12.460
    ------------------------------------------------------------
         Minimum  Quartile 1  Quartile 2  Quartile 3     Maximum
          47.000     157.000     220.000     314.000     942.000
    ------------------------------------------------------------
            Skew     SD Skew    Kurtosis     SD Kurt
           1.849       0.200       7.596       0.400
    ------------------------------------------------------------
       Null Mean           t    prob (t)           F    prob (F)
           0.000      20.902       0.000     436.892       0.000
    ------------------------------------------------------------
    Man erhält also folgende Ergebnisse:


zurück zur Hauptseite zum Seminar "Rechnergestützte Auswertung von psychologischen Experimenten"

Anmerkungen und Mitteilungen an

rainer@zwisler.de
Last modified 11-7-98