extra keine 50 extra eine 12 extra mehr 28 intro keine 50 intro eine 8 intro mehr 2Die Variable Persönlichkeit besitzt nur nominales Niveau; bei den abhängigen Variablen handelt es sich um Häufigkeiten. Deshalb ist hier der Chi-Quadrat-Unabhängigkeitstest anzuwenden, um feststellen zu können, ob die beiden Variablen Persönlichkeit und Zigarettenkonsum voneinander abhängen. Die Nullhypothese H_0 ist dabei, daß das Rauchverhalten unabhängig von der Persönlichkeitsstruktur sei. Die Kommandozeile
contab < ueb1_1.datliefert folgendes Ergebnis:
FACTOR:          A          B       DATA 
LEVELS:          2          3        150 
A          count
extra         90
intro         60
Total        150
NOTE: Yates' correction for continuity applied
	chisq       5.606667     df   1      p  0.017892
B          count
keine        100
eine          20
mehr          30
Total        150
	chisq      76.000000     df   2      p  0.000000
SOURCE: A B 
           keine    eine    mehr  Totals
extra         50      12      28      90
intro         50       8       2      60
Totals       100      20      30     150
Analysis for A x B:
	chisq      18.055556     df   2      p  0.000120
	Cramer's V                              0.346944
	Contingency Coefficient                 0.327777 
Wichtig ist dabei insbesondere der Ausdruck  chisq = 18.055556; d.h. die Nullhypothese muß abgelehnt werden, da die Wahrscheinlichkeit für sie p < 0.001 ist. Die Persönlichkeitsstruktur hat also einen Einfluß auf das Rauchverhalten.
19 15 22 7 32 31 17 10 37 28 20 12 23 23 24 17 28 19 21 24 15 11 18 16Weil vor und nach Betrachten des Films Datenpunkte erhoben werden, handelt es sich um eine abhängige Stichprobe. Falls die Daten metrisch sind, muß der t-Test für abhängige Stichproben eingesetzt werden. Dies geht folgendermaßen:
pair < ueb1_2.datDieses Kommando erzeugt folgenden Output:
Analysis for 12 points:
                         Column 1         Column 2       Difference
Minimums                  15.0000           7.0000          -3.0000
Maximums                  37.0000          31.0000          15.0000
Sums                     276.0000         213.0000          63.0000
SumSquares              6806.0000        4395.0000         595.0000
Means                     23.0000          17.7500           5.2500
SDs                        6.4526           7.4727           4.9013
t(11)                     12.3476           8.2283           3.7106
p                          0.0000           0.0000           0.0034
     Correlation        r-squared            t(10)                p
          0.7617           0.5802           3.7174           0.0040
       Intercept            Slope
         -2.5382           0.8821
Man erhält also als Ergebnis t(11) = 3.71 und p = 0.0034. Geht man dagegen von ordinalen Daten aus, muß ein nichtparametrischer Test eingesetzt werden. Bei dem nichtparametrischen Test kann beispielsweise derjenige nach Wilcoxon angewandt werden, der mit dem Kommando  rankrel durchgeführt wird:
rankrel < ueb1_2.datDer auf diese Weise erzeugte Output sieht folgendermaßen aus:
             N      Min      25%   Median      75%      Max
Cond-1      12    15.00    18.50    21.50    26.00    37.00
Cond-2      12     7.00    11.50    16.50    23.50    31.00
Total       24     7.00    15.50    19.50    24.00    37.00
Binomial Sign Test:
	Number of cases Cond-1 is above Cond-2:  10
	Number of cases Cond-1 is below Cond-2:   1
	One-tail probability (exact)            0.005859
Wilcoxon Matched-Pairs Signed-Ranks Test:
    Comparison of Cond-1 and Cond-2
	T (smaller ranksum of like signs)       3.000000
	N (number of signed differences)       11.000000
	z                                       2.622870
	One-tail probability approximation      0.004360
	NOTE: Yates' correction for continuity applied
	Check a table for T with N = 11
Friedman Chi-Square Test for Ranks:
	Chi-square of ranks                     6.750000
	chisq       6.750000     df   1      p  0.009375
	Check a table for Friedman with N = 12
Spearman Rank Correlation (rho) [corrected for ties]:
	Critical r (.05) t approximation        0.575983
	Critical r (.01) t approximation        0.707888
	rho                                     0.727273
Hier erhält man somit einen z-Wert von 2.62; die Wahrscheinlichkeit dafür, daß der Mittelwertsunterschied zufällig zustande kan, beträgt nur  p = 0.0044.
Bonusfrage: Wie hoch ist die Rangkorrelation nach Spearman zwischen den beiden Wertepaaren? Antwort: rho = 0.73. Was bedeutet dies? Etwa die Hälfte der Varianz im Rauchverhalten läßt sich durch das Betrachten oder Nicht-Betrachten des abschreckenden Films erklären.
------------------------------------------------------------
 Under Range    In Range  Over Range         Sum
           0         150           0   39067.000
------------------------------------------------------------
        Mean      Median    Midpoint   Geometric    Harmonic
     260.447     220.000     494.500     225.734     195.950
------------------------------------------------------------
          SD   Quart Dev       Range     SE mean
     152.608      78.500     895.000      12.460
------------------------------------------------------------
     Minimum  Quartile 1  Quartile 2  Quartile 3     Maximum
      47.000     157.000     220.000     314.000     942.000
------------------------------------------------------------
        Skew     SD Skew    Kurtosis     SD Kurt
       1.849       0.200       7.596       0.400
------------------------------------------------------------
   Null Mean           t    prob (t)           F    prob (F)
       0.000      20.902       0.000     436.892       0.000
------------------------------------------------------------
Man erhält also folgende Ergebnisse:
zurück zur Hauptseite zum Seminar "Rechnergestützte Auswertung von psychologischen Experimenten"
Anmerkungen und Mitteilungen an
rainer@zwisler.de