probdist rand z 100 | dm "2.8 * x1 + 165" | descEs werden auch Mittelwert und Varianz der neuen Werte anzeigen (z.B. Mittelwert mean = 165.261 und Standardabweichung SD = 2,71).
probdist rand z 10 | dm "2.8 * x1 + 165" | stats meanDaraufhin können die 10 so erhaltenen Mittelwerte in einer datei, z.B. mean10.dat, gespeichert werden. Mit dem Kommando
desc -o -h < mean10.daterhält man folgenden Output (die gesuchte geschätzte Varianz der Mittelwerte ist fett hervorgehoben; die Option -o steht für ordinale Statistiken und -h für die Anzeige eines Histogramms):
------------------------------------------------------------
Under Range In Range Over Range Sum
0 10 0 1650.910
------------------------------------------------------------
Mean Median Midpoint Geometric Harmonic
165.091 165.278 164.728 165.089 165.087
------------------------------------------------------------
SD Quart Dev Range SE mean
0.869 0.642 2.670 0.275
------------------------------------------------------------
Minimum Quartile 1 Quartile 2 Quartile 3 Maximum
163.393 164.496 165.278 165.779 166.063
------------------------------------------------------------
Skew SD Skew Kurtosis SD Kurt
-0.628 0.775 1.974 1.549
------------------------------------------------------------
Null Mean t prob (t) F prob (F)
0.000 600.974 0.000 361169.925 0.000
------------------------------------------------------------
Midpt Freq
163.342 1 *
164.027 1 *
164.712 2 **
165.397 3 ***
166.082 3 ***
desc -o -h < mean100.datMan erhält dann folgenden Output:
------------------------------------------------------------
Under Range In Range Over Range Sum
0 10 0 1650.122
------------------------------------------------------------
Mean Median Midpoint Geometric Harmonic
165.012 165.034 164.990 165.012 165.012
------------------------------------------------------------
SD Quart Dev Range SE mean
0.267 0.174 0.892 0.085
------------------------------------------------------------
Minimum Quartile 1 Quartile 2 Quartile 3 Maximum
164.544 164.842 165.034 165.189 165.436
------------------------------------------------------------
Skew SD Skew Kurtosis SD Kurt
-0.121 0.775 1.845 1.549
------------------------------------------------------------
Null Mean t prob (t) F prob (F)
0.000 1952.407 0.000 3811894.921 0.000
------------------------------------------------------------
Midpt Freq
164.161 0
164.482 1 *
164.803 3 ***
165.124 4 ****
165.445 2 **
probdist rand z 100 | dm "x1 * 2.8 + 165" | dm "((x1 -165) / 2.8) * 9 +175"
probdist prob n 1.2 probdist prob n 1.4Man erhält für VP1 das Ergebnis 0.885 und für VP2 0.919. Zieht man diese Werte von 1 ab, erhält man die Wanrscheinlichkeit dafür, daß jemand aus der Gesamtpopulation besser ist als die jeweilige Versuchsperson (VP1: 0.115; VP2: 0.081).
rankrel < fussb.datMan erhält unter anderem folgende Ausgabe, die aufgrund der hohen Korrelation der vermuteten Verdacht bestätigt:
Spearman Rank Correlation (rho) [corrected for ties]:
Critical r (.05) t approximation 0.631897
Critical r (.01) t approximation 0.764592
rho 0.886887
Es scheint also ein Zusammenhang zwischen Angriffsposition (niedrige Trikotnummer?) und Anzahl der Tore zu bestehen.
pair -sp < speed1.dat(in der Datei speed1.dat stehen die Werte für die erste Versuchspersonengruppe in zwei Spalten; die Option -sp bewirkt das Zeichnen eines scatter plots) bzw.
pair -sp < speed2.datfür die zweite Versuchspersonengruppe, deren Daten in der Datei speed2.dat abgelegt sind. Für die erste Gruppe erhält man:
Correlation r-squared t(8) p
-0.7118 0.5066 -2.8661 0.0210
Intercept Slope
1753.4004 -0.6379
|--------------------------------------------------|1.02e+03
| 1 1 |
|1 1 1 |
| 1 |
| |
| 1 |
| |
| |
| 1 |
| 1 |
| |Column 2
| |
| |
| |
| |
| |
| |
| |
| |
| 1|
|--------------------------------------------------|480
1110.000 1650.000
Column 1
also eine signifikante Korrelation. Auch für die zweite Gruppe sieht das Ergebnis so aus:
Correlation r-squared t(8) p
-0.7722 0.5962 -3.4371 0.0089
Intercept Slope
1479.0120 -0.7147
|--------------------------------------------------|1.03e+03
| 1 |
|1 |
| |
| |
| |
| 1 |
| |
| |
| |
| 1 |Column 2
| |
| 1 |
| |
| |
| |
| |
| 1 1 |
| 1 1|
| 1 |
|--------------------------------------------------|440
740.000 1550.000
Column 1
Diese Korrelation ist sogar noch etwas deutlicher.
Berechnet man die Korrelation für die Gesamtstichprobe mit der Zeile
pair -sp < speedall.dat(Die Datei speedall.dat ist durch folgende Sequenz erzeugbar:
type speed1.dat > speedall.dat type speed2.dat >> speedall.dat), erhält man folgendes Ergebnis (mit Plot):
Correlation r-squared t(18) p
-0.3165 0.1002 -1.4158 0.1739
Intercept Slope
1142.5397 -0.2908
|--------------------------------------------------|1.03e+03
| 1 1 1 |
|1 1 1 1 |
| 1 |
| |
| 1 |
| 1 |
| |
| 1 1 |
| |
| 1 |Column 2
| |
| 1 |
| |
| |
| |
| |
| 1 1 |
| 1 1 1|
| 1 |
|--------------------------------------------------|440
740.000 1650.000
Column 1
Diese Korrelation ist deutlich geringer und nicht mehr signifikant. Also: Aufpassen beim Poolen von Daten. Liegt in zwei Teilstichproben eine Korrelation vor, kann sich diese beim Poolen der beiden Stichproben auflösen.
dm "x1 * 0.454" "x2 * 2.54" < usa.dat > usa_n.datdas die Daten aus der Datei usa.dat liest und die transformierten Werte in der Datei usa_n.dat ablegt.
dm s1 < germ.dat > weights.dat echo -1 >> weights.dat dm s1 < usa_n.dat >> weights.dat echo -1 >> weights.dat dm s1 < dansk.dat >> weights.dat dm s2 < germ.dat > heights.dat echo -1 >> heights.dat dm s2 < usa_n.dat >> heights.dat echo -1 >> heights.dat dm s2 < dansk.dat >> heights.datNun läßt sich mit
oneway -p < weights.datbestimmen, ob die Studentinnen aus den drei Ländern aus der selben Gewichts-Grundgesamtheit stammen:
Name N Mean SD Min Max
Group-1 8 62.500 9.651 51.000 82.000
Group-2 7 61.225 5.482 54.934 69.916
Group-3 8 65.000 7.838 55.000 80.000
Total 23 62.982 7.741 51.000 82.000
Group-1 |<--============(======#=====)============------------------>|
Group-2 | <-======(===#===)=======-----> |
Group-3 | <---==========(=====#====)==========-------------> |
51.000 82.000
Weighted Means Analysis:
Source SS df MS F p
Between 56.043 2 28.022 0.444 0.648
Within 1262.322 20 63.116
Die Gruppen unterscheiden sich nicht signifikant, es liegt also kein Einfluß vor. Dies gilt auch für die Größen, wie man nach Ausführung von
oneway -p < heights.datsehen kann: Hier ist der Unterschied zwischen den Gruppen knapp nicht signifikant.
Name N Mean SD Min Max
Group-1 8 174.375 9.927 163.000 193.000
Group-2 7 166.914 6.674 157.480 175.260
Group-3 8 162.625 10.809 152.000 182.000
Total 23 168.017 10.312 152.000 193.000
Group-1 | <-=========(====#====)==========----------->|
Group-2 | <---======(==#===)======--> |
Group-3 |<========(=====#=====)==========-----------> |
152.000 193.000
Weighted Means Analysis:
Source SS df MS F p
Between 564.494 2 282.247 3.180 0.063
Within 1775.031 20 88.752
zurück zur Hauptseite zum Seminar "Rechnergestützte Auswertung von psychologischen Experimenten"
Anmerkungen und Mitteilungen an
rainer@zwisler.de