Next: Psychophysische Methoden Up: Psychologische Methodenlehre Previous: Wissenschaftstheoretische Grundlagen

Versuchsplanung

Psychologie als Wissenschaft

Im Gegensatz zur Alltagspsychologie versucht die wissenschaftliche Psychologie, ihre Aussagen mit geeigneten Methoden daraufhin kritisch zu überprüfen, ob sie wahr oder falsch sind. Diese Überprüfung erfolgt systematisch und methodisch kontrolliert. Alltagspsychologische Annahmen können aber auch zufällig richtig sein, sie können im Sinne selbsterfüllender Prophezeiungen wirken, sie können die Wahrnehmung verzerren und oft handelt es sich dabei um nachträglich konstruierte Erklärungen (ex post facto).

Demgegenüber soll die wissenschaftliche Forschung zwei Ziele anstreben: Die Sammlung von Tatsachenwissen (rein deskriptiv) und die Erforschung von Gesetzmäßigkeiten mit dem Ziel der Vorhersage von Ereignissen. Um vom Tatsachenwissen zu geeigneten Hypothesen zu gelangen, ist ein expliziter kreativer Akt der Hypothesenbildung notwendig.

Ein wesentlicher Bestandteil solcher Hypothesen und Gesetze sind Variablen, die mindestens in zwei Abstufungen vorliegen müssen, von denen immer nur eine realisiert werden kann. Variablen mit nur zwei Ausprägungen nennt man auch qualitativ, Variablen mit vielen Ausprägungen werden dagegen als quantitativ bezeichnet; eine weitere Unterscheidung ist nach dem Skalenniveau möglich:

: Nominalskala: Hier wird nur zwischen Gleichheit und Verschiedenheit unterschieden (qualitative Variablen).
: Ordinalskala: Unterscheidung von größer und kleiner (komparative Variable).
: Intervallskala: Auch Aussagen über das Verhältnis von Intervallen zwischen Skalenwerten sind möglich, jede lineare Transformation ist zulässig.
: Verhältnisskala: Auch Aussagen über das Verhältnis von Skalenwerten sind möglich; die Einheit ist willkürlich, aber der Nullpunkt ist fest. Daher sind beliebige Multiplikatioen mit einer positiven Konstante möglich.
: Absolutskala: Es existiert ein natürlicher Nullpunkt und eine natürliche Einheit.

Ein wesentlicher Schritt der Hypothesenprüfung ist die Operationalisierung der Variablen, d.h. die Zuordnung von beobachtbaren Phänomenen zu diesen Variablen. Aus den praktisch unendlich vielen Variablen müssen außerdem einige wenige selegiert werden, auf die man sich konzentrieren will. Wissenschaft besteht auch darin, die für eine bestimmte Fragestellung bedeutsamen Variablen zu entdecken.

Die Grundidee einer empirischen Prüfung ist die, daß man aus der Hypothese eine empirische Vorhersage formuliert und diese mit der Wirklichkeit vergleicht. Bei einem Experiment greift der Forscher aktiv in das Geschehen ein, währen bei einer nicht-experimentellen Untersuchung nur Ereignisse beobachtet werden.

Hypothesen

Eine Hypothese ist eine Antwort auf eine Frage nach wissenschaftlichen Gesetzmäßigkeiten, die provisorisch als wahr angenommen wird und deren Zweck in der Vorhersage im Rahmen einer wissenschaftlichen Hypothesenprüfung liegt. Eine Theorie wird häufig als ein System von Hypothesen aufgefaßt. Die Bildung von Hypothesen kann beispielsweise durch bestimmte Verfahren der Datenanalyse (z.B. Faktorenanalyse) ermöglicht werden. Andere Quellen von Hypothesen sind eine intensive Beschäftigung mit dem Gegenstandsbereich und eine gute Beschreibung des Problems. Liegen zu wenige Informationen für die präzise Formulierung einer Hypothese vor, dann läßt sich eine explorative Studie zur Präzisierung durchführen. Folgende Arten von Hypothesen lassen sich unterscheiden:

: Universelle Hypothesen sollen für alle Fälle eines bestimmten Bereichs gelten. Strikt universelle Hypothesen gelten ohne Einschränkung für alle Fälle eines Bereichs, quasiuniverselle Hypothesen sind auf bestimmte Teilbereiche eingeschränkt, z.B. auf alle Frauen; sie können falsifiziert werden, aber nicht verifiziert.
: Existentielle Hypothesen behaupten einen Sachverhalt für mindestens einen Fall; sie können verifiziert, aber nicht falsifiziert werden.
: Hypothesen über Anteile hängen mit stochastischen (nichtdeterministischen) Hypothesen zusammen (probabilistische stochastische Hypothese) oder damit, daß ein bestimmter Sachverhalt nur für einen Anteil aller Fälle gilt (statistische stochastische Hypothese). Können nicht alle Elemente des Gegenstandbereichs untersucht werden, sind solche Hypothesen weder verifizierbar noch falsifizierbar.

Beim Überprüfen von Hypothesen geht es um deren Wahrheit oder Falschheit. Der ``Nachweis durch Beispiele'', der in der Alltagspsychologie oft Anwendung findet, genügt aber wissenschaftlichen Kriterien nicht, allerdings ist eine Falsifizierung durch Gegenbeispiele möglich. Die Überprüfung von Hypothesen kann nicht alleine durch logische Argumente erfolgen, sondern es muß auch eine empirische Prüfung erfolgen (wenn sie nicht schon aus logischen Gründen falsch bzw. kontradiktorisch sind).

Aus der Hypothese wird eine Vorhersage über einen empirischen Sachverhalt gemacht, die postuliert, daß unter bestimmten Bedingungen ein spezielles empirisches Ereignis eintritt. Bei der Realisierung wird aktiv in einem Experiment oder passiv in einer nicht-experimentellen Untersuchung geprüft, ob die Bedingungen zutreffen. Anschließend wird geprüft, inwieweit das oder die beobachteten Ereignisse mit der Vorhersage übereinstimmen. Als Ergebnis des Vergleichs zwischen Vorhersage und Wirklichkeit kann nun die Hypothese als wahr akzeptiert oder als falsch abgelehnt werden. Steht das Ergebnis der empirischen Prüfung im Widerspruch zu der Hypothese, dann gibt es mehrere Möglichkeiten: Die Hypothese kann falsch sein, eine oder mehrere der Zusatzannahmen können falsch sein, oder beides. Voraussetzungen für die Überprüfbarkeit einer Hypothese sind

Widerspruchsfreiheit,
Kritisierbarkeit (es muß mögliche Ereignisse geben, die die Hypothese falsifizieren oder deren Bestätigungsgrad absenken),
Operationalisierbarkeit (den vorkommenden Begriffen müssen beobachtbare Daten zugeordnet werden),
Aufstellen der Hypothese vor der Überprüfung.

Alle Fälle des Geltungsbereichs einer Hypothese können nur dann untersucht werden, wenn die Zahl der Fälle klein ist. In diesem Fall sind alle Arten von Hypothesen verifizierbar und falsifizierbar. Eine universelle Hypothese, die empirisch geprüft und dabei nicht falisifizert wurde, nennt man bestätigt oder bewährt. Dabei kann man unterschiedliche Grade der Bewährung unterscheiden, je nachdem, wie oft und wie streng eine Hypothesen überprüft wurde. Eine Hypothese mit einem hohen empirischen Gehalt kann auf viele verschiedene Arten falsifiziert werden; zusammen mit einem hohen Bewährungsgrad werden derartige Hypothesen angestrebt. Die Prüfung einer Hypothese sollte dabei möglichst streng erfolgen. Dies wird unter anderem dadurch sichergestellt, daß Wissenschaft auch ein sozialer Prozeß ist (auch andere Wissenschaftler können einen Befund überprüfen).

Grundlagen des Experimentierens

Ein Experiment ist durch zwei Bedingungen gekennzeichnet:

Der Experimentator variiert systematisch mindestens eine Variable und registriert, welchen Effekt diese aktive Veränderung bewirkt.
Gleichzeitig schaltet er die Wirkung von anderen (Stör-)Variablen aus.

Bei der nicht-experimentellen Forschung finden nur Beobachtungen statt, ohne in das Geschehen einzugreifen (oft ist dies aus praktischen oder ethischen Gründen so). Nur durch Experimente läßt sich Kausalität untersuchen. Beim Experimentieren unterscheidet man unabhängige Variablen, die aktiv vom Experimentator verändert werden (und oft auch als Faktor bezeichnet werden) von den abhängigen Variablen, die letztlich vorhergesagt werden sollen. Störvariablen beeinflussen sie abhängige Variable ebenfalls, so daß deren Wirkung im Experiment entweder neutralisiert oder aktiv in die Untersuchung einbezogen (als zusätzliche unabhängige Variable) werden soll, da sie den Effekt der unabhängigen Variable stören würde. Eine Störvariable kontrollieren heißt, ihre Wirkung auszuschalten. Dazu sind zwei Wege möglich:

Konstanthalten: Man sorgt dafür, daß die Störvariable während des gesamten Experiments denselben Wert hat; dadurch wird aber die Generalisierbarkeit der Befunde eingeschränkt.
Randomisieren: Die verschiedenen Stufen der Störvariable werden zufällig mit den Stufen der unabhängigen Variable kombiniert. Bei einer geringen Anzahl von Versuchspersonen besteht aber hierbei die Gefahr deutlich ungleicher Gruppen.

Experimente lasen sich auf verschiedene Arten klassifizieren. Einige Schemata sind die folgenden:

Einteilung nach dem Ziel: Prüfexperiment, Erkundungsexperiment (exploratives Experiment), Vorexperiment.
Einteilung nach der Zahl der unabhängigen Variablen: einfaktorielles oder mehrfaktorielles Experiment.
Einteilung nach der Zahl der abhängigen Variablen: univariates oder multivariates Experiment.
Labor- (spezieller Untersuchungsraum) und Feldexperiment (natürliches Umfeld).
Echte Experimente (aktives Variieren der UV und Kontrolle der Störvariablen) und Quasi-Experimente (keine Kontrolle der Störvariablen).

Schritte bei einem Experiment

Die Durchführung von Experimenten läßt sich in mehrere Stufen untergliedern, die nacheinander durchlaufen werden:

Fragestellung, die im Laufe der Untersuchung weiter präzisiert wird.
Sachliche Hypothesen, die auf bisherigen Forschungsergebnissen, theoretischen Überlegungen oder empirischen Beobachtungen aufbauen.
Operationalisierung, also Zuordnung von Begriffen der Hypothese zu beobachtbaren Phänomenen: Man sucht einen empirisch beobachtbaren Indikator für die Begriffe. Dazu gehört auch die Auswahl einer leicht realisierbaren Situation, in der die Versuchspersonen bisher noch keine Erfahrungen sammeln konnten. Die Information, die mithilfe einer Operationalisierung gewonnen wird, wird als Datum bezeichnet. Die Güte der Operationalisierung wird oft auch Konstruktvalidität bezeichnet. Die theoretischen Begriffe einer Hypothese können mehr oder weniger direkt operationalisiert werden, so wie Variablen mehr oder weniger beobachtungsnah sind.
Operationalisierungstechniken werden oft auch als Methoden der Datengewinnung bezeichnet, wobei allen empirischen Wissenschaften die wissenschaftliche Beobachtung zugrunde liegt; in der Psychologie ist dabei insbesondere die Verhaltensbeobachtung von großer Bedeutung. Dzu werden folgende Methoden eingesetzt:
- Befragung in mündlicher (Interview) oder schriftlicher (Fragebogen) Art;
- Test (standardisierte Reize unter standardisierten Bedingungen);
- Analyse von Verhaltensspuren.
Zur Operationalisierung gehört auch, daß bestimmte Verhaltensaspekte gemessen werden: Beim Messen werden empirische Relationen durch numerische Relationen strukturerhaltend repräsentiert; die den Meßwerten zugeordneten Zahlen heißen Skalenwerte. Beim Repräsentationsproblem geht es darum, ob eine bestimmte empirische Variable meßbar ist oder nicht; wenn ja, werden die dazu erforderlichen Voraussetzungen in Form von Axiomen angegeben. Das Eindeutigkeitsproblem fragt, welche Freiheitsgrade bei der Zuordnung der Skalenwerte besteht bzw. wie die Skalenwerte transformiert werden können. Das Bedeutsamkeitsproblem stellt die Frage, welche Schlüsse auf der Basis der Skalenwerte gezogen werden dürfen (eine Aussage ist dann bedeutsam, wenn sich ihr Wahrheitswert bei allen zulässigen Transformationen nicht verändert). Das Skalierungsproblem besteht darin, daß für eine Menge von Meßobjekten konkrete Skalenwerte konstruiert werden müssen; dabei müssen Validität und Reliabilität berücksichtigt werden.
Versuchsplan, der logische Aufbau des Versuchs im Hinblick auf die Hypothesenprüfung: Wird die abhängige Variable auch vor der Realisierung der jeweiligen Stufe der unabhängigen Variable erhoben, spricht man von einer Vorhermessung, die spätere Messung nennt man dann Nachhermessung. Durch die Vorhermessung kann festgestellt werden, ob sich die Versuchspersonengruppen unterscheiden und aus der Differenz zwischen Vorher- und Nachhermessung läßt sich die Effektstärke bestimmen. Nachteilig ist aber der größere Aufwand, die manchmal schwierige praktische Realisierung (z.B. in der Entwicklungspsychologie) und mögliche kausale Auswirkungen der Vorhermessung auf die Nachhermessung.
Die Experimentalgruppe ist die Gruppe, bei der diejenige Stufe der UV realisiert wird, die die Forscher interessiert. Die andere Gruppe soll den Vergleich ermöglichen und die Störvariablen kontrollieren; sie wird deshalb Kontrollgruppe genannt. Theoretisch kann auch an einer einzigen Gruppe von Versuchspersonen das gesamte Design vollzogen werden, z.B. nach dem Schema .
Kontrolle der Störvariablen der Versuchsperson und der Untersuchungssituation, deren Neutralisierung durch Konstanthalten oder Randomisieren. Die Störvariablen der Versuchsperson lassen sich durch Parallelisieren (Aufteilen der Versuchspersonen in äquivalente Gruppen) und Randomisieren (durch Losen, Münzwurf oder Zufallszahlen) kontrollieren. Die Störvariablen der Untersuchsungssituation lassen sich kontrollieren durch Elimination (wenn möglich), Konstanthalten (Problem der Generalisierbarkeit), Zufallsvariation oder durch Einführung einer Kontrollgruppe, so daß Veränderungen und Einflüsse zwischen den Zeitpunkten und der reaktive Effekt der Vorhermessung bestimmt werden können.
Trotz aller Kontrolltechniken kann es aber vorkommen, daß eine Störvariable systematisch mit der UV variiert. Man nennt diesen Sachverhalt Konfundierung von Störvariable und UV. Das Ergebnis läßt sich dann nicht mehr alleine auf die UV zurückführen. Besonders problematisch ist es, wenn sich eine Konfundierung erst nachträglich zeigt. Läßt sie sich nicht vermeiden, muß man auf ein Quasi-Experiment ausweichen. Der Bewährungsgrad einer scheinbar gut bewährten Hypothese kann sich drastisch verändern, wenn die Aufdeckung einer Konfundierung eine Neueinschätzung der bisherigen Untersuchungsergebnisse notwendig macht.
Stichprobe, deren Umfang, deren Auswahl und Werbung: Meist erfolgt keine Zufallsauswahl der Teilnehmer der Stichprobe aus der vollständigen Liste der Elemente, so daß große Sorgfalt notwendig ist, um keine systematisch verzerrte Stichprobe zu erhalten. Ohne Zufallsauswahl spricht man von einer anfallenden Stichprobe oder einer Quotenstichprobe. Hat man aber eine Zufallsstichprobe, so ist eine gute Verallgemeinerung der Ergebnisse möglich. Durch die Freiwilligkeit der Teilnahme kann eine zusätzliche Störvariable eingebracht werden. Eine geschichtete Stichprobe spiegelt die Verteilung in der Population auf einer bestimmten Variablen wider; dabei lassen sich verschiedene Variablen unterschiedlich leicht schichten.
Empirische Vorhersage und statistische Hypothese: Auf dem Hintergrund einer statistischen Theorie wird aus der empirischen Vorhersage eine statistische Hypothese abgeleitet. Die empirische Vorhersage wird aus der Sachhypothese entwickelt auf der Basis der Operationalisierung, des Versuchsplans, der Art der Kontrolle der Störvariablen, der Stichprobe und des fachlichen und methodischen Hintergrundwissens. Daraus wird die statistische Hypothese gebildet, da bei Messungen der operationalisierten AV immer auch Meßfehler auftreten können. Zuerst muß dabei ein geeignetes statistisches Verfahren ausgewählt werden (Skalenniveau, Verteilungsannahmen usw.); anschließend können die statistischen Hypothesen dann formuliert werden (Nullhypothese und Alternativhypothese). Dies soll unbedingt vor der Durchführung des Experiments erfolgen.
Durchführung unter besonderer Berücksichtigung der Standardisierung der Untersuchungsbedingungen (alle Variablen, die vom Experimentator nicht als UV systematisch verändert werden oder die zufällig variieren, sollen im Experiment konstant gehalten werden):
- der praktische Ablauf der Untersuchung (Einzel- oder Gruppenversuch, wobei im letzteren Fall eher zusätzliche Störvariablen zu erwarten sind; Pausen zwischen den einzelnen Versuchspersonen),
- ``Pflege'' der Versuchspersonen (sie sollen sich in der Untersuchungssituation wohl fühlen, nicht getäuscht werden, am Ende aufgeklärt werden; Aufwärmphase; Anwerben von freiwilligen Versuchspersonen ohne Verschweigen von unangenehmen Aspekten; kompetentes Auftreten des Versuchsleiters),
- Räumlichkeiten (störungsfrei, gut belüftet, beleuchtet und wohltemperiert; meist im Labor, aber auch in der natürlichen Umgebung der Versuchsperson denkbar; räumliche Trennung der Versuchspersonen, die das Experiment bereits hinter sich haben, von der prospektiven Kandidaten),
- die verwendeten Hilfsmittel und Geräte (zur Versuchsdurchführung und zur Aufzeichnung der Daten, insbesondere Computer; Möglichkeit des Versagens muß immer berücksichtigt werden),
- die aufgezeichneten Daten,
- und die Behandlung der Versuchspersonen, insbesondere deren Instruktion (die einen starken Einfluß auf das Experiment ausüben kann: sie soll den Zweck des Experiments, das erwartete Verhalten der VPn sowie deren Aufgabenstellung enthalten; außerdem soll das Verständnis der Instruktion überprüft werden; einfache und verständliche Formulierung sind anzustreben),
- zuletzt Durchführung eines Vorexperiments.
Auswertung der Daten durch Prüfung der statistischen Hypothese und Annahme oder Verwerfung der statistischen Hypothese: Das Ergebnis der statistischen Prüfung ist die Bewertung der statistischen Hypothesen auf der Basis von Prüfgrößen. Dabei ist wichtig, daß die Daten fehlerfrei in die statistische Auswertung eingebracht werden.
Schluß auf die Sachhypothese unter Berücksichtigung der Qualität der Operationalisierung, der Neutralisierung von Störvariablen und der Generalisierbarkeit: Schließt man nun auf die Sachhypothese zurück, geht man von der Voraussetzung aus, daß die Operationalisierung stimmig ist, der Versuchsplan der Prüfung der Hypothesen angemessen ist, die relevanten Störvariablen durch geeignete Kontrollmaßnahmen neutralisiert wurden, daß die Stichprobe korrekt ausgewählt wurde, daß das fachliche und methodische Hintergrundwissen richtig eingesetzt wurde und daß ein angemessenes statistisches Prüfverfahren herangezogen wurde. Bei der Frage, ob eine Hypothese als bestätigt angesehen werden kann oder nicht, spielen neben dem Signifikanzniveau der statistischen Hypothese auch diese Faktoren eine wichtige Rolle. Sie können für Ad-Hoc-Hypothesen zur Erklärung von unerwarteten Ergebnissen herangezogen werden, die dann aber in einem weiteren Experiment wiederum empirisch untersucht werden müssen (z.B. bei einer Replikation unter gleichen oder ähnlichen Bedingungen).
Diskussion der Ergebnisse für Theorie und Praxis: Die beim letzten Punkt genannten Ursachen für das Zutreffen oder Nichtzutreffen der sachlichen Hypothesen werden hier untersucht. Insbesondere muß die Güte bzw. Validität des Experiments untersucht werden:
- Interne Validität: Wie gut sind mögliche Störvariablen kontrolliert?
- Externe Validität: Wie weit läßt sich das Ergebnis generalisieren?
- Konstruktvalidität: Wie gut sind UV und AV operationalisiert?
- Validität statistischer Schlußfolgerungen: Ist das spezielle statistische Verfahren gerechtfertigt?
Bericht, der das Experiment und sein Ergebnis auch anderen Wissenschaftlern zugänglich macht: Alles Wesentliche über das Experiment soll mitgeteilt werden, so daß es nachvollziehbar wird. Die klassische Gliederung lautet: Einleitung und Theorie - Methode (Vpn / Apparate und Materialien / Versuchsplan / Durchführung) - Ergebnisse - Diskussion - Literaturverzeichnis - Zusammenfassung. Das kritische Lesen von Berichten sollte geübt werden.

Versuchspläne mit mehreren Gruppen

Bei UVn mit mehr als zwei Stufen liegt ein einfaktorielles varianzanalytisches Design nahe. Ein fixer Effekt liegt dann vor, wenn alle Stufen der UV, die den Forscher interessieren, in die Untersuchung einbezogen werden. Bei einem Zufallseffekt wird dagegen nur eine Stichprobe aus allen möglichen Stufen in der Untersuchung realisiert. Durch einen Versuchsplan mit mehreren Stufen einer UV lassen sich Behauptungen über Unterschiede aufstellen, über Rangreihen in der Wirksamkeit von UV-Stufen und über die Abbildung der Werte der UV in die Werte der AV.

Bei Versuchsplänen mit mehreren UVn läßt sich bestimmen, ob eine bestimmte Ursache eine bestimmte Wirkung zeigt. Hierfür werden mehrfaktorielle Versuchspläne eingesetzt. Bei diesen wird jede Kombination von UV-Stufen als experimentelle Bedingung bezeichnet; alle zusammen lassen sich übersichtlich in einer Matrix darstellen. Die Anzahl der Zellen wird praktisch durch die Zahl der zur Verfügung stehenden Versuchspersonen begrenzt (Design ohne Meßwiederholung, between subjects design) bzw. durch die Zahl der experimentellen Bedingungen, die man einer Versuchsperson zumuten kann (Design mit Meßwiederholung, within subjects design). Mit derartigen Versuchsanordnungen lassen sich Hypothesen über Haupteffekte und Hypothesen über Interaktionen prüfen. Bei Vorliegen einer Interaktion zwischen Variablen sind diese nicht unabhängig. Interaktionen lassen sich nicht untersuchen, wenn jede UV einzeln in einem einfaktoriellen Experiment überprüft wird; je mehr Faktoren an einer Interaktion beteiligt sind, desto schwieriger wird es, diese Interaktion zu interpretieren.

Mit Hilfe eines mehrfaktoriellen Versuchsplanes lassen sich also komplexe Beziehungen zwischen Variablen erforschen. Bei mehreren Faktoren steigt die Zahl der prüfbaren Hypothesen rasch an. Dabei muß beachtet werden, daß Ergebnisse über Effekte (Haupteffekte und Interaktionen), zu denen im voraus keine Hypothesen formuliert wurden, ausschließlich zur Beschreibung und zur Hypothesenbildung verwendet werden dürfen.

Störvariablen bei Meßwiederholung

Wie bereits erwähnt, können auch die ganz elementaren Versuchspläne mit einer UV, die in zwei Stufen variiert wird, so gestaltet werden, daß jede Versuchsperson beide Bedingungen absolviert (Vorteil: Ökonomie und Parallelisierung der Störvariablen der Versuchsperson). Werden die Bedingungen aber allen Versuchspersonen in derselben Reihenfolge vorgegeben, so bildet die Reihenfolge eine Quelle möglicher Störvariablen. Dabei können jedoch zwei Arten von störenden Effekten auftreten:

Positionseffekt: Die Position einer experimentellen Bedingung in der Reihenfolge wirkt sich auf deren Effekt aus, beispielsweise wegen der Störvariablen Ermüdung, Übung, Durst, nachlassende Angst vor dem Experiment usw. Die Kontrolle von Positionseffekten ist möglich durch

vollständiges Ausbalancieren (Erzeugung aller möglichen Reihenfolgen und gleichmäßiges Verteilen auf alle Versuchspersonen kann Positionseffekte neutralisieren, aber bei n Bedingungen gibt es n! verschiedene Reihenfolgen);
unvollständiges Ausbalancieren;
Zufallsauswahl (jede Versuchsperson erhält eine andere, zufällig ausgewählte Reihenfolge);
Spiegelbildmethode (es wird nur eine einzige Reihenfolge von experimentellen Bedingungen herausgegriffen, die dann aber verdoppelt und gespiegelt wird, z.B. wird xyz zu xyzzyx; hierzu muß aber jede Bedingung zweimal durchführbar sein und der Positionseffekt muß linear sein);
Methode des Lateinischen Quadrats (man sucht so viele Reihenfolgen wie es experimentelle Bedingungen gibt und verteilt diese so, daß jede Bedingung genau einmal auf jeder Reihen-Position vorkommt). Ein Lateinisches Quadrat läßt sich in einen faktoriellen Versuchsplan integrieren, so daß der Positionseffekt gleich in seiner Wirkung untersucht werden kann.

Carry-over-Effekt: Eine frühere experimentelle Bedingung beeinflußt eine spätere inhaltlich. Deshalb ist nicht die Reihenfolge an sich entscheidend, sondern welche spezielle(n) andere(n) Bedingungen einer bestimmten Bedingung vorausgegangen sind. Die Kontrolle von Carry-over-Effekten kann nur durch Beseitigung von deren Ursache oder durch Rückkehr zu einem Versuchsplan, bei dem jede VP nur einer einzigen Bedingung ausgesetzt wird, erfolgen.

Positionseffekt und Carry-over-Effekt können auch kombiniert auftreten.

Soziale Situation als Störvariable

Die persönlichen Hoffnungen, Erwartungen, Befürchtungen, Motive etc. von Vesuchspersonen und Versuchsleiter können sich ebenfalls auf das Ergebnis eines Experiments auswirken.

Die Erwartung des Versuchsleiters als Störvariable kann sich im unbeabsichtigten Versuchsleiter-Erwartungseffekt zeigen, der im Wesentlichen auf dessen nonverbalen Verhalten beruht (Rosenthal-Effekt). Derartige Effekte treten nicht nur bei Experimenten auf, sondern überall dort, wo ein Psychologe, der eine VL-ähnliche Rolle innehat, mit einer Person interagiert, deren Rolle einer VP ähnlich ist. Nur diejenigen Untersuchungen bleiben ganz vom VL-Effekt verschont, bei denen Versuchspersonen und Versuchsleiter nicht direkt miteinander kommunizieren. Folgende Voraussetzungen für einen VL-Effekt lassen sich nennen:

Der VL muß in der Lage sein, für jede VP eine einzelne Erwartung zu bilden;
der VL muß seine Erwartungen in seinem bestimmten Verhalten ausdrücken;
die VP muß in der Lage sein, aus dem Verhalten des VL Information darüber zu entnehmen, welches Verhalten von ihr erwartet wird;
die VP muß sich beeinflussen lassen.

Die Kontrolle des VL-Erwartungseffekts ist auf verschiedene Weise möglich:

Standardisierung der Versuchsbedingungen;
Ausschalten des VL;
Training des VL;
Manipulation der Erwartungen des VL (oder Einführung einer Erwartungs-Kontroll-Gruppe);
Blindversuch und Doppelblindversuch.

Neben den Versuchsleiter-Effekten können aber auch Versuchspersonen-Efekte auftreten: Die Erwartungen (zu den Auswirkungen einer experimentellen Bedingungen, z.B. Placeboeffekt; aufgrund von Aufforderungsvariablen und die soziale Erwünschtheit von Verhalten) der Versuchspersonen und deren Motive (Freiwilligkeit der Teilnahme, Kooperation, Testangst bzw. Bewertungsangst und Bedürfnis nach sozialer Anerkennung) wirken sich auf das Ergebnis aus.

Quasi-Experimente

Bei manchen Untersuchungen lassen sich nicht alle Störvariablen kontrollieren. Ist die zufällige Zuordnung von Versuchspersonen zu experimentellen Bedingungen nicht möglich, spricht man von einem Quasi-Experiment; hat der Versuchsleiter auch die UV nicht unter Kontrolle, sollte man gar nicht mehr von einem Experiment sprechen. Hierbei handelt es sich um das methodisch schärfste Werkzeug, das bei Feldstudien eingesetzt werden kann. Der direkte Schluß von der AV auf die Wirkung ist nur dann möglich, wenn Störvariablen ausgeschlossen sind.

Versuchspläne mit nichtäquivalenter Kontrollgruppe sind solche, bei denen nur eine Gruppe am Experiment teilnimmt (und daher gar keine Kontrollgruppe vorhanden ist) oder Versuchspläne mit mehreren Gruppen, die aber nicht randomisiert oder nach relevanten Störvariablen parallelisiert sind. Diese Gruppen unterscheiden sich daher systematisch. Für die Interpretation der Ergebnisse ist ausschlaggebend, inwieweit Erklärungsmöglichkeiten durch Störvariablen ausgeschlossen werden können. Dafür müssen konkrete Argumente und Belege herangezogen werden.

Bei Zeitreihenversuchsplänen wird die AV zu mehreren Zeitpunkten gemessen. Unterscheiden sich die AV-Messungen vor der Einführung der UV von denen nach der Einführung, könnte man auf die Wirksamkeit der UV schließen, sofern die Wirkung von Störvariablen ausgeschlossen ist. Der Vorteil von Zeitreihenversuchsplänen ist, daß man mehr als zwei Zeitpunkte miteinander vergleichen kann und daher die Wirkung der UV wesentlich sicherer isolieren kann.

Ein weiterer bekannter Versuchsplan ist der Einzelfall-Versuchsplan mit Reversion, der bei einer einzigen Versuchsperson bestimmen soll, ob eine bestimmte (therapeutische) Behandlung den beabsichtigten Effekt hat. Wichtig ist auch hierbei, die Wirkung der UV von der der Störvariablen zu trennen. Ein bekanntes Beispiel für derartige Versuchspläne ist der ABAB-Plan, bei dem B die therapeutische Behandlung signalisiert und A deren Fehlen.

Ethische Probleme

Ethische Probleme treten sowohl bei der Anwendung des Wissens als auch bei der Forschung auf. Der Problemkreis der Forschungsziele betrifft auch die Relevanz von Forschungsprojekten. Der Versuchsleiter trägt eine besondere Verantwortung gegenüber den Versuchspersonen, die sich insbesondere aus der Undurchschaubarkeit der experimentellen Situation ergibt. Folgende ethischen Probleme können auftreten:

Schädigung der Versuchsperson (auch durch Verletzung von deren Selbstwertgefühl durch zu schwierige Aufgaben o.ä.);
Täuschung;
Manipulation von VP-Eigenschaften;
Verletzungen der Vertraulichkeit oder des Datenschutzes.

Oft lassen sich derartige ethische Probleme beseitigen, indem man die Untersuchung entsprechend abändert. In jedem Fall sollte die Versuchsperson über alle möglichen negativen Aspekte informiert werden und dann entscheiden können, ob sie am Experiment teilnehmen will; sie sollte aber auch jederzeit die Untersuchung abbrechen dürfen. Nach dem Experiment sollte eine Aufklärung über dessen Ziele stattfinden.

Die negativen Aspekte des Versuches sollten durch positive Aspekte aufgehoben werden (finanzielle oder andere Belohnung). Durch Kosten-Nutzen-Rechnung sollte entschieden werden, ob die Verletzung von ethischen Prinzipien durch den möglichen Wissenszuwachs gerechtfertigt ist.

Next: Psychophysische Methoden Up: Psychologische Methodenlehre Previous: Wissenschaftstheoretische Grundlagen

rainer@zwisler.de

Last modified 10-29-98