Nachdem die Modelltests keine eindeutigen Belege für die Notwendigkeit von projektiven Transformationen zur Beschreibung der Kontexteffekte erbringen, soll nun aufgrund verschiedener Merkmale des Verhaltens der Versuchspersonen beim Durchführen der Farbabgleiche gezeigt werden, daß sie im veränderten Kontext immer eine Farbe herstellen können, die genauso aussieht wie der Standardreiz im Ausgangskontext. Wenn dies der Fall ist, können sich die Kontexteffekte aber nicht linear oder affin auswirken.
Während des Experiments wird der vorgegebene Reiz von den Versuchspersonen durch Betätigen von verschiedenen Druckknöpfen variiert, wobei jeder derartige Tastendruck als eine Aktion gezählt wird. Durch den Vergleich der Anzahlen von Aktionen, die zur Veränderung der einzelnen Farbattribute durchgeführt werden, lassen sich Rückschlüsse auf die Vorgehensweise bei den Farbabgleichen ziehen. Die Möglichkeiten, die Farbattribute Farbton, Helligkeit und Sättigung in beide Richtungen zu manipulieren, werden in Kapitel 2.8.4 beschrieben. Wie dort dargestellt ist, ist für die drei Einflußmöglichkeiten eine adaptive Steuerung implementiert, die bei mehrmaligem aufeinanderfolgenden Betätigen derselben Steuertaste die betreffende Schrittweite vorübergehend bis auf das Dreifache anhebt. Auch das Auslösen von solchen größeren Schritten wird im folgenden als eine einzige Aktion gezählt.
Die durchschnittliche Anzahl der für einen Farbabgleich benötigten Aktionen
In Tabelle 3.1 ist für jede Versuchsperson die Anzahl der durchschnittlich für einen Farbabgleich benötigten Aktionen für jede der drei Steuermöglichkeiten angegeben. In Tabelle A.3 im Anhang A ist für jeden Standardreiz die durchschnittliche Anzahl von Aktionen sowohl für die Einstellungen mit Kontextwechsel als auch für die Einstellungen innerhalb eines Kontextes angegeben. Bei der Interpretation der mittleren Anzahlen von Aktionen ist zu beachten, daß die tatsächliche Zahl der in einem Durchgang getätigten Aktionen sehr großen Schwankungen unterliegt, wie man an den ebenfalls in Tabelle 3.1 eingetragenen Standardabweichungen sehen kann: Sie sind auch im Vergleich zu den Mittelwerten relativ hoch. Da jeder dieser Mittelwerte aus 840 Einstellungen berechnet wird, ist der Standardfehler der Mittelwerte jedoch relativ gering.
Alle vier Versuchspersonen verändern am häufigsten den Farbton der Zielfarbe durch Einstellen der Wellenlänge des LCTF, am seltensten manipulieren sie dagegen die Sättigung der Zielfarbe durch Verstellen von Graukeil 2. Die Zahl von Aktionen zur Variation der Gesamt-Leuchtdichte liegt bei allen Versuchspersonen zwischen den beiden anderen, so daß sich bei allen Versuchspersonen dieselbe Rangreihe ergibt. Auch die durchschnittliche absolute Anzahl der Änderungen des Farbtons ist bei allen Versuchspersonen ähnlich: Sie liegt zwischen 21.72 bei Versuchsperson WES und 25.88 bei Versuchsperson SIG. Der Farbton als der wichtigste Teil der Einstellung wird damit von allen Versuchspersonen etwa gleich ``intensiv'' bearbeitet. Die mittlere Gesamtzahl der Aktionen schwankt dagegen zwischen 33.46 bei Versuchsperson SCA und 51.66 bei Versuchsperson SIG. Wegen der ähnlichen Anzahlen von Änderungen beim LCTF können diese Unterschiede nur an verschiedenen Häufigkeiten der Veränderung von Helligkeit bzw. der Sättigung liegen. Bemerkenswert ist in diesem Zusammenhang, daß von allen Versuchspersonen in einer Befragung am Ende des Experiments angegeben wird, daß der Farbton das wichtigste Kriterium für die Einstellung sei und daß die Durchgänge jeweils mit dem Verändern des Farbtons begonnen würden.
Zwischen den Versuchspersonen können noch weitere Unterschiede aufgezeigt werden (siehe Tabelle 3.1): Das Verhalten von Versuchsperson SCA weicht am deutlichsten von dem der übrigen Versuchspersonen ab, da sie überwiegend Veränderungen des Farbtons und kaum Veränderungen der anderen Parameter vornimmt. Den Gegenpol bildet Versuchsperson WES, die auch die anderen Einflußmöglichkeiten wesentlich häufiger anwendet. In diesen Verhaltensunterschieden könnte sich eine unterschiedliche Gewichtung der verschiedenen Farbattribute bei den Versuchspersonen widerspiegeln.
Die Versuchspersonen stellen ihre Abgleiche also auf verschiedene Weise her. Die hohe Streuung der Anzahl von Aktionen deutet darauf hin, daß bei der Erstellung der Farbabgleich nicht einfach eine bereits erlernte Strategie schrittweise abgearbeitet wird. In diesem Sinne scheint also kein Strategieerwerb stattgefunden zu haben. In Abschnitt 3.3.3 wird auch gezeigt, daß die Bearbeitungszeiten im Verlauf des Experiments nicht erkennbar sinken, was beim Erlernen effizienter Strategien zu erwarten wäre, so daß sich auch bezüglich dieses Kriteriums kein Strategieerwerb nachweisen läßt.
Vergleich der Anzahl von Aktionen für einen Farbabgleich bei monochromatischen und bei polychromatischen Standardreizen im Zielkontext
Nun soll geprüft werden, ob sich bei Betrachtung der Anzahl der insgesamt für einen Farbabgleich benötigten Aktionen Hinweise darauf finden lassen, daß die Versuchspersonen im veränderten Kontext keinen Farbabgleich zu den im Ausgangskontext präsentierten monochromatischen Standardreizen herstellen können. Ist dies der Fall, dann wäre in solchen Fällen eine höhere Anzahl von Aktionen zu erwarten als bei den Einstellungen zu polychromatischen Standardreizen im Zielkontext, zu denen immer ein Abgleich möglich sein sollte. Beim Vergleich der im unteren Teil von Tabelle 3.2 dargestellten Mediane der Anzahlen von Aktionen, die für Farbabgleiche im Zielkontext benötigt werden, ergeben sich außer bei der Versuchsperson WES aber bei den monochromatischen Standardreizen eher geringere Anzahlen. Bei keiner der Versuchspersonen ist diese Tendenz auf einem Signifikanzniveau von 0.05 statistisch signifikant.
Die Analyse der Anzahl von Aktionen führt also zu dem Schluß, daß im veränderten Kontext eher weniger Aktionen für einen Farbabgleich zu monochromatischen Standardreizen benötigt werden als zu polychromatischen Reizen. Ähnliche Tendenzen findet man auch, wenn man die im nächsten Abschnitt behandelten mittleren Bearbeitungszeiten betrachtet, die für die einzelnen Abgleiche erforderlich sind.
Nun wird der Zeitaufwand betrachtet, den die Versuchspersonen für die Erstellung eines Farbabgleiches aus dem Gedächtnis benötigen. Dazu werden die Bearbeitungszeiten zwischen Beginn der Präsentation der Ausgangskonfiguration (also des zufällig abgeänderten Standardreizes) und Beenden des Farbabgleichs durch Drücken der ``Eingabetaste'' gemessen. In Tabelle A.5 im Anhang A sind die mittleren für eine Einstellung benötigten Zeiten sowie deren Standardfehler für alle Standardreize und für jede Versuchsperson angegeben. Dabei zeigen sich deutliche unsystematische Unterschiede zwischen den einzelnen Reizen: Vor allem bei den Reizen 4, 6, 9 und 10 werden bei allen Versuchspersonen nur relativ geringe Bearbeitungszeiten benötigt. Außerdem sind die mittleren Bearbeitungszeiten bei den Einstellungen im veränderten Kontext niedriger als im Ausgangskontext; dieser Befund wird im Abschnitt 3.3.3 weiter diskutiert.
Die mittleren Bearbeitungszeiten in Sekunden bei den mono- und polychromatischen Standardreizen sowie deren Standardfehler
In Tabelle 3.3 sind die durchschnittlichen Bearbeitungszeiten für die Einstellungen zu monochromatischen und polychromatischen Standardreizen innerhalb des Ausgangskontextes und im veränderten Kontext zusammengefaßt. Der deutlich niedrigere Standardfehler bei den polychromatischen Reizen und bei den Einstellungen im Ausgangskontext kommt durch den in diesem Fall größeren Stichprobenumfang zustande. Zur inferenzstatistischen Untersuchung der Bearbeitungszeiten unter verschiedenen Bedingungen werden U-Tests durchgeführt, da nicht von einer Normalverteilung der Bearbeitungszeiten ausgegangen werden kann. Vergleicht man die für Farbabgleiche innerhalb eines Kontextes durchschnittlich benötigte Zeit bei monochromatischen Standardreizen mit der Bearbeitungszeit bei polychromatischen Reizen, so ergibt der U-Test, daß die Bearbeitungszeiten bei der Versuchsperson SCA ( = ) bei monochromatischen Standardreizen signifikant länger sind und bei WES () in diesem Fall signifikant kürzer. Die Prüfgrößen sind dagegen bei der Versuchspersonen EIM () und SIG () jeweils insignifikant.
Auffällig ist, daß sich ein ähnlicher Befund auch bei Betrachtung der Zeiten zeigt, die für Einstellungen im veränderten Kontext benötigt werden: Die Durchführung eines U-Tests ergibt wieder bei Versuchsperson SCA () einen signifikanten Unterschied zwischen den Bearbeitungszeiten für monochromatische Reize und denen für polychromatische Reize, die Prüfgrößen für die Versuchspersonen EIM (), SIG () und WES () bleiben dagegen insignifikant.
Versuchsperson SCA ist also sowohl im Ausgangskontext als auch im veränderten Zielkontext bei der Erstellung von Farbabgleichen zu polychromatischen Standardreizen signifikant schneller als bei den Einstellungen zu monochromatischen Standardreizen. Bei den anderen drei Versuchspersonen sind die Unterschiede dagegen nicht so ausgeprägt. Außerdem unterscheiden sie sich von der Versuchsperson SCA dadurch, daß bei ihnen die Einstellungen zu den monochromatischen Standardreizen durchschnittlich etwas schneller erfolgen (siehe Tabelle 3.3). Dies ist ein Indiz dafür, daß nur der Versuchsperson SCA die Einstellungen zu den monochromatischen Standardreizen schwerer fallen als zu den anderen Reizen. Die längeren Bearbeitungszeiten sind bei dieser Versuchsperson aber nicht spezifisch für die Einstellungen im Zielkontext, denn sie treten auch im Standardkontext auf. Auch die Betrachtung der für einen Farbabgleich benötigten Zeit liefert somit keine Hinweise darauf, daß zu den monochromatischen Standardreizen im veränderten Kontext keine Entsprechung gefunden werden kann.
In diesem Abschnitt soll untersucht werden, wie sich das Verhalten der Versuchspersonen bei der Erstellung der Farbabgleiche im Verlauf des Experiments verändert. Vor Beginn des (Haupt-)Experiments müssen die Versuchspersonen ja bereits ausgiebige (insgesamt achtstündige) Vorversuche absolvieren. Deshalb ist zu erwarten, daß im Verlauf der 21 experimentellen Sitzungen keine nennenswerten systematischen Verhaltensänderungen mehr auftreten. Vor Untersuchung dieser Frage soll aber noch betrachtet werden, ob sich innerhalb eines Durchgangs Lerneffekte nachweisen lassen.
Ein einzelner Durchgang besteht aus sechs Farbabgleichen zum selben Standardreiz, von denen die ersten fünf im Ausgangskontext und der sechste im Zielkontext durchgeführt werden. Durch das in kurzen zeitlichen Abständen wiederholte Erstellen von Abgleichen zum selben Standardreiz sollten auch die dafür benötigten Bearbeitungszeiten sinken. Tatsächlich zeigt sich, daß die Versuchspersonen innerhalb eines einzelnen Durchgangs bei der Erstellung der Farbabgleiche schneller werden: Die für eine einzelne Farbreproduktion aus dem Gedächtnis durchschnittlich benötigte Zeit nimmt mit der zeitlichen Position innerhalb eines Durchganges tendenziell ab. In Abbildung 3.13 ist dieser Trend deutlich zu erkennen. Die durchschnittliche für die ersten der fünf Abgleiche (innerhalb des Ausgangskontextes) benötigte Zeitspanne liegt über der für den letzten Abgleich (im veränderten Kontext) benötigten.
Die mittlere für einen Farbabgleich benötigte Zeit: Diese Abbildung zeigt für jede Versuchsperson die mittlere für einen Farbgleich benötigte Zeit in Abhängigkeit von dessen zeitlicher Position innerhalb eines Durchgangs: Dazu wird die mittlere Bearbeitungszeit für alle ersten, ..., fünften Einstellungen im Ausgangskontext und zuletzt (als Position 6) für die Einstellungen im Zielkontext bestimmt. Zu diesen Mittelwerten ist auch der Standardfehler eingezeichnet.
Vergleich der Bearbeitungszeiten bei den Einstellungen im Ausgangskontext und bei Kontextübergängen
Dieser Übungseffekt erklärt, warum die mittleren Zeiten, die für die Abgleiche bei verändertem Kontext benötigt werden, relativ kurz sind im Vergleich zu den mittleren Zeiten, die für Abgleiche innerhalb des Ausgangskontextes benötigt werden (siehe Tabelle A.5 im Anhang A). Daß die mittleren Einstellungszeiten innerhalb des veränderten Kontextes insgesamt niedriger sind als bei den ersten fünf Abgleichen im unveränderten Kontext, läßt sich auch aus Tabelle 3.4 entnehmen. Dieser Trend zeigt sich deutlich bei allen Versuchspersonen, jedoch ist der Unterschied bei Durchführung eines U-Tests nur bei den Versuchspersonen EIM () und SIG () signifikant.
In diesem Abschnitt wird untersucht, ob auch noch während des Hauptexperiments systematische Veränderungen im Verhalten der Versuchspersonen stattfinden, was gegen die Konstanz der Parameterwerte sprechen würde, die zur Beschreibung der Kontexteffekte geschätzt werden. Solche Veränderungen könnten dadurch zustande kommen, daß im Verlauf des Experiments von den Versuchspersonen neue Bearbeitungsstrategien erworben werden. Ein Hinweis auf das Anwenden effizienterer Strategien wäre eine Verringerung der für einen Farbabgleich benötigten Zeit und der Anzahl der dazu benötigten Aktionen.
Die durchschnittliche Anzahl von Aktionen in den einzelnen experimentellen Sitzungen: Diese Abbildung zeigt die durchschnittliche Anzahl von Aktionen, die von den Versuchspersonen SCA, EIM, SIG und WES von der ersten bis zur 21. Sitzung bei einem Farbabgleich durchgeführt werden, sowie deren Standardabweichung.
In Abbildung 3.14 ist für jede experimentelle Sitzung die durchschnittlich für einen Farbabgleich benötigte Anzahl von Aktionen dargestellt, wobei sich diese Anzahl wie in Abschnitt 3.3.1 beschrieben zusammensetzt. Die einzelnen Farbabgleiche im Experiment lassen sich für jede Versuchsperson in chronologischer Reihenfolge durchnumerieren, so daß man Nummern von 1 bis 846 erhält. Betrachtet man nun die Rangkorrelation zwischen der Nummer eines einzelnen Farbabgleichs und der Anzahl der dazu benötigten Aktionen, so ergeben sich nur sehr geringe Korrelationen für die einzelnen Versuchspersonen: und . Diese Korrelationen sind durchwegs sehr niedrig und nur bei den Versuchspersonen EIM und SIG signifikant. Bei der Versuchsperson EIM ist diese Korrelation negativ, was auf eine als Lerneffekt interpretierbare Tendenz hindeutet, in den späteren Durchgängen weniger Reizmanipulationen durchzuführen. Bei der Versuchsperson SIG ist die Korrelation dagegen positiv, sie benötigt also in den späteren Durchgängen eher mehr Aktionen.
Die durchschnittlich für einen Farbabgleich benötigte Zeit ist für jede experimentelle Sitzung in Abbildung 3.15 dargestellt. Auch hier zeigt sich keine systematische Verkürzung der für die Einstellungen benötigten Zeit und bei der Berechnung der Rangkorrelation zwischen der Durchgangsnummer und der für die Farbeinstellung benötigten Zeit ergeben sich wiederum nur geringe Korrelationen für die einzelnen Versuchspersonen: und . Einzig bei der Versuchsperson EIM erreicht die Korrelation Signifikanz; sie scheint also im Verlauf des Experiments schneller zu werden.
Die durchschnittliche Dauer eines Farbabgleichs in den einzelnen experimentellen Sitzungen: Diese Abbildung zeigt die in einer experimentellen Sitzung durchschnittlich für einen Farbabgleich benötigte Zeit in Sekunden für die Versuchspersonen SCA, EIM, SIG und WES, sowie deren Standardabweichung.
Insgesamt läßt sich feststellen, daß sich nur bei der Versuchsperson EIM Anzeichen für eine Verbesserung der Bearbeitungsstrategie im Verlauf des Hauptexperimentes nachweisen lassen, die aber auch bei dieser Versuchsperson nur sehr gering ausgeprägt sind. Dies stimmt mit den in Abschnitt 1.1.6 beschriebenen Befunden von Brown (1957) überein.
Von den Versuchspersonen wird nach Beendigung eines Farbabgleichs ein Urteil darüber erhoben, für wie gut sie ihre gerade beendete Einstellung halten (siehe Abschnitt 2.8.4), während erneut der Standardreiz vor dem Ausgangskontext präsentiert wird. Für diese hier Zufriedenheitsurteile genannten Aussagen kann aus fünf vorgegebenen Alternativen gewählt werden, denen für die statistische Auswertung Zahlenwerte von 1 (für die Aussage sehr schlecht) bis 5 (für das Urteil sehr gut) zugeordnet werden, wobei ein höherer numerischer Wert auf eine größere Zufriedenheit der Versuchsperson mit dem von ihr produzierten Reiz hindeutet. Es wird von einem Ordinalskalenniveau dieser Werte ausgegangen. Als Maß der zentralen Tendenz wird hier dennoch das arithmetische Mittel berechnet, da der Median in einigen untersuchten Fällen beim Wert 3 liegt und somit keine hinreichend genaue Unterscheidung zuläßt. Für inferenzstatistische Betrachtungen werden aber nur parameterfreie Verfahren eingesetzt.
Im Anhang A sind für die einzelnen Versuchspersonen die durchschnittlichen Zufriedenheitsurteile zu den Einstellungen für die zehn verschiedenen Standardreize zu finden (Tabelle A.4). Besonders interessant ist die Abhängigkeit der Urteile der Versuchspersonen davon, ob der zu reproduzierende Reiz ein monochromatischer oder polychromatischer ist. In Tabelle 3.5 sind deshalb die mittleren Zufriedenheitsurteile zu den Einstellungen zu monochromatischen Standardreizen denen zu den polychromatischen Standardreizen für die Abgleiche im Ausgangskontext (oberer Teil) und im veränderten Kontext (unterer Teil) gegenübergestellt.
Vergleich der Zufriedenheitsurteile zu den Einstellungen bei monochromatischen und polychromatischen Standardreizen
Wichtig ist hierbei, daß im Falle von Kontextübergängen fast immer die zu den monochromatischen Standardreizen eingestellten Abgleiche am besten beurteilt werden, wobei nur die Beurteilung von Reiz 8 bei den Versuchspersonen SIG und WES eine Ausnahme darstellt. Dies bedeutet, daß die Übereinstimmung der Einstellungen mit dem ursprünglich präsentierten Reiz von den Versuchspersonen bei den monochromatischen Standardreizen als besonders gut beurteilt wird, selbst wenn eine Einstellung im veränderten Kontext beurteilt werden soll. Dies belegen auch die Mediantests, die im unteren Teil von Tabelle 3.5 dargestellt sind: Das mittlere Zufriedenheitsurteil zu den Einstellungen im veränderten Kontext bei monochromatischen Zielreizen liegt bei den Versuchspersonen SCA (), EIM () und SIG () signifikant über dem mittleren Zufriedenheitsurteil zu den Einstellungen bei polychromatischen Zielreizen. Die vierte Versuchsperson WES beurteilt ihre Einstellungen zu den monochromatischen Standardreizen ebenfalls deutlich besser, allerdings bleibt diese Tendenz () bei Durchführung eines Mediantests insignifikant.
Soll der Zielreiz im Ausgangskontext hergestellt werden, ist diese Tendenz zu besseren Zufriedenheitsurteilen bei Spektralreizen etwas schwächer, aber immer noch deutlich. Auch hier liegen die mittleren Güteurteile bei den Versuchspersonen SCA (), EIM () und SIG () im Fall von monochromatischen Reizen in einem Mediantest signifikant über denen bei polychromatischen Reizen (siehe dazu den oberen Teil von Tabelle 3.5). Nur bei Versuchsperson WES () ist dies wiederum nicht der Fall.
Vergleich der Zufriedenheitsurteile zu den Einstellungen im Ausgangskontext und im veränderten Kontext
Eine mögliche Erklärung für die bessere Beurteilung der Einstellungen zu monochromatischen Standardreizen wäre, daß bei stark gesättigten Reizen eine höhere Unterschiedsschwelle vorliegt und deshalb gleiche absolute Abweichungen nicht so deutlich wahrgenommen werden. Dies trifft jedoch zumindest für die verwendeten monochromatischen Standardreize im Bereich von 600 nm Wellenlängenmaximum nicht zu: In diesem Bereich der Normfarbtafel können bereits geringe Farbabweichungen erkannt werden, wie sich beispielsweise an der niedrigen Schwelle der Wellenlängendiskrimination bei Bedford und Wyszecki (1958) und an der Größe der Diskriminationsellipsoide in Abbildung 1.4 zeigt, die von Brown und MacAdam (1949) an monokular vor dunklem Hintergrund präsentierten Reizen bestimmt werden. Eine alternative Erklärung kann darin bestehen, daß die monochromatischen Reize aufgrund ihrer hohen Sättigung als besonders prototypisch wahrgenommen werden, weshalb auch ähnliche Reize diesen Prototypen zugeordnet werden. Wegen solcher Gedächtniseffekte könnten die Versuchspersonen auch bei etwas abweichenden Einstellungen dadurch die Ähnlichkeit für groß halten.
In Tabelle 3.6 sind die mittleren Zufriedenheitsurteile der einzelnen Versuchspersonen zu den Einstellungen im Ausgangskontext den mittleren Urteilen zu den Einstellungen im Zielkontext gegenübergestellt. Bei Durchführung eines Mediantests zeigen sich keine signifikanten Unterschiede bei Versuchsperson SCA () und WES (). Für die beiden anderen Versuchspersonen ergeben sich unterschiedliche Tendenzen: Versuchsperson EIM beurteilt ihre Einstellungen bei einem Kontextwechsel signifikant als besser (), während Versuchsperson SIG sie in diesem Fall signifikant als schlechter () beurteilt. Es lassen sich also keine systematischen Unterschiede in den Urteilen zur Zufriedenheit mit den Einstellungen zwischen Ausgangs- und Zielkontext finden.
Der wichtigste Befund bei der Untersuchung der Urteile der Versuchspersonen zur Güte ihrer Einstellungen ist, daß die im veränderten Kontext hergestellten Abgleiche zu monochromatischen Standardreizen als gut beurteilt werden. Dies kann als sehr deutlicher Hinweis darauf interpretiert werden, daß es den Versuchspersonen auch unter diesen Bedingungen gelingt, eine gleich wie der Standardreiz aussehende Farbe zu finden. Die Bedeutung dieses Ergebnisses für Entscheidungen über die Art möglicher Kontexteffekte wird im nächsten Kapitel diskutiert.