Die im letzten Abschnitt qualitativ beschriebenen Veränderungen aufgrund der Kontext- und Gedächtniseffekte sollen nun im Rahmen verschiedener Modelle quantitativ erfaßt werden: In diesem Abschnitt werden die Transformationen geschätzt, die die -Koordinaten der Einstellungen im selben und bei verändertem Kontext aufgrund der Koordinaten des betreffenden Standardreizes oder von dessen Gedächtnisfarbe vorhersagen. Dazu wird eine Schätzprozedur nach dem Maximum-Likelihood-Prinzip eingesetzt, die auf einem modifizierten Programm von Kiener (1995) aufbaut. Neben Unabhängigkeit der Werte, die durch Randomisierung der Reihenfolge der Reizdarbietung gewährleistet werden soll, wird dabei eine Normalverteilung der Einstellungen der Versuchspersonen angenommen, die auf Seite begründet wird. Für jede Versuchsperson erfolgt getrennt eine Schätzung der Parameter und der Likelihood für die folgenden vier Modelle zur Vorhersage des Erwartungswerts der Einstellungen aufgrund der -Koordinaten des Standardreizes (bzw. der Gedächtnisfarbe):
Die für diese Modelle erforderlichen Parameter werden durch ein von Kiener (1995) erstelltes und geringfügig modifiziertes Programm geschätzt, das dazu den nach Gegenfurtner (1992) implementierten iterativen PRAXIS-Algorithmus (Brent, 1973) einsetzt. Der Ablauf der Schätzprozedur kann auf verschiedene Weise so beeinflußt werden, daß bereits bei relativ wenigen (nämlich acht bis zwölf) Wiederholungen dieser Prozedur stabile und plausible Werte gefunden werden:
Der C-Quelltext des Schätzprogramms ist vom Autor dieser Arbeit so modifiziert, daß es sich problemlos zwischen verschiedensten Rechnerarchitekturen portieren läßt, und so compiliert, daß eine maximale Ausführungsgeschwindigkeit erzielt werden kann. Obwohl das Programm auf einer sehr schnellen Workstation vom Hersteller Silicon Graphics (ausgestattet mit acht MIPS R4400 Prozessoren mit 150 MHz Taktfrequenz und Coprozessoren sowie 768 MBytes Hauptspeicher) eingesetzt wird, werden für die Schätzprozedur teilweise sehr lange Zeiten benötigt: Für eine einzige Schätzung der Kontexteffekte bei einer Versuchsperson aus etwa 700 Meßwerten wird beispielsweise selbst von diesem Computer eine reine CPU-Zeit von über drei Stunden benötigt.
Das Programm zur Parameterschätzung wird mit einer Datendatei aufgerufen, in der für jeden Farbabgleich die xyL-Koordinaten des vorgegebenen Standardreizes und die xyL-Koordinaten der Einstellung der Versuchsperson stehen. Die daraus bestimmten Transformationsmatrizen, deren Likelihood für das lineare, das affine oder das projektive Modell maximiert ist, sind für alle Versuchspersonen in den Tabellen C.1 bis C.12 im Anhang C angegeben. Es werden jeweils drei verschiedene Schätzungen dargestellt:
Nach der Bestimmung dieser Parameter werden mehrere Likelihood-Quotienten-Tests zum Vergleich der verschiedenen Modelle durchgeführt. Zunächst werden die drei geschätzten Modelle dem unrestingiertem-Modell gegenübergestellt, das als einzige Restriktion eine Normalverteilung der Daten um das Zentroid der Koordinaten der Einstellungen voraussetzt. Anschließend werden auch die drei genannten Modelle untereinander verglichen. Nullhypothese ist bei diesen Tests, daß sich je zwei miteinander verglichene Modelle nicht in ihrer Vorhersagegüte unterscheiden. In den Tabellen C.13 bis C.16 im Anhang C sind die Ergebnisse dieser Modelltests zu sehen. Beim Vergleich mit dem unrestringierten Modell zeigt sich, daß mit einer Ausnahme alle Ergebnisse signifikant sind, d.h. daß die strengeren Modelle die Daten schlechter vorhersagen als das unrestringierte Modell. Daraus folgt, daß weder das lineare noch das affine oder das projektive Modell gut zur Vorhersage der Einstellungen der Versuchspersonen geeignet sind.
Bei Vergleich mit dem unrestringierten Modell erweist sich nur einer der 36 Fälle (4 Versuchspersonen, 3 Modelle, 3 Arten von Effekten) als nicht signifikant: Nur bei Versuchsperson WES erklärt das projektive Modell die Daten genauso gut wie das unrestringierte ((15) = 18.46; p = 0.239), wenn die um die Gedächtniseffekte korrigierten Kontexteffekte betrachtet werden. Da aber nur einer von 36 Vergleichen zwischen dem projektiven und dem unrestringierten Modell ein nicht-signifikantes Ergebnis zeigt, darf diesem keine zu große Bedeutung beigemessen werden.
Beim Vergleich der restringierten Modelle untereinander ergeben sich ebenfalls nur bei Betrachtung der bereinigten Kontexteffekte nicht-signifikante Ergebnisse: Für Versuchsperson SCA erklärt in diesem Fall das affine Modell die Daten genauso gut wie das projektive ((3) = 2.84; p = 0.417). Bei den Versuchspersonen EIM ((3) = 5.8; p = 0.122) und WES ((3) = 4.84; p = 0.187) unterscheiden sich das lineare und das affine Modell nicht in ihrer Vorhersagegüte und bei der Versuchsperson EIM sind das affine ((3) = 4.48; p = 0.214) und das lineare ((6) = 10.28; p = 0.113) Modell genauso gut wie das projektive. Nur in wenigen Fällen - und nur bei Betrachtung der bereinigten Kontexteffekte - beschreiben lineare oder affine Modelle die Daten genauso gut wie projektive. Die Ergebnisse dieser Modelltests deuten also auf eine Überlegenheit des projektiven Modells hin.
Insgesamt ergeben diese Modelltests, daß sich wie auch in der Untersuchung von Kiener (1995) keines der Modelle gut zur Vorhersage des Verhaltens der Versuchspersonen eignet. Von den überprüften Modellen erklärt das projektive, das die meisten freien Parameter besitzt, die Daten noch am besten.