Axiomatisierung der bilinearen Modelle (Wille, 1994)

Vortrag im Diplomandenseminar
Lehrstuhl Prof. Drösler

Rainer Zwisler

SS 1997

Nachzulesen in:

Bilineare Modelle und Meßtheorie

In der Wissenschaft allgemein versucht man, beobachtbare Phänomene mit Hilfe mathematischer Modelle zu beschreiben; es sollen also Gesetzmäßigkeiten in Form quantitativer Beziehungen der jeweils zugrundeliegenden Eigenschaften ausgedrückt werden. Dabei wird vorausgesetzt, daß die Ausprägungen der betrachteten Eigenschaften des Forschungsgegenstandes gemessen werden können, also durch Zahlen repräsentiert werden können.

Vor allem in den Sozialwissenschaften werden häufig bilineare Modelle eingesetzt, die den Zusammenhang zwischen Eigenschaften durch Produktsummen erfassen. Diese Zusammenhänge lassen sich durch quantitative Modelle erfassen, bei denen die erhobenen Daten in Form einer Tabelle dargestellt werden: Den zu untersuchenden Objekten (Personen bzw. Gegenständen) werden jeweils Ausprägungen (Werte) verschiedener beobachtbarer Merkmale zugeordnet.

Mit Hilfe von bilinearen Modellen lassen sich Zusammenhänge zwischen Eigenschaften als Summen von Produkten ausdrücken:

displaymath34

wobei es sich bei tex2html_wrap_inline927 um Variablen handelt, die die untersuchten Attribute beschreiben. Ein Beispiel ist die Einstellungstheorie von Fishbein & Ajzen, nach der sich die Einstellung tex2html_wrap_inline929 einer Person p zu einem Objekt o Alas Produktsummes aus

berechnen läßt nach der Formel

displaymath42

Orth (1985) hat anhand einiger Beispiele bilineare Modelle aus der Einstellungsforschung betrachtet und analysiert, auf welchem Meßniveau die beteiligten Eigenschaften gemessen werden müssen, um sinnvoll Produktsummen mit den Meßwerten berechnen zu können. Hiernach müssen die jeweiligen Eigenschaften auf Verhältnisskalenniveau gemessen werden. Es muß also mit dem gleichen Informationsgehalt gemessen werden wie in der Längenmessung, was in sozialwissenschaftlichen Zusammenhängen als sehr problematisch gesehen werden muß (meist Rating-Verfahren).

In einem meßtheoretischen Sinne muß man sich an dieser Stelle fragen, unter welchen Voraussetzungen sich ein empirisches Modell eines zu untersuchenden Wirklichkeitsbereichs durch ein derartiges bilineares Modell repräsentieren läßt, d.h. welche Bedingungen ein Datensatz erfüllen muß, damit es überhaupt sinnvoll ist, mit den Meßwerten Produktsummen zu berechnen. Hier soll nun eine meßtheoretische Axiomatisierung diskutiert werden, die eine empirische Überprüfung bilinearer Modelle ermöglicht.

Formulierung des mathematischen Problems

Ziel dieser Arbeit ist es, einen Isomorphismus zu finden zwischen einer Darstellung der Daten und einer numerischen Beschreibung dieser. Dazu wird zunächst ein formales Modell des zu untersuchenden Wirklichkeitsbereiches erstellt, der sogenannte vollständige mehrwertige Kontext tex2html_wrap_inline949 ; dieses formale Modell wird dann durch ein numerisches Modell, den bilinearen Kontext tex2html_wrap_inline951 der Dimension n, repräsentiert. Dann ist das bilineare Modell auch formal gerechtfertigt, d.h. die damit errechneten Werte sind bedeutsam.

Am Ende der Arbeit steht also ein Repräsentationssatz, der die Bedingungen angibt, unter denen eine Berechnung von Produktsummen (wie sie vom bilinearen Modell vorgenommen wird) im meßtheoretischen Sinne als sinnvoll oder bedeutsam bezeichnet werden kann, also eine Repräsentation durch ein bilineares Modell existiert.

Die Frage der Meßbarkeit der Eigenschaften, die einer empirischen Situation zugrunde liegen, reduziert sich somit auf die Frage nach der Existenz einer Repräsentation durch ein numerisches Modell; diese Frage ist dann rein mathematischer Natur. Diese Fragestellung tritt übrigens vergleichbar in den ``Grundlagen der Geometrie'' als Koordinatisierungsproblem auf.

Bilineare Formen in der Mathematik

Zuerst muß nun genau dargelegt werden, was man unter bilinearen Formen zu verstehen hat; insbesondere wird auf den Spezialfall des Skalarproduktes eingegangen.

DEFINITION: Es sei V ein Vektorraum endlicher Dimension auf einem Körper K. Eine bilineare Form auf V ist eine Abbildung tex2html_wrap_inline961 , welche die Bedingungen

displaymath64

displaymath67

für alle tex2html_wrap_inline963 und tex2html_wrap_inline965 erfüllt.

Man macht die Bedingung (i) deutlich, indem man sagt, daß f linear in der ersten Variable ist und entsprechend die Bedingung (ii), indem man sagt, daß f linear in der zweiten Variable sei. Hierfür zwei Beispiele:

Eine Bilinearform tex2html_wrap_inline961 heißt symmetrisch, wenn

displaymath80

für alle tex2html_wrap_inline1001 .

Eine symmetrische Bilinearform tex2html_wrap_inline961 heißt positiv definit, wenn

displaymath83

für alle tex2html_wrap_inline1005 mit tex2html_wrap_inline1007 gilt.

Skalarprodukt

DEFINITION: Ist V ein K-Vektorraum, so nennt man eine positiv definite symmetrische Bilinearform der Gestalt tex2html_wrap_inline1013 mit (wobei die Schreibweise tex2html_wrap_inline1015 eben besagt, daß es sich um ein Skalarprodukt handelt)

displaymath87

ein Skalarprodukt in V.

Wichtig ist, daß man als Ergebnis wieder ein Skalar erhält (daher auch die Bezeichnung ``Skalarprodukt''). Die dafür charakteristischen Bedingungen sollen hier noch einmal für den Fall tex2html_wrap_inline1019 zusammengefaßt werden; für alle tex2html_wrap_inline1021 und tex2html_wrap_inline1023 soll gelten:

tex2html_wrap_inline1025 ,
tex2html_wrap_inline1027 ,
tex2html_wrap_inline1029 ,
tex2html_wrap_inline1031 ,
tex2html_wrap_inline1033 ,
tex2html_wrap_inline1035 , falls tex2html_wrap_inline1007 .

Ein reeller Vektorraum zusammen mit einem Skalarprodukt heißt euklidischer Vektorraum und ein komplexer Vektorraum zusammen mit einem Skalarprodukt heißt unitärer Vektorraum.

Seien tex2html_wrap_inline1039 und tex2html_wrap_inline1041 Spaltenvektoren. Dann ist durch

displaymath103

ein Skalarprodukt in tex2html_wrap_inline989 definiert. Dabei ist zu beachten, daß tex2html_wrap_inline1045 eine reelle Zahl ist. Die Vektoren u und v werden orthogonal genannt, wenn ihr Skalarprodukt Null ist.

Dualraum

DEFINITION: Seien K-Vektorräume V und W sowie eine Abbildung tex2html_wrap_inline1057 gegeben. F heißt K-linear, falls für alle tex2html_wrap_inline1001 und tex2html_wrap_inline1065 gilt:

eqnarray110

DEFINITION: Es sei V ein K-Vektorraum. Dann heißt

displaymath113

d.h. der Vektorraum der linearen Abbildungen tex2html_wrap_inline1071 , der zu V duale Vektorraum oder kurz der Dualraum von V. Jedes tex2html_wrap_inline1077 nennt man Linearform (oder lineares Funktional) auf V.

Der Begriff der Basis des Vektorraums V ist definiert als linear unabhängiger aufgespannter Raum, der wiederum aus einer Familie von Vektoren aus V besteht, aus denen sich alle Elemente von V linear kombinieren lassen.

SATZ: Sei V ein endlich-dimensionaler K-Vektorraum und tex2html_wrap_inline1091 eine Basis von V. Dann gibt es eindeutig bestimmte Linearformen tex2html_wrap_inline1095 mit

eqnarray127

Dann ist tex2html_wrap_inline1097 eine Basis von tex2html_wrap_inline1099 . Man nennt tex2html_wrap_inline1101 die zu tex2html_wrap_inline1103 duale Basis von tex2html_wrap_inline1099 . Zur Abkürzung verwendet man dabei oft das Kronecker-Symbol tex2html_wrap_inline1107 .

Mehrwertige Kontexte zur Beschreibung der Daten

Jetzt muß also als erstes ein geeignetes Modell zur Beschreibung der Daten gefunden werden. In den meisten Anwendungszusammenhängen sind die erhobenen Daten in Form einer Tabelle gegeben, in der bei den zu untersuchenden Objekten jeweils Ausprägungen verschiedener Merkmale beobachtet werden. Eine Formalisierung dieses häufig auftretenden Datensatztyps findet man in der Formalen Begriffsanalyse, die eine Methode der Datenanalyse entwickelt hat, die auf der mathematischen Ordnungstheorie aufbaut. Der Untersuchungsgegenstand der Formalen Begriffsanalyse sind mehrwertige Kontexte, die folgendermaßen definiert sind:

DEFINITION: Ein mehrwertiger Kontext tex2html_wrap_inline1109 besteht aus den Mengen G, M und W und einer dreistelligen Relation tex2html_wrap_inline1117 , wobei gilt:

displaymath154

Die Elemente der Mengen G, M und W haben folgende Bedeutung:

tex2html_wrap_inline1139 wird gelesen als ``das Merkmal m hat beim Gegenstand g den Wert w''; anstelle der Schreibweise tex2html_wrap_inline1139 kann man auch schreiben

displaymath164

Gibt es zu jedem tex2html_wrap_inline1149 ein tex2html_wrap_inline1151 mit tex2html_wrap_inline1139 , so heißt der Kontext tex2html_wrap_inline1109 vollständig.

Die Schreibweise m(g) deutet schon an, daß es sich bei m um Funktionen handelt; im bilinearen Kontext sind es dann entsprechend Elemente aus tex2html_wrap_inline1099 :

Mehrwertige Kontexte sind zur sinnvollen Modellierung von Datensätzen geeignet. Deshalb wird in dieser Arbeit von vollständigen mehrwertigen Kontexten als empirischen Modellen ausgegangen, d.h. es wird angenommen, daß der zu untersuchende Datensatz in Form einer Gegenstand-Merkmal-Tabelle gegeben ist.

Zu diesem empirischen Modell ist nun ein passendes numerisches Modell zu suchen, in dem sich die Produktsummen angemessen modellieren lassen. Das Skalarprodukt ist in der Linearen Algebra der Grundtyp für Produktsummen. Jetzt können wir nun den Begriff des bilinearen Kontextes definieren:

DEFINITION: Sei V ein n-dimensionaler Vektorraum über dem Körper K und tex2html_wrap_inline1099 der Dualraum von V. Dann heißt der mehrwertige Kontext tex2html_wrap_inline1173 , für den die Relation E definiert ist durch (wobei tex2html_wrap_inline1177 )

displaymath175

ein bilinearer Kontext der Dimension n.

Aus dieser Definition läßt sich die zentrale Frage dieser Arbeit formulieren:

tabular179

Zur Beantwortung dieser Frage muß eine Addition und eine Multiplikation auf W so definiert werden, daß W mit diesen Operationen einen Körper bildet (man muß mit den Elementen aus W, also den Testergebnissen, rechnen können) und es müssen die Bijektionen

displaymath186

mit tex2html_wrap_inline1189 und

displaymath188

mit tex2html_wrap_inline1191 gefunden werden, so daß gilt:

displaymath192

Im folgenden wird ein Repräsentationssatz angegeben, der die Bedingungen für die Existenz einer Addition, Multiplikation und Bijektion darlegt, so daß sichergestellt ist, daß das Paar tex2html_wrap_inline1193 einen Isomorphismus zwischen den mehrwertigen Kontexten (G, M, W, I) und tex2html_wrap_inline1197 herstellt. Dann läßt sich der Wert w = m(g) eines Attributes folgendermaßen bestimmen:

displaymath195

wobei dem Objekt g der Vektor tex2html_wrap_inline1203 entspricht und dem Merkmal m der durch die Linearform beschriebene Vektor tex2html_wrap_inline1207 ; außerdem muß gelten tex2html_wrap_inline1209 .

Einwertige und mehrwertige Kontexte

Bei der Untersuchung mehrwertiger Kontexte führt man diese häufig auf einwertige Kontexte zurück, indem man die Merkmalsausprägungen durch einwertige Merkmale interpretiert.

DEFINITION: Unter einwertigen Kontexten versteht man Kontexte, bei denen die Wertemenge W nur ein einziges Element besitzt.

Betrachtet man einen mehrwertigen Kontext (G, M, W, I), so erhält man zu jeden Wert r aus W einen einwertigen Kontext tex2html_wrap_inline1219 , bei dem tex2html_wrap_inline1221 folgendermaßen definiert ist:

displaymath203

Dann lassen sich definieren:

eqnarray205

In Worten läßt sich dies so ausdrücken:

Der folgende Satz besagt nun, daß für einen festen Wert r die durch die Hüllenoperatoren tex2html_wrap_inline1267 und tex2html_wrap_inline1269 definierten Hüllensysteme mit tex2html_wrap_inline1271 vollständige Verbände sind, zwischen denen die Ableitungsoperatoren tex2html_wrap_inline1223 und tex2html_wrap_inline1237 inverse Antiisomorphiosmen induzieren:

SATZ: Für den Kontext tex2html_wrap_inline949 gelte

displaymath221

und

displaymath226

Dann sind tex2html_wrap_inline1279 und tex2html_wrap_inline1281 vollständige Verbände mit dem Supremum tex2html_wrap_inline1283 und dem Infimum tex2html_wrap_inline1285 , wobei tex2html_wrap_inline1287 bzw. tex2html_wrap_inline1289 für alle tex2html_wrap_inline1291 . Die Abbildungen

displaymath245

definiert durch

displaymath256

bilden dann für jedes tex2html_wrap_inline1293 zueinander inverse Antiisomorphismen zwischen tex2html_wrap_inline1295 und tex2html_wrap_inline1297 . Deshalb schreibt man oft anstelle von tex2html_wrap_inline1299 auch tex2html_wrap_inline1301 .

Bemerkenswert ist hier, daß in dem bilinearen Kontext tex2html_wrap_inline1173 für tex2html_wrap_inline1305 offensichtlich immer gilt:

eqnarray266

Im allgemeinen besitzen mehrwertige Kontexte diese Eigenschaft nicht; dies bedeutet, daß diese Eigenschaft, wenn sie nicht aus den anderen geforderten Bedingungen folgt, für einen mehrwertigen Kontext postuliert werden muß, wenn man ihn durch einen bilinearen Kontext repräsentieren will. Für den mehrwertigen Kontext tex2html_wrap_inline949 und tex2html_wrap_inline1309 benötigt man dazu die beiden Bedingungen tex2html_wrap_inline1311 bzw. tex2html_wrap_inline1313 , die folgendermaßen festgelegt werden:

eqnarray278

Zur Verdeutlichung: tex2html_wrap_inline1315 hat folgende Bedeutung: die Menge aller Gegenstände, die beim Merkmal m den Wert r haben.

In Worten lassen sich diese Bedingungen folgendermaßen ausdrücken:

Dazu läßt sich der folgende Hilfssatz aufstellen:

HILFSSATZ: Sei tex2html_wrap_inline949 ein mehrwertiger Kontext und tex2html_wrap_inline1309 . In tex2html_wrap_inline1377 gilt genau dann tex2html_wrap_inline1379 , wenn tex2html_wrap_inline1377 den Bedingungen tex2html_wrap_inline1311 und tex2html_wrap_inline1385 genügt, und es gilt tex2html_wrap_inline1387 , wenn tex2html_wrap_inline1377 den Bedingungen tex2html_wrap_inline1313 und tex2html_wrap_inline1393 genügt.

Gilt tex2html_wrap_inline1379 bzw. tex2html_wrap_inline1387 , so ist tex2html_wrap_inline1399 bzw. tex2html_wrap_inline1401 ein Automorphismus von tex2html_wrap_inline1403 bzw. tex2html_wrap_inline1405 .

Diese Idee soll nun auf mehrwertige Kontexte übertragen werden. Empirisch sieht dies bei einem in Form eines mehrwertigen Kontextes gegebenen Datensatz so aus: Es ist sinnvoll, zu jedem Merkmal alle Gegenstände, die für dieses Merkmal die selbe Ausprägung haben, zusammenzufassen und dabei alle Ausprägungen zu durchlaufen. Deshalb definiert man zu jedem Merkmal m des mehrwertigen Kontextes (G, M, W, I) eine Äquivalenzrelation tex2html_wrap_inline1411 auf G durch

displaymath315

und entsprechend zu jedem Gegenstand tex2html_wrap_inline1239 eine Äquivalenzrelation tex2html_wrap_inline1417 auf M durch

displaymath318

Somit sind

displaymath320

und

displaymath322

Mengenzuerlegungen in Äquivalenzklassen mit gleichem Wert r für tex2html_wrap_inline1239 und tex2html_wrap_inline1225 ; außerdem ist

displaymath324

die Menge aller Gegenstände aus G, die beim Merkmal m alle den selben Wert m(g) haben, und

displaymath327

die Menge aller Merkmale aus M, die beim Gegenstand g alle den selben Wert m(g) haben, wobei tex2html_wrap_inline1439 die Äquivalenzklasse von tex2html_wrap_inline1411 ist, die g enthält, und tex2html_wrap_inline1445 die Äquivalenzklasse von tex2html_wrap_inline1417 ist, die m enthält. Auf diese Weise läßt sich also eine Zerlegung von G bzw. von M in Äquivalenzklassen mit gleichem Wert m(g) erzeugen.

Rahmen

Der Begriff Rahmen stammt von John von Neumann und kann als verbandstheoretisches Gegenstück der Koordinatensysteme in der projektiven Geometrie verstanden werden. Im folgenden wird nun jeweils ein Rahmen in den Äquivalenzrelationenverband von G und M eingeführt.

Jeder Vektorraum V hängt mit seinem Dualraum tex2html_wrap_inline1099 strukturell eng zusammen: Zu jeder Basis von V existiert eine eindeutig bestimmbare Dualbasis von tex2html_wrap_inline1099 . Deshalb sollen nun die Rahmen in den Äquivalenzrelationenverbänden von G und M auf ähnliche Weise zusammenhängen. Dies kommt in der Definition des Doppelrahmens zum Ausdruck. Zuerst werden jedoch die folgenden Schreibweisen eingeführt:

Sind tex2html_wrap_inline1473 fest gewählte Elemente aus G und tex2html_wrap_inline1477 fest gewählte Elemente aus M, so schreibt man für tex2html_wrap_inline1481 mit tex2html_wrap_inline1483

displaymath336

Dies bedeutet folgendes:

Außerdem wird folgende Schreibweise eingeführt:

displaymath347

In Worten läßt sich dies so formulieren:

Für die den Gegenstand g enthaltende Äquivalenzklasse tex2html_wrap_inline1535 von tex2html_wrap_inline1485 schreibt man kurz tex2html_wrap_inline1539 , und für die Äquivalenzklasse tex2html_wrap_inline1541 von tex2html_wrap_inline1505 wird tex2html_wrap_inline1545 geschrieben. tex2html_wrap_inline1545 bezeichnet also die Äquivalenzklasse, die alle Gegenstände enthält, die bei allen Merkmalen außer tex2html_wrap_inline1489 und tex2html_wrap_inline1511 den selben Wert tex2html_wrap_inline1553 haben.

Für tex2html_wrap_inline1225 werden die entsprechenden Bezeichnungen benutzt:

displaymath365

ZUR ERINNERUNG: Eine Abbildung ist surjektiv, gdw. sie rechtstotal ist (jedem Element des Wertebereichs wird eines aus dem Definitionsbereich zugeordnet).

DEFINITION: Sei (G, M, W, I) ein mehrwertiger Kontext. Dann heißt ein geordnetes 2(n+1)-tupel

displaymath374

ein Doppelrahmen der Ordnung n in (G, M, W, I), wenn es zwei Elemente 0, 1 in W gibt mit tex2html_wrap_inline1567 (wobei tex2html_wrap_inline1569 ) für alle tex2html_wrap_inline1571 und wenn für alle tex2html_wrap_inline1481 mit tex2html_wrap_inline1483 die folgenden Bedingungen gelten:

eqnarray381

tex2html_wrap_inline1577 bezeichnet alle Gegenstände, die bei allen Merkmalen außer tex2html_wrap_inline1511 den selben Wert haben. Die Bedingung tex2html_wrap_inline1581 besagt also, daß jeweils zwei Objekte bei mindestens einem Attribut unterschiedliche Werte haben (sonst kann man sie als ein und das selbe Objekt betrachten). Für die Merkmale gilt das selbe. Diese Forderung läuft darauf hinaus, daß (G, M, W, I) keine zwei gleichen Zeilen oder Spalten besitzt. Diese Bedingung stellt keine starke Forderung dar, da man einfach gleiche Zeilen oder Spalten miteinander identifizieren kann. Die Bedingungen tex2html_wrap_inline1585 und tex2html_wrap_inline1587 garantieren insbesondere auch die Existenz von tex2html_wrap_inline1589 und tex2html_wrap_inline1591 .

Dann ist für tex2html_wrap_inline1593 die Bedingung tex2html_wrap_inline1595 äquivalent zu der Eigenschaft, daß jedes Merkmal von M funktional abhängig ist von tex2html_wrap_inline1599 . Außerdem stellt die Bedingung tex2html_wrap_inline1601 sicher, daß tex2html_wrap_inline1489 nicht funktional abhängig ist von tex2html_wrap_inline1605 für alle tex2html_wrap_inline1593 . Deshalb bilden die Einheitsattribute eine ``Basis'' bezüglich der funktionalen Abhängigkeit in M; für die Objekte gilt dies ähnlich.

Ein Doppelrahmen heißt surjektiv, falls

displaymath400

für alle tex2html_wrap_inline1611 .

Sei K ein Körper. Dann ist

displaymath402

ein surjektiver Doppelrahmen des bilinearen Kontextes tex2html_wrap_inline1615 , wobei

Ziel ist es nun, für jeden vollständigen mehrwertigen Kontext (G, M, W, I), der einen surjektiven Doppelrahmen der Ordnung n besitzt, ``kanonische'' Bijektionen tex2html_wrap_inline1631 und tex2html_wrap_inline1633 von G und M auf tex2html_wrap_inline1639 anzugeben. Dazu sind zunächst einige Aussagen über die durch einen Doppelrahmen gegebenen Äquivalenzrelationen tex2html_wrap_inline1641 (beziehungsweise tex2html_wrap_inline1643 ) erforderlich.

Ebenso wie in der projektiven Geometrie mit Hilfe von Koordinatensystemen kann man mit Hilfe der Rahmen tex2html_wrap_inline1645 und tex2html_wrap_inline1647 Bijektionen von G und M auf tex2html_wrap_inline1639 definieren.

SATZ: Sei (G, M, W, I) ein vollständiger mehrwertiger Kontext. Existiert in (G, M, W, I) ein surjektiver Doppelrahmen tex2html_wrap_inline1659 , so sind die Abbildungen tex2html_wrap_inline1661 und tex2html_wrap_inline1663 mit

displaymath428

displaymath431

Bijektionen von G bzw. M auf tex2html_wrap_inline1639 .

Im folgenden werden die zwei weitere Abkürzungen eingeführt:

Der Repräsentationssatz

REPRäSENTATIONSSATZ: Sei n eine natürliche Zahl größer als 2. Ein vollständiger mehrwertiger Kontext (G, M, W, I) mit ausgezeichneten Elementen tex2html_wrap_inline1705 ist genau dann isomorph zu einem bilinearen Kontext der Dimension n, wenn (G, M, W, I) für alle tex2html_wrap_inline1711 den Bedingungen tex2html_wrap_inline1311 und tex2html_wrap_inline1313 genügt und bezüglich 0, 1 einen surjektiven Doppelrahmen tex2html_wrap_inline1717 der Ordnung n besitzt, so daß die folgenden fünf Axiome gelten:

(A0)
Für tex2html_wrap_inline1225 und tex2html_wrap_inline1723 gilt tex2html_wrap_inline1725 und tex2html_wrap_inline1727 .

(A1)
Ist tex2html_wrap_inline1729 und tex2html_wrap_inline1731 für alle tex2html_wrap_inline1733 mit tex2html_wrap_inline1735 und tex2html_wrap_inline1483 , dann existiert ein Merkmal m ungleich tex2html_wrap_inline1591 mit m(g) = m(h); dabei kann tex2html_wrap_inline1745 gewählt werden, wenn tex2html_wrap_inline1747 gilt.

(A2)
Ist tex2html_wrap_inline1749 für ein tex2html_wrap_inline1611 und tex2html_wrap_inline1753 für alle tex2html_wrap_inline1755 , dann gilt für jedes tex2html_wrap_inline1225 :

displaymath452

(A3)
Zu tex2html_wrap_inline1759 und tex2html_wrap_inline1761 mit tex2html_wrap_inline1763 existiert stets ein tex2html_wrap_inline1723 mit tex2html_wrap_inline1767

(A4)
Zu jedem Gegenstand tex2html_wrap_inline1769 und zu jedem Merkmal tex2html_wrap_inline1771 existiert ein Wert tex2html_wrap_inline1723 mit tex2html_wrap_inline1775 bzw. tex2html_wrap_inline1777 .

Gilt dieser Repräsentationssatz, dann existiert ein bilinearer Kontext tex2html_wrap_inline951 ,

Wille(1994) zeigt, daß in tex2html_wrap_inline1615 mit dem Doppelrahmen tex2html_wrap_inline1795 zusätzlich die Axiome (A0) - (A4) gelten.

Interpretation des Repräsentationssatzes

Vorbemerkungen

Der Repräsentationssatz gibt also die Bedingungen an, unter denen ein vollständiger mehrwertiger Kontext (G, M, W, I) isomorph zu einem bilinearen Kontext tex2html_wrap_inline1197 der Dimension n > 2 ist. Ist dies der Fall, dann läßt sich ein Attributwert m(g) folgendermaßen berechnen:

displaymath195

wobei das Objekt g dem Vektor tex2html_wrap_inline1203 entspricht und das Attribut m entspricht der Linearform, die durch den Vektor tex2html_wrap_inline1811 beschrieben wird.

Hier zeigt sich, daß die Annahme der bilinearen Repräsentation eines vollständigen mehrwertigen Kontextes damit zusammenhängt, daß jeder Wert m(g) als Komposition der Werte von g bezüglich m in verschiedenen ``Zuständen'' abhängt. Um dies zu betonen, bezeichnet man den Wert m(g) als einen zusammengesetzten Wert (aggregate value), der sich aus bestimmten Zustandswerten (state values) tex2html_wrap_inline1821 von g bezüglich m im Zustand i zusammensetzt.

Die natürliche Zahl n läßt sich als die Anzahl der betrachteten Zustände interpretieren; die Menge der Zustäde werde bezeichnet durch

displaymath483

Zusammenfassend kann man also sagen, daß im Falle eines Isomorphismus tex2html_wrap_inline1193 von (G, M, W, I) auf tex2html_wrap_inline1197 ein zusammengesetzter Wert m(g) sich aus den Zustandswerten tex2html_wrap_inline1839 zusammensetzt, wobei

Dies bedeutet:

displaymath494

Dabei ist zu beachten, daß hier nicht einfach Objekte und Merkmale betrachtet werden, sondern Objekte und Merkmale in bestimmten Zuständen, die durch eine gegebene Zustandsmenge Z festgelegt sind.

Annahmen des Repräsentationssatzes

Zur Wiederholung der Repräsentationssatz:

Sei n eine natürliche Zahl größer als 2. Ein vollständiger mehrwertiger Kontext (G, M, W, I) mit ausgezeichneten Elementen tex2html_wrap_inline1705 ist genau dann isomorph zu einem bilinearen Kontext der Dimension n, wenn (G, M, W, I) für alle tex2html_wrap_inline1711 den Bedingungen tex2html_wrap_inline1311 und tex2html_wrap_inline1313 genügt und bezüglich 0, 1 einen surjektiven Doppelrahmen tex2html_wrap_inline1717 der Ordnung n besitzt, so daß die fünf Axiome (A0) – (A4) gelten.

Die erste Voraussetzung für den Repräsentationssatz ist, daß für (G, M, W, I) für alle Werte tex2html_wrap_inline1711 die Begingungen tex2html_wrap_inline1311 und tex2html_wrap_inline1313 erfüllt sind. Zur Wiederholung:

tex2html_wrap_inline1311 bedeutet: Für alle Merkmale m existieren Merkmale n, so daß gilt, daß die Menge an Gegenständen tex2html_wrap_inline1239 , die bei dem Merkmal m den Wert r annehmen, gleich sein soll der Menge an Gegenständen sein, die bei dem Merkmal n den Wert s annehmen.

Die zweite Annahme des Repräsentationssatzes ist die Existenz eines surjektiven Doppelrahmens tex2html_wrap_inline1891 unter bezug auf festgelegte Elemente 0 und 1 aus W. Der Wert 0 läßt sich als Gleichgewichtswert (equilibrium value) interpretieren; der Wert 1 kann als Einheit (unit value) für die auf der Grundlage des Doppelrahmens tex2html_wrap_inline1795 erarbeitete Koordinatisierung verstanden werden.

Der Doppelrahmen tex2html_wrap_inline1795 führt auf natürliche Weise zu Bijektionen tex2html_wrap_inline1899 und tex2html_wrap_inline1901 , die folgendermaßen definiert sind:

displaymath508

displaymath511

Die Bedingung für einen Doppelrahmen, tex2html_wrap_inline1601 legt es nahe, die Objekte tex2html_wrap_inline1687 von tex2html_wrap_inline1795 als Einheitsobjekte zu bezeichnen und die Attribute tex2html_wrap_inline1677 von tex2html_wrap_inline1795 als Einheitsattribute. Das restliche Objekt tex2html_wrap_inline1913 und das restliche Attribut tex2html_wrap_inline1915 spielen eine verbindende und vereinende Rolle für die Dimensionen, die von tex2html_wrap_inline1687 und von tex2html_wrap_inline1677 begründet werden. Deshalb bezeichnet man tex2html_wrap_inline1913 als das vereinheitlichende Objekt und tex2html_wrap_inline1915 als das vereinheitlichende Merkmal des Doppelrahmens tex2html_wrap_inline1795 .

Axiom 0

(A0) Für tex2html_wrap_inline1225 und tex2html_wrap_inline1723 gilt tex2html_wrap_inline1725 und tex2html_wrap_inline1727 .

Zuerst zur Klärung der Bestandteile des Axioms (A0):

Es wird also gefordert, daß

tex2html_wrap_inline1591 wird auch das Gleichgewichtsattribut (equilibrium attribute) genannt und tex2html_wrap_inline1589 wird auch als das Gleichgewichtsobjekt (equilibrium object) bezeichnet.

Axiom 1

(A1) Ist tex2html_wrap_inline1729 und tex2html_wrap_inline1731 für alle tex2html_wrap_inline1733 mit tex2html_wrap_inline1735 und tex2html_wrap_inline1483 , dann existiert ein Merkmal m ungleich tex2html_wrap_inline1591 mit m(g) = m(h); dabei kann tex2html_wrap_inline1745 gewählt werden, wenn tex2html_wrap_inline1747 gilt.

Nach diesem Axiom existiert ein Merkmal m ungleich tex2html_wrap_inline1591 , für das m(g) = m(h) gilt. Auch hierbei handelt es sich um ein ``Reichhaltigkeits''-Bedingung (richness condition).

Zur Erinnerung: Bei der Definition des surjektiven Doppelrahmens tex2html_wrap_inline1795 wurde festgelegt:

displaymath529

Also tex2html_wrap_inline2007 .

Interessanter ist der zweite Teil von (A1), der fordert, daß für alle tex2html_wrap_inline2009 und tex2html_wrap_inline1735 gelten soll

displaymath545

Eine besondere Folge davon ist, daß tex2html_wrap_inline2013 für alle tex2html_wrap_inline1735 ; dies bedeutet, daß tex2html_wrap_inline2017 für ein Element tex2html_wrap_inline2019 . Somit sichert (A1) den vereinigenden Charakter von tex2html_wrap_inline1915 .

Axiom 2

(A2) Ist tex2html_wrap_inline1749 für ein tex2html_wrap_inline1611 und tex2html_wrap_inline1753 für alle tex2html_wrap_inline1755 , dann gilt für jedes tex2html_wrap_inline1225 :

displaymath452

Unter Zuhilfenahme von Axiom (A1) läßt sich tex2html_wrap_inline2033 folgendermaßen formulieren:

eqnarray555

Dies soll zeigen, daß das Axiom (A2) eine ähnliche Rolle spielt wie das Axiom P2 im Savage's Expected-Utility-Theorem von Fishburn (1970), das sich folgendermaßen interpretieren läßt: ``P2 besagt, daß die Handlungspräferenzen nicht von denjenigen Zuständen abhängen sollen, die bei den beiden Handlungsalternativen zu den selben Konsequenzen führen.'' Eine ähnliche Interpretation für das Axiom (A2) läßt sich so formulieren:

(A2) besagt, daß die Gleichheit von zusammengesetzten Werten (aggregate values) von Objekten bezüglich eines festen Attributs m nicht von denjenigen Zuständen abhängen soll, die identische Zustandswerte bei den beiden Objekten bezüglich m besitzen.

Interpretiert man das Paar (A, B) mit tex2html_wrap_inline2041 und tex2html_wrap_inline2043 als einen ``natürlichen'' Begriff (concept) von tex2html_wrap_inline1377 mit der Extension A und der Intension B, dann drückt dieser Antiisomorphismus in mathematischen Begrifen aus, was in der Philosophie bekannt ist als das Gesetz der Reziprozität für Begriffe (reciprocity law for concepts). Nach dieser Interpretation führen tex2html_wrap_inline1711 die Bedingungen tex2html_wrap_inline1311 und tex2html_wrap_inline1313 zu einer Übereinstimmung zwischen den extensionalen Strukturen:

displaymath571

und von intensionalen Strukturen:

displaymath580

(Zur Erinnerung: tex2html_wrap_inline2057 und tex2html_wrap_inline1379 gdw. tex2html_wrap_inline1311 und tex2html_wrap_inline1385 gelten).

Axiom 3

(A3) Zu tex2html_wrap_inline1759 und tex2html_wrap_inline1761 mit tex2html_wrap_inline1763 existiert stets ein tex2html_wrap_inline1723 mit tex2html_wrap_inline1767 .

Anstelle von tex2html_wrap_inline2075 Man kann man die Bestandteile des Axiom (A3) auch ausführlicher schreiben:

eqnarray600

Auf ähnliche Weise wie bei (A0) läßt sich zeigen, daß (A3) in tex2html_wrap_inline1615 gilt: Seien tex2html_wrap_inline2079 und tex2html_wrap_inline2081 zwei verschiedene zueinander parallele Hyperebenen in tex2html_wrap_inline1619 , die tex2html_wrap_inline2085 nicht enthalten. Dann gibt es, wie wir aus der analytischen Geometrie wissen, eine Streckung, die tex2html_wrap_inline2079 auf tex2html_wrap_inline2081 abbildet; d.h. es gibt ein tex2html_wrap_inline2091 mit tex2html_wrap_inline2093 . Damit folgt, daß zu tex2html_wrap_inline2079 und tex2html_wrap_inline2081 ein r existiert mit tex2html_wrap_inline2101 .

Axiom (A3) besagt, daß die extensionale Struktur tex2html_wrap_inline2103 stark symmetrisch ist; dies gilt auch für die intensionale Struktur tex2html_wrap_inline2105 : Für alle tex2html_wrap_inline1711 ist die Verkettung tex2html_wrap_inline1399 ein Automorphismus auf tex2html_wrap_inline2103

Das Axiom (A3) fordert dann, daß jedes beliebige Coatom tex2html_wrap_inline2113 von tex2html_wrap_inline2103 abgebildet werden kann auf jedes unverbundene Coatom tex2html_wrap_inline2117 mit Hilfe eines speziellen Automorphismus tex2html_wrap_inline2119 ( tex2html_wrap_inline2121 ist wie folgt definiert: tex2html_wrap_inline2123 ). Dieser Automorphismus läßt sich geometrisch verstehen als die Streckung um den Faktor r, der durch das Gleichgewichtsobjekt tex2html_wrap_inline1589 festgelegt ist.

Axiom 4

(A4) Zu jedem Gegenstand tex2html_wrap_inline1769 und zu jedem Merkmal tex2html_wrap_inline1771 existiert ein Wert tex2html_wrap_inline1723 mit tex2html_wrap_inline1775 bzw. tex2html_wrap_inline1777 .

Unter der Annahme der Bedingungen tex2html_wrap_inline1311 und tex2html_wrap_inline1313 fordert das Axiom (A4), daß

des Verbandes tex2html_wrap_inline2147 für alle tex2html_wrap_inline1723 ist. Dementsprechend soll gelten, daß des Verbandes tex2html_wrap_inline2155 für alle tex2html_wrap_inline1723 ist. Somit handelt es sich bei (A4) um eine weitere Reichhaltigkeitsbedingung, da sie fordert, daß Objekte durch Merkmale unterschieden werden können und daß Merkmale durch Objekte getrennt werden können.

Die Mengen tex2html_wrap_inline1315 bzw. tex2html_wrap_inline2161 mit tex2html_wrap_inline2163 werden als Gegenstands- bzw. Merkmalshyperebenen bezeichnet.

Schlußwort

Das Repräsentationstheorem setzt einen allgemeinen Rahmen für die Analyse bilinearer Modelle. Möglicherweise existieren Datenkontexte, bei denen sich die Voraussetzungen für das Repräsentationstheorem nachweisen lassen; dann wäre ein bilinearer Kontext eine geeignete Beschreibung der Daten.

In den meisten Fällen sind die Daten jedoch mehr oder weniger unvollständig. Dann stellt sich die Frage, ob sich die vorgegebenen Daten durch potentielle Objekte, Attribute und Werte so erweitern lassen, daß sie einen vollständigen mehrwertigen Kontext bilden, der zu einem bilinearen Kontext isomorph ist. Für die Anwendung der bilinearen Modelle sollte sich die Forschung deshalb auf das folgende Problem konzentrieren:

Unter welchen Annahmen kann ein vollständiger mehrwertiger Kontext tex2html_wrap_inline1377 so in einen bilinearen Kontext eingebettet werden, daß die extensionalen und die intensionalen Strukturen von tex2html_wrap_inline1377 berücksichtigt werden?

Bedeutsamkeit von bilinearen Modellen

Nach: Orth, B. (1985). Bedeutsamkeitsanalysen bilinearer Einstellungsmodelle. Zeitschrift für Sozialpsychologie, 16, S. 101-115.

In dieser Arbeit geht es darum, wann Aussagen aufgrund von Skalenwerten empirisch bedeutsam sind; um Bedeutsam zu sein, muß eine numerische Aussage auch für alle gleichwertigen Skalen gelten. Diese Forderung läuft darauf hinaus, daß eine Aussage aufgrund von Skalenwerten gleichermaßen für die zulässig transformierten Skalenwerte der beteiligten Skalen gelten muß. Gleichwertige Skalen liegen somit dann vor, wenn sie jeweils durch zulässige Transformationen ineinander überführbar sind. Dabei spielen die verschiedenen Skalentypen eine wichtige Rolle bei der Untersuchung der Bedeutsamkeit numerischer Aussagen.

DEFINITION: Eine numerische Aussage ist sinnvoll ( bedeutsam) dann und nur dann, wenn sich ihr Wahrheitswert (``wahr'' oder ``falsch'') unter allen zulässigen Transformationen der betreffenden Skala (oder Skalen) nicht ändert.

Anzumerken ist, daß sich der Begriff der Bedeutsamkeit immer auf Aussagen bezieht und nicht auf Rechenoperationen oder z.B. statistische Methoden der Datenauswertung: Nicht die Rechenoperationen oder statistischen Tests sind sinnvoll, sondern die Aussagen, die mit Hilfe dieser Operationen oder Tests aufgrund von Meßwerten gemacht werden. (z.B. statistische Hypothesen, die getestet werden sollen).

Die zulässigen Transformationen charakterisieren den Zusammenhang zwischen gleichwertigen Skalen, also zwischen Skalen, die gleichermaßen homomorphe Abbildungen eines empirischen Relativs in das selbe numerische Relativ sind. Hier seien nun einige häufig vorkommende Klassen zulässiger Transformationen von Skalen beschrieben, die die verschiedenen Skalentypen oder Skalenniveaus bestimmen.

Allg. Bedeutsamkeitsanalyse bilinearer Modelle

Es wurde gezeigt, daß bilineare Modelle der Form

eqnarray664

oder (wenn F eine monoton steigende Funktion ist und A, B, C Variablen sind)

eqnarray667

keine sinnvollen numerischen Aussagen sind, sofern die Variablen A und B auf Ordinal- oder Intervallskalenniveau gemessen sind (unabhängig vom Niveau der Skala C). Dagegen müssen die Skalen A, B mindestens Verhältnisskalenniveau besitzen, also

displaymath670

damit die oben genannten Aussagen (das bilineare Modell) sinnvoll bzw. bedeutsam sind.

Modifikation des Modells

Es läßt sich zeigen, daß die Annahmen in Form der Gleichungen tex2html_wrap_inline2181 bzw. tex2html_wrap_inline2183 derart modifiziert werden können, daß sie sinnvolle numerische Aussagen sind, wenn die Variablen A und/oder B lediglich Intervallskalenniveau haben. Dazu betrachtet man anstelle von Gleichung tex2html_wrap_inline2181 die folgende Gleichung

eqnarray676

wobei a und b reelle Konstanten sind. In dieser Arbeit wird gezeigt, daß ein Modell nach dieser Gleichung, das ebenfalls ein bilineares Modell ist, lediglich Intervallskalenniveau für alle Variablen erfordert.

Für den Fall, daß A Verhältnis- oder Absolutskala und B Intervallskala ist, kann anstelle der letzten Gleichuung die folgende Modellgleichung betrachtet werden,

eqnarray682

wobei b eine reelle Konstante ist. Diese Gleichung könnte beispielsweise dann in Betracht kommen, wenn die Variable A als subjektive Wahrscheinlichkeit nicht nur interpretiert, sondern auch gemessen wird und dann eine Absolutskala ist. Sinnvoll sind Vergleiche von Einstellungswerten aufgrund eines bilinearen Ausdrucks in dieser letzten Gleichung jedoch auch, wenn A nur Verhältnisskala und B Intervallskala ist.

Multiplikatives und biskalierbares Modell

Nach: Falmagne, J.C. (1972). Biscalability of Error Matrices and All-or-None Reaction Time Theories. Journal of Mathematical Psychology, 9, pp 206-224.

Falmagne betrachtet einen Spezialfall des bilinearen Modells, das multiplikative biskalierbare Modell, dem folgende Grundgleichung zugrunde liegt:

displaymath691

Werden bei dieser multiplikativen Verknüpfung anstelle von Skalaren a und x Vektoren eingesetzt, müßte man das Skalarprodukt verwenden. Es würde sich somit um einen bilineares Modell handeln.

Das hier präsentierte Modell wurde für ein experimentelles Paradigma konstruiert, bei dem eine Reaktion von mehreren möglichen Alternativen ausgeführt werden soll (choice reaction situation); der Versuchsperson ist bereits vor dem Durchgang bekannt, welches die richtige Reaktion für jeden Reiz ist. Auch nach intensivem Training können dabei noch Fehler auftreten, die die Reize und die Reaktionen nicht mit perfekter Genauigkeit unterschieden werden können, wegen des Zeitdrucks, Vergessens usw.

Als Daten erhält man die bedingten relativen Häufigkeiten für die verschiedenen Reaktionsklassen, wobei die einzelnen Reize gegeben sind. Solche Daten werden üblicherweise als Konfusionsmatrix bezeichnet.

Eine Zwei-Faktoren-Theorie der Konfusionsmatrizen

Nun müssen zuerst die Bestandteile unserer Theorie definiert werden:

DEFINITION: Treffen die gerade genannten Bedingung zu, dann kann man tex2html_wrap_inline2241 als eine (positive) Konfusionsmatrix bezeichnen.

Die Menge der Wahrscheinlichkeiten in einer Konfusionsmatrix kann durch einen Reizfaktor v(x) und durch einen Reaktionsfaktor u(a) (z.B. eine Tendenz zu bestimmten Reaktionen) erklärt werden. Es lassen sich zwei abstrakte Formen dieser Überlegung betrachten, ein allgemeines biskalierbares und ein spezielle multiplikatives biskalierbares Modell:

Allgemeines bilineares Modell

Es seien u und v reellwertige Funktionen auf R bzw. S; es gilt also tex2html_wrap_inline2255 und tex2html_wrap_inline2257 . Dann sei tex2html_wrap_inline2259 die Menge aller Reiz-Reaktionspaare (a, x), für die gilt tex2html_wrap_inline2263 (es handelt sich also um alle Reiz-Reaktionspaare, die ``falsch'' sind). tex2html_wrap_inline2265 sei das Komplement von P bezüglich K, also die Menge der ``richtigen'' Reiz-Reaktionspaare.

Die Funktion F sei eine reellwertige Funktion, die auf allen Paaren von Zahlen der Form (u(a), v(x)) definiert ist, wobei tex2html_wrap_inline2275 gelten muß. Nun werde angenommen, daß

eqnarray712

für alle tex2html_wrap_inline2275 . Erfüllt eine Konfusionsmatrix diese Bedingungen, wird sie als biskalierbar bezeichnet. Hierbei handelt es sich um einen Spezialfall der verbundenen Messung; dies zeigt sich in der Tatsache, daß tex2html_wrap_inline2265 eine partielle Ordnung auf dem kartesischen Produkt tex2html_wrap_inline2281 induziert.

Spezielles multiplikatives Modell

In manchen Fällen des bilinearen Modells ist der folgende Spezialfall einer biskalierbaren Konfusionsmatrix von Interesse: Es seien u und v wie oben definiert, wobei u > 0 und v > 0 gelten soll. Es werde angenommen, daß

eqnarray719

für alle tex2html_wrap_inline2275 . Eine Konfusionsmatrix, die dieser Bedingung genügt, wird als eine multiplikative Konfusionsmatrix bezeichnet.

Diese Bedingung kann als eine Verallgemeinerung der Bedingung der Quasi- Unabhängigkeit betrachtet werden.

Es existiert ein Verbindungsglied zwischen der Biskalierbarkeit und der Multiplikativität; dabei handelt es sich um die folgende Repräsentation (die hier nicht näher behandelt wird):

displaymath724

Biskalierbare Konfusionsmatrizen

Es sei tex2html_wrap_inline2241 eine Konfusionsmatrix. Es läßt sich zeigen, daß wenn R nur zwei Elemente enthält die Konfusionsmatrix immer multiplikativ ist. Deshalb wird im folgenden davon ausgegangen, daß R mindestens drei Elemente enthält.

In diesem Fall werden angenommen, daß

Ist F im ersten Argument steigend, impliziert dies, daß

displaymath735

Daher gilt wenn tex2html_wrap_inline2311 , dann

displaymath737

Das selbe Argument ergibt sich, wenn F im ersten Argument fallend ist. Aus Symmetriegründen ergeben sich hieraus die Bedingungen:

(BS tex2html_wrap_inline2315 ):
Wenn tex2html_wrap_inline2305 und tex2html_wrap_inline2307 , dann ist tex2html_wrap_inline2321 .

(BS tex2html_wrap_inline2323 ):
Wenn tex2html_wrap_inline2325 und tex2html_wrap_inline2327 , dann ist tex2html_wrap_inline2329 .

(BS tex2html_wrap_inline2331 ):
Wenn tex2html_wrap_inline2305 und tex2html_wrap_inline2335 , dann ist tex2html_wrap_inline2337

Enthält die Reizmenge R mehr als drei Elemente, dann sind die Bedingungen (BS tex2html_wrap_inline2315 ) und (BS tex2html_wrap_inline2323 ) äquivalent zu den folgenden:

(BS tex2html_wrap_inline2315 '):
Wenn tex2html_wrap_inline2305 , dann ist tex2html_wrap_inline2349 .

(BS tex2html_wrap_inline2323 '):
Wenn tex2html_wrap_inline2325 , dann ist tex2html_wrap_inline2355 .

Die bisher dargestellten Ergebnisse münden im Theorem 1:

THEOREM 1: Es sei tex2html_wrap_inline2357 eine Konfusionsmatrix, in der R mindestens drei Elemente enthält. Dann ist tex2html_wrap_inline2361 biskalierbar, genau dann, wenn sie den Bedingungen (BS tex2html_wrap_inline2315 ) - (BS tex2html_wrap_inline2331 ) genügt. Außerdem sind diese Bedingungen unabhängig.

Multiplikative Konfusionsmatrizen

Nun wird wieder angenommen, daß R mindestens drei Elemente enthält; man betrachte die Folgende Bedingung (M), die notwendig und hinreichend dafür ist, daß eine Konfusionsmatrix multiplikativ ist:

displaymath777

für alle tex2html_wrap_inline2369 .

THEOREM 2: Es sei tex2html_wrap_inline2357 eine Konfusionsmatrix, in der R mindestens drei Elemente enthält. Dann ist tex2html_wrap_inline2361 multiplikativ, genau dann wenn die Bedingung (M) gilt.

Es ist zu beachten, daß die Bedingung (M) die Bedingung (M') impliziert:

displaymath790

für alle tex2html_wrap_inline2377 . Wichtig ist dabei, daß im allgemeinen die Bedingung (M') nicht die Bedingung (M) impliziert. Wenn R allerdings mindestens vier Reaktionen enthält, dann sind (M) und (M') äquivalent.

Das nächste Theorem löst die Eindeutigkeitsfrage:

THEOREM 3: Es sei tex2html_wrap_inline2357 eine Konfusionsmatrix, in der R mindestens drei Elemente enthält. Wenn (u, v), (u', v') zwei Paare von streng positiven Funktionen sind, die die Bedingung (2), also tex2html_wrap_inline2387 , für alle tex2html_wrap_inline2275 erfüllen, dann existiert eine Konstante C > 0, so daß für alle tex2html_wrap_inline2393 gilt:

eqnarray799

Verwandschaft zur verbundenen Messung

Nach der Grundgleichung des allgemeinen Modells, tex2html_wrap_inline2303 , handelt es sich bei F um eine beliebige, in ihren beiden Argumenten streng monotone Funktion; dabei ist nur die von tex2html_wrap_inline2265 auf dem kartesischen Produkt tex2html_wrap_inline2281 induzierte Ordnung für die Theorie relevant. Eine biskalierbare Konfusionsmatrix ist deshalb ein Spezialfall der verbundenen Messung (conjoint measurement).

Die Axiome (BS tex2html_wrap_inline2315 ') und (BS tex2html_wrap_inline2323 ')

eqnarray807

sind entweder direkt Teil aller Theorien zur verbundenen Messung oder aus ihnen ableitbar. Es handelt sich dabei um Unabhängigkeitsaxiome, die sicherstellen, daß die Relation tex2html_wrap_inline2407 getrente Ordnungen auf R und S ermöglicht.

Es zeigt sich aber der folgende Unterschied zwischen Theorien zur Biskalierbarkeit und zur verbundenen Messung: tex2html_wrap_inline2265 induziert nur eine partielle Ordnung auf tex2html_wrap_inline2281 anstelle einer totalen Ordnung. Hieraus ergibt sich die Konsequenz, daß (BS tex2html_wrap_inline2331 )

eqnarray820

nicht direkt aus den beiden Bedingungen (BS tex2html_wrap_inline2315 ) und (BS tex2html_wrap_inline2323 )

eqnarray828

abgeleitet werden kann; bei (BS tex2html_wrap_inline2331 ) handelt es sich um ein neues Axiom.

S-Mulitplikativität

Nach: Wandmacher, J. (1977). S-Multiplicativity of a Stochastic Matrix and Applications to Visual Identification. Journal of Mathematical Psychology, 16, pp. 219-233.

Wandmacher verallgemeinert das Konzept der multiplikativen Konfusionsmatrizen von Falmagne zu dem Konzept der S-Multiplikativität. Dabei geht Wandmacher von einer Teilmenge tex2html_wrap_inline2427 aus. In dem Modell von Falmagne (I1972) würde S genau alle falschen Reiz-Reaktions-Paare enthalten; es geht also um alle Elemente außerhalb der Hauptdiagonalen; Wandmacher nennt sie deshalb auch tex2html_wrap_inline2431 -Multiplikativität.

Im folgenden sei tex2html_wrap_inline2433 eine stochastische Matrix; tex2html_wrap_inline2435 läßt sich dann als die bedingte Wahrscheinlichkeit für die Reaktion mit dem Index j unter der Bedingung des Reizes mit dem Index i interpretieren. Falmagne würde dafür schreiben P(a, x). Ein einfaches Modell für derartige stochastische Matrizen besteht darin, die bedingten Wahrscheinlichkeiten als Produkt zweier Funktionen zu analysieren, von denen eine vom Reiz und die andere von der Reaktion abhängt. Diese Dekomposition muß nicht unbedingt für die gesamte Matrix (indexiert durch Elemente aus I) gelten, sondern kann auch nur bei einem Teil (indexiert durch Elemente aus tex2html_wrap_inline2445 ) davon zutreffen. Präziser wird dies in der Definition 1 dargestellt:

DEFINITION 1: Sei tex2html_wrap_inline2447 eine Menge von Indizes; weiterhin sei tex2html_wrap_inline2449 eine stochastische Matrix ( tex2html_wrap_inline2451 ). Man nennt dann P S-multiplikativ, genau dann wenn tex2html_wrap_inline2445 und zwei reellwertige Funktionen u und v existieren, so daß gilt

displaymath857

Dabei schreibt man zur Vereinfachung iSj, um auszudrücken, daß tex2html_wrap_inline2463 .

Falmagne (1972) zeigt einige Verbindungen zwischen der D-Multiplikativität als formales Merkmal einer stochastischen Quadratmatrix und verschiedenen Prozessmodellen für die perzeptuelle Identifizierung und für das Wahlverhalten; diese Modelle sagen tex2html_wrap_inline2431 -multiplikative Konfusionsmatrizen vorher. Von besonderem Interesse ist hierbei das Alles- oder-Nichts-Modell von Townsend (1971). Demnach wird der dargebotene Reiz i entweder mit der Wahrscheinlichkeit tex2html_wrap_inline2471 identifiziert oder es ist keine Information über den präsentierten Reiz verfügbar und die Versuchsperson rät eine Reaktion j mit der Wahrscheinlichkeit tex2html_wrap_inline2475 . Das Alles-oder-Nichts-Modell sagt deshalb eine Konfusionsmatrix nach der folgenden Gleichung vorher (wobei die Reaktion i die einzige für den Reiz i richtige Reaktion sein soll):

eqnarray862

und tex2html_wrap_inline2481 . Gleichung (1) impliziert D- Multiplikativität; später wird sich allerdings zeigen, daß bei Experimenten zur perzeptuellen Identifizierung die empirisch gewonnenen Konfusionsmatrizen nicht D-multiplikativ sein müssen und somit das Alles- oder-Nichts-Modell kein allgemein geeignetes Modell der perzeptuellen Identifizierung darstellt: In der vorliegenden Studie werden Konfusionsmatrizen auf D-Multiplikativität getestet; diese Eigenschaft läßt sich in manchen, aber nicht in allen Fällen nachweisen. Mit der multi component theory of perception (MCTP) von Rumelhart läßt sich erfolgreich vorhersagen, in welchen Situationen die D-Multiplikativität gilt und in welchen nicht. Nun sollen aber zuerst einige Konsequenzen der oben gegebenen Definition der S-Multiplikativität dargestellt werden.

Eigenschaften der S-Multiplikativität

Aufgrund der Definition der S-Multiplikativität ist jede beliebige stochastische Matrix multiplikativ bezüglich einer bestimmten Teilmenge tex2html_wrap_inline2445 ; deshalb müssen bestimmte Bedingungen für die Zusammensetzung von S eingeführt werden, um die S-Multiplikativität nicht-trivial zu halten.

SATZ: Sei tex2html_wrap_inline2449 eine positive stochastische Matrix ( tex2html_wrap_inline2505 ); es sei tex2html_wrap_inline2507 ein Element außerhalb einer Untermenge tex2html_wrap_inline2509 , so daß für einige tex2html_wrap_inline2511 und tex2html_wrap_inline2513 nicht gleichzeitig iSl und kSj gilt. Außerdem sei tex2html_wrap_inline2519

Zerlegungen der S-Multiplikativität

DEFINITION 3: Zwei Teilmengen tex2html_wrap_inline2509 und tex2html_wrap_inline2525 werden dekomponierbar (decomposable) genannt, wenn iSj weder iS'l noch kS'j für beliebige l und k impliziert.

Sei nun tex2html_wrap_inline2537 eine Zerlegung von tex2html_wrap_inline2509 und die Teilmengen tex2html_wrap_inline2541 seien paarweise dekomponierbar. Dann sei tex2html_wrap_inline2543 eine stochastische Matrix, für die gilt, daß P tex2html_wrap_inline2547 -multiplikativ für tex2html_wrap_inline2549 ist. Dann ist P S-multiplikativ.

Gilt also Dekomponierbarkeit der Teilmengen, dann ist auch die Vereinigung dieser multiplikativen Teilmengen wiederum multiplikativ.

Die Eindeutigkeit der Funktionen u und v

Schließlich läßt sich zeigen, daß die Funktionen u und v, die die S- Unabhängigkeit definieren, eindeutig sind bis auf die Multiplikation mit einer Konstanten.



zurück zu meiner homepage

rainer@zwisler.de

Last modified 10-29-98