next up previous contents
Next: Einführende Beispiele Up: Multidimensionale Skalierung Previous: Inhalt

Meßtheoretische Grundlagen

Multidimensionale Skalierung ist die Bezeichnung für eine Gruppe von Methoden, die Reizähnlichkeiten räumlich repräsentieren wollen. Diese Methoden erlauben es, aus ordinalen Annahmen über die Daten zu metrischen euklidischen Distanzen der zu beurteilenden Objekte zu gelangen. Im Gegensatz zur Faktorenanalyse können auch Daten eingesetzt werden, die an wenigen Versuchspersonen und unter wenigen Grundannahmen erhoben werden. Das hauptsächliche Ziel ist eine sparsame (parsimonious) räumliche Repräsentation der Objekte.

Vorüberlegungen

In der Tradition von Fechner wird versucht, eindimensionale Skalierungsverfahren zu entwickeln, die dem physikalischen Kontinuum zugeordnete subjektive Empfindungen meßbar machen sollen (psychophysische Funktion). Am Anfang stand der Ansatz von Thurstone, das law of comparative judgment, bei dem ein Attribut des Reizes variiert wird und die Beurteiler angewiesen werden, ihre Urteilsbildung nach dieser Dimension zu organisieren.

Bei der multidimensionalen Skalierung (MDS) wird der subjektiven Ähnlichkeit zwischen Objekten eine metrische Distanz zwischen Punkten im mehrdimensionalen Raum zugeordnet. Ahrens (1974) spricht von einem subjektiven oder psychologischen Reizraum, dessen metrische und dimensionale Repräsentation das Ziel der multidimensionalen Skalierung darstellt. MDS-Modelle werden oft als geometrische Dekompensationsmodelle bezeichnet, deren Grundlage eine gewisse Zerlegbarkeit der Ähnlichkeitsdaten darstellt.

Die der MDS zugrundeliegenden Ähnlichkeitsdaten können z.B.

sein. Es wird davon ausgegangen, daß sich diese empirisch gewonnenen Unähnlichkeiten wie metrische Distanzen verhalten. Deshalb können diese Daten dann einer multivariaten Analyse zu Ähnlichkeitsskalierung unterzogen werden. Dabei wird folgendes Grundprinzip zugrunde gelegt (nach Ahrens, 1974):
Die Objekte werden als Punkte eines metrischen Raumes betrachtet, der nach expliziten Vorschriften des Skalierungsmodells so aufgespannt wird, daß bei minimaler Dimensionalität die beobachteten Reizähnlichkeiten möglichst genau durch die Punktdistanzen approximiert werden.

Bei Verwendung euklidischer Distanzen besteht eine große Ähnlichkeit zwischen MDS und Faktorenanalyse. MDS kommt aber eher aus der Tradition der Psychophysik und soll diejenigen Attribute messen, die der subjektiven Beurteilung komplexer Reizobjekte vermutlich zugrunde liegen. Es werden also quantitative Informationen über latente Meßdimensionen der Reizobjekte hergeleitet. Es handelt sich um ein Verfahren zur Gewinnung von Meßdaten, während die Faktorenanalyse eher zu deren Analyse eingesetzt wird.

Im weiteren Sinne kann man die MDS als Methode zur quantitativen Strukturierung von multivariaten Verhaltensinformationen ansehen; es handelt sich damit eher um ein meßtheoretisches Verfahren als um ein statistisches. Man kann daher MDS auch als Spezialfall von Methoden der Strukturanalyse und dimensionalen Reduktion multivariater Beobachtungen oder sogar als psychologische Theorie der subjektiven Reizähnlichkeit betrachten. Man kann MDS auch als strukturelle Basis von Verhaltenstheorien ansehen, beispielsweise als Theorie der Urteilsbildung oder als Wahrnehmungstheorie. Der theoretische Erklärungswert eines MDS-Modells muß auf drei Ebenen gerechtfertigt werden (was aber in der Praxis nur in den seltensten Fällen getan wird):

Bei der Analyse von MDS-Modellen muß auch die interindividuelle Heterogenität der Beurteiler beachtet werden, also die ``Beurteiler tex2html_wrap_inline1330 Reizobjekt''-Interaktion. Aus der Perspektive der allgemeinen Psychologie und der Psychophysik werden individuelle Unterschiede als Störgröße betrachtet, die ``herausgemittelt'' werden soll, um zu möglichst allgemeinen Aussagen zu gelangen; dies gilt auch für die meisten MDS-Analysen. Man kann aber auch eine differentialpsychologische Basis der MDS berücksichtigen, indem intraindividuell gegliederte subjektive Reizstrukturen in Abhängigkeit von systematischen interindividuellen Unterschieden der Beurteiler skaliert werden.

Datenmodell

Eine Datentheorie nach Coombs soll die Zusammenhänge zwischen Meßwerten und Beobachtungsdaten klären und Konzepte bereitstellen, die der Strukturierung von Datenerhebungsmethoden und Meßverfahren in verschiedenen Verhaltensbereichen dienen. Geometrische Modelle beschreiben das Verhalten als Relationen zwischen Punkten im metrischen Raum. Eine empirisch bedeutsame Messung (Abbildung eines empirischen Relativs in ein numerisches) muß zwei grundlegende Anteile enthalten:

  1. Abstraktion der Realität (theoretische Abstraktion durch mathematisches Modell und experimentelle Abstraktion durch Versuchsplan.),
  2. Interpretation der Realität (theoretische Interpretation des mathematischen Modells und statistische Interpretation der empirischen Beobachtungen),
wobei unter ``Realität'' hier die Reizobjekte zu verstehen sind, die mit den Subjekten interagieren. Wenn sich die theoretische und die statistische Interpretation nicht unterscheiden, dann gilt das Skalierungsmodell als empirisch abgesicherte theoretische Erklärung.

Das empirische Relativ von Personenurteilen, das in Form von Dominanzrelationen (a wird vor b bevorzugt bzw. Präferenzwahrscheinlichkeiten in einer Dominanzmatrix) oder Ähnlichkeitsrelationen (direkte Einschätzung der Ähnlichkeit zweier Reize oder indirekte über Tripelvergleiche, bei denen angegeben werden muß, welcher von zwei Reizen einem dritten ähnlicher ist.) vorliegt, soll also in ein numerisches Relativ abgebildet werden. Es sind auch probabilistische Skalierungsmodelle denkbar, etwa nach dem Luce'schen Wahlaxiom.

Bei der Unfolding-Skalierung werden auf der Grundlage von expliziten Präferenzurteilen von Versuchspersonen implizite Ähnlichkeitsbeziehungen zwischen ihrem Idealpunkt auf einem individuellen Kontinuum und den Reizpunkten hergestellt. Solche im Idealpunkt I einer Person gefaltete Skalen nennt man I-Skala; Ziel der Skalierung ist es, aus den verschiedenen I-Skalen zuerst eine gemeinsame qualitative J-Skala (joint scale) zu entfalten, auf der sich Personen und Objekte gemeinsam abbilden lassen. Unter geeigneten Voraussetzungen (z.B. Eindimensionalität) läßt sich dann aus den Ranginformationen über die Reizähnlichkeiten eine quantitative J-Skala herleiten, die metrische Aussagen über die Ähnlichkeiten bzw. Distanzen der Reize zuläßt. Das Unfolding-Modell wurde auch für mehrdimensionale Ansätze erweitert.

Besonders wichtig im Rahmen der MDS sind Proximitätsdaten. Dabei kann es sich um

handeln. Meist liegen die Daten in Form von tex2html_wrap_inline1346 -Matrizen vor, deren Zeilen/Spalten den n vorgegebenen Reizobjekten entsprechen. Zwischen den Ähnlichkeitsmaßen (Proximitäten) tex2html_wrap_inline1350 und den Distanzen tex2html_wrap_inline1352 in der MDS-Repräsentation soll dabei zumindest eine monotone Beziehung bestehen.

Ahrens (1974) untersucht außerdem das Repräsentationsproblem (Postulieren einer homomorphen/isomorphen Abbildung von den empirischen Strukturen in die Zahlen), das Eindeutigkeitsproblemgif (Skalenniveau aufgrund der Zuordungsvorschrift von den empirischen in die numerischen Strukturen) und das Bedeutsamkeitsproblem (spezifische Bedeutung der numerischen Aussagen für das empirische System).

Das Konzept der Ähnlichkeit und der Metrik

Das Konzept der Ähnlichkeit (Proximität) von Reizen bildet die Grundlage der MDS-Skalierung. Dabei handelt es sich um eine zwei- oder dreistellige Relation. Bei der MDS wird die Versuchsperson nicht explizit instruiert, die Ähnlichkeit hinsichtlich bestimmter Reizmerkmale zu beurteilen, sondern es wird nach der globalen Ähnlichkeit gefragt. Durch beobachtbare Reizähnlichkeiten sollen latente Reizdimensionen geschätzt werden. Dem liegt das theoretische Konstrukt der Existenz einer subjektiven Reizstruktur mit latenten Ähnlichkeitsrelationen zugrunde.

Die Reizähnlichkeiten werden durch die MDS in einem mehrdimensionalen metrischen Raum durch metrische Distanzen repräsentiert. In diesem Sinne spricht man von der Konstruktion eines mehrdimensionalen subjektiven Ähnlichkeitsraumes oder kurz von einem ``psychologischen Raum''. Die Distanzfunktion dieses psychologischen Raumes wird als Modell der zugrundeliegenden subjektiven Prozesse interpretiert, nämlich als Kombiationsregeln für die Bildung von Ähnlichkeitsurteilen in den Dimensionen des metrischen Bildraumes.

Die Aufgabe der Analyse subjektiver Reizähnlichkeiten wird im Prinzip so gelöst, daß man zunächst die Existenz eines empirisch zugänglichen Raumes subjektiver Ähnlichkeitsrelationen zwischen Reizen postuliert. Dann versucht man, die empirischen Reizähnlichkeiten isomorph (bzw. homomorph) in ein numerisches Relativ abzubilden, das strukturell durch einen metrischen Modellraum beschrieben wird, in welchem die Reizähnlichkeiten als metrische Punktdistanzen repräsentiert werden. Die Abbildungsvorschriften sind formal in dem jeweils verwendeten MDS-Modell zusammengefaßt.

Durch diese numerischen Zuordnungen wird im Rahmen der verwendeten Distanzfunktion beschrieben, nach welchen spezifischen Anteilen sich die globalen Reizähnlichkeiten strukturieren: Die globale Distanz d(x, y) zweier Reize i und j wird als Funktion ihrer spezifischen Distanzen tex2html_wrap_inline1372 in den einzelnen Dimensionen i des Abbildungsraumes dargestellt. Damit besteht die wichtigste Aufgabe der Ähnlichkeitsskalierung in der Konstruktion einer geeigneten Distanzfunktion, die angibt, wie und in welcher Metrik die globalen Distanzen aus latenten Reizattributen kombiniert werden können. Dabei müssen die folgenden fundamentalen Axiome einer Metrik erfüllt sein:

  1. Positivität: d(x, y) = 0 für x = y und d(x, y) > 0 für tex2html_wrap_inline1382 .
  2. Symmetrie: d(x, y) = d(y, x).
  3. Dreiecksungleichung: tex2html_wrap_inline1386 .
Gerade die Annahme der Symmetrie ist aber relativ streng und wird bei der MDS-Skalierung meist nicht überprüft. Ahrens (1974) weist darauf hin, daß für nicht-symmetrische Daten noch kein geeignetes MDS-Modell ausgearbeitet wurde.

Die Art der Metrik kommt in der Definition des Abstandes d(x,y) zweier Punkte x und y zum Ausdruck, wobei die globalen Distanzen d(x,y) als Funktion der spezifischen Distanzen tex2html_wrap_inline1372 in n Dimensionen ausgedrückt werden. Für MDS-Modelle werden folgende Metriken eingesetzt:

Metrische MDS

Ahrens (1974) beschreibt verschiedene Verfahren zur MDS. Bei der multidimensionalen Skalierung euklidischer Distanzen nach Torgerson muß berücksichtigt werden, daß es sich bei den Proximitäten um subjektive Schätzungen handelt, die mit einem Fehler behaftet sind. Daher würden man zu unterschiedlichen Konfigurationen gelangen, je nachdem, welchen Punkt man als Ursprung verwenden würde. Um diese Fehler auszugleichen, legt man den Ursprung der Vektoren in den Schwerpunkt der Reizkonfiguration (und hofft, daß so unsystematische Fehler herausgemittelt werden). Zur empirischen Gewinnung der Ähnlichkeitsurteile wird häufig die Methode der vollständigen Triaden verwendet.

In einer ersten Stufe (Distanzmodell) wird eine eindimensionale Skalierung der Ähnlichkeit durchgeführt, die zu vorläufigen Distanzen aufgrund von komparativen Ähnlichkeitsurteilen führt: Aus den beobachtbaren Ähnlichkeitsurteilen werden Distanzen bestimmt. In einer zweiten Stufe (Raummodell) folgt eine metrische und dimensionale Einbettung der Distanzen, so daß die Distanzen auf eine Menge von Reizkoordinaten (als möglichst geringe Punktabstände) in möglichst wenigen Dimensionen reduziert werden. Die Achsen dieses psychologischen Raumes sind die gesuchten Skalen und sie werden auch als subjektive Unterscheidungsvariable interpretiert.

Nonmetrische MDS

Bei der nonmetrischen MDS wird nicht zwischen dem Raummodell und dem Distanzmodell getrennt, beide werden gleichzeitig bestimmt. Außerdem wird keine bestimmte Funktionsform für die Umwandlung von empirischen Ähnlichkeitswerten in metrische Distanzmaße postuliert, sondern es wird nur ein monotoner Zusammenhang zwischen empirischen Ähnlichkeiten und metrischen Distanzen angenommen. Es soll lediglich die Rangordnung beobachteter Unähnlichkeiten in den Reizpaaren durch die Ordnung ihrer metrischen Konfigurations-Distanzen approximiert werden.

Bei dem Ansatz von Shepard wird die metrische Konfiguration aus ordinaler Information konstruiert: Es wird eine minimale Anzahl kartesischer Koordinaten ermittelt, wobei die Ausgangsinformation nicht durch metrische Punktdistanzen, sondern nur durch eine unbekannte Funktion dieser Distanzen dargestellt wird. Durch eine monotone Transformation von Proximitätsmaßen erhält man explizite Distanzen in einem euklidischen Raum minimaler Dimensionalität. In einer simultanen Prozedur sollen also folgende zwei Ziele erreicht werden:

  1. Überführung der Proximitätsmaße tex2html_wrap_inline1350 in euklidische Distanzen tex2html_wrap_inline1352 und
  2. Ermittlung der Konfigurationskoordinaten tex2html_wrap_inline1416 mit tex2html_wrap_inline1418 (wobei r die Dimensionalität des metrischen Raumes bezeichnet.
Man erhält dabei also eine metrische Lösung, obwohl, nur von ordinaler Information und damit von schwachen Annahmen ausgegangen wird!

Güte und Interpretation der MDS-Skalen

Die Güte der Anpassung einer MDS-Lösung muß in bezug auf die Zielsetzung der MDS bestimmt werden. Folgende beiden Zielsetzung sind möglich:

Erklärende MDS: Die MDS wird als Modell betrachtet und als direktes Mittel zur Theorienbildung über Urteilsprozesse, Wahrnehmungsorganisation, Präferenzstrukturen etc. In diesem Falle muß die ``externe Gültigkeit'' einer MDS-Lösung untersucht werden.

Deskriptive MDS: Man kann die MDS auch als Mittel zur Datenreduktion bzw. Datenbeschreibung betrachten. Die Skalierungsprozedur soll Ergebnisse erzeugen, die die Ausgangsdaten reproduzieren und die globalen Anpassungskriterien genügen. Diese ``interne Gültigkeit'' läßt sich durch statistische Signifikanztests überprüfen.

Eine Möglichkeit, die Brauchbarkeit einer Lösung zu bestimmen, besteht im Methodenvergleich: Die Ergebnisse sollten invariant gegenüber der zu ihrer Erhebung verwendeten Methode sein. Die Anpassungsgüte der Skalierung kann beispielsweise wiederum über eine euklidische Distanzfunktion geprüft werden.

Wie bei jeder multivariaten Dimensionsanalyse stellt sich auch bei der MDS das Problem der inhaltlich-psychologischen Interpretation der metrischen Repräsentation der skalierten Ähnlichkeitsdaten. Dies ist insbesondere dann schwierig, wenn die MDS zur Erzeugung neuer Strukturhypothesen eingesetzt wird. Dabei werden drei Methodengruppen unterschieden:

Interne Analyse der räumlichen Repräsentation: Hier orientiert man sich nur an den Ausgangsdaten und der MDS-Repräsentation, wobei zur Interpretation der MDS-Skalen bestimmte Klassifikations- und Cluster-Analysen durchgeführt werden können. Im euklidischen Fall können die Achsen rotiert werden, so daß man das gesamte System so rotieren kann, daß sinnvolle Voraussetzungen für die Interpretierbarkeit erfüllt sind.

Vergleich der räumlichen Repräsentation mit externen Daten: Diese Methoden gehen davon aus, daß neue Achsen so bestimmt werden, daß die Reizprojektionen optimal mit korrespondierenden Reizen hinsichtlich externer Variablen korrelieren (sowohl lineare als auch nicht-lineare Korrelationen sind denkbar). Wird dagegen die zu interpretierende Struktur in Beziehung gesetzt zu einer ``idealen'' Struktur (die von bestimmten Hypothesen vorhergesagt wird), kann die MDS zur Hypothesenprüfung herangezogen werden.

Vergleich verschiedener räumlicher Repräsentationen: Bestimmte Methoden erlauben eine Transformation zwischen verschiedenen Strukturen, so daß räumliche Repräsentationen verglichen werden können, die bei identischen Ausgangsdaten unter Verwendung verschiedener Methoden gewonnen wurden.


next up previous contents
Next: Einführende Beispiele Up: Multidimensionale Skalierung Previous: Inhalt

rainer@zwisler.de

Last modified 10-29-98