Virtuelle Umgebungen können unterschiedliche Sinnesorgane mit Informationen über physikalisch nicht anwesende Objektkonfigurationen reizen. Insbesondere lassen sich nicht existierende oder unzugängliche physikalische Räume simulieren.
Da die mentale Repräsentation von Landkarten räumlicher Natur ist, sollen zuerst allgemeine Befunde zur mentalen Repräsentation von räumlichem Wissen (auch als mentale Vorstellungsbilder oder mental imagery bezeichnet) dargestellt werden; hierbei wird auf die Übersicht von Anderson (1990) zurückgegriffen.
Folgender Befund ist sehr wichtig: Wenn Menschen mit mentalen Bildern operieren, wenden sie analoge Prozesse an wie bei der physikalischen Manipulation der Objekte. Dies zeigt sich beispielsweise in den Ergebnissen von Shepard (siehe Anderson, 1990, S. 91 f.) zur mentalen Rotation zweidimensionaler Abbildungen von dreidimensionalen Objekten: Versuchspersonen sollten angeben, ob sich zwei solcher dargestellten Objekte durch Rotation ineinander überführen lassen. Die dafür benötigte Zeit nimmt linear mit dem Drehungswinkel zu. Da dies für Drehungen mit zwei Freiheitsgraden und für Drehungen mit drei Freiheitsgraden gleichermaßen gilt, folgert der Autor, daß eine dreidimensionale mentale Repräsentation des Objekts manipuliert wird.
Weitere Hinweise auf den bildhaften Charakter bestimmter Gedächtnisrepräsentationen liefern die Experimente zum image scanning von Kosslyn und anderen (siehe Anderson, 1990, S. 93 ff.): Nachdem Versuchspersonen die Landkarte einer Insel so lange gelernt hatten, bis sie diese fehlerfrei aufzeichnen konnten, sollten sie ausgehend von einer Landmarke eine andere suchen und dann eine Reaktionstaste drücken. Die dabei gemessenen Reaktionszeiten steigen linear mit den Distanzen zwischen den Landmarken an. Auch dieses Ergebnis kann so interpretiert werden, daß die Versuchspersonen einen Prozeß durchführen, der einer physikalischen Operation (des Begehens der Strecke) entspricht.
Hinweise darauf, daß es sich auch tatsächlich um bildhafte Repräsentationen handelt ergeben sich aus der Interferenz mit anderen räumlichen Aufgaben: In einer Untersuchung von Brooks (siehe Anderson, 1990, S. 95 ff.) sollten Versuchspersonen an einem vorgestellten F entlangwandern und immer ``ja'' sagen, wenn eine Ecke oben oder unten liegt und ``nein'' sonst (räumliche Bedingung); in der verbalen Bedingung sollten sie für jedes Wort eines vorgegebenen Satzes angeben, ob es sich um ein Substantiv handelt. Mußte die Antwort verbal gegeben werden, unterschieden sich die beiden Bedingungen kaum. Sollte dagegen durch Zeigen auf entsprechende Felder oder durch Klopfen mit der linken bzw. rechten Hand geantwortet werden, zeigten sich in der räumlichen Bedingung deutliche Einbußen. Daraus kann man folgern, daß sowohl die eigentliche Aufgabe als auch die Produktion der Antwort die selben mentalen Strukturen benutzen und es daher zu Interferenz kommt. Daß es sich dabei um kein rein visuelles Phänomen handelt zeigt sich darin, daß es auch auftritt wenn durch Fühlen auf entsprechende Felder gezeigt werden soll. Daß es sich um räumliche und nicht visuelle Phänomene handelt, zeigt sich auch daran, daß sich eine visuelle, aber nicht räumliche secondary task (Helligkeitsurteile) störender auswirkt als eine räumliche aber nicht visuelle (mit verbundenen Augen durch akustisches Feedback einem Pendel folgen).
Beim Größenvergleich von mentalen Konzepten lassen sich ebenfalls Effekte von mentalen Bildern demonstrieren: Beim Größenvergleich von Tierarten hängt die Entscheidungszeit linear vom Logarithmus der geschätzten Größendifferenz ab. Der selbe Befund zeigt sich auch beim Größenvergleich vorgegebener Längen (cf. Moyer, dargestellt in Anderson, 1990, S. 99 ff.).
Anderson (1990) weist außerdem darauf hin, daß mentale Bilder hierarchisch aufgebaut sind aus einzelnen Komponenten. Die Untergliederung wird dabei vom Betrachter geleistet: Komplexe Bilder lassen sich in immer kleinere Einheiten zerlegen (chunking). Dies gilt auch für mentale Landkarten, die ebenfalls eine hierarchische Struktur besitzen (Kontinente, Länder, Bundestaaten, Städte usw.). Durch diese Hierarchie kann es zu Fehleinschätzungen kommen: Beispielsweise glauben die meisten Versuchspersonen, Seattle liege südliche von Montreal, weil die USA südlich von Kanada liegen. Ähnliche Befunde lassen sich auch mit künstlichen Landkarten nachweisen (siehe Stevens und Coupe, dargestellt in Anderson, 1990, S. 103 f.).
Personen mit hohen räumlichen Fähigkeiten erlernen auch räumliches Wissen schneller aus Landkarten. Wissen zur räumlichen Orientierung kann auf zwei verschiedene Arten vorliegen:
Vorteil: Beurteilung aus der eigenen Perspektive möglich, z.B. Angabe der Richtung, in der eine Landmarke vom der gegebenen Position aus liegt; Beurteilung der Wegstrecke zwischen zwei Punkten und Kenntnis von deren Verbindungsstrecke. Durch intensives Training entwickelt sich auch Übersichtswissen, so daß entsprechend trainierte Versuchspersonen den Versuchspersonen, die ihr Wissen alleine aus Landkarten erwerben, in allen Aufgaben überlegen sind.
Nachteil: Bei Abweichungen von der bekannten Route ist die Reorientierung schwierig (dies könnte insbesondere bei Hypertexten zum schnellen Orientierungsverlust führen).
Vorteil: Beurteilung aus der Welt-Perspektive möglich, daher Schätzung der relativen Richtung zwischen zwei Landmarken; Schätzung euklidischen Distanz zwischen zwei Punkten; Kenntnis der absoluten Position von Orten; Finden von Abkürzungen.
Nachteil: Intensives Training bewirkt keine Verbesserung mehr.
Sollen Versuchspersonen Entscheidungen aufgrund von Landkarten treffen, wirkt sich deren Komplexität nicht auf die Reaktionszeit aus; werden dagegen Routenlisten vorgegeben, steigen die Reaktionszeiten mit der Länge der Listen an, wie eine Untersuchung von Bartram (dargestellt in Wickens, 1984) ergab. Für Hypertexte bedeutet dies, daß das Nachschlagen in einer längeren Liste (z.B. Bookmarks oder Historienliste) länger dauert als das Nachschlagen in einer entsprechend aufbereiteten Grafik.
Ein großes Problem bei der Verwendung von Landkarten ist deren richtige Orientierung (alignment problem): Eine richtige Orientierung liegt vor, wenn ```oben'' auch ``weiter vorne'' bedeutet. Wird diese Art der Orientierung nicht eingehalten, dann entsteht ein höherer Aufwand beim Navigieren (cf. May, Peruch & Savoyant, 1995). Wenn vorhandenes Übersichtswissen eingesetzt werden soll, muß es erst von einem exozentrischem Bezugssystem in ein egozentrisches transformiert werden. Dementsprechend definieren May et al. (1995) Navigieren als zusammengesetzte Serie von solchen Transformationen und Rotationen innerhalb eines egozentrisch organisierten Raumes.
May et al. (1995) untersuchen die Auswirkung von misalignment (verdrehten Karten) und von Repräsentationsart (Landkarte vs. Navigation in virtueller Realität) auf Genauigkeit und Zeitaufwand beim zielgerichteten Navigieren. Sowohl die Genauigkeit als auch die Geschwindigkeit der Navigation lassen bei zunehmendem misalignment nach. Falsche Anordnungen wirken sich also sowohl bei räumlichem Wissen aus, das über Landkarten erworben wird, als auch bei Routenwissen, das durch aktives Navigieren zustandekommt. Dieser Befund steht auch mit den Theorien zur mentalen Rotation in Einklang: Die Verschlechterung ist direkt proportional zum Grad der Verdrehung.
Ruddle, Payne und Jones (1998) untersuchen den Erwerb räumlichen Wissens über ein Gebäude. Sie nennen folgende Unterschiede beim Erwerb räumlichen Wissens aufgrund der Art der Übung:
Im zweiten Experiment von Ruddle et al. (1998) wird die Navigation in einer virtuellen Umgebung mit und ohne abstrakte farbige Landmarken verglichen. Es zeigt sich, daß bei Vorhandensein von Landmarken diese erkannt und zur Navigation eingesetzt werden, allerdings führen sie nicht zu einer Verbesserung des Routenwissens. Im dritten Experiment, in dem konkrete Landmarken, die auch eine räumliche Orientierung aufweisen (z.B. Auto, Gabel, Pfanne), eingesetzt werden, führen diese dagegen schon zu einer Verbesserung des Routenwissens. Nach Ruddle et al. (1998) werden (konkrete) Landmarken dabei auf zweierlei Art eingesetzt:
Eine interessante Frage im Zusammenhang mit der Navigation in virtuellen Umgebungen ist, welcher Transfer des in virtuellen Umgebungen erworbenen Wissens auf reale Umgebungen nachweisbar ist. Beim Erwerb motorischer Fertigkeiten ließ sich teilweise kein Transfer auf reale Situationen nachweisen, vermutlich weil in der (virtuellen) Lernsituation kein geeignetes Feedback gegeben wurde. In anderen Untersuchungen (Helikopter-Training oder Brandbekämpfung) konnte dagegen schon ein Transfer nachgewiesen werden (cf. Witmer, Bailey, Knerr & Parsons, 1996).
Der Erwerb von Routenwissen in der realen Welt beginnt bei Landmarken, die dann über aktiv besuchte Wege miteinander verbunden werden. Man kann Routenwissen als das prozedurale Wissen darüber betrachten, wie man von einem Ausgangsort erfolgreich zu einem Bestimmungsort gelangen kann. Es setzt sich aus expliziten Repräsentationen derjenigen Punkte auf der Strecke zusammen, an denen abgezweigt werden muß, und dem Winkel solcher Abzweigungen. Die Schwierigkeit beim Erlernen einer Route hängt ab von
Die zur Zeit verfügbaren Systeme zur Erzeugung virtueller Umgebungen weisen nach Witmer et al. (1996) verschiedene technische Mängel auf, die den Erwerb von Routenwissen beeinträchtigen können:
Witmer et al. (1996) vergleichen drei verschiedene Arten des Erwerbs von Navigationswissen für ein großes Gebäude
Das Erlernen der Routen fällt zu Beginn in der Bedingung ``virtuelle Umgebung'' besonders schwer, es ergibt sich aber eine rasche Besserung (bezüglich der Fehler und der für einen Rehearsal benötigten Zeit); dies wird mit Schwierigkeiten bei der Navigation in der virtuellen Umgebung begründet (insbesondere Kollisionen mit Wänden). Die beiden anderen Gruppen - reale Begehung und symbolisches Erlernen - unterscheiden sich kaum. Es zeigt sich eine positive Korrelation zwischen der zum Erlernen benötigten Zeit und Schwierigkeiten beim Transfer.
Bei dem Trainingstransfer ergibt sich ein deutlicher Haupteffekt der Präsentationsmethode: Am besten ist das Training in der realen Umgebung, das Training in der virtuellen Umgebung ist annähernd genauso effizient und das rein symbolische Training ist deutlich unterlegen (jeweils bezüglich der Zeiten und der Fehler). Das Erlernen der Konfiguration wird dagegen nicht von der Präsentationsart beeinflußt.
Als Fazit ergibt sich, daß Training in virtuellen Umgebungen fast genauso effizient sein kann wie Training in realen Umgebungen. Eine gewisse Steigerung wäre sogar noch durch größere Kompetenz im Umgang mit den Navigationsmöglichkeiten bei virtuellen Umgebungen möglich. Neben militärischen Anwendungen diskutieren Witmer et al. (1996) auch Anwendungen im Katastrophenschutz und bei der Planung von Fluchtwegen.
Allgemein wird angenommen, daß sich durch eine möglichst realistische Darstellung (und insbesondere durch VR) auch die Genauigkeit der mentalen Repräsentation einer (virtuell dargebotenen) Szene erhöht. Es finden sich aber Hinweise in der Literatur darauf, daß die Benutzer virtueller Umgebungen die Größe von Objekten systematisch unterschätzen (wegen ungenauer Darstellung und Verzerrung am Rand der Anzeige von HMDs).
Caird und Hancock (1991) konnten bereits nach 30-minütigem Umgang mit einem VR-System genauere absolute und relative Urteile zur räumlichen Lage nachweisen, aber auch nach der Übungsphase wurden wieder systematische Verzerrungen gefunden. Tversky und andere verwendeten eine Priming-Methode zum Nachweis solcher Verzerrungen. Sie fanden, daß bereits besuchte Wege kürzer erscheinen. Entfernungen zwischen nicht verbundenen Orten wirken dagegen länger.
In dem Experiment von Arthur, Hancock und Chrysler (1997) wurde untersucht, wie gut sich Versuchspersonen die Lage und Entfernungen von neuen Gegenständen merken können, die auf verschiedene Weise präsentiert wurden:
Beim Einschätzen der Entfernungen zwischen den Objekten ergibt sich eine signifikante Wechselwirkung zwischen Geschlecht und Präsentationsart: Frauen kommen besser mit der einäugigen unbewegten Betrachtung zurecht. Beim Zeichnen der Landkarten ergibt sich ein signifikanter Haupteffekt der Präsentationsmethode, da die einäugige Betrachtung überlegen ist. Bei Objekten am Rand ist die Ungenauigkeit größer, vermutlich weil sie mit weniger anderen Objekten in Beziehung gesetzt werden können (es können daher weniger constraints gebildet werden; dafür spricht auch, daß Landmarks und deren Umgebung in anderen Untersuchungen besonders gut erinnert werden können). Schließlich läßt sich eine größere Genauigkeit bei den Urteilen zu Objekten nachweisen, die in einer vor-oder-hinter-Relation zueinander stehen.
Insgesamt ergibt sich in der Untersuchung von Arthur et al. (1997) damit, daß sich die reale und die virtuellen dreidimensionale Darstellung kaum unterschiedlich auf die Bildung einer räumlichen Landkarte auswirken, während das Betrachten eines Abbildes den beiden aktiven Varianten überlegen ist. Euklidische Distanzen scheinen ein geeigneterer Input zum Erlernen räumlicher Zusammenhänge zu sein als aktives Explorieren (wahrscheinlich, weil nur eine Perspektive vorliegt und diese somit auch leichter erlernt werden kann; außerdem führt das aktive Navigieren möglicherweise zu einer erhöhten kognitiven Belastung, was das Erlernen ebenfalls stören kann).