GI 60 Jahre nach Memex: Über die Unvereinbarkeit von Desktop- und Web-Paradigma

von Matthias Müller-Prove
Erschienen in: Lecture Notes in Informatics (LNI): INFORMATIK 2005 – Informatik LIVE! 35. Jahrestagung der Gesellschaft für Informatik e.V. (GI)
Workshop 7: Der Engpass Mensch-Computer-Interface aus der Langzeitperspektive

Abstract: Das World Wide Web hat die etablierte Welt der PCs erobert. Bei allen neuen Möglichkeiten ist dabei aber die Frage nach der Benutzungsschnittstelle nie gestellt worden, so dass wir es heute mit einem Konglomerat aus Desktop- und Browser-Metapher zu tun haben. Es ist dringend anzuraten die zu Grunde liegenden Paradigmen neu zu bewerten.

Die Folien des Vortrags sind noch nicht online.

Memex

Vor nunmehr 60 Jahren beschrieb Vannevar Bush in dem Artikel »As We May Think« [Bu45], dass es Wissenschaftlern kaum noch möglich wäre effektiv und effizient zu arbeiten, da sie – ob der schieren Menge an publizierten Fachartikeln – die Bezüge und à propos unmöglich noch selbst erkennen könnten. Zur Lösung des Problems schlug er eine fiktive Maschine vor, die dem Knowledge-Worker seiner Zeit einen performanten Zugriff auf Dokumente geben sollte.

Memex basierte auf dem Einsatz von Microfilmen. Ähnlich einem Zeitschriftenabo sollten Filmspulen mit den neuesten Veröffentlichungen den Dokumentenschatz des Memex kontinuierlich ergänzen. Im Inneren eines Schreibtisches waren Apparaturen untergebracht, die die Seiten auf mehreren Projektionsschirmen darstellten konnten.

Hatte der Wissenschaftler eine interessante Querverbindung gefunden, so sollte das Memex-System es erlauben die beiden Dokumente dauerhaft miteinander zu verbinden. Weitere Dokumente zu dem jeweiligen Thema konnten ebenfalls angehängt werden, so dass lange Ketten entstehen konnten. Damit entsprechen die sogenannten Trails den Gedankengängen und Überlegungen des Forschers bei der Lektüre. Neben der Erstellung von themenbezogenen Trails sollten die Seiten auch mit Anmerkungen versehen werden dürfen, die dann vom Memex abfotografiert und wie alle anderen Dokumente zur Lektüre und Verknüpfung zur Verfügung standen.
Die Relation zwischen Trails und Dokumenten muss nicht eindeutig sein; ein Dokument kann durchaus unter verschiedenen Gesichtspunkten zu unterschiedlichen Trails gehören. Die sich daraus ergebende Struktur ähnelt verblüffend den Hypertextsystemen, die ab Mitte der sechziger Jahre konzipiert und entwickelt wurden, und die seit Beginn der neunziger Jahre den Erdball in Form des World Wide Web umspannen [Mü02].

Die Desktop-Metapher

Konstituierend für die heutigen grafischen Benutzungsschnittstellen à la Mac OS, Microsoft Windows oder GNOME sind die vier Komponenten Fenster, Icons, Menüs und Zeigegerät (WIMP), sowie fünftens die Desktop-Metapher. Diese Oberflächen seien hier unter dem Begriff WIMP-Desktop zusammengefasst [Mü02].

Die Entwicklung der WIMP-Desktop Systeme reicht bis in die fünfziger Jahre zurück. Zuerst fand im militärischen Bereich die Lightgun, ein Vorläufer des Lichtgriffel, als Pointing-Device Verwendung [Fr99]. Doug Engelbart und Bill English haben dann 1963 am Stanford Research Institute (SRI) die Maus entwickelt. Tiled-Windows zur Darstellung von grafischen Informationen auf einer Kathodenstrahlröhre wurden 1963 von Ivan Sutherland für sein System Sketchpad benutzt [Su63]; später implementierte auch das Team am SRI Freezed-Windows für NLS/Augment. Die ersten überlappenden Fenster und Popup-Menüs wurden von Alan Kay am Xerox PARC für das Smalltalk Entwicklungssystem auf dem Xerox Alto Computer eingeführt. Schließlich komplettierte David Canfield Smith’ Arbeit über Icons Mitte der siebziger Jahre das WIMP Quartett.

Unter dem Begriff Desktop-Metapher – ursprünglich Physical-Office-Metapher – versteht man ein Paradigma der grafischen Benutzungsschnittstellen, über das die Aktionen und Objekte des realen Büroalltags im Computer-Interface eine Entsprechung finden [Sm82]. Dadurch soll Benutzern, die im Umgang mit Computern noch unerfahren sind, die Scheu genommen werden und gleichzeitig auf ihr Alltagswissen rekurriert werden. Die Bürowelt mit Dokumenten, Ordnern, Aktenschränken, Ein- und Ausgangkörben, sowie einem Papierkorb bot sich an, da hier auch die Kunden für die ersten kommerziellen Systeme gesucht wurden. 1981 wurde der Xerox Star vorgestellt; zwei Jahre danach die davon unabhängig entwickelte Apple Lisa. Der Apple Macintosh löste ein weiteres Jahr später die Desktop-Publishing-Revolution der achtziger Jahre aus und war damit der erste kommerziell erfolgreiche Computer mit einer grafischen Benutzungsschnittstelle.

Interaktions-Konventionen der WIMP-Desktop Systeme

Die Darstellung von Objekten auf dem Bildschirm (Fenster und Icons) und deren direkte Manipulation per Mausklick und Menübefehl bzw. per Drag-and-Drop sind wesentlich für WIMP-Desktop Systeme. Icons repräsentieren Ordner und Dokumente. Sie können mit einem Einfachklick markiert werden; ein Doppelklick löst zumeist die Öffnen-Funktion aus.

Weiterentwicklung der Desktop-Metapher

De facto sind die WIMP-Desktop Systeme seit ihrer Markteinführung nur marginal weiterentwickelt worden. Hierarchische Untermenüs, Kontextmenüs, hierarchische Ordnerstrukturen, Taskbar und Dock, Farbe und die Unterstützung eines Mausrades sind alles Erweiterungen, die das grundsätzliche Modell nicht in Frage stellen, sondern in einzelnen Aspekten versuchen mit der gewachsenen Komplexität und den Ansprüchen der Nutzer Schritt zu halten.

Im Bereich der Desktop-Metapher ist sogar zu beobachten, dass die ursprünglichen Konzepte erodieren. Beim Xerox Star, der Apple Lisa und lange Jahre auch beim Macintosh galt beispielsweise der Grundsatz, dass Dokument-Icon und Dokument-Fenster nur zwei unterschiedliche Darstellungsformen desselben Objektes sind. Folglich änderte das Icon sein Aussehen, sobald das Dokument geöffnet war. Ein noch offensichtlicheres Beispiel ist die Eigenschaft realer Objekte, die sich nur an einer Stelle zur gleichen Zeit befinden können. Heute ist es auf Desktop-Systemen möglich, dass zwei verschiedene Fenster denselben Ordner darstellen. Ein eklatanter Verstoß gegen die Alltagserfahrung.

Das World Wide Web

1965 prägte Ted Nelson den Begriff Hypertext [Ne65]. Fast alle danach entwickelten Hypertext-Systeme waren nicht netzwerkfähig.** Die beiden nennenswerten Ausnahmen sind NLS/Augment – 1969 der zweite Knoten des ARPAnet – und Hyper-G, das im gleichen Jahr wie das World Wide Web 1989 von Hermann Maurer an der Universität Graz entwickelt wurde. Erst 1989 stellte Tim Berners-Lee am Kernforschungszentrum CERN den Projektantrag zum World Wide Web [Be89], der die Infrastruktur des Internet nutzbar machte, um eine Hypertextseite auf einem Web-Server mit einer anderen Seite auf einem anderen Server zu verbinden.

Der Web-Client ist zunächst einmal ein normales Programm, das Web-Seiten, die mit einer eindeutigen URL identifiziert werden, in einem Fenster darstellen kann.

Bei dem von Tim Berners-Lee und Robert Cailliau unter NeXT entwickelten Client handelte es sich noch um eine Kombination aus Web-Browser und WYSIWYG-Web-Editor. Die Bearbeitungsfunktionen wurde aber leider bei der Portierung auf andere Plattformen für nicht wichtig erachtet und darum gar nicht erst implementiert, so dass NCSA Mosaic und alle folgenden Web-Clients nur noch reine Browser waren.

Weiterentwicklung des Web

Obwohl das Web-Consortium W3C ständig damit beschäftigt ist einen Konsens über die verwendete Markup-Sprache herzustellen und Erweiterungen wie Cascading Style Sheets und stärkere Strukturen mittels XML zu definieren, hat sich das Web in seinen Strukturprinzipien kaum verändert.
Der Charakter des Web wandelte sich allerdings durch neue Web-Services und Inhaltsangebote sehr. Stellvertretend für die kommerzielle Seite sei hier auf Amazon und eBay hingewiesen. Außerdem hat die weltweite Suche nach Informationen eine neue Qualität erreicht, wie man an Googles Erfolg deutlich ablesen kann.

Interaktions-Konventionen im Web

Die Interaktions-Metapher des Web ist das Browsen – sinngemäß das Durchstöbern von Seiten nach interessanten Inhalten. Die wichtigsten Interaktionsformen sind dabei der Klick auf einen Hyperlink und die reziproke Aktion des Back-Buttons.

In den letzten Jahren sind Tabbed-Windows sehr populär geworden. Das ist ein Interface-Element, bei dem mehrere Sessions wie Karteikarten in einem Fenster Platz finden. Außerdem gibt es Browser-Plugins zur Gestenerkennung. Mit relativ einfachen Mausbewegungen kann der Benutzer damit bestimmte Aktionen im Browser auslösen.

Von der Gleichzeitigkeit des Unvereinbaren

Aus Sicht des Desktop-Paradigmas ist der Web-Browser lediglich ein Schreibtischwerkzeug unter vielen. Das Web hat nun aber eine Größe und Bedeutung angenommen, die bezüglich der Benutzungsschnittstelle insgesamt nicht mehr ignoriert werden darf. Die Interaktionsformen des WIMP-Desktop auf der einen Seite und des Web auf der anderen stehen nämlich konträr gegeneinander. Der wichtige Grundsatz der Erwartungskonformität der Schnittstelle ist schwer verletzt. Dazu drei Beispiele:

  1. In einem Fenster genügt ein Einfachklick auf einen Hyperlink, wohingegen in dem anderen Fenster einen Doppelklick auf ein Dokument- oder Ordner-Icon für eine äquivalente Funktion notwendig ist.
  2. Der Browser merkt sich die Folge der aufgerufenen Web-Seiten in der History. Wenn man nun den Schritt zu einer uninteressanten Seite rückgängig machen möchte, hilft einem die Back-Funktion. Nicht so in Dokumenten der Desktop-Welt. Wenn man da eine Folge von Bearbeitungsschritten rückgängig machen möchte, steht einem (hoffentlich) die Undo-Funktion zur Verfügung. Undo und History sind also zwei Konzepte, die wegen ihrer semantischen Ahnlichkeit zu einer einzigen verschmelzen sollten.
  3. Unter dem WIMP-Desktop Paradigma sind Icon und Fenster zwei verschiedene Darstellungsformen eines Dokuments. Das Dokumentenfenster hat dabei eine sehr starke Bindung an eine bestimmte Datei, da der Speicherungszustand von zentraler Bedeutung ist. Unter dem Web-Paradigma gleicht ein Browser-Fenster vielmehr einem Wechselrahmen, der nacheinander verschiedene Dokumente darstellt. Ein Anwender, der sich auf die Eigenschaften der Desktop-Welt verlässt, die ihn davor bewahren eigene Daten zu verlieren („Wollen Sie das Dokument jetzt sichern?“), wird beim versehentlichen Schließen eines Browser-Fensters entsprechende Warnung schmerzlich vermissen. Es wäre denkbar die History selbst als schützenswerten Inhalt zu begreifen und sie quasi als Trail abzuspeichern. Das ist aber in heutigen Browsern nicht vorgesehen.

Die Beispiele zeigen, dass dieses Nebeneinander verschiedener Interaktionsformen ein effektives und elegantes Arbeiten mit dem Computer verhindert. Der Benutzer wird durch ein kompliziertes Benutzungsschnittstellenwirrwarr von seiner eigentlichen Tätigkeit abgelenkt. Das User Interface sollte aber vertraut und selbstverständlich sein und dadurch im besten Sinne des Wortes transparent werden können. Erst dann kann der Mensch das Potential des Mediums Computer voll ausschöpfen.

Résumé

Vannevar Bushs Idee des Memex war ein einheitliches System zur wissenschaftlichen Lektüre, zur Forschung und zum Verfassen neuer Artikel. Die einzelnen Komponenten dazu sind heute durchaus in einer Qualität verwirklicht, die damals undenkbar war. Die Entwicklungsgeschichte hin zum Personal Computer und dem World Wide Web hat aber ein komplexes System hervor gebracht, das weit hinter Bushs Vision zurückbleibt. Desktop- und Web-Paradigma ergänzen sich leider nicht zu einem homogenen und konsistent bedienbaren Ganzen, sondern konkurrieren miteinander in wichtigen Aspekten der Metapher und Interaktion.

Die Desktop-Metapher ist über 20 Jahre alt und hat inzwischen an Bedeutung verloren. Es wäre daher nicht bedauerlich, wenn sie einer abstrakteren Interaktion mit dem Computer Platz machte. Die neuen Interaktionsformen und Metaphern des Web bieten aber keine vollwertige Alternative, da die Autorenrolle des Benutzers nicht entwickelt ist. Es ist daher dringend notwendig, dass beide Paradigmen zu Gunsten eines besser bedienbaren Systems überdacht werden.

Literaturverzeichnis

Zitiert in

Meyer, H.A., Vogt, P. & Glier, M.: Performance und Usability. i-com, Zeitschrift für interaktive und kooperative Medien (in Druck)

Diskussion

Hans Dieter Hellige, 26. Juni 2005

Date: Sun, 26 Jun 2005 12:24:54 +0200
To: Matthias Mueller-Prove

Werter Herr Mueller-Prove,
[…]

Nur eine kleine Anmerkung: Sie erwecken den Anschein, als ob das Memex-System in sich logisch perfekt war und noch immer nicht realisiert ist. Das Trail-Prinzip war aber durch seine Adressierung mit 6 alphanumerischen Zeichen nicht handhabbar. Da die Adressenvergabe situativ und individuell erfolgen sollte, waren die Dokumente zudem ohne ein umfassendes Adressenverzeichnis gar nicht wiederauffindbar geschweige denn kommunizierbar. Es ist erstaunlich, dass Bush das Retrievalproblem derart verdrängt hat.

Mit den besten Grüßen
Hans Dieter Hellige

MMP, 27. Juni 2005

To: Hans Dieter Hellige
From: Matthias Mueller-Prove

[…]

Sie haben recht, dass Memex nicht in allen Aspekten ausgereift ist. Ich glaube aber, dass die Codes nur Mittel zum Zweck sind. Habe ich erstmal ein Dokument gefunden, dass vage mit dem Gesuchten zu tun hat, dann kann ich mich per Assoziation durchhangeln.

[…]

Herzlichst,
Matthias Müller-Prove

Hans Dieter Hellige, 29. Juni 2005

Date: Wed, 29 Jun 2005 21:04:39 +0200
To: Matthias Mueller-Prove

Lieber Herr Müller-Prove

Das Paper bildet, wie ich gehofft hatte, eine interessante Brücke zwischen Historie und Gegenwart.

Ganz herzlichen Dank

Peter K. Sanner, 4. Juli 2005

Date: 04/07/2005, 3:54 pm
To: Matthias Müller-Prove
Subject: Vertraute Ansichten - doch was tun sprach Zeus

Hallo Herr Müller-Prove,

als ich Ihr Paper gelesen habe, da fand ich vieles von dem was ich Kollegen, Kunden und Freunden regelmäßig beim geselligen Beisammensein an den Kopf werfe wieder ;-)

"Was hat sich die letzten 30-40 Jahre am WIMP Paradigma geändert – Bildschirmauflösung, Anzahl der Farben, Anzahl der Maustasten"… und ähnliches.

Aber was tun? Wenn man Ted Nelsons Leidensweg betrachtet, dann wird doch eines offensichtlich – entweder ist "die Gesellschaft", oder die "Gesellschaften" a.) zu ignorant, b.) zu bequem oder c.) gar nicht willens über bestimmte Zusammenhänge und Quereffekte nachzudenken. Andrew Pam hat mit "Where the world wide web went wrong" so ein schönes Essay dazu geschrieben … But: Who cares?!

Heute ist es hoffähig sich mit "Mein Computer hat gestreikt" aus Verbindlichkeiten zu verabschieden. "Die Mail ist aber raus, ganz bestimmt", wie oft hört man das?! Und das beste: ES WIRD AKZEPTIERT!!!

"Internet Experten" bewerben sich bei Firmen, mit Spezialknowhow im Umgang mit x-verschiedenen Browsern …

Wann kommt der nächste Paradigmensprung? Wann gehen wir Menschen mit Informationen um, und wenden darauf Funktionen an, statt über Netzwerkstandards, Programmversionen etc. zu streiten …

[…]

LG
Peter K. Sanner

Matthias Müller-Prove, 20. Juli 2005

To: Peter K. Sanner

Guten Tag Herr Sanner,

da wir uns ja einig sind, brauche ich mich einfach nur für Ihr Mail zu bedanken.

Gerne würde ich eine Antwort auf die von Ihnen aufgeworfene Frage nach dem Grund der Misere geben: a, b, oder c. Ted Nelsons "Computer Lib" schrie denn auch seine Leser auf dem Cover an: You can und must understand computers NOW.

Ob wohl keiner zugehört hat?

Wir Computer-Wissenschaftler müssen uns aber auch an die eigene Nase fassen. Zu kryptisch, zu komplex und unverständlich sind die Geräte und Programme, die wir den Anwendern hinstellen. Ihnen, den Anwendern, bzw. der "Gesellschaft" kann ich das nicht vorwerfen. Eher sind es die Marketingleute, die ausser vom Tuten keine Ahnung haben und die Monopolisten, die auf halbwegs erfolgreichen Systemen herumreiten, bis der Klepper mausetot ist. Kein Platz für Innovationen.

Die Ideen sind gut. Aber eben nicht massentauglich, solange sie nur als Konzept existieren. Viele Kompromisse sind gemacht worden, um überhaupt so weit zu kommen, wie wir heute sind. Heute fehlt aber der Spirit, um das (und noch mehr) zu machen, was damals nicht umsetztbar war.

Ihre Gründe würde ich in der Reihenfolge b-a-c gewichten. Für die Hersteller gilt c-a-b.

Es grüßt
Matthias Müller-Prove

Francesc Hervada-Sala, 17. Juli 2005

Date: Sun, 17 Jul 2005 20:40:18 +0200
Subject: Re: (Zur Info) MemexSim: The Memex Simulator
To: Matthias Mueller-Prove

Lieber Herr Müller-Prove,

[…]

Ich habe es gelesen — sehr interessant. Haben Sie denn eine Chance, irgendwie Bewegung in diesem Feld zu bringen? Wäre natürlich toll.

Mir ist zwischen PC und Web auch noch den Unterschied aufgefallen, dass es im Web keine Menüs gibt (zumindest keine standardmäßigen, schon gar nicht mit den übrigen am Fensterrand integriert).

Ich bin gerade auf ein Papier gestoßen, das Sie vielleicht interessiert:

A Personal Information and Knowledge Infrastructure Integrator

"[...] This paper explores how blogging is embracing the ideals of hypertext as seen in Xanadu (Nelson 1990), Bush's (1945) memex, and the accumulated research of the hypertext and hypermedia communities (Engelbart 1962 and the Bootstrap Institute). The key benefits seen by end-users will be identified. By projecting these developments into the future, we explore the potential impact and the biggest technological hurdles to accomplishing common-use hypertext."

Viele Grüße,
Francesc Hervada-Sala

Matthias Müller-Prove, 31. Juli 2005

To: Francesc Hervada-Sala

Guten Tag,

das ist ja ein ganz besonders schöner Artikel. Herzlichen Dank für den Link!

Mit den Menüs haben Sie natürlich recht. Keine Menüs im Web. Nur die blödsinnigen Contextmenüs, die einem anbieten das Bild eines Buttons zu speichern. Wer will den sowas?

mit Grüßen
Matthias Müller-Prove

dr. clemens lango, 30. Oktober 2005

hallo herr müller-prove,

heute habe ich einmal in den interessanten artikeln ihrer site gestöbert. […]

zu ihrem artikel "60 Jahre nach Memex" könnte vielleicht für sie mein konzept "visuos" interesant sein - eine software für knowledge worker.

ein schönes wochenende noch und schönen grüße,
clemens lango.

à propos

Mensch-Computer-Interface : Zur Geschichte und Zukunft der Computerbedienung. Hans Dieter Hellige (Hrsg.), transcript, 2008