Lexikon

Web Science

Das World Wide Web ist ein Informationsmedium, das sich dadurch auszeichnet, dass es von seinen Benutzern gleichzeitig geschaffen, konsumiert und modifiziert wird und dass dabei die Grenzen zwischen Informationskonsum-produktion und -modifikation verwischen. Selbst vermeintlich statische Hypertextseiten werden weitergeschrieben, erst recht sind Wiki-Seiten, Seiten in sozialen Online-Netzwerken, Webseiten mit Empfehlungsfunktionen, Like-Buttons, Kommentarfeldern oder Diskussionsforen so dynamisch, dass ihr Aussehen und ihre Inhalte auf der lokalen Website aufgrund der Benutzerinteraktionen angepasst werden.

Die Auswahl des Konsumenten, z.B. durch Verfolgen eines Links, beeinflusst aber auch im globalen Web die Darstellung von Inhalten. Besonders offensichtlich ist dieser Zusammenhang, wenn in Suchmaschinen die Ergebnisauswahl eines Nutzers die Suchergebnisse aller anderen Nutzer beeinflusst. Subtiler, aber gleichzeitig viel weitreichender, ist aber die Tatsache, dass die Vernetzung von Informationsdiensten, wie zum Beispiel von Suchmaschinen, sozialen Netzwerken, Werbediensten und Betriebssystemen auf mobilen Endgeräten dazu führen, dass die Aktivitäten einer Person auf einer Webseite zur Modifikation der präsentierten Inhalte und Optionen auf anderen Webseiten führt.

Wenn Benutzer des Webs gleichzeitig Konsumenten, Produzenten und Modifikatoren von Informationen sind und dadurch die Informationspräsentationen und die Informationssichten anderer beeinflussen, dann lässt sich das Web nicht nur als ein dezentrales System von technischen Komponenten beschreiben. Vielmehr bedarf es einer systemischen Sichtweise, die untersucht, wie Vorwissen, Kognition, Affekte, soziale Interaktionen und gesellschaftliche Diskurse im Web(z.B. die Diskussion zum PRISM Überwachungsprogramm der NSA) die Benutzer in ihrem Verhalten beeinflussen, mit dem sie neue Information konsumieren, produzieren und modifizieren, und wie positive und negative Anreize, wie etwa ökonomischer oder sozialen Gewinn, dieses Verhalten steuern. Auch eine nicht-technische Untersuchung von Benutzerverhalten würde hier zu kurz greifen, denn die verwendeten technischen Plattformen und Infrastrukturen im World Wide Web, können das Benutzerverhalten begrenzen, erweitern oder auch subtil modifizieren – z.B. durch die Reaktionsgeschwindigkeit des Systems oder durch das Ranking und das Layout von Informationen.

Solche systemischen, soziotechnischen Mechanismen sind bisher wenig untersucht. Da es um die Verarbeitung und Interpretation von Information geht, sowie um die Beeinflussung menschlichen Verhaltens, spielen Effekte eine Rolle, die üblicherweise in verschiedenen wissenschaftlichen Disziplinen untersucht werden. Durch die zentrale Rolle, die diese Effekte in Bezug auf Wirkung und die Rückkopplung innerhalb des Systems einnehmen, benötigt Web Science als eine Wissenschaft vom Web einen multi- und interdisziplinären Zugang zur Beschreibung und Modellierung des Systems „World Wide Web“ und seiner Akteure.

Abbildung 1 fasst zusammen, was Web Science mindestens abdecken muss: Viele Akteure interagieren auf der individuellen Ebene in Mikrointeraktionen. Einerseits spiegeln diese Mikrointeraktionen Aspekte des Benutzerverhaltens wieder, wie es durch seine kognitiven, sozialen und ökonomischen Gegebenheiten situiert ist. Andererseits reflektieren diese Mikrointeraktionen auch die technischen Beschränkungen, die vorhandene Daten und Informationen, Anwendungen, Protokolle und Regulierungen des Webs dem Benutzer auferlegen. Beides zusammen führt in der Masse der Benutzer zu Makroeffekten. Dementsprechend lässt sich Web Science wie folgt definieren:

Web Science ist die soziotechnische Wissenschaft, die untersucht, wie (i) neue oder vorhandene Technologien, (ii) Regulierungen im Web und Regulierungen durch Webtechnologien oder Webanwendungen und (iii) Aktivitäten der Webbenutzer das Web formen und verändern und wie umgekehrt das Web auf die  Akteure zurückwirkt.

Das Ziel von Web Science ist es, Mikrointeraktionen und Makroeffekte zu beschreiben und zu verstehen. Idealerweise erfolgt dieses Verständnis durch quantitativ beschreibende Modelle, wo das nicht möglich ist zumindest durch qualitative Aussagen über den Zusammenhang zwischen Mikro- und Makroebene. Effekte auf beiden Ebenen sind im Kontext von Regulierungen des World Wide Web zu analysieren, wie sie durch Gesetze (z.B. politische Aussagen, Abbildungen von Nacktheit), technische Standardisierungen (z.B. HTML5), aber auch durch monopolartige Strukturen (z.B. Top-Level-Domänenvergabe) und oligopolartige Strukturen (z.B. Optimierung für wenige Suchmaschinenbetreiber) dem Benutzer und Betreiber von WWW-Plattformen vorgegeben werden (vgl. (Zittrain 2008)).

Im weiteren fokussieren wir uns in diesem Artikel auf die Erläuterung der Bedeutung der Mikro- und Makroebene in Web Science und zeigen an diesen exemplarisch auf, inwiefern ein multi-disziplinärer Ansatz für Web Science nötig ist.

Benutzerinteraktion und –verhalten auf der Mikroebene

Die Modellierung von Interaktions- und Verhaltensmuster ist ein etabliertes Thema in der Webforschung, das zunächst vor allem eingeführt wurde, damit Webanwendungen den Benutzern Vorschläge machen können, welches Informationsobjekt für sie am interessantesten ist (Resnick et al. 1994), wie sie am besten navigieren können oder welches Produkt für sie am geeignetsten sein könnte (Linden et al. 2003). Diese frühesten Modelle des Benutzerverhaltens, die in Empfehlungssystemen realisiert werden, waren aber restringiert auf punktuelle Entscheidungen des Benutzers, z.B. ein Produkt zu kaufen oder nicht. Durch die Modellierung solcher punktuellen Entscheidungen erzielt man kein Verständnis über die Art und Weise, wie Benutzer im Web ihre Zeit einteilen und wie sie verschiedene Webanwendungen nutzen.

Darüber gehen neue Ansätze hinaus, die ein tiefergehendes Verständnis der psychologischen und sozialen Verhaltensmuster anvisieren. Zum Beispiel haben (Lehmann et al. 2012) festgestellt, dass selbst einfache Charakterisierungen des Benutzerverhaltens, wie Verweildauern und Häufigkeit der Nutzung einer Webanwendung, geeignet sind, um verschiedene Arten von Benutzerverhalten und Anwendungen zu kategorisieren. Zum Beispiel werden Suchmaschinen häufig benutzt, aber eher mit kürzerer Verweildauer, soziale Netzwerke oft und mit langer Verweildauer und Reiseportale eher selten – nämlich genau zur Erledigung der Aufgabe „Reisebuchung“. Ob Benutzer also zufrieden sind mit einem Angebot und eine Benutzerbindung an das Angebot eingetreten ist, lässt sich nicht alleine aufgrund dieser Muster bestimmen, sondern nur im Vergleich zur Nutzung ähnlich gearteter Angebote.

Über Verweildauer und Häufigkeit der Nutzung hinaus sind aber diffizilere Unterschiede in den Verhaltensweisen der Benutzer von entscheidendem Interesse. Die Sozialwissenschaften haben für kollaborative Systeme verschiedene Verhaltenstypen beschrieben, z.B. Lurkers, Trolls oder Elitists. Neuere Untersuchungen befassen sich damit die Klassifikation in diese Nutzertypen automatisiert aus dem beobachtbaren Verhalten im Web abzuleiten (vgl.  (Alani et al 2014)). Zum Beispiel wird hierfür betrachtet, wer Diskussionen anstößt und wer wie oft und in welchen sozialen Zusammenhängen antwortet. Aus der Betrachtung dieses individuellen Verhaltens und der Zusammensetzung einer Online Community mit variierenden Anteilen verschiedener Benutzertypen lassen sich dann Vorhersagen, z.B. ob eine Online Community verstärkt von der Abwanderung ihrer Benutzer betroffen sein könnte.

Makrostrukturen in sozialen Inhalten und Informationssystemen

Mikrointeraktionen individueller, isoliert voneinander agierender Benutzer lassen sich auf Meso- und Makroebene zusammenfassen in Form von Verteilungen über Aktivitäten und daraus resultierenden Strukturen. Im Web finden sich Makrobeobachtungen zum Beispiel zu:

  • Häufigkeitsverteilungen von Wort-Verwendungen; z.B. in Dokumenten oder in benutzererzeugten Inhalten oder in Suchmaschinenanfragen
  • Häufigkeitsverteilungen von Beurteilungen; z.B. Notenvergabe für Produkte
  • Verteilungen von Linkstrukturen; z.B. Hypertextlinks oder Freundschaftsbeziehungen

Das wohl auffälligste Merkmal von Makrobeobachtungen sozialer Benutzerinteraktionen im Web ist, dass selten Gleich-, Normal- oder Exponentialverteilungen auftreten, wie man es oft erwarten würde, wenn die Modelle für die Mikrointeraktionen der einzelnen Benutzer unabhängig voneinander wären.

Seit Ende der 90er Jahre gab es eine umfangreiche Analyse von Netzwerkstrukturen des World Wide Webs. An vielen Stellen wurde wiederholt festgestellt, dass Linkstrukturen im Web skalenfrei sind, die Anzahl der Links pro Knoten einem Potenzgesetz folgen und sich ein Gesamtnetzwerk mit im Mittel kleinem mittleren Abstand zwischen zwei beliebigen Knoten ergibt, d.h. das Netzwerk eine Small World bildet (vgl. (Easley & Kleinberg 2010)). Ähnliche Aussagen lassen sich auch finden für andere Strukturen im Web, z.B. Freundschaftsbeziehungen in sozialen Netzwerken (Backstrom et al. 2012). Die Entwicklung von fundamentalen Modellen für die Mikrointeraktion, die diese beobachtbaren Makroeffekte erklären, ist noch bei weitem nicht abgeschlossen (vgl. (Akkermans 2012)).

Rückkopplungen von Benutzerverhalten im World Wide Web erfolgen oft beiläufig so, dass der Benutzer Wertungen abgibt, zum Beispiel dadurch, dass er Produkte wie Bücher oder Hotels auf einer Skala bewertet und gegebenenfalls Kommentare verfasst, sowie dadurch, dass der Benutzer eigene oder fremde Informationsinhalte annotiert. Es kommt zu Systemeffekten erster Ordnung: die Daten der Webanwendung ändern sich und aufgrund dieses geänderten oder erweiterten Informationsbestandes ändern sich Menge, Reihenfolge und Art der Informationspräsentation. Folgen die dabei entstehenden Häufigkeiten von Worten oder Bewertungen nicht den zu erwartenden Verteilungen, kann man oft von Anomalien ausgehen. Dellschaft  (2013) berichtet, dass Spammer so andere Mikrointeraktionen bei der Auswahl ihrer Worte durchführen als „normale“ Benutzer, dass man alleine aufgrund der andersgearteten Verteilung und ohne jegliche Analyse der Inhalte Spammer und Nicht-Spammer unterscheiden kann, sofern nur genügend viele Daten vorliegen.

Darüber hinaus ergeben sich aber auch Systemeffekte zweiter Ordnung: Aufgrund der geänderten Ansicht erhält der Informationskonsument ein anderes Bild, andere Eingaben von Information, Bewertung oder Annotierungen werden nahegelegt und damit ändern sich Informationsmodifikation und –produktion. Mithin ändern die produzierten Informationsinhalte des einen Benutzers, was der nächste Benutzer erzeugt. Solche Effekte können die Qualität des Informationsgehaltes insgesamt potentiell verbessern – aber auch verschlechtern.

Eine mögliche Folge von Systemeffekten zweiter Ordnung sind Informationskaskaden (vgl. (Easley & Kleinberg 2010)), d.h. dass für den Benutzer aufgrund vorheriger eigener Aktivitäten und der Aktivitäten anderer Benutzer gewisse Informationen ausgeblendet werden. Wähler von linken Parteien sehen dann aufgrund ihrer ursprünglichen Präferenzen  im Extremfall nur noch Informationen von den von ihnen präferierten politisch links-orientierten Autoren und das Analoge gilt für die Wähler von rechten Parteien. Ein globaler demokratischer Dialog wird aufgrund solcher Systemeffekte eher eingeschränkt. Solche Makroeffekte wurden bei der Analyse von Querverweisen zwischen Blogs mit politischen Inhalten beobachtet (Adamic & Glance, 2005): als Systemeffekt gibt sich eine Tendenz zu Meinungsmonokulturen, obwohl das Medium Web selbst im Prinzip bestens dafür geeignet wäre, die Diskussion zu fördern, kommt in einem naiv organisierten Informationsraum diese Fähigkeit nicht zum tragen – vielmehr kann das Gegenteil eintreten (vgl. (Pariser 2011)). 

Konklusion

Web Science untersucht Regulierungs-, Kollaborations- und Koordinationsmethoden, die das Web auch in Zukunft zu einer produktiven und gesellschaftlich wünschenswerten Plattform für unsere Zukunft machen. Web Science benötigt hierfür einen Methodenmix: Web Engineering befasst sich primär mit der technischen Realisierung von skalierbaren Webplattformen und Webinfrastrukturen. Um aber zu verstehen, wie Benutzer damit umgehen, muss normative Wissenschaft Regulierungen im Web auf ihre Auswirkungen hin untersuchen, deskriptive Wissenschaft die beobachteten Web-Phänomene strukturieren und klassifizieren – insbesondere historische und aktuelle Aktivitäten der Benutzer. Prädiktive Methoden extrapolieren diese Beobachtungen in die Zukunft. Möglich sind diese Untersuchung nur auf Basis von Webbeobachtungen, wie sie derzeit weltweit unter dem Schlagwort „Web Observatories“ vorangetrieben werden. Web Science muss hier allerdings eine juristische und ethische Selbstbeschränkung dahingehend zu Grunde legen, dass nicht alles, was man vielleicht gerne beobachten würde, beobachtet werden darf.

Das Resultat dieser Wissenschaft vom Web wird ein besseres Verständnis des existierenden World Wide Webs sein, auch eine verbesserte Fähigkeit neue Entwicklungen im Web früher und genauer zu beurteilen, zu nutzen und zielgerichtet Webplattformen für neue Aufgaben zu entwickeln, insbesondere für Aufgaben, die die kreative Zusammenarbeit von vielen Menschen erfordern.

Literatur

Harith Alani, Thomas Gottron, Bassem Nasser, Steffen Staab (eds.). A Computational Approach to Analyzing and Managing Online Communities. Springer, to appear 2014.

Lada A. Adamic, Natalie Glance. The political blogosphere and the 2004 U.S. election: divided they blog. In Proceedings of the 3rd international workshop on Link discovery (LinkKDD '05). ACM, New York, NY, USA, 2005, pp. 36-43.

Hans Akkermans: Web dynamics as a random walk: How and why power laws occur. In: ACM Web Science 2012: Conference Proceedings, June 22-24, 2012. Evanston, IL, pp. 1-10.

Lars Backstrom, Paolo Boldi, Marco Rosa, Johan Ugander, Sebastiano Vigna. Four Degrees of Separation. In: Fourth ACM/ICA Web Science Conference 2012, Evanston, IL, June, 2012.

Tim Berners-Lee, Wendy Hall, James A. Hendler, Kieron O’Hara, Nigel Shadbolt and Daniel J. Weitzner. A Framework for Web Science. Foundations and Trends in Web Science. now publishers, September 2006.

Klaas Dellschaft. The Epistemic Dynamic Model: Developing a Theory of Tagging Systems. Dissertation, Universität Koblenz-Landau, 2013.

David Easley, Jon Kleinberg: Networks, Crowds, and Markets: Reasoning About a Highly Connected World, Cambridge University Press, 2010.

Janette Lehmann, Mounia Lalmas, Elad Yom-Tov, Georges Dupret. Models of user engagement. In: User Modeling, Adaptation, And Personalization. LNCS 7379, Springer 2012, pp. 164.175,

Greg Linden, Brent Smith, Jeremy York. Amazon.com Recommendations: Item-to-Item Collaborative Filtering. IEEE Internet Computing, 7(1): 76-80, 2003.

Eli Pariser. The Filter Bubble: What the Internet Is Hiding from You, Penguin Press, New York, May 2011.

Paul Resnick, Neophytos Iacovou, Mitesh Suchak, Peter Bergstrom, John Riedl. GroupLens: an open architecture for collaborative filtering of netnews. In Proceedings of the 1994 ACM conference on Computer supported cooperative work (CSCW '94). ACM, New York, NY, USA, 175-186. 

S. Staab. Web Science. In: Kuhlen, W. Semar, D. Strauch (eds.). Grundlagen der praktischen Information und Dokumentation - Handbuch zur Einführung in die Informationswissenschaft und -praxis. 6. Ausgabe, Walter De Gruyter, 2013, pp. 441-453.

Jonathan Zittrain. The Future of the Internet - And How to Stop It. 2008.

Autoren und Copyright

Prof. Dr. Steffen Staab
Universität Koblenz-Landau

E-Mail

© Springer-Verlag Berlin Heidelberg 2013