Lexikon

Web 2.0, Publizieren im

Einleitung

Die Revolution des Web 2.0 hinterlässt allseits seine Spuren. Fast jeder hat inzwischen Zugang zum Internet und ist nicht nur in der Lage, Informationen zu konsumieren, sondern kann diese auch selbst mit wenigen Handgriffen bereitstellen. Schnell ist ein Tweet geschickt, eine Wikipedia-Seite geändert oder das eigene Blog online gestellt. Die Auswirkungen dieses neuen Webs machen sich auch bei der Arbeit in der Forschung bemerkbar.

Veröffentlichungen in Form von Büchern, Aufsätzen, Artikeln oder Beiträgen zu Konferenzen oder Workshops sind immer noch der übliche Weg, Forschungsergebnisse zu verbreiten. Allerdings hat sich der Zugang zu den Arbeiten durch das Web grundlegend gewandelt. War noch vor 10-15 Jahren die Bibliothek die zentrale Anlaufstelle, so werden mittlerweile die meisten Veröffentlichungen auch im Web zur Verfügung gestellt. Sucht man also heute nach einer Veröffentlichung, so kann man Standard-Suchmaschinen wie Google nutzen, die auch die Seiten der Verlage in Ihrem Index erfassen. Aber auch spezielle Portale der Bibliotheken oder der Verlage erlauben die Suche nach Veröffentlichungen im Netz, wobei der Umfang und der Zugriff auf die Bestände zum Teil sehr unterschiedlich sein können. 

Was man typischerweise findet, sind nicht immer die Volltexte, sondern meist (nur) die Metadaten, die man auch zum korrekten Zitieren einer Arbeit benötigt. Den Volltext kann man kaufen, oder mit etwas Glück eine Vorabversion von der Webseite des Autors laden. Hat man die gesuchte Veröffentlichung gefunden, dann landen alle Daten im Publikationsmanager, einem Programm zum Verwalten der Veröffentlichungen. Auch hierfür bietet das Web 2.0 Lösungen, die nicht nur eine einfache Übernahme der Meta-Daten sowie das Speichern der Volltexte einer Veröffentlichung erlauben, sondern auch Kontakt zu anderen Nutzern mit gleichen Interessen ermöglichen. Oft bieten solche Portale zusätzliche Funktionen und verweisen auf ähnliche Arbeiten oder unterstützen den Nutzer bei der Arbeit mit und der Organisation von Veröffentlichungen. Diese Web-basierten Dienste stellen das „Verwaltungssystem 2.0“ für Publikationen dar und bieten Vorteile die jeder Wissenschaftler nutzen sollte. 

Der Artikel diskutiert die Suche nach und die Arbeit mit Veröffentlichungen sowie den Umgang mit Volltexten im Web. 

Suche nach Veröffentlichungen

Literaturrecherche mittels Standard-Suchmaschinen

Meist beginnt die Arbeit an einem neuen Aufsatz mit der Suche nach verwandten Artikeln und Arbeiten. Diese startet bei den heutigen Informatikern nicht mehr in der Bibliothek, sondern oft mit Hilfe der Suchmaschine der Wahl. Häufig wird man fündig, da aktuelle Suchmaschinen viele Webseiten von Wissenschaftlern im Index haben. Leider ist nicht jede Fachrichtung gleich gut mit ihren Arbeiten im Web vertreten. Verlage präsentieren ihren Bestand im Web und können so per Suchmaschine gut gefunden werden. Was nicht im Web verfügbar ist, wird nicht gefunden, was zu einem Problem werden kann. Meist lohnt sich ein Blick auf die Online-Portale der Bibliotheken oder auf spezielle akademische Suchmaschinen, die im folgendem vorgestellt werden. 

 

Digitale Bibliotheken “2.0”

Wird man im Web nicht fündig, so gibt es eine Reihe von weiteren Möglichkeiten. Ausgehend vom Bibliothekskatalog der eigenen Universitätsbibliothek, der meist eine Suche über alle Werke der eigenen Bibliothek erlaubt, kann man auch zentrale Verbundkatalogsysteme anfragen. Diese enthalten meist deutlich mehr Werke und ergänzen so den Bestand der eigenen Bibliothek. Für den Autor des Artikels wäre die erste Anlaufstelle der Katalog der Universität Würzburg[1]. Wird er hier nicht fündig, so verweist die Bibliothek[2] selbst auf ihren Seiten gleich auf den BVB, den Verbundkatalog des Bibliotheksverbundes Bayern[3]. Dessen Suchmaske bietet auch die Möglichkeit, direkt im WorldCat[4] (einem übergeordnetem Katalog) zu suchen. 

Ausgehend von Bibliotheksdiensten zum Suchen von Literatur wurde von OCLC in den letzten Jahren der sehr umfangreiche Katalog WorldCat ins Netz gestellt. Er ist einer der größten Kataloge mit über 271 Mill. Einträgen und 1,8 Mrd. Standortreferenzen[5]. Der WorldCat erlaubt die Mitarbeit seiner Nutzer und bietet neben Tagging auch Nutzer-Rezensionen. Auf diese Weise sollen die Nutzer eingebunden werden, um die Attraktivität des Kataloges zu steigern.

Ähnlich umfangreiche Suchmöglichkeiten bietet der Karlsruher Virtuelle Katalog (KVK)[6], geht dabei aber ganz anders vor. Während der WorldCat eine zentrale Datenbasis hat, die als Grundlage für die Suche fungiert, stellt der KVK Anfragen an verschiedene vom Nutzer gewählte Kataloge und präsentiert die Ergebnisse übersichtlich aber pro Katalog und nicht in einer zusammengefassten Liste. Die Liste der anfragbaren Kataloge ist groß und beinhaltet sogar die Kataloge des Buchhandels. 

Online-Buchhändler wie Amazon[7] stellen eine weitere Quelle für die Suche im Netz dar. Neben dem sehr umfangreichen Katalog hat Amazon auch eine Vorschaufunktion, die es dem Nutzer erlaubt, Teile des Buches online anzusehen. Eine solche Funktion bietet auch Google Books[8]. Dieses Projekt hat den Online-Zugriff auf alle Bücher der Welt zum Ziel und scannt aktiv die Bestände von kooperierenden Bibliotheken, um den Online-Bestand zu steigern.

Alle in diesem Abschnitt vorgestellten Dienste zielen primär auf Bücher, wobei Zeitschriftenartikel und Aufsätze auch gefunden werden können. Vorteilhaft bei der Suche gerade in Bibliothekssystemen ist die sehr hohe Qualität der Metadaten die eine verlässliche Suche ermöglichen, was bei Suchmaschinen und den dort gefundenen Daten nicht immer der Fall sein muss. Eine nicht vollständige, aber doch recht umfangreiche Liste mit Anbietern von Onlineressourcen für Publikationen ist auf einer Infoseite[9] von BibSonomy (mehr s.u.) zu finden. 

Publikationssuchdienste

Ein guter Einstieg in die Suche nach Aufsätzen und Artikeln bietet die Spezialsuchmaschine Google Scholar[10]. Die Daten für die Suche basieren auf den Volltexten von Artikeln, die Google im Netz findet oder von Verlagen erhält. Die PDF-Dateien werden verarbeitet und alle wichtigen Meta-Daten entnommen. Zusätzlich werden auch alle Referenzen automatisch extrahiert. Das ermöglicht z.B. die näherungsweise Berechnung des h-Index (ein Maß für den wissenschaftlichen Einfluss eines Autors in seiner Disziplin), erlaubt aber auch ein besseres Ranking der Artikel bei der Anzeige der Suchergebnisse. Das gleiche Prinzip nutzt CiteSeer[11], wobei die Datenbasis deutlich kleiner ist. Interessant ist, dass CiteSeer Rankings für Konferenzen und Zeitschriften auf seiner Datenbasis berechnet. Sehr ähnlich sind Microsoft Academic Search[12] und ArnetMiner[13], wobei beide die Publikationsdaten weiter aufbereiten und u.a. das Koautoren-Netzwerk ansprechend präsentieren. 

Portale wie ScientificCommons[14] oder BASE[15] bieten ähnliche Suchfunktionen wie Google Scholar oder CiteSeer, basieren aber auf anderen Daten. Beide Systeme greifen auf Katalogquellen über die OAI-PMH[16] Schnittstelle zu und führen so die Daten von anderen Katalogen in ihrer Suchmaschine zusammen. Anders als Google Scholar können sie nicht die von den Autoren zur Verfügung gestellten PDF-Dateien aus dem Netz nutzen, um den Datenbestand weiter auszubauen. 

 

Fachbezogene Publikationsarchive

Eine weitere Quelle für Publikationen stellen so genannte Online-Archive dar. Einer der bekanntesten Vertreter ist arXiv.org[17] für die Physik, Mathematik und Informatik mit über 700.000 Volltexten. Die Aufsätze können von den Autoren vor der Veröffentlichung als Volltexte eingestellt werden und sind nach Themen organisiert. 

Ein vergleichbares Portal für die Biomedizin ist PubMed[18]. Mit 21 Millionen Referenzen ist es eines der größten Portale in diesem Bereich. Leider enthält es keine Volltexte, sondern nur die Verweise auf die Seiten der Verlage oder auf PubMed Central[19], welches ca. 2.4 Millionen Volltexte enthält. 

Für die Informatik ist DBLP[20] eine wichtige Ressource. Es wird von der Universität Trier betrieben und enthält mehr als 2 Millionen Referenzen. Es gilt als eines der zentralen Archive im Bereich der Informatik. 

Trotzt der Vielfalt von Recherchemöglichkeiten umfasst keines der Systeme alle Veröffentlichungen. Gerade ältere Aufsätze findet man häufig nur in Bibliotheken, während Suchmaschinen neuere Arbeiten im Index haben. Bei populären Themen wird die Treffermenge der Suchmaschinen schnell sehr groß und unübersichtlich. Dann bieten die vorgestellten Portale und Suchdienste eine gute Alternative und führen oft schneller zum Ziel. Auch ist die Abdeckung der Veröffentlichungen für die einzelnen Forschungsrichtungen im Netz sehr unterschiedlich, wobei Arbeiten aus dem Bereich der Informatik meist sehr gut im Netz vorhanden sind. Daher kann nur schwer eine Empfehlung für eine der Optionen gegeben werden, und eine umfassende Suche sollte nicht nur Suchmaschinen nutzen.

 

Arbeit mit Veröffentlichungen

Literaturverwaltungssysteme

Das Web 2.0 hat eine Reihe von Diensten im Tagging-Bereich hervorgebracht, die auf das Verwalten von Lieteratur zielen. Mit Tagging bezeichnet man das einfache Verschlagworten mit frei wählbaren Schlagwörtern auch Tags genannt. Die Tags werden zum Organisieren der einzelnen Veröffentlichungen verwendet. Die drei bekanntesten Systeme mit ähnlichen Aufbau sind: BibSonomy, Citeulike und Connotea. Die meisten Nutzer hat Citeulike - gefolgt von BibSonomy - wobei die Zielsetzung beider Systeme sehr unterschiedlich ist. BibSonomy stammt von Wissenschaftlern und unterstützt mit dem System nicht nur die Arbeit mit Publikationen, sondern auch Experimente aus der Forschung. Alle Systeme erlauben die manuelle Eingabe von Publikationsmetadaten. Da dies sehr aufwendig ist, unterstützen die Systeme die Eingabe mit Mechanismen zur automatischen Übernahme der Metadaten durch so genannte Bookmarklets, d.h. etwas JavaScript in einem Browser-Button zur Übertragung der wichtigsten Daten an den Server. Auch findet man häufig „Share“-Links solcher Systeme auf den Seiten der Verlage oder Archive, die eine einfache Übernahme der Daten in die eigene Sammlung erlauben. 

Sind die Publikationen erst einmal im System, kann man nicht nur sehen, welche anderen Nutzer sich auch für die Publikationen interessiert haben, die man selber hat, sondern es gibt auch die Möglichkeit, Listen für die Homepage automatisch zu erzeugen, z.B. mit den eigenen Referenzen. Man kann die Einträge für sich pflegen oder auch mit anderen Nutzern teilen. Einträge können bewertet werden und man kann Rezensionen schreiben. Das Browsen durch die Systeme ermöglicht das (unerwartete) Entdecken von Veröffentlichungen und so die Entdeckung neuer und spannender Arbeiten von Kollegen. Ein Vergleich der wichtigsten Funktionen der Systeme wird z.B. in Wikipedia gepflegt[21]. 

Seit Jahren gibt es Tools zum Verwalten der Referenzen für jedes gängige Betriebssystem. Die bekanntesten Tools sind Citavi und Endnote oder auch das Open-Source-System Jabref. Ähnlich funktioniert auch Mendeley[22], welches mit Hilfe von Informationsextraktions-Methoden versucht, dem Nutzer die Erfassung der Publikationsdaten zu erleichtern. Dazu analysiert es die PDF-Dateien auf dem Rechner des Nutzers und extrahiert die gesuchten Daten, d.h. es nutzt ähnliche Methoden wie Google Scholar und CiteSeer. Die Ergebnisse kann der Nutzer auf die Server von Mendeley laden und dort mit anderen Nutzern über die Veröffentlichungen diskutieren. 

Es gibt eine Reihe von weiteren Systemen. Manche sind browserbasiert wie Zotero,[23] andere wiederum stellen ein virtuelles Bücherregal dar, wie LibraryThing[24]. Nicht alle Dienste können hier besprochen werden, da dies den Rahmen sprengen würde. 

Soziale Netzwerke für Wissenschaftler 

Während sowohl die Offlineprogramme als auch die netzbasierten Literaturverwaltungssysteme sehr auf den Umgang und die Arbeit mit den Veröffentlichungen fokussieren, geht ResearchGate[25] einen anderen Weg. Es ist ein soziales Netzwerk wie Facebook oder Google Plus für Wissenschaftler. Es erlaubt die Präsentation der eigenen Veröffentlichungen und fokussiert weniger stark auf die Verwaltung von Literatur. Ein ähnliches Ziel verfolgt Scholarz[26]. Neben dem Community-Aspekt findet man in beiden Systemen auch die Möglichkeit, eigene Projekte zu pflegen und sich so zu präsentieren. 

Forschungsinformationssysteme (FIS) 

Die Messung der universitätsbezogenen Forschungsleistung erfolgt immer häufiger mit Forschungs­informations­systemen, die den bisher vorgestellten Systemen sehr ähnlich sind. Typische Vertreter sind z.B. Pure[27] oder Converis[28]. Neben der - eher umständlichen - Erfassung der eigenen Veröffentlichungen werden auch alle eigenen Projekte sowie eingeworbene Drittmittel zusammengetragen. Mit Hilfe von Maßen für Publikationen wie dem Zitationsindex werden die Publikationen bewertet, und durch Zuordnung zu Projekten lassen sich die Ergebnisse der Projekte genauer beurteilen. Leider konzentrieren sich solche Systeme nur auf die Erfassung der Daten und unterstützen die Forscher nicht bei ihrer alltäglichen Arbeit mit Literatur, obwohl die wesentlichen Funktionen dafür schon vorhanden wären. Daher sei an dieser Stelle auf das PUMA-Projekt (PUblikations-MAnagement)[29] verwiesen. Dabei handelt es sich um eine Open-Source-Version von BibSonomy mit leicht verändertem Funktionsumfang speziell angepasst für Bibliotheken und mit Verbindung zu DSpace, einem Institutional Repositories (siehe unten). Auch sind rudimentäre Statistikfunktionen enthalten, die aber ausgebaut werden müssen, um einen mit FIS-Systemen vergleichbaren Funktionsumfang zu bieten.

Volltexte der Veröffentlichungen

Natürlich geht es dem Wissenschaftler nicht nur um die Verwaltung der Metadaten von Veröffentlichungen, die das Zitieren erlauben, sondern es stellt sich immer öfter die Frage nach der Beschaffung und Organisation der Volltexte. Die meisten der bisher vorgestellten Tools bieten die Speicherung von Volltexten an. Viele Systeme bieten auch Funktionen zur Unterstützung von Forschergruppen an, was häufig auch das Teilen und Austauschen der Volltexte innerhalb der Gruppe umfasst.

Onlineportale der Verlage

Neben den schon vorgestellten Archiven bieten Verlage wie Springer, Wiley-Blackwell und Elsevier und die großen Organisationen wie ACM und IEEE eigene Online-Portale an, die den Zugriff auf Volltexte erlauben. Diese sind aber meist kostenpflichtig, d.h. den Volltext kann man – wie bisher auch das Buch, die Zeitschrift oder den Tagungsband – kaufen. Häufig hat die eigene Universitätsbibliothek Verträge mit mehreren Verlagen abgeschlossen, so dass man aus dem Universitätsnetzwerk auf deren Volltexte zugreifen kann. Immer häufiger findet man benötigte Aufsätze aber auch auf den Homepages der Autoren, was deutlich kostengünstiger ist. 

Open Access

Eine ebenfalls kostenfreie Alternative stellen sogenannte Institutional Repositories dar. Hier können die Autoren ihr Zweitverwertungsrecht nutzen und die eigenen Veröffentlichungen in das Repository ihrer Universität oder Forschungseinrichtung stellen. Das hat gegenüber der eigenen Homepage den Vorteil, dass die Dauerhaftigkeit des Zugriffes auf den Artikel durch den Betreiber garantiert wird. Eine detaillierte Diskussion dieser Aspekte würde den Rahmen dieses Artikels sprengen.

Zusammenfassung und Ausblick

Das Web hat den Wissenschaftsalltag grundlegend geändert. War es früher eher ein Problem, die Arbeiten zu finden, ist es heute ein Problem, den Zugriff auf die Arbeiten zu einem vertretbaren Preis zu erhalten und die Masse an Informationen zu verwalten. Die Forschungsergebnisse der Wissenschaftler werden durch das Web immer leichter zugreifbar. Es stellt sich aber die Frage, wer und auf welchem Weg man Zugriff auf die Informationen und Forschungsergebnisse erhält. Wem gehört eigentlich der Artikel, den ich gerade geschrieben habe und wer darf ihn unter welchen Bedingungen runter laden? Mit dieser Frage müssen sich Wissenschaftler immer häufiger beschäftigen. 

Die Arbeit mit Literatur wird sich in den nächsten Jahren weiter ändern. Neben dem Zugriff auf Veröffentlichungen stehen auch die Beurteilung der Qualität und der effiziente Umgang mit Publikationen im Zentrum der Entwicklung. 

Autor und Copyright:

Andreas Hotho
Universität Würzburg & Forschungszentrum L35

E-Mail

© 2012 Informatik Spektrum, Springer-Verlag Heidelberg