Lexikon

Ontologie(n)

Ontologie ist ein überlieferter Begriff aus der Philosophie und steht dort für die Lehre vom Sein - genauer: von den Möglichkeiten und Bedingungen des Seienden -, ist also eng verwandt mit der Erkenntnistheorie, die sich mit den Möglichkeiten und Grenzen menschlichen Wahrnehmens und Erkennens auseinander setzt.

In der Informatik steht man in vielen Bereichen vor der Aufgabe, Erkanntes oder Erdachtes zu repräsentieren und Wissen zu kommunizieren, z.B. über Fakten, Sachverhalte oder Regeln in einem technischen Anwendungsbereich, in einem Geschäftsprozess oder in einem juristischen Verfahren oder über die Inhalte von Dokumenten oder Webseiten.

Menschen Können sich gespeichertes Wissen zunutze machen, indem sie auf ihr Grund- und Kontextwissen des jeweiligen Wissensbereichs zurückgreifen, Lehrbücher, Regelwerke, Lexika und Schlagwortregister verwenden und mit den gespeicherten Inhalten verbinden. Sollen dagegen Automaten Such-, Kommunikations- und Entscheidungsaufgaben in Bezug auf das gespeicherte Wissen übernehmen oder Daten austauschen, die selbst Information darüber enthalten, wie sie zu strukturieren und zu interpretieren sind (sog. Metadaten), so benötigen sie dazu eine Repräsentation der zugrunde liegenden Begriffe und derer Zusammenhänge. Dafür hat sich in einigen Zweigen der Informatik in den letzten Jahren der Begriff Ontologie eingebürgert.

Der wohl bekannteste Definitionsversuch stammt von T. Gruber. Dieser bezeichnet Ontologie als „explizite formale Spezifikation einer gemeinsamen Konzeptualisierung" (orig.: "shared conceptualization").

In diesem Sinne beschreibt eine Ontologie also einen Wissensbereich (knowledge domain) mit Hilfe einer standardisierenden Terminologie sowie Beziehungen und ggf. Ableitungsregeln zwischen den dort definierten Begriffen. Das gemeinsame Vokabular ist in der Regel in Form einer Taxonomie gegeben, die als Ausgangselemente (modelling primitives) Klassen, Relationen, Funktionen und Axiome enthält. Da es viele Wissensbereiche - mit einer jeweils eigenen oder sogar mehreren konkurrierenden Terminologien - gibt, macht hier (im Gegensatz zur Philosophie) auch der Gebrauch des Plurals („Ontologien") Sinn.

Neben der Zuordnung zu Anwendungsbereichen kann man Ontologien auch nach ihrem Umfang klassifizieren. So unterscheidet Ron Weber (in Anlehnung an Guarini) drei Stufen von Ontologien: (1)allgemeine, Bereichsübergreifende, "top level ontologies", (2) auf bestimmte Anwendungsbereiche bezogene "domain ontologies", (3) bekannte konzeptuelle Daten- und Klassenmodelle, die lediglich mit dem modischen Namen "Ontologie" aufgewertet werden sollen. Im folgenden sollen nur die Stufen (1)und (2)betrachtet werden.

Wozu werden Ontologien in der Informatik verwendet? Gruninger und Lee unterscheiden drei Anwendungsfelder: Kommunikationautomatisches Schließen und Repräsentation sowie Wiederverwendung von Wissen. Sollen zwei Programme (z.B. Web-Suchmaschinen oder Software-Agenten)miteinander kommunizieren, so müssen sie entweder selbst die Interpretationsvorschrift für die Daten in sich tragen (sind also datenabhängig), oder aber sie liefern diese in Form von Metadaten aus einer beiden Seiten zugänglichen Ontologie mit. - Beim automatischen Schließen können Programme logische Schlüsse schon aufgrund der per Ontologie bekannten Ableitungsregeln ziehen - diese müssen also nicht stets von Neuem übermittelt werden. Ähnlich ist es bei der Wissensrepräsentation und -wiederverwendung (vgl. dazu die ausführliche Darstellung von Staab).

Ontologien sind also in allen mit Wissen befassten Bereichen der Informatik von Bedeutung - wie etwa künstliche Intelligenz, Datenbanken und Informationssysteme (im weitesten Sinne, einschließlich des globalen Informationssystems WWW). Dazu kommen angrenzende Bereiche wie Softwaretechnik und Multimedia-Kommunikation sowie Anwendungsgebiete wie z.B. Medizin, Rechtswesen und Wirtschaftsinformatik.

An den Ontologiebegriff knüpfen sich Zusammensetzungen wie z.B. Ontologie-Entwurf ("ontology design") und Ontologie-Technik ("ontological engineering"). Beide Begriffe machen selbstverständlich nur beim Begriffsverständnis der Informatiker Sinn - in philosophischer Deutung könnten dies höchstens angenommene Vorgehensweisen eines Demiurgen, also eines metaphysischen höheren Wesens sein. Ontological Engineering umfasst - analog zum Software-Engineering - alles, was zur Unterstützung des Ontologie-Lebenszyklus dienen kann. Ein Ontologie-Entwurf kann grundsätzlich durch einen induktiven Ansatz (Bildung größerer Ontologien aus mehreren kleinen "leichtgewichtigen" durch Verbindung - "merging") oder durch einen deduktiven Ansatz (Festlegung allgemeiner Konzepte und Regeln durch ein Gremium oder Konsortium, Überprüfung, Standardisierung und anschließende Spezialisierung für Teilbereiche) geschehen.

Der Wert einer Ontologie steht und fällt mit dem Umfang der Anerkennung und Zustimmung ("ontological commitment"), die diese in der betreffenden Fachwelt erfahrt. Im Allgemeinen ist diese Zustimmung umso leichter zu erreichen, je mehr Entscheidungsträger und Betroffene am Entwurfsprozess beteiligt sind. Andererseits steigt der Aufwand in der Regel mit der Zahl der am Entwurf beteiligten Personen.

Besonderes, weltweites Interesse finden Ontologien in jüngster Zeit aufgrund der Semantic-Web-Initiative des WWW-Schöpfers Tim Berners-Lee und seiner Kollegen. Sie beruht auf der Grundidee, Web-Dokumente (jeglicher Größenordnung) mit "Semantik" in Form von Metadaten ("tags") zu versehen, die ihren Inhalt näher beschreiben, und diese durch Ableitungsregeln ("inference rules") miteinander zu verknüpfen. Damit sollen Suchmaschinen und andere elektronische Mechanismen wie Agenten unterstützt werden, benötigte Informationen gezielt und effizient zu finden und miteinander zu verbinden. Ontologien dienen dazu, die dafür benötigten Grundlagen an Metadaten und Verknüpfungsregeln zu liefern. Das bedeutet, dass sich z.B. zwei Agenten über ihre Aufgaben und Ergebnisse mit Hilfe einer beiden verfügbaren Ontologie verständigen können.

Für die Entwicklung und Prüfung von Ontologien sind in den letzten Jahren eine Reihe von Sprachen, Methoden und Werkzeugen entstanden bzw. verfügbar gemacht worden. Im Zusammenhang mit dem Semantik Webansatz sind hier vor allem XML (Extensible Markup Language) und RDF (Resource Description Framework) zu nennen: XML für die Annotierung und Strukturbeschreibung von Daten und Dokumenten, RDF für die Möglichkeit, Ressourcen durch Eigenschaften zu beschreiben und diesen Werte - darunter auch Verweise auf andere Ressourcen - zuzuordnen. Dieser Ansatz fußt auf der bekannten Grundidee, semantische Netze als Graphen aufzufassen.

Die Mächtigkeit dieser Sprachmittel und die Lesbarkeit von Dokumenten lässt sich durch den Einsatz von Schemadefinitionen (XML Schema Definition XSD, und RDF Schema RDFS) beträchtlich steigern.

Daneben hat die US-Behörde DARPA DAML (DARPA Agent Markup Language) als Agenten-Verständigungssprache - "an Esperanto for machines" definiert. Diese wurde im Hinblick auf Ontologien mit OIL (ursprünglich: Ontology Inference Layer, neuerdings: Ontology Interchange Language ) zu DAML+OIL kombiniert und wird vom WWW-Konsortium als Standard für die Repräsentation von Metadaten und Ontologien vorgeschlagen.

Dieser Ansatz beruht auf den von der KI her bekannten Frames sowie auf Description Logics zur Beschreibung von Semantik und logischen Verknüpfungen. (Für nähere Hinweise dazu und zu Werkzeugen wie Ontologie-Editoren und Entwicklungsumgebungen.) Ontologien sind bereits für verschiedene Wissensgebiete entwickelt worden, so z.B. für Entscheidungsunterstützungssysteme (Decision Support Systems, DSS) oder für das Wissensmanagement . Im kommerziellen Bereich spielen sie - z.B. als Grundlage für E-Business-Systeme - bereits eine wichtige Rolle. Für den Bereich der Informationssysteme hat die IFIP-Arbeitsgruppe FRISCO (Framework of Information System Concepts) ein umfassendes konzeptuelles Rahmenwerk vorgeschlagen, das auch als allgemeine Basis für weitere, spezialisierte Ontologien dienen konnten. Einen damit verwandten Ansatz haben Y. Wand und R. Weber entwickelt.

In der Softwaretechnik gewinnen Ontologien zz. in zweierlei Hinsicht an Bedeutung:

  1. Ontologien als Hilfsmittel und Wissensfundus bei der Software-Entwicklung. Will man die Idee von Web-Services, d.h. im Web verteilten, wieder- und weiterverwendbaren Anwendungssystemen oder -komponenten verwirklichen, so müssen diese auf einem von allen potenziellen Benutzern getragenen gemeinsamen Struktur- und Begriffsverständnis des betreffenden Anwendungsgebiets beruhen. 
    Ontologien können hier dabei helfen, den Anteil an wiederverwendbaren Ergebnissen (z.B. Konzepten oder Modellen) in den sog. Frühen "Phasen" deutlich zu erhöhen.
  2. Softwaretechnik als Gegenstand einer Ontologie, d.h. als standardisiert zu beschreibendes Wissensgebiet. Für eine solche Software Engineering Ontology hat die SWEBoK-Initiative (Software Engineering Body of Knowledge) wertvolle Vorarbeit geleistet. In diesem Zusammenhang sind auch deutschsprachige Arbeiten an einem "Begriffsnetz" für die Softwaretechnik zu nennen.

Die wichtigsten noch ungelösten Probleme mit Ontologien betreffen aus heutiger Sicht die folgenden Punkte:

  • Wie lassen sich gut verwertbare Metadaten für sehr große Ressourcenbestände erzeugen und konsistent weiterentwickeln? Lässt sich das Annotieren von Dokumenten sinnvoll automatisieren?
  • Können Ressourcen klar und eindeutig klassifiziert werden, z.B. in Dokumente, Daten, Metadaten, physische und virtuelle Aktoren (actors), physische Einheiten?
  • Wie lassen sich Metadaten in (möglicherweise überlappende und inkonsistente) Ontologien einordnen? Wie werden Synonyme, Homonyme und zirkuläre Definitionen behandelt?
  • Macht es Sinn, nach einer gemeinsamen, allen Ontologien unterliegenden Top-level-, Universal- oder Meta-Ontologie zu suchen - oder führt dies zu ähnlichen Schwierigkeiten wie die Suche nach einem objektiven Weltbild in der Physik?

Nicht zuletzt stellt sich die Frage nach einer philosophischen Fundierung eines (informatischen) Ontologiebegriffs. Für Philosophen ist die Antwort auf die ontologische Grundfrage "Was ist?" keineswegs so trivial, wie es zunächst scheinen mag, da

  • unsere Wahrnehmung der Wirklichkeit durch unsere Wahrnehmungsorgane gefiltert wird, wir also keineswegs sicher sein können, dass die Welt so beschaffen ist, wie wir sie wahrnehmen;
  • die Beantwortung zwangsläufig mit sprachlichen Mitteln erfolgen muss, wir uns also bei der Beschreibung des Wahrgenommenen möglicherweise nochmals durch die Wahl unserer Begriffe, Worte und Bilder vom eigentlich "Seienden" entfernen.

Die sog. traditionelle Ontologie war von alters her dem Gebiet der Metaphysik zugeordnet. Wahrend sich die Physik mit der Existenz der (materiellen) Dinge, deren Bewegungen und der natürlichen Notwendigkeit der Materie (res concretae) befasst, sind es bei der Metaphysik die Grunde der Dinge und der dahinter stehenden Ideen (res abstractae).

Schon Kant beurteilte die traditionelle Ontologie als .anmaßend" und ersetzt die (doktrinäre) Annahme "gegebener" Objekte durch eine Transzendentalphilosophie, die "die Bedingungen und ersten Elemente aller unserer Erkenntnis a priori enthält" und damit die Erkenntnis als Filter für das "Seiende" einsetzt.

Im 20.Jahrhundert gibt es Versuche zu einer logisch präzisen Fassung, z.B. bei E. Husserl als formale Ontologie mit Mitteln der "reinen Logik". Husserl unterscheidet explizit zwischen dem (materialen, in der Natur verankerten) Ding schlechthin und dessen Sinn, dem keine "realen Eigenschaften" zugeordnet werden können. Die Analyse von Wahrnehmungen und Erlebnissen im Hinblick auf ihren Sinn fuhrt zur Erkenntnis verschiedener "Seinsregionen" und damit zu - jetzt im Plural auftretenden (!) materialen bzw.regionalen Ontologien.

Modernere Ansätze laufen darauf hinaus, der Ontologie ihren metaphysischen Charakter zu nehmen. So ruckt in der analytischen Philosophie der sprachliche Gesichtspunkt ins Zentrum: Eine Ontologie ist sprecherbezogen und gibt dem Hörer oder Leser die Existenzvoraussetzungen an, an die er sich durch das Akzeptieren einer Sprache oder Theorie bindet . Eine radikal formalistische Ausprägung dieses Ansatzes formuliert W. van O. Quine: "To be is to be the value of a bound variable" .

Hier kommen sich zu guter Letzt Philosophie und Informatik doch noch nahe: Ontologie wird nicht mehr als metaphysische Deutung des Wesens aller Dinge, sondern als praxisgeleitete sprachliche Kategorisierung von Lebens- und Wissensbereichen verstanden. In diesem Sinne sollte es - trotz der damit verbundenen und von P. Janich mit Recht aufgezeigten Gefahren von Mißverständnissen - auch Informatikern erlaubt und für sie möglicherweise sogar nützlich sein, sich mit Ontologie(n)zu beschäftigen.

Literatur

  1. Berners-Lee, T., Hendler, J., Lassila, O.: The Semantic Web. Scientific American, www.scientificamerican.com/2001/0501issue/0501berners-lee.html (Mai 2001)
  2. Falkenberg, E. D., Hesse, W., Lindgreen, P., et al.: FRISCO - A framework of information system concepts. The FRISCO Report. IFIP WG 8.1 Task Group FRISCO (Web version: 1998)
  3. GI-Arbeitskreise "Terminologie der Softwaretechnik" und "Begriffe für Vorgehensmodelle": Informatik-Begriffsnetz. http://www.tfh-berlin.de/~giak/ (Stand v. 01.06.2002)
  4. Gruninger, M., Lee, J.: Ontology - applications and design. Comm. ACM 45(2), 39-41 (2002)
  5. N. Guarino: Formal Ontology and Information Systems. In: Proc. FOIS'98, Trento (Italy), June 1998, pp 3-15. IOS Press, Amsterdam 1998
  6. Hesse, W., v. Braun, H.: Wo kommen die Objekte her? Ontologisch-erkenntnistheoretische Zugänge zum Objektbegriff. In: Bauknecht, K., et al. (eds.): Informatik 2001 . Tagungsband der GI/OCG-Jahrestagung, Bd. II, S. 776-781. Österr. Computer-Gesellschaft 2001
  7. Hesse, W., Barkow, G., v. Braun, H., Kittlaus, H. B., Scheschonk, G.: Terminologie der Softwaretechnik . Ein Begriffssystem für die Analyse und Modellierung von Anwendungssystemen. Informatik Spektrum 17(1), 39-47, und 17(2), 96-105 (1994)
  8. Holsapple, C. W., Joshi, K. D.: A collaborative approach to ontology design. Comm. ACM 45(2), 42-47 (2002)
  9. Janich, P.: Wozu Ontologie für Informatiker? Objektbezug durch Sprachkritik. In: Bauknecht, K., et al. (eds.): Informatik 2001 - Tagungsband der GI/OCG-Jahrestagung, Bd. II, S. 765-769. Österr. Computer-Gesellschaft 2001
  10. Ritter, J., Gründer, K.: Historisches Wörterbuch der Philosophie, Bd. 6. Darmstadt: Wissenschaftliche Buchgesellschaft 1998
  11. Schefe, P.: Softwaretechnik und Erkenntnistheorie. Informatik Spektrum 22(2), 122-135 (1999)
  12. Staab, S.: Wissensmanagement mit Ontologien und Metadaten. Informatik Spektrum 25(3), 194-209 (2002)
  13. Wand, Y., Weber, R.: An ontological model of an information system. IEEE Transact. on Software Eng. 16(11), 1282-1292 (1990)

Hinweis: Die URLs entsprechen dem Stand bei der Veröffentlichung des Artikels und werden nicht aktualisiert.

Autor und Copyright

Wolfgang Hesse 
FB Mathematik und Informatik, 
Philipps-Universität Marburg

© 2002 Informatik Spektrum, Springer-Verlag Berlin Heidelberg