Lexikon

MPEG-7

MPEG-7 wurde von der Moving Picture Experts Group (MPEG) im März 2002 als Internationaler Standard verabschiedet. Nach der erfolgreichen Einführung der Standards MPEG-1/2/4 zur audiovisuellen Kodierung von Inhalten ist MPEG-7 ein Standard, der ein Austauschformat für Beschreibungen von multimedialen Inhalten festlegt.

 

Die Moving Picture Experts Group, eine Arbeitsgruppe der ISO SC29, ist seit 1988 aktiv und hat mit ihren MPEG-1/2/4 einen entscheidenden Einfluss auf die Multimedia-Industrie genommen. Mit der Verabschiedung von MPEG-1 im November 1992 stand erstmals ein integrierter Standard zur Verfügung, der die Kodierung von Bewegtbildern und zugehörigem Audio für die Speicherung auf einer CD bei einer Datenrate von etwa 1,5 Mbit/s ermöglichte. MPEG-2 (1994) baute auf der MPEG-1-Systemspezifikation auf und ergänzte sie insbesondere um die Möglichkeit zur Kodierung von zeilenverschränkten Video bei verschiedenen Auflösungen, bis hin zum HDTV-Format. Erstmals wurde auch die Möglichkeit einer skalierbaren Kompression der Bilddaten eingeführt. MPEG-2 liefert auch die Basistechnologie für die DVD zur Speicherung und Wiedergabe von hochqualitativem Video und Mehrkanal-Audio im Heimbereich. MPEG-2 Audio Layer 3 war auch die Basis für das populäre MP3-Audioformat, das als industrielle Weiterentwicklung entstand. MP3 ist nicht mit MPEG-3 zu verwechseln, denn MPEG-3 war für HDTV vorgesehen und wurde in MPEG-2 integriert. MP3 ermöglicht eine hohe Kompression von Audiodaten bei sehr geringem Qualitätsverlust durch Entfernen von überlagerten Tönen und solchen, die praktisch unhörbar sind. Mit MPEG-4 wurde 1998 erstmals eine Kodierung vorgestellt, welche die Aufteilung einer Szene in einzelne audiovisuelle Objekte ermöglicht. Die separate Beschreibung dieser Objekte in einem Datenstrom erlaubt es, den Szeneninhalt durch Benutzerinteraktion zu manipulieren. Ein weiteres Merkmal ist die individuelle Konfiguration des Leistungsumfanges von MPEG-4 durch spezielle Profile. Seit der ersten Version wurden MPEG-4 mehrere Ergänzungen hinzugefügt. Zurzeit wird vom Joint Video Team (JVT), das sich aus Experten der ITU h.264 und der MPEG-Standardisierung zusammensetzt, der hinsichtlich der Kodierungseffizienz verbesserte Advanced Video Codec verabschiedet.

Im Jahre 1997 begann MPEG an dem neuen Standard „Multimedia Content Description Interface" (kurz „MPEG-7") zu arbeiten, der im März 2002 in Version 1 verabschiedet wurde. MPEG-7 stellt eine sinnvolle Ergänzung zu den Standards MPEG-1/2/4 dar, der mit Inhaltsbeschreibungen einen gezielten Abruf von audiovisuellen Daten ermöglicht und deren Verwaltung unterstützt.

Die in MPEG-7 definierten Beschreibungen setzen sich aus Deskriptoren und Beschreibungsstrukturen zusammen. Die Deskriptoren beschreiben die Merkmale der audiovisuellen Daten. Um die Deskriptoren in einer Beschreibung interpretieren zu können, weisen die Beschreibungsstrukturen, in denen die Deskriptoren eingebettet sind, diesen Deskriptoren einen Kontext bzw. eine Bedeutung zu. Die Definition von MPEG-7-Deskriptoren und Beschreibungsstrukturen (DSs, Description Schemesdurch eine auf XML-Schema basierende, strukturdefinierende Sprache ermöglicht es, MPEG-7 Beschreibungen für die Anforderungen in den jeweiligen Applikationen anzupassen. Durch diese Flexibilität und ein effizientes Format zur synchronen Übertragung können Beschreibungen in unterschiedlichen Applikationsfeldern, wie Rundfunk oder Informationsabruf, im Internet eingesetzt werden, ohne den mitunter aufwendigen Prozess der Beschreibungsgenerierung neu zu durchlaufen.

MPEG-7 wird die Indizierung von Multimediamaterial homogenisieren. Bisherige Multimedia-Beschreibungsstandards, wie das Dublin Core Model, stellten Metadaten nur für einen kleinen Teil des Metadaten-Lebenszyklus (z.B. für die Erstellung) zur Verfügung. MPEG-7 ermöglicht die Indizierung mit einem einheitlichen Framework, von der Erstellung über die Suche bis hin zum Transport der Beschreibungen. Neben der Suche wird auch die Navigation durch große audiovisuelle Datenbestände erleichtert, da das zugrunde liegende XML eine breite Unterstützung in Programmier- und Datenbanksprachen, wie z.B. XMLTypes in Oracle 9i oder Java XML, erfahrt.

Die Nachteile einer XML-basierten Beschreibung, wie beispielsweise der hohe Speicherbedarf oder die fehlende Unterstützung Beschreibungen inkrementell zu übertragen, wurden auf Systemebene behoben. Hierzu enthält MPEG-7 Werkzeuge zur effizienten Kodierung und inkrementellen Übertragung (Streaming)von XML-basierten Dokumenten. Die Interaktionsmöglichkeiten von MPEG-4,gekoppelt mit MPEG-7,eroffnen neue kommerzielle Anwendungen im Bereich des digitalen Fernsehens — z.B. liefert die Auswahl eines Produktes in einer Werbesendung die Inhaltsinformation in MPEG-7 und ermöglicht die Navigation zu weiteren Informationen wie Preis, Vorrat und Bestellung.

MPEG-7-Teile

Der MPEG-7-Standard ist in 8 Teilen organisiert (ISO/IEC 15983:1-8:2002).

  1. Systems beschreibt Formate, in denen MPEG-7-Dokumente gespeichert und über ein Kommunikationsnetzwerk transportiert werden können. Ein wichtiger Bestandteil von Systems ist der BiM-Codec (Binary Format MPEG-7 encoder und decoder), der es ermöglicht, MPEG-7-Dokumente zu komprimieren. Das Dokument wird dabei in Fragmente zerlegt, die in einzelne Pakete („Access Units") gruppiert werden. MPEG-7-Ströme werden getrennt oder synchronisiert mit denen von ihnen beschriebenen Medienströmen (z.B. MPEG-2/4) übertragen.
  2. Data Definition Language (DDL) beschreibt die Syntax der MPEG-7-Beschreibungsstruktur und baut auf die von W3C standardisierte XML-Schema-Sprache auf . Zusätzlich zu dieser wurden hauptsächlich Datentypen zur Beschreibung von Zeitmarken und Matritzendimensionalitäten definiert, die in audiovisuellen Deskriptoren genutzt werden. Die Verwendung der DDL zur Definition der MPEG-7-Deskrip-toren und DSs ermöglicht es dem Anwender, basierend auf dem Standard eigene, applikationsspezifische Erweiterungen zu definieren.
  3. Grundlegende visuelle Deskriptoren decken vor allem den automatisch erfassbaren Teil der Beschreibungen für Merkmale der Bilder und Videos ab. Typische visuelle Deskriptoren sind die Formdeskriptoren von Regionen, Deskriptoren, die dominante Farben in Bildern oder Bildregionen spezifizieren, Deskriptoren für lokale oder globale Farbverteilungen, für Texturen und für Bewegungsbeschreibungen in Bildsequenzen.
  4. Grundlegende Audiodeskriptoren spezifizieren beispielsweise die Merkmale von Audiosignalen, die Sprache oder Musik enthalten. Dazu gehören beispielsweise Beschreibungen von Merkmalen der Melodie oder Phonemnetzen. Es können aber auch die Eigenschaften der Erzeugerinstrumente beschrieben werden, wie z.B. die Klangfarbe einer Violine.
  5. Die Multimedia Description Schemes (MDS) spezifizieren eine Bibliothek an Beschreibungsstrukturen, aus denen Teile für eine Beschreibung instantiiert werden können. Die generisch aufgebauten Beschreibungsschemata ermöglichen semantische Beschreibungen von Medieninhalten und bilden einen Beschreibungsrahmen, in den die audio-visuellen Deskriptoren eingefügt werden können.
  6. Die Referenzsoftware enthält Beispielimplementierungen für die Erzeugung und Verarbeitung der MPEG-7-Deskriptoren und DSs. Die Software wurde im Standardisierungsprozess zur Validierung der standardisierten Technologien eingesetzt. Die Referenzsoftware ist unter http://www.lis.e-technik.tu-muenchen.de/research/bv/topics/mmdb/e_mpeg7.html verfügbar.
  7. Konformität definiert Vorschriften für Konformitätstests der MPEG-7-Beschreibungen. Hierzu wurde ein Profilkonzept [1] und die Definition von Komplexitätsstufen (sog. levels) von MPEG-7-Beschreibungen erarbeitet.
  8. Extraktion und Benutzung stellt informative Beispiele für Instantiierung von Beschreibungsschemata und Ansätze für die Extraktion von Beschreibungen aus Medienströmen zur Verfügung. Zudem wurden auch Beispiele für den Gebrauch von Beschreibungen entworfen.

MPEG-7-Codec

Der MPEG-7-BiM-Codec stellt Werkzeuge zur Komprimierung und Übertragung von MPEG-7-Dokumenten zur Verfügung.Diese Werkzeuge sind nicht auf die Verwendung für MPEG-7 beschränkt, sondern können generell für XML-Schema-basierte XML-Dokumente verwendet werden.

Bei der Standardisierung des MPEG-7-BiM-Codecs wurden Anforderungen von Applikationen an die Übertragung von Metadaten berücksichtigt, die von der textuellen XML-Repräsentation nicht erfüllt werden, wie beispielsweise die inkrementelle Übertragung.

Diese Anforderungen werden von dem MPEG-7-BiM-Codec unterstützt. Neben einer hohen Kompression kann beispielsweise der MPEG-7-BiM-Codec die Baumstruktur von XML-Dokumenten in kleinere Subbäume fragmentieren. Durch eine während der Übertragung persistente Kodierung der Position des Subbaumes im gesamten Dokumentenbaum des XML-Dokumentes ist es auch möglich, XML-Dokumente inkrementell in beliebiger Reihenfolge zu übertragen. Zudem ist es möglich, durch entsprechende Befehle bereits übertragene Subbäume nachträglich zu verändern und somit auf der Empfängerseite dynamische XML-Dokumente aufzubauen. Im Rahmen von MPEG-7 ist dies, insbesondere bei Beschreibungen von „Life"-Sendungen, erforderlich. Auf der anderen Seite ist es für Metadatenempfänger notwendig, empfangene Daten schnell filtern bzw. durchsuchen zu können. Aufgrund der Strukturierung der Fragmente ist es möglich, die Fragmente so zu codieren, dass der Inhalt der Fragmente auf Bitpatternebene klassifiziert werden kann, ohne die Fragmente hierfür decodieren zu müssen.

So unterstützt der MPEG-7-BiM-Codec viele Anwendungsszenarien, die für die Übertragung von MPEG-7-Daten, im Speziellen aber auch von XML-Daten, im Allgemeinen relevant sind. Die Integration des MPEG-7-BiM-Codecs in bestehende XML-Übertragungsstrecken erfordert zudem nur geringen Aufwand, da der generische Codec mit XML und XML-Schema bereits verwendete, standardisierte Informationsformate nutzt.

Ausblick auf MPEG-21

Der Standard MPEG-7 spezifiziert ein Austauschformat für Beschreibungen von multimedialen Inhalten. Für die Übertragung von Medien und Metadaten relevante Aspekte, wie beispielsweise die der Kompatibilität von Wiedergabesystemen oder die rechtlichen Befugnisse des Senders und Empfängers, wurden in MPEG-7 nicht berücksichtigt, da diese Metadaten vor allem Relevanz für die Steuerung der Kommunikation besitzen.

Ein so genannter Framework-Standard, der diese Aspekte aufgreift und spezifiziert, wird innerhalb von MPEG mit MPEG-21 bearbeitet. Hierzu werden Digital Items betrachtet, die zunächst einen Container für digitale Information zur Verfügung stellen. Solche Digital Items können neben den multimedialen Inhalten und deren Beschreibungen beispielsweise auch Charakterisierungen hinsichtlich Anforderungen an Übertragungskanäle, rechtliche Befugnisse bzw. Wahlmöglichkeiten, beinhalten, um die bestehenden Rahmenbedingungen zur Handhabung des Digital Items mit den Anforderungen abzugleichen.

Hauptbestandteile von MPEG-21 sollen bis Ende 2003 verabschiedet werden. Weiterführende Informationen sind auf der MPEG-Homepage aufgeführt (s. unten).

Ausgewählte Links

Literatur

  1. Kaup, A.: MPEG-Standards: Techniken und Entwicklungstrends. Fernseh- und Kinotechnik 55(6), 352–362 (2001)
  2. Hansch, M., Kuhlins, S., Schader, M.: XML-Schema. Informatik Spektrum 25(5), 363–366 (2002)
  3. Kosch, H.: MPEG-7 and multimedia database systems. SIGMOD Records, ACM Press 31(2), 34–39 (2002)
  4. Niedermeier, U., Heuer, J., Hutter, A., Stechele, W., Kaup; A.: An MPEG-7 tool for compression and streaming of XML data. IEEE International Conference on Multimedia and Expo, August 2002, Lausanne, Switzerland, pp. 521–524

Hinweis: Die URLs entsprechen dem Stand bei der Veröffentlichung des Artikels und werden nicht aktualisiert.

Autor und Copyright

H. Kosch
Institut für Informationstechnologie,
Universität Klagenfurt,
Universitätsstraße 65–67,
9020 Klagenfurt,
Österreich
harald.kosch@itec.uni-klu.ac.at

J. Heuer
Corporate Technology Netze und Multimediakommunikation,
Siemens AG,
München
Joerg.Heuer@mchp.siemens.de

© 2003 Informatik Spektrum, Springer-Verlag Berlin Heidelberg