Lexikon

Business Intelligence

Einleitung

Business Intelligence (BI) ist kein neuer Begriff und trotzdem wird er oft wolkig verwendet und zugleich kennzeichnet er einen Bereich höchster Aktualität im derzeitigen IT-Markt. Der Nutzen von BI etwa bei der Missbrauchserkennung von Kreditkarten, der gezielten Selektion aus Massendaten zwecks wirkungsvoller, individueller Kundenansprache oder die Steuerung von Unternehmen über Kennzahlen ist von hervorragender Bedeutung. So sind BI-Spezialisten heiß begehrt am Arbeitsmarkt und milliardenschwere Übernahmen von BI-Produkt-Herstellern etwa von Business Objects durch SAP, Hyperion durch Oracle und Cognos durch IBM zeigen die Bedeutung des Feldes.

Begriffe und Architektur

Wir folgen weitgehend der Definition von [1] und definieren Business Intelligence (BI) als betriebliche Entscheidungsunterstützung durch einen integrierten, aufs Unternehmen bezogenen IT-basierten Gesamtansatz (Abb. 1).

Entscheidungsunterstützung durch BI (Quelle: msg systems) Business Intelligence ist also Entscheidungsunterstützung fürs Geschäft. Das englische „intelligence“ bedeutet in diesem Zusammenhang nicht Intelligenz, sondern die durch Sammeln und Auswerten von Daten gewonnenen Informationen und Erkenntnisse. Die Bedeutung ähnelt damit der Verwendung im Namen des US-Geheimdienstes CIA – Central Intelligence Agency. Eine BI-Lösung besteht prinzipiell aus fünf grundlegenden Bausteinen (Abb. 2).

Die Datenversorgung transferiert Daten aus verschiedenen Datenquellen und erledigt dabei Plausibilitätsprüfungen, Bereinigungen, Vereinheitlichungen und Aggregationen. Das Datenmanagement ist der zentrale Baustein, hier erfolgt die Speicherung und Strukturierung der Daten. Die BI-Anwendungen sind die eigentlichen Nutzanwendungen für Präsentation und Aufbereitung von Informationen für den Endnutzer und nachgelagerte Anwendungen. Das Metadatenmanagement verwaltet Informationen über die vorhandenen Daten, deren Verfügbarkeit, die durchgeführten Transformationen und die Bereitstellung dieser Daten. Das Warehouse Management schließlich verwaltet die BI-Infrastruktur. Die BI-Architektur eines Unternehmens wird oft in Schichten mit klaren Funktionen und definierten Schnittstellen aufgebaut (Abb. 3). Wir folgen hier dem Muster der sogenannten Hub-and-Spoke-Architektur mit zentralem Data Warehouse als Hub und darauf aufbauenden Data Marts als Spokes.

Die einzelnen Schichten sind nachfolgend beschrieben.

  • Quellen 
    Relevante Daten können sowohl aus unternehmensinternen als auch externen Systemen stammen. Externe Daten liefern beispielsweise Marktforschungsunternehmen, Verbänden oder Partnerunternehmen. Über eine Extraktionsschicht werden die Quelldaten in Schnittstellen dem Data Warehouse zur Verfügung gestellt.
  • Datenversorgung Datenpool (Datenintegration) 
    Hier erfolgt die syntaktische und semantische Harmonisierung der Daten aus den unterschiedlichen Quellen. Dabei werden syntaktische Mängel, wie Formatanpassungen und Formatinkompatibilitäten, soweit wie möglich automatisch erkannt und bereinigt. Syntaktische Unterschiede, wie unterschiedliche Kodierung gleicher Attribute, unterschiedliche Attributnamen mit gleicher Bedeutung oder gleiche Attributnamen mit unterschiedlichen Bedeutungen werden mit fachlich definierten Bereinigungsregeln vereinheitlicht bzw. differenziert. Semantische Mängel, wie fehlende Datenwerte, unbekannte Wertausprägungen oder semantische Fehler in operativen Quelldaten werden mit fachlich definierten Validierungsregeln erkannt und protokolliert, erfordern jedoch häufig eine manuelle Bereinigung in den operativen Quellsystemen. Weiterhin erfolgt in dieser Schicht die semantische Vereinheitlichung der zusammenzuführenden Daten bezüglich betriebswirtschaftlichen, fachspezifischen und zeitlichen Bedeutungen [1, S.24 ff].
  • Data Warehouse (DWH-Kern) 
    Dieser zentrale Datenkern speichert die Daten in einer integrierten, einheitlichen Struktur über längere, historische Zeiträume und stellt sie für Auswertungen und weitere Verarbeitungsschritte zur Verfügung. Wesentlich nach [2] ist, dass die Daten dauerhaft gespeichert (non-volatile), themenorientiert strukturiert (subject-oriented), integriert und historisch korrekt (time-variant) sind. Die Datenstruktur ist anwendungsneutral modelliert, also unabhängig von einzelnen Berichtsanforderungen. Sie orientiert sich an den relevanten Geschäftsobjekten und deren Beziehungen. Zusätzlich gestattet sie Historisierung und Versionierung der Geschäftsobjekte und Beziehungen. Für Flexibilität und Erweiterbarkeit sollte die Datenstruktur nahe einer dritten Normalform mit kontrollierten Redundanzen modelliert werden [1, S.53 ff.].
  • Datenversorgung Data Marts 
    Hier werden Daten nach anwendungs- oder fachbereichsspezifischen Anforderungen selektiert und aufbereitet. Häufig werden Basisdaten niedrigster Granularität aggregiert und neue Datenelemente aus Kombinationen vorhandener Datenelemente berechnet.
  • Auswertungsorientierte Schicht (Data Marts) 
    Die Data Marts speichern selektierte und aggregierte Daten in einer für den Anwendungsfall aufbereiteten und für Endbenutzer verständlichen Struktur. Die Daten werden meist multidimensional modelliert und in Form von sogenannten Star- oder Snowflake-Modellen abgelegt [3]. Dabei werden auch Maßnahmen zur besseren Abfragegeschwindigkeit berücksichtigt, z. B. starke Denormalisierung oder Einsatz einer multidimensionalen Datenbank. Für jedes Anwendungsgebiet enthält diese Schicht die dafür notwendigen Daten in der geforderten Granularität.
  • BI-Anwendungen 
    Diese Schicht stellt Komponenten für den Endanwender zur Verfügung, mit deren Hilfe die Auswertung und Präsentation ermöglicht wird. Zudem erfolgt hier die Verteilung der Informationen an die Endbenutzer. Je nach Zielsetzung und Funktionalität unterscheiden sich die BI-Anwendungen in folgende Kategorien:
  •  
    • Reporting und Analyse: 
      Das Standardreporting erstellt die regelmäßigen, standardisierten Berichte meist in Form von Listen, Tabellen und Grafiken. Hierzu gehören auch Aspekte wie automatische Verteilung, Informationsportale und komplexe Berechtigungskonzepte. Daneben ist das ad-hoc Reporting wichtig. Der Benutzer initiiert anforderungsgetrieben Berichte mit Zugriff auf für ihn autorisierte Daten und Reporting-Funktionalitäten.
    •  Performance Management 
      Nach [5] wird im Performance-Management die Unternehmensleistung mit der Unternehmensstrategie in Verbindung gesetzt. Neben der Festlegung der strategischen Ziele wird eine systematische Leistungsmessung anhand definierter Kennwerte (Key Performance Indicator) vorgenommen. Bei Abweichungen werden entsprechende, korrigierende Aktionen geplant und durchgeführt.
    • Analytische Anwendungen 
      Verschiedene am Markt verfügbare Standardsoftwarekomponenten stellen geschäftslogikspezifische Analysen zur Verfügung. Beispiele sind Risikomanagement-Anwendungen bei Finanzdienstleistern oder Anwendungen zur Missbrauchserkennung bei Kreditkartenunternehmen und Versicherungen. Hier kommen Techniken des Data Mining und der sogenannten Wissensentdeckung zum Einsatz.
    • Planung und Simulation 
      Bei der Planung und Simulation erfolgt nicht nur ein lesender Zugriff auf die Daten, sondern es werden die relevanten Planzahlen auf Basis der Istwerte der Vorperiode erfasst. Zur Unterstützung des Planungsprozesses wird eine Workflowkomponente benötigt, die neben der Erfassung und Freigabe der Plandaten auch einen Überblick über den Planungsfortschritt ermöglicht.

Die BI-Anwendungen unterstützen verschiedene Benutzerprofile und können meist über Inter- oder Intranet angebunden werden.

Abhängig vom Anwendungsgebiet werden in den BI-Anwendungen unterschiedliche Technologien und Methoden verwendet. Das Spektrum reicht hier von einfachen Berichtsgeneratoren über Komponenten für das sogenannte Online Analytical Processing (OLAP) zur multidimensionalen Analyse der Daten bis zum Data Mining. Letzteres ermöglicht nicht nur die Analyse von Daten aus der Vergangenheit sondern die Generierung von neuen Hypothesen und die Ableitung von künftigen Entwicklungen und Verhaltensmustern. Hierfür werden ein entsprechender Miningprozess und geeignete Modelltypen wie beispielsweise Klassifikationsmodelle, Clustering, Sequenzmodelle oder Assoziationsmodelle eingesetzt.

Benachbart zu BI wird oft auch das Feld des Wissensmanagements gesehen [1., S. 125ff.]

Organisatorische Einbettung ins Unternehmen

Neben einer flexiblen Architektur ist die Etablierung entsprechender organisatorischer Maßnahmen ein wichtiger Erfolgsfaktor für Business Intelligence. In jüngster Zeit werden in immer mehr Unternehmen hierfür sogenannte Business Intelligence Competence Center (BICC) gebildet, die die Umsetzung der BI-Strategie verantworten und unterstützen. Ein BICC ist nach [4] eine funktionsübergreifende Einheit mit bestimmten Aufgaben, Rollen, Verantwortlichkeiten und Prozessen die den effizienten Einsatz von Business Intelligence im Unternehmen unterstützt und vorantreibt. Dies ist notwendig, da Business Intelligence kein rein technologisches Thema darstellt sondern die Herausforderungen für erfolgreiches Business Intelligence in verschiedensten Bereichen liegen (nach [4]):

  • Daten
  • Technologie
  • Prozesse
  • Unternehmensstrategie
  • Benutzerakzeptanz
  • Unternehmenskultur

Nur wenn alle Bereiche bei der Einführung einer BI-Lösung berücksichtigt werden, kann der erwartete Nutzen erreicht werden.

Anwendungen und Bedeutung in der Praxis

Gerade vor dem Hintergrund einer schwierigen weltwirtschaftlichen Situation ist es für ein Unternehmen unerlässlich, Entscheidungen auf Basis aktueller, korrekter und qualitativ hochwertiger Informationen zu treffen. Nur so kann die Gefahr einer Fehlentscheidung minimiert werden. Viele Unternehmen haben dies erkannt und bereits entsprechende BI-Lösungen in ihren Unternehmen etabliert. Dabei ist der Reifegrad der vorhandenen BI-Lösungen sehr unterschiedlich. Zur Standortbestimmung eignen sich sogenannte Reifegradmodelle. Ein mögliches Modell ist das BI-Maturity Model des TDWI (The Data Warehouse Institute) [6]. Dieses unterscheidet sechs Reifegradstufen: Pränatal, Kleinkind, Kind, Jugendlicher, Erwachsener, Weiser. Jede Stufe ist durch Eigenschaften definiert, die die vorhandene BI-Landschaft kennzeichnen. Beispiele hierfür sind Inhalt und Umfang, Analysearten und -strukturen, Managementeinschätzung, eingesetzte Technologien aber auch Change Management und Betrieb. Je höher der Reifegrad der BI-Lösung ist, umso höher ist auch der geschäftliche Nutzen, der aus der Lösung generiert wird.

Business Intelligence spielt nicht nur für Großunternehmen eine wichtige Rolle. Auch für mittelständische Unternehmen wird es immer wichtiger, Entscheidungen auf Basis von Unternehmensdaten zu treffen. Dies haben auch die Hersteller von BI-Produkten erkannt und bieten für diese Kundenkategorie entsprechend kompaktere und preisgünstige Produkte an.

Produkte und Hersteller

Dieses aktuelle Schlagwort bietet nicht den Raum für eine systematische Produktübersicht. Trotzdem sollen mit SAP/BusinessObjects [7], IBM/Cognos [8], Oracle/Hyperion [9] und SAS [10] die marktführenden Hersteller für Business Intelligence im Bereich betrieblicher Informationssysteme zumindest namentlich genannt sein. Daneben gibt es eine Vielzahl von kleineren, spezialisierten Anbietern. Interessant ist, dass sich auch Microsoft [11] ausgehend von seiner Office Suite mit dem SQL Server und dem Produkt Sharepoint Server dem Thema Business Intelligence mit erheblichem Einsatz genähert hat.

Aktuelle Themen und Fragestellungen

Wir beobachten in der Praxis, dass in Unternehmen auf Basis neu definierter BI-Strategien eine Zentralisierung und Konsolidierung von historisch gewachsenen anwendungsbereich-spezifischen, isolierten Insellösungen erfolgt. Diese verursachen häufig hohe Kosten in Wartung und Betrieb und liefern nur einen geringen Nutzen im Hinblick auf eine unternehmensweite Informationsbereitstellung und Steuerung. [12].

Die klassische Business Intelligence beschäftigt sich auch heute noch überwiegend mit der Auswertung vergangenheitsbezogener Daten im Rahmen einer ex post-Analyse. Aktuell wird dieses Anwendungsgebiet verstärkt auch um die vorausschauende Analyse erweitert, d. h. die Herleitung künftigen Verhaltens auf Basis von historischen Daten (predictive analytics). Beispiele hierfür sind bereits seit geraumer Zeit im Kampagnenmanagement zu finden, bei dem nur die Kunden für eine Mailingaktion angeschrieben werden, von denen eine hohe Antwortrate erwartet wird oder im Rahmen der Kündigungsprävention bei Telekommunikationsunternehmen und Finanzdienstleistern potentiell abwanderungs-gefährdete Kunden mit besonderen Maßnahmen und Angeboten gehalten werden. Basis dieses Anwendungsgebietes sind die Methoden und Verfahren des Data Mining.

Im Rahmen der sogenannten „prozessorientierten Business Intelligence“ gewinnt die enge Integration von Business Intelligence in die operativen Geschäftsabläufe künftig zunehmend an Bedeutung. Die Prozessunterstützung umfasst hierbei sowohl nicht automatisierte Prozesse wie beispielsweise Marketing und Kundenbetreuung als auch automatisierte Prozesse wie sie zum Beispiel bei der Kreditwürdigkeitsprüfung im Internethandel angewendet wird.

Unter dem Begriff „Business Intelligence 2.0“ entwickelt sich aktuell die nächste Generation von Business Intelligence. Hierunter werden neben unterschiedlichen technologischen Eigenschaften wie:

  • BI als Service in einer serviceorientierten Architektur
  • Open Source BI
  • Embedded BI
  • Anspruchsvolle und komplexe Visualisierungs- und Analysetechniken
  • BI-Suche
  • BI-Mashups auch die potentielle Erweiterung des Anwendungsgebiets auf den Privatbereich verstanden[13].

Dabei wäre vorstellbar, dass durch ein „soziales“ BI-Netzwerk für Privatpersonen entscheidungsrelevante Informationen jederzeit für jedermann bereitgestellt werden.

Fazit

Angesichts steigender Anforderungen von Eigentümern und Gesetzgebern bezüglich Transparenz von Informationen und Entscheidungen wird das Thema Business Intelligence nach unserer Einschätzung auch in den nächsten Jahren eine sehr wichtige kommerzielle praktische Bedeutung einnehmen. Dabei wird neben der Nutzung von vielfältigen Markt- und Unternehmensdaten auch die Integration des wachsenden Datenvolumens von unstrukturierten Informationen, wie sie beispielsweise durch Web 2.0-Technologien auch in Unternehmen entstehen, für eine zielgerichtete Entscheidungsunterstützung eine weitere Herausforderung für künftige BI-Lösungen darstellen.

Literatur

1. Kemper H.-G., Mehanna W., Unger C. (2006) Business Intelligence – Grundlagen und praktische Anwendungen. Friedr. Vieweg & Sohn Verlag, GWV Fachverlage GmbH Wiesbaden

2. Inmon W. H. (2002) Building the Data Warehouse. John Wiley & Sons, Inc. New York

3. Kimball R., Reeves L., Ross M., Thornthwaite W. (1998) The Data Warehouse Lifecycle Toolkit. John Wiley & Sons, Inc. New York

4. Miller, G. J., Bräutigam D., Gerlach S. V. (2006) Business Intelligence competency center: a team approach to maximizing competitive advantage. John Wiley & Sons, Inc. Hoboken, New Jersey

5. Eckerson, W.W. (2009) Performance Management Strategies, How to create and deploy effective metrics, TDWI Best Practices Report, First Quarter 2009, www.tdwi.org (Zugriff am 18.05.2009)

6. Eckerson, W.W. (2009) Gauge Your Data Warehousing Maturity, www.tdwi.org/publications/display.aspx (Zugriff am 04.06.2009)

7. SAP BusinessObjects Lösungsportfolio (2009), www.sap.com/germany/solutions/sapbusinessobjects/index.epx (Zugriff am 27.05.2009)

8. IBM Cognos Business Intelligence und finanzielles Performance Management (2009), www-01.ibm.com/software/de/data/cognos (Zugriff am 27.05.2009)

9. Oracle Enterprise Performance Management and Business Intelligence (2009), www.oracle.com/solutions/business_intelligence/index.html (Zugriff am 27.05.2009)

10. SAS Business Intelligence (2009), www.sas.com/technologies/bi/ (Zugriff am 27.05.2009)

11. Microsoft Business Intelligence (2009), www.microsoft.com/germany/bi/default.aspx (Zugriff am 27.05.2009)

12. Ariyachandra Th., Watson H. J. (2006), Which Data Warehouse Architecture Is Most Successful?, www.tdwi.org/Publications/BIJournal/display.aspx (Zugriff am 29.07.2009)

13. Elliot, T. (2007), BI 2.0?, timoelliott.com/blog/2007/03/bi_20.html (Zugriff am 29.07.2009)

Autoren und Copyright

Markus Grünwald, E-Mail
Dr. Dirk Taubner, E-Mail
msg systems ag 
Robert-Bürkle-Str. 1 
85737 Ismaning/München

© 2009 Informatik Spektrum, Springer-Verlag Berlin Heidelberg