Chancen und Herausforderungen des Semantik Web in der Zukunft

Aus Winfwiki

Wechseln zu: Navigation, Suche
Namen der Autoren: Christian Geyer, Vivien Tölke
Titel der Arbeit: "Chancen und Herausforderungen des semantic web in der Zukunft"
Hochschule und Studienort: FOM Berlin

Inhaltsverzeichnis

1 Abkürzungsverzeichnis

AbkürzungBedeutung
A2AAdministration to Administration
A2BAdministration to Business
A2CAdministration to Consumer
B2BBusiness to Business
B2CBusiness to Consumer
C2CConsumer to Consumer
CRMCustomer Relation Management
CMSContent Management System
DAML-QLDARPA Agent Markup Language-Query Language
FZIForschungszentrum Informatik
HTMLHypertext Markup Language
KMUKleine und Mittlere Unternehmen
OWLWeb Ontology Language
OWL DLOWL Description Logic
OWL-QLOWL Query Language
RDFResource Description Framework
RDFSResource Description Framework Schema
SOAService-Orientierte Architektur
SPARQLSparkel Query Language
URIUniform Resource Identifier
URLUniform Resource Locator
W3CWorld Wide Web Consortium
XMLExtensible Markup Language

2 Abbildungsverzeichnis

Abb.-Nr.Abbildung
1Entwicklung des Webs
2"semantische Treppe"
3Darstellung einer RDF-Grammatik
4vergleichendes Beispiel einer Google-Anfrage
5E-Commerce Geschäftsvorfälle
6"Ontologiereifungsprozess"

3 Einleitung

Das semantic web ist eines der aktuellsten Themen im Zusammenhang mit der Weiterentwicklung des heutigen Webs. So sind viele Forschungsrichtungen und Projekte zu finden, die sich mit der Semantik und deren Realisation in einer IT-Umgebung beziehungsweise Web-Umgebung auseinandersetzen. Wahrscheinlich werden daraus viele neue Anwendungsgebiete entstehen. Viele dieser Projekte werden sicher auch zur Entwicklung des Gesamtwissens beitragen, jedoch aufgrund verschiedener Hindernisse nicht realisierbar sein oder nur als "Non-Profit"-Projekt ihre Daseinsberechtigung haben. Andererseits ist es möglich, dass eine Vielzahl von Anwendungsmöglichkeiten in Zukunft durch die Idee des semantic web verändert werden könnten oder vielleicht sogar revolutioniert werden. Diese Arbeit setzt sich mit den Chancen wesentlicher Anwendungsgebiete auseinander. Dabei findet eine Konzentration auf praxisnahe, vor allem für den "Endverbraucher" nützliche Anwendungsgebiete statt. Neben den wesentlichen Themen wie semantische Suchmaschine und E-Commerce wird auch der semantische Desktop behandelt und deren Chancen analysiert. Als zweiter Schwerpunkt stehen die Herausforderungen im Fokus der Betrachtung. So wird eine Analyse über die unterschiedlichen Herausforderungen in den Bereichen Mensch, Hardware und Software sowie über die fachlichen Anforderungen erstellt, die die Einführung und Entwicklung des semantic web mit sich bringt. Abschließend wird in einer Machbarkeitsanalyse ein Überblick über die realistische Umsetzbarkeit der betrachteten Anwendungsgebiete gegeben, dies erfolgt mit dem Hintergrund der analysierten Herausforderungen. Ziel ist es einen realistischen Überblick sowohl bei Chancen als auch bei Herausforderungen über die vielschichtigen Felder des semantic web zu geben.

4 Idee des semantischen Web

4.1 Konzeptionelle Grundidee

Als das Web, wie es heute existiert, in seiner Entstehungsphase war, wurde es als Medium zur Repräsentation von Inhalten genutzt. Es war die erste Entwicklungsstufe der weltweiten Vernetzung durch das Internet. Durch die einfach verständliche Auszeichnungssprache Hyper Text Markup Language (HTML) wurde es für einen immer größer werdenden Nutzerkreis möglich Inhalte in verschiedener Form öffentlich darzustellen. Der Zugang zu Informationen wurde erheblich erleichtert. Die Fülle an Webseiten und Informationsgehalt nahm stetig zu. Mit der Weiterentwicklung zum sogenannten Web 2.0 entstand die Möglichkeit zur Erzeugung von Inhalten durch den Web-Nutzer wie zum Beispiel Blogs, Wikis oder Communities. Dass heißt, nicht nur dem Anbieter der Website selbst ist es möglich Inhalte zu erzeugen, sondern jeder Nutzer hat die Möglichkeit die Inhalte des Webs zu beeinflussen. Durch diese weitere Entwicklungsstufe gab es eine zusätzliche Beschleunigung des Anstiegs der Informationsmenge. Dennoch handelt es sich bei den Formen der aktuellen Webseiten, trotz Beeinflussung eines jeden Web-Nutzers, um eine Darstellung von Inhalten. Für die Maschine selbst ist es eine meist undefinierbare Ansammlung von Zeichenketten, die zwar in Ihrer Wiederholung und Abfolge maschinell erfassbar sind, aber die Maschine die Semantik, sprich die Bedeutung der Zeichenfolge, nicht in einen verwertbaren Zusammenhang bringen kann. Dieser Problemstellung widmet sich das semantic web.[1] Dabei fundiert dieses auf einer Beschreibung der im Web verfügbaren, durch den Menschen geschaffenen Inhalte durch standardisierte Beschreibungssprachen, die die Semantik der einzelnen Inhalte maschinell lesbar machen.[2]

In Anlehnung an: Wahlster (2008), S. 64. Abbildung 1: Entwicklung des Webs
In Anlehnung an: Wahlster (2008), S. 64. Abbildung 1: Entwicklung des Webs

Im Zusammenhang mit dem semantic web wird oft von Web 3.0 gesprochen. Zur Unterscheidung der Entwicklungsstruktur und des Inhalts wird zwischen der Benutzerpartizipation auf der einen Seite und der semantischen Fundiertheit auf der anderen Seite unterschieden. Wie in Abbildung 1 sichtbar, gab es bei der Entwicklung vom Web 1.0 zum Web 2.0 eine Erhöhung der Benutzerpartizipation. In der Weiterentwicklung zum semantic web beziehungsweise Web 3.0 ergänzen sich die Entwicklungsstufen um die semantische Fundierung. Der Begriff semantic web und Web 3.0 differenzieren sich demnach in der Intensität der Benutzerpartizipation.[3] Grundsätzlich ist dies jedoch nur eine Möglichkeit der Einteilung und häufig wird der Begriff semantic web für die Gesamtentwicklung des Web zu semantischen Inhalten genutzt und dabei weniger Wert auf die spezielle Differenzierung des Faktors Benutzerpartizipation gelegt.

Der Erfinder des ursprünglichen Webs, Tim Berners-Lee, war auch Vorreiter jenes semantic web. Bereits im Jahre 2001 veröffentlichte er einen Artikel, welcher dieses Thema beleuchtete. Darin definierte er drei Ziele des semantic web. Das erste ist die Erweiterung des heutigen Webs. Hierbei wird auf das Konzept der Repräsentation von Inhalten Bezug genommen, die semantische Technologien anwenden. Somit können bisher bestehende Anwendungen weiter genutzt werden und unterliegen nicht zwingend der semantischen Anreicherung von Daten. Diese Datenanreicherung ist die zweite erkennbare Zielsetzung, welche sich ableiten lässt. Dabei werden bestehende Daten mit neuen bedeutungsorientierten Inhalten angereichert, um diese maschinell lesbar zu machen. Diese maschinelle Lesbarkeit führt zu einem dritten hervorzuhebenden Ziel, welches die Kooperation im weitesten Sinne zwischen Mensch und Maschine vorsieht, um dem Menschen die Nutzung des Webs einfacher zu gestalten. [4] Um diese Ziele erreichbar zu machen sind einige Voraussetzungen notwendig. Zu einem der wichtigen Punkte zählt die Findung einheitlicher Standards für die Anreicherung von Informationen mit Daten. Dadurch wird die Interoperabilität zwischen den verschiedenen Anwendungen und Plattformen sichergestellt. Bereits entwickelte wichtige Standards für das semantic web sind RDF bzw. RDF(S) und OWL. Bei ihnen handelt es sich um Informations- und Spezifikationssprachen zur Beschreibung von Ontologien, welche einen weiteren zentralen Punkt innerhalb der Idee des semantic web darstellen.[5]

4.2 Ontologien

Im Konzept des semantic web sind Ontologien ein wesentlicher Bestandteil[6]. Philosophisch werden Ontologien eher als Seinslehre betrachtet[7]. Eine Ontologie im Zusammenhang mit dem semantic web ist jedoch davon differenzierter zu betrachten und als eine Wissensbasis zu verstehen. Dabei ist diese als Darstellung von modelliertem Wissen eines bestimmten Anwendungsbereiches definierbar[8]. Genauer kann es als Beziehungssystem definiert werden, welches einer Hierarchie und bestimmten Regeln unterliegt[9].

Das heißt, in einer Ontologie existieren Ressourcen, welche bestimmte Attribute vorweisen. Diese Ressourcen sind durch Beziehungen miteinander verbunden. Des Weiteren ist die Ontologie mit Regeln hinterlegt, welche zur Schlussfolgerung aus der Gesamtheit der Beziehungen dienen.[10] So entsteht aus einer Vielfalt von Ressourcen, Attributen, Beziehungen und Regeln ein Geflecht. Durch die Darstellung dieses Geflechtes, werden Beziehungen zwischen den Ressourcen sichtbar, die ohne die Ontologie nicht erkennbar gewesen sind.
In Anlehnung an: Blumauer, Pellegrini (2006), S. 16. Abbildung 2: "semantische Treppe"
In Anlehnung an: Blumauer, Pellegrini (2006), S. 16. Abbildung 2: "semantische Treppe"

Es existieren unterschiedliche Formen von Wissensmodellen, die sich durch ihre Mächtigkeit ihrer Reichhaltigkeit an semantischen Informationen unterscheiden lassen. Dabei stellt die Ontologie das Wissensmodell mit dem höchsten semantischen Detailgrad dar. Ein Wissensmodell mit dem geringsten Detailgrad an semantischen Mehrwert sind Verzeichnisse. Sie haben eine hierarchische Struktur und tragen keine Informationen über Beziehungen in Form von Metadaten. Das Glossar bildet ein Wissensmodell mit höherem Detailgrad ab. Darin werden Begriffe erklärt und in einen Zusammenhang gebracht. Es existiert dabei häufig eine Verbindung der Begriffe durch Links, die jedoch mit keiner Bedeutung hinterlegt sind. Eine Erweiterung des Glossars stellt ein Thesaurus dar. In diesem sind die Begriffe zusätzlich in einer hierarchischen Struktur eingeordnet, so dass jeweils Unter- und Oberbegriffe zugeordnet werden können. Letztlich lässt sich eine Hierarchie der Wissensmodelle auf Grundlage der semantischen Reichhaltigkeit in Form einer Treppe darstellen.[11] [12]

5 Wesentliche Standards

5.1 Beschreibungssprachen

Wie bereits oben beschrieben ist einer der zentralen Beschreibungssprachen des semantic web das Resource Description Framework (RDF). Diese basiert auf der Auszeichnungssprache XML (Extensible Markup Language) und wesentlich auf der URI-Technologie (Uniform Resource Identifier).[13] XML ist wie HTML konzipiert auf dem Prinzip der vollständig geklammerten Elemente. Der Unterschied zu HTML besteht jedoch darin, dass in XML die Elementnamen, welche zur Definition des in der Klammer befindlichen Dokuments dienen, frei wählbar sind. Sowohl XML als auch RDF machen sich die URI-Technologie zu nutze. So sichert XML durch diese Technologie die Eindeutigkeit der frei wählbaren Elemente ab.[14] Die URI-Technologie ermöglicht dementsprechend eine klare Definition einer Ressource zu finden und kann dieser einen weltweit einzigartigen Namen geben. In diesem Zusammenhang ist eine Ressource als jede Sache zu verstehen, welche eindeutig definiert werden kann. Dabei ist es sekundär ob es sich um abstrakte Begriffe oder real existierende Objekte handelt. Die Syntax einer URI ist in drei verschiedene Teile untergliedert: <schema>:<schema-specific-part>#fragment </p>

Das Schema definiert dabei den Namensraum. Die bekanntesten Schemata stellen http, ftp und mailto im Web dar. Der zweite Teil schema-specific-part lässt dem Ersteller einer URI beliebigen Spielraum zur Unterstrukturierung der Namensräume. Der letzte Teil fragment wird in direkter Relation zum zweiten Teil interpretiert. Im Rahmen des semantic web wird die bereits existierende Struktur der URLs (Uniform Resource Locators) genutzt. Die URL, als eine Ausprägungsart der URI, sind weltweit eindeutig und daher zur Definition von URIs gut geeignet. Ein Beispiel dafür ist: http://de.wikipedia.org/wiki/Deutschland[15].

In Anlehnung an: Dostal, Jeckle et al. (2004), S. 34. Abbildung 3: Darstellung einer RDF-Grammatik
In Anlehnung an: Dostal, Jeckle et al. (2004), S. 34. Abbildung 3: Darstellung einer RDF-Grammatik

Um dem Konzept des semantic web gerecht zu werden, ist jedoch eine reine Beschreibung der Ressource nicht ausreichend. Die Ressourcen müssen in Beziehung zueinander stehen, dafür wurden Ontologien geschaffen und RDF entwickelt. Grundlage der Beschreibungssprache RDF ist die Konzeption des Tripels. Dabei wird jede Beziehung zweier Ressourcen in Subjekt, Prädikat und Objekt unterteilt. Wenn von einer Beziehung zwischen Ressource A und B ausgegangen wird, wie in Abbildung 3 sichtbar, so ist Ressource A das Subjekt, die Beziehung von A zu B das Prädikat und die Ressource B das Objekt. Im weiteren Verlauf kann wiederum das Objekt der einen Beziehung zum Subjekt einer neuen Beziehung werden. Somit entsteht eine vernetzte Struktur von Ressourcen - eine Ontologie.[16] Neben der oben dargestellten grafischen Verdeutlichung sind zwei weitere Darstellungsformen, N3 und RDF/XML, möglich[17]. Beide sind keine grafischen Darstellungsformen, sondern basieren auf Zeichenkettendarstellung.[18] Da RDF auf grafischen Darstellungen basiert, musste eine Darstellungsform entwickelt werden, welche für Maschinen besser lesbar ist, dass heißt in Form von einer Folge von Zeichen. Das W3C (World Wide Web Consortium) entschied sich XML als Basis zu verwenden, da das Konsortium dieses als zukunftsweisende Technologie für das Web sieht. Weiter ist sicher ein Grund, dass sich eine XML-basierende Sprache besser in bestehende Strukturen der W3C-Gemeinde einbetten lassen. Daraus folgte die Entwicklung von RDF/XML[19][20]. N3 ist ebenfalls im Rahmen des W3C entstanden und hat den Vorteil gegenüber RDF/XML, das die Syntax wesentlich kürzer ist und dementsprechend weniger Zeichenketten benötigt werden um einen identischen Inhalt abzubilden. Für den Nutzer wird eine bessere Lesbarkeit erzeugt. RDF in der Form wie es oben beschrieben wurde, gelingt lediglich die Beschreibung einzelner Ressourcen und deren Beziehungen untereinander. Nun ist es jedoch nicht nur notwendig bei einer Beschreibung einer Domäne einzelne Ressourcen bzw. deren Beziehungen zu beschreiben, sondern auch bestimmte Oberbegriffe, auch Klassen genannt, zu bilden. Für den Menschen sind viele Klassen-Begriffe semantisch logisch, wie zum Beispiel das ein Bahnhof ein Gebäude ist oder ein Mitarbeiter ein Mensch sein muss. Für die Maschine ist es jedoch nur eine Folge von Zeichen ohne Bedeutungsinhalt. Um dieses sogenannte Hintergrundwissen oder auch Schemenwissen maschinell interpretierbar zu machen, wurde eine weitere Ontologiesprache durch das W3C entwickelt: RDF-Schema. Genauer ist es durch RDF-Schema möglich Klassen und Unterklassen zu bilden, aber auch eine Definition von Gültigkeitsbereichen lässt es zu. Vorteil von RDF-Schema ist die Möglichkeit des Anwenders Klassen, Unterklassen und Eigenschaften frei zu definieren. Weiterhin ist es in RDF-Schema auch möglich logische Schlussfolgerungen auf Eigenschaften zu ziehen, die nicht direkt als Daten vorhanden sind, aber aus dem vorhandenen Bestand geschlossen werden können.[21] RDF-Schema ist demzufolge keine Ontologiesprache, welche Ressourcen und ihre Beziehungen selbst beschreibt, sondern das Ordnungssystem der Klassen dieser Ressourcen und welche Verbindungen zwischen diesen bestehen können[22]. So wird bezogen auf das vorangegangene Beispiel in RDF-Schema nicht der Mitarbeiter in Verbindung mit dem Bahnhof gesetzt, sondern es wird allgemein die Möglichkeit der Verbindung hergestellt, dass ein Mensch sich im Bahnhof aufhalten kann. In den Standards RDF bzw. RDF-Schema sind jedoch Grenzen der Semantik erkennbar. So ist es nicht möglich negative Aussagen zu formulieren. Dies könnte nun in den Klassen bzw. Eigenschaften selbst durch Negation gelöst werden. Zum Beispiel müsste als Negation zum Raucher die Klasse Nichtraucher bestimmt werden. Jedoch besteht weiter das Problem, dass kein Ausschlusskriterium definiert werden kann, so dass Elemente der einen Klasse nicht in einer bestimmten anderen Klasse definiert sein dürfen. Ein Element in der Klasse Nichtraucher kann nach RDF-Schema auch der Klasse Raucher zugehörig sein.

Um diese semantischen Grenzen zu überwinden wurde eine weitere Ontologiesprache entwickelt: Web Ontology Language (OWL).[23]

Durch OWL kommt es zu einer Ergänzung von weiteren Ressourcen und Eigenschaften. So ist es mit OWL möglich Aufzählungen vorzunehmen. Des Weiteren sind logische Verknüpfungen von Klassen wie "und" oder "oder" realisierbar. Letztlich sind auch Kardinalitäten, wie "mehr als n Instanzen aus Raucher", bzw. Komplementäre, wie "alles was nicht Raucher ist", nun umsetzbar. Da OWL zu den ausdrucksstarken Repräsentationssprachen zählt und diese Ausdruckstärke hohe Komplexität erzeugen kann, wurden je nach Anforderungen der Komplexität in der Praxis verschiedene Teilsprachen geschaffen. Es wird dabei unterschieden in OWL Lite, OWL DL (Description Logic) und OWL Full. Dabei ist OWL Lite wenig ausdrucksstark. OWL DL ist durch größere Komplexität und Ausdrucksstärke gekennzeichnet. OWL Full beinhaltet sowohl OWL DL und OWL Lite als Teilsprachen und wird als ausdrucksstärkste OWL-Sprache angesehen.[24][25] Seit 2004 ist OWL als Ontologiesprache vom W3C eingeführt worden, um Webdokumente bzw. deren Inhalte in einen semantischen Zusammenhang zu bringen.

5.2 Anfragesprachen

Um Daten aus einer Ontologie-Struktur ausgeben zu können, sind Sprachen zur Abfrage nötig. Deshalb sind neben den Beschreibungssprachen als zweiter Art die Abfragesprachen SPARQL (Sparkel Query Language) und OWL-QL (OWL Query Language) zu finden. Zum Ausgeben von Daten in RDF dient die Abfragesprache SPARQL als neuer Standard. Mit dem Zitat: „‚Zu versuchen, das semantische Web ohne SPARQL zu nutzen ist wie der Versuch, relationale Datenbanken ohne SQL zu benutzen,’ erklärte Tim Berners-Lee“[26], wie entscheidend auch SPARQL für die Weiterentwicklung des semantic web ist. SPARQL ist an kein bestimmtes Datenbankformat gebunden und kann somit den Anforderungen des heutigen Webs, mit der immer wachsenden Datenmenge und unterschiedlichen Datenbankformaten, als auch dem zukünftigen semantic web gerecht werden. Die Syntax einer SPARQL-Anfrage basiert dabei auf einfachen RDF-Anfragen. Neben der grundsätzlichen Abfrage lassen sich durch SPARQL auch weitere Funktionalitäten abbilden. So sind Filterbedingungen als auch Formatierungen bei jeder Anfrage einsetzbar. Die Syntax von SPARQL besteht aus drei wesentlichen Bestandteilen, welche durch die drei Schlüsselwörter PREFIX, SELECT und WHERE gekennzeichnet sind. Die Funktion des Schlüsselwortes PREFIX ist dabei die Deklaration eines bestimmten Namensraumes. Das Ausgabeformat bestimmt das Schlüsselwort SELECT. Hier werden alle Bezeichner vermerkt, die auszuwerten sind und für die dementsprechenden Rückgabewerte angefordert werden müssen. Letztlich wird nach dem Schlüsselwort WHERE die eigentliche Anfrage modelliert. Neben der Anfragesprache selbst gibt es zur Übermittlung von Anfragen noch das SPARQL-Protokoll und zur Kodierung der Ergebnisse in XML die SPARQL-Kodierung.[27][28] OWL-QL als Anfragesprache für OWL stellt die zweite wesentliche Anfragesprache dar. Sie ist die Weiterentwicklung von DAML-QL (DAML Query Language). OWL-QL wird als Kandidat angesehen, einer der Standards des W3C zu werden. OWL-QL stellt eine formale Sprache dar. Eine wesentliche Zielsetzung ist die eigentliche Unabhängigkeit von der Beschreibungssprache und den Zugriff auf möglichst viele Wissensbasen zu ermöglichen. Derzeit befindet sich diese Abfragesprache in einer ständigen Weiterentwicklung.[29]

6 Anwendungsgebiete

6.1 Semantische Suchmaschinen

6.1.1 Forschungs- und Entwicklungsstatus

Im Dienst-Umfeld des Internets haben Suchmaschinen neben Emails mittlerweile die größte Bedeutung erlangt. Sie bilden eine universelle Schnittstelle zur Differenzierung, Auswahl und Vermittlung von Informationen. Dabei ist es den Suchmaschinen heute möglich innerhalb von wenigen Sekunden eine Linkliste zu erstellen, die in einen Zusammenhang zu dem in der Stichwort-Anfrage eingegebenen Begriffen steht. Dennoch interpretiert die Suchmaschine nicht die Semantik der gesuchten Begriffe, sondern sucht nach Buchstabenfolgen die den Suchbegriffen entsprechen. Webseiten beziehungsweise Informationen werden dann in einer Rangliste von Links angezeigt. Die Position in dieser Rangliste richtet sich nach der vermeintlichen Relevanz des Links zu den jeweiligen Suchbegriffen. Wie die Relevanz-Bewertung stattfindet und nach welchen Kriterien die Suchmaschinen das Ranking vornehmen, wird zur Vorbeugung von Manipulationen von den Suchmaschinenbetreibern geheim gehalten. Manipulation im Zusammenhang mit Suchmaschinen gewinnt mit zunehmendem Wissen über Ranking-Kriterien der Suchmaschinen an Bedeutung. So ist es heute bei Erstellung einer gewerblichen Website selbstverständlich sich auch der Suchmaschinenoptimierung zu widmen und Inhalte auf wichtige und bekannte Ranking-Kriterien, wie z.B. Keyword-Dichte, abzustimmen. Diese Suchmaschinenoptimierung ist dementsprechend eine bestimmte Art von Manipulation, die das Suchergebnis im Interesse des jeweiligen Website-Betreibers beeinflusst.[30][31]

Da letztlich nur die jeweiligen Buchstabenfolgen unterschiedlich analysiert und ausgewertet werden, "versteht" die Suchmaschine die Begriffe dem eigentlichen Sinn nach nicht. Dennoch sind die Algorithmen der Suchmaschinen heute schon soweit verfeinert, dass Sie bereits Antworten auf einfache Fragen geben können ohne in einer Linkliste lange danach suchen zu müssen. Wird zum Beispiel bei der weltweit bekanntesten und erfolgreichsten Suchmaschine google.de eine Frage eingegeben wie: "Wer hat die Glühlampe erfunden?", so erfährt der Suchende bereits im ersten Link der Liste, dass es nicht Thomas Edison war, wie viele vermuten. Sucht der Suchende in der selbigen Suchmaschine nach: "Wer ist der Erfinder der Glühlampe?" so gibt die Suchmaschine als erstes Ergebnis genau das gegenteilige Ergebnis "Thomas Edison" an.[32]

Ein Ergebnis ist als schnell und relativ eindeutig zu erkennen, aber obwohl in diesem Beispiel die Frage denselben Bedeutungsinhalt aufweist, gibt die Suchmaschine unterschiedliche Ergebnisse aus. Dies ist gleichzeitig der konkrete Hinweis darauf, dass heute bekannte Suchmaschinen, wie google, nicht oder nur unzureichend mit semantischen Hintergrund suchen und sich lediglich auf die Relevanz der eingegebenen Suchbegriffe in den Inhalten der verschiedenen Webseiten konzentrieren. Die aktuelle Forschung konzentriert sich derzeit auf die Thematik aus den oben benannten Suchmaschinen "Antwortmaschinen" zu entwickeln. Dabei besteht der Anspruch die Defizite der heutigen Suchmaschinen zu korrigieren und damit qualitativ hochwertige und eindeutige Antworten auf eine Frage zu erlagen. Einer der Defizite heutiger Suchmaschinen stellt die Einzelbetrachtung der jeweiligen Suchanfrage dar. Jede Anfrage wird separat betrachtet ohne Sie in einen Zusammenhang mit vorangegangenen Suchanfragen zu stellen. Dabei gehen häufig wertvolle semantische Informationen verloren, die die Anfrage qualitativ hätten besser auswerten können. Ein weiteres Defizit ist die Verarbeitung vom komplexen Suchanfragen. Besteht die Anfrage aus mehreren Begriffen die in Relation zueinander stehen oder wird in der Frage eine Einschränkung zu einem Sachverhalt gegeben, dann führt dies mit heutigen Suchmethoden häufig zu falschen oder schlechten Ergebnissen. Der dritte defizitäre Aspekt ist, dass Inhalte, die in pdf-Dokumenten oder Portalen verfügbar sind, nicht gefunden werden. Letztlich ist als viertes Defizit der aktuelle Suchmechanismus der oben bereits erläuterten Tatsache zu erwähnen, dass die Anfrage durch die Maschine selbst nicht "verstanden" wird, sondern als reine semantikfreie Zeichenkette interpretiert und betrachtet wird. In diesem Zusammenhang lassen sich verschiedene Forschungsgebiete ableiten die unterschiedliche Entwicklungschancen aufweisen.[33]

6.1.2 Entwicklungschancen

In Verbindung mit semantischen Suchmaschinen gibt es unterschiedliche Forschungsrichtungen und demnach unterschiedliche Entwicklungschancen. Als Erste ist der mobile Nutzen von semantischen Suchmaschinen zu nennen. Hier besteht ein besonderer Anspruch in der Eingabe und Ausgabe von Informationen. Da der Nutzer unterwegs ist, ist häufig eine kurze und übersichtliche Eingabe von Informationen nötig. Ebenfalls kurz und ohne kurze Erklärung sollte die Antwort sein. Der Anspruch dieser Forschungsrichtung liegt nun darin aus den begrenzten Eingabedaten durch semantische Mechanismen die richtige Ausgabe zu finden, die der Nutzer benötigt. In einem semantischen mobilen Konzept soll dabei auch auf den Standort des Nutzers zurückgegriffen werden sowie Tageszeit und anderen Umfeld-Faktoren. Diese werden dann ebenfalls in Verbindung mit der Anfrage des Nutzers gestellt. So wird ein Entwicklungsziel sein, auf kurze Anfragen wie: "Wo ist das nächste italienische Restaurant?" aufgrund des Aufenthaltsortes des Nutzers eine eindeutige Antwort zu erhalten. Dabei wird die Frage semantisch analysiert, demzufolge werden alle italienischen Restaurants aufgelistet, mit der Information des Standortes des Nutzers verknüpft und schlussendlich wird das Restaurant mit der kürzesten Reichweite für den Nutzer ausgegeben. Eine weitere Entwicklungschance ist auf dem Forschungsgebiet der personalisierten Suche zu finden. Dabei werden alle Daten, die ein Nutzer in der Vergangenheit gesucht hat, mit in die aktuelle semantische Suche einbezogen. Zu diesen Historiedaten können auch jegliche persönlichen Daten wie Bildung, Familienkontext, Interessen und Kenntnisgebiete hinzugefügt werden. Die Suchmaschine "versteht" seinen Nutzer und zieht aus den vorhandenen Daten Rückschlüsse auf die aktuelle Suchanfrage. Die persönlichen Daten helfen dabei die auszugebende Information auf die Suchanfrage zu konkretisieren und in einen besseren semantischen Zusammenhang zu stellen. In beiden Forschungsgebieten ist vor allem das Problem der Datenhaltung von persönlichen Informationen zu betrachten. Ist diese ungeschützt zugänglich ist die semantische Verbindung der Einzelinformationen ein erheblich größeres Datenschutzproblem als eine ungeschützte Einzelinformation. Um beide Forschungsgebiete vor allem auf der semantischen Ebene weiterzuentwickeln, braucht es auch die komplexe Arbeit der semantischen Annotationen. Bezogen auf das Restaurant-Beispiel muss jedes Restaurant seinen genauen Standort annotieren. Dieses Einzelbeispiel scheint für sich genommen realisierbar, aber bezogen auf alle Restaurants weltweit nimmt die Komplexität erheblich zu, wobei zu beachten ist, dass dieses Beispiel nur ein einzigen Sachverhalt darstellt. Der Ansatz des semantic web und demnach auch der semantischen Suchmechanismen ist die Benutzerpartizipation des Web 2.0 auszunutzen, um Annotationen durch die Masse lösbar zu machen. Das Thema Tagging spielt dabei unter anderem eine Rolle und wird in dieser Arbeit unter Indizierung näher erläutert. Bereits heute sind mehrere semantische Suchmaschinen nutzbar und werden stetig weiterentwickelt.

6.1.3 Beispiele

Derzeit entsteht eine Vielzahl an semantischen Suchmaschinen. Eine deutsche semantische Suchmaschine ist semager.de. Grundlage dieser semantischen Suchmaschine bildet die Erstellung von semantischen Beziehungen, die auf mathematischen Berechnungen beruhen. Dabei wird der Grad der Übereinstimmung zweier Wörter in einer Prozentzahl ausgedrückt. Je mehr zwei Begriffe demzufolge übereinstimmen, desto höher ist die Prozentzahl. Je vielschichtiger die Wortbeziehungen sind, das heißt wenn Wörter nicht nur in eine Richtung aufeinander verweisen, sondern mindestens auch in die Gegenrichtung, desto enger sind die Wortbeziehungen. Dieser Wortbeziehung wird dementsprechend eine höhere Prozentzahl zugeordnet. Laut semager.de ist das erklärte Ziel der Suchmaschine, dass der Nutzer beliebig, voneinander unabhängige Begriffe eingeben kann und als Ergebnis die Fakten erhält die alle Begrifflichkeiten miteinander verbinden. Selbst über die Qualität der Ergebnisse differenziert segamer.de und erkennt derzeit große Unterschiede zwischen den Anfragen.[34]

Eine zweite wesentliche semantische Suchmaschine ist powerset.com. Diese Suchmaschine wurde in den USA 2005 gegründet und beschränkt sich derzeit mit möglichen Ergebnisanzeigen auf den englischsprachigen Raum. Auch powerset.com verfolgt den Ansatz möglichst qualitativ hochwertige Ergebnisse auf Suchanfragen auszugeben. Derzeit beschränkt sich powerset.com auf die Suche innerhalb der Wikipedia-Umgebung. Durch den Kauf von Microsoft im August 2008 ist jedoch davon auszugehen, dass eine schnelle Weiterentwicklung stattfindet.[35]

Als drittes Beispiel ist cuil.com zu erwähnen. Auch diese semantische Suchmaschine ist im englischen Sprachraum zu finden. In der Darstellung der Ergebnisse verfolgt diese Suchmaschine das Drei-Spalten-Konzept. Dies erzeugt eine größere Übersichtlichkeit. Zusammenfassend befindet sich die Branche der semantischen Suchmaschinen in einer starken Entwicklungsphase. Aufgrund der hohen Investitionen von Microsoft in diese Branche ist eine klare Motivation zur Weiterentwicklung auf diesem Themengebiet gegeben.

6.2 E-Commerce

Je nach Fachrichtung wird E-Commerce unterschiedlich betrachtet. Die Informatiker verbinden mit dem Begriff eine Anwendung der angewandten Informatik, hingegen handelt es sich bei den Betriebswirten und Wirtschaftsinformatikern um eine transaktionsorientierte Anwendung. Eine E-Commerce-Anwendung ist Teil einer E-Business-Anwendung. Beteiligte einer E-Commerce-Anwendung werden nach dem ABC-Schema eingeteilt, wobei A für Administration, B für Business und C für Consumer bzw. Citizen steht. In Abbildung 5 sind die möglichen Geschäftsvorfälle dargestellt. Im Folgenden wird näher auf die Thematik des E-Commerce unter der Betrachtungsweise einer transaktionsorientierten Anwendung eingegangen.

In Anlehnung an: Werthner, Borovicka (2006), S. 308. Abbildung 5: E-Commerce Geschäftsvorfälle
In Anlehnung an: Werthner, Borovicka (2006), S. 308. Abbildung 5: E-Commerce Geschäftsvorfälle

6.2.1 Forschungs- und Entwicklungsstatus

Voraussetzung für eine Vernetzung der einzelnen Kunden im Business to Business (B2B) Markt ist, dass es in der entsprechenden Branche ein Konsortium gibt, welches die Teilnehmenden koordiniert und den Zugang zum Netzwerk einrichtet. Zusätzlich wird ein gemeinsames Ontologie-Schema benötigt, um die Branche abstrakt zu beschreiben. Letztlich wird ein Werkzeug benötigt, welches den Zugang zum Netzwerk bereitstellt und die nötigen Austauschoperationen durchführen kann.[36]

Für den Business to Consumer (B2C) Markt ist die Tag-Funktionalität eine einfache Möglichkeit die Produkte in Internetshops in Kategorien einzuteilen. Hierfür kann sowohl Tag-Software verwendet werden, die auf einem Katalog an Tag-Begriffen aufbaut oder die es ermöglicht eigene Begriffe zu definieren. Nähere Informationen über Tag-Software ist unter Indizierung zu finden.

6.2.2 Entwicklungschancen

Zahlen aus dem Jahre 2005 zeigen, dass der B2B Markt 7-8-mal so groß ist wie der B2C Markt. Weltweit hat die USA einen Marktanteil von 38% am B2B und B2C Gesamtumsatz. Der E-Commerce Bereich unterliegt einem starken Wachstum, was an der Entwicklung des Gesamtvolumens über die Jahre 2000 bis 2004 erkennbar ist, dabei stieg das Gesamtvolumen von 200 Mio. US$ auf 1.580 Mio. US$. In Europa spielt E-Commerce noch eher eine nebenläufige Rolle, gerade mal 16% der ansässigen Firmen in Europa verkaufen über das Internet ihre Produkte. Der E-Commerce Umsatz hat einen Anteil von 5% am Gesamtumsatz der einzelnen Firmen. In Europa wird E-Commerce lediglich als zusätzlicher Verkaufskanal betracht. Bei der Betrachtung der Tourismus- und Reiseindustrie gestaltet sich der Umsatzanteil, der über das Internet erzielt wird, mit 9% bereits weit aus stärker. Das liegt darin begründet, weil in der Tourismusbranche hauptsächlich kleine und mittlere Unternehmen (KMU) ihre Dienstleistungen anpreisen und das Internet als starkes Medium eine weltweite Verbreitung gewährt. Mit Hilfe von semantic web Technologien können E-Commerce Anwendungen im B2B Markt entwickelt werden, die für alle Vorteile liefern. Die Kunden erhalten die Möglichkeit sich individuelle Produkte oder Dienstleistungen zusammenzustellen ohne dafür überhöhte Preise zu zahlen. Für Anbieter stellt die Vernetzung die Möglichkeit bereit nicht lukrative Produkte auszulagern und sich auf das Kerngeschäft zu konzentrieren, ohne dabei die Gefahr einzugehen einen Kunden zu verlieren, weil ein spezielles Produkt nicht angeboten wird.[37]

Im B2C Bereich können sich Kunden bei Produkten, die ein Tag aufweisen, ähnliche Produkte betrachten und zudem Informationen über die Qualität der Produkte (von anderen Kunden) erhalten. Der Anbieter erfährt anhand von Tags worauf Kunden achten und kann entsprechend seine Produktpalette anpassen.

6.2.3 Beispiele

Mit dem Projekt "Harmonise" wurde für die Reise- und Tourismusindustrie eine semantic web Anwendung erstellt, die die einzelnen Anbieter vernetzt. Vorhandene Standards wurden verwendet, so dass die Anbieter ihre bisher verwendete Software weiterhin einsetzen können. Die Tourismusbranche handelt im Endeffekt lediglich mit Informationen, die zum Schluss zu einem Serviceprodukt zusammengeschnürt werden und an den Konsumenten verkauft werden. Da die Informationssuche durch die stetig steigende Menge an Daten immer kostspieliger wurde, schlägt sich dies im Preis nieder. Bei einem Großteil der Anbieter handelt es sich um KMU, die sich durch unterschiedliche Architekturen, Technologien und Zielsetzungen auszeichnen, was eine Inkompatibilität im Informationsaustausch zur Folge hat. Ziel des Projektes war es einen größtenteils automatischen Informationsaustausch zwischen den Informationssystemen zu erreichen. Mit Hilfe des semantic web kann eine Art "Mediationsservice" zwischen den Anbietern (B2B) stattfinden. Zur Anbindung der Anbieter an das Netzwerk wurden Web Services implementiert. Für die Verständigung zwischen den verschiedenen Informationssystemen wurden Mappings erstellt, die die Informationen auf Basis eines einheitlichen Ontologie-Schemas übersetzen und so die Transformation der Daten zwischen den Systemen ermöglichen. Für den Informationsaustausch steht zum einen die Möglichkeit für einen Datenaustausch über Dateien zur Verfügung, welche die vollständig übersetzten Informationen in Blöcken bereitstellen. Als andere Alternative besteht die Möglichkeit dynamische Abfragen abzusetzen, wobei die Attribute auf Basis der konzeptionellen Ebene erstellt sind. Im europäischen Tourismusportal findet das Projekt Harmonise seine Anwendung und stellt durch die Verwendung der semantic web Technologie sicher, dass die nationalen Tourismusorganisationen ihre Autonomie behalten.[38]

Ein anderes E-Commerce Projekt aus dem Bereich des B2C, welches semantic web Technologien verwendet, ist die Online-Plattform Flippid. Bei dieser handelt es sich um eine Auktionsplattform, bei der die Käufer Wunschlisten erstellen und die einzelnen Wünsche mit Tags und Höchstpreisen versehen. Es besteht die Möglichkeit seine Wunschlisten mit Freunden auszutauschen. Bei der Einstellung eines neuen Wunsches wird über ein Tag-Abonnement einem potentiellen Verkäufer die Information zugesendet. In der Auktion unterbieten sich die Anbieter. Die vergebenen Tags werden für das Auffinden und Identifizieren von Produkten und deren Qualität genutzt.[39]

In Deutschland nutzt der Onlineshop Bonprix die Tagging-Funktionalität, um durch die Käufer die Produkte mit Tags beschreiben zu lassen. Beim Taggen wird der Benutzer durch ein Suggestions-Feld unterstützt, wobei dieses den Kunden nicht beeinflussen soll, sondern alle verfügbaren Tags bereitstellt. Einen direkten Nutzen hat der taggende Endkunde nicht, lediglich durch eine große Anzahl an Taggenden besteht später die Möglichkeit von Produkt zu Tag zu Produkt zu springen, wodurch z.B. ähnlich bequeme Kleidungsstücke betrachtet werden können. Mehrfach vergebene Tags auf ein Produkt werden gezählt und entsprechend größer dargestellt. [40]

6.3 semantischer Desktop

6.3.1 Forschungs- und Entwicklungsstatus

Der semantische Desktop ist eine Entwicklung in der sich das semantic web und Desktop Computer miteinander verbinden. Dabei eröffnet die Technik des semantic web neue Möglichkeiten für die Arbeit am Desktop und demzufolge auch am Arbeitsplatz. Metaphorisch wäre der semantische Desktop als Baum vorstellbar. Die Wurzel bilden die Ontologien, auf welche zugegriffen werden kann. Der Stamm symbolisiert die Datenintegration und die Blätter und Äste symbolisieren die Anwendungen und Benutzerschnittstellen die metaphorisch die Früchte tragen.

Die aktuelle Situation ist jedoch diese, dass jeder Computer meist eine "dokumenten-zentrierte Maschine"[41] darstellt, auf welche zum Beispiel eine Email verfasst wird. Diese wird versendet und beim Empfänger wird der Text wiederum gelesen. Damit hat diese Art vom Dokumentenmanagement der Papierform, abgesehen von der Geschwindigkeit der Übertragung, nicht viel voraus. Jegliche Information wird heute meist via Computer erfasst. Vor allem im Arbeitsalltag ist der Computer wesentlicher Bestandteil zur Informationserfassung. Um diesen Informationen semantische Annotationen zu geben, wird jedoch der Mensch benötigt. Bei der Entwicklung der Standards wie RDF oder OWL zur Erstellung von Ontologien, die eine zentrale Rolle in der semantischen Desktopumgebung bilden, wurde die Bereitstellung von benutzerfreundlichen Werkzeugen jedoch vernachlässigt. Dementsprechend ist es derzeit schwierig Werkzeuge zu finden, mit welchen die Erstellung von semantischen Annotationen und dementsprechenden Ontologien möglich ist. Im Rahmen des derzeitigen Webs gibt es Beispiele wie Flickr.com, die es möglich machen zum Beispiel für Fotos semantische Annotationen zu erstellen. Im Umfeld des semantischen Desktop beziehungsweise Business-Desktop sind derzeit wenige derartige Ansätze zu finden und es bedarf an Entwicklung von neuen Werkzeugen. Die Ontologie als Wissensbasis spielt in diesem Zusammenhang eine zentrale Rolle. Eine qualitativ hochwertige semantische Annotation kann erst durch einen Nutzer des Desktop erstellt werden, wenn der Prozess der Annotation selbst in die Arbeitsabläufe integriert ist. Eine Ontologie sollte dem Nutzer einen Mehrwert geben, zum Beispiel bei der Suche oder Einordnung von Dokumenten und erzeugt daraus eine automatische Arbeit mit einer Ontologie und somit eine Anreicherung semantischer Informationen. Derzeitiger Stand der Nutzbarkeit von Ontologien sind die bereits entwickelten Ontologiesprachen RDF-Schema und OWL. Des Weiteren sind Domänen-Ontologien nutzbar. Firmen-Ontologien in Form von beispielsweise Organigrammen sind ein weiterer nutzbarer Faktor. Letztlich dienen auch semantische Werkzeuge zur Annotation wie bei Flickr.com der aktuellen Nützlichkeit. Im Gegensatz dazu fehlen jedoch Varianten zur Einbindung von Ontologien in den täglichen Arbeitsprozess. So können derzeit keine persönlichen Ontologien integriert oder genutzt werden. Persönliche Ontologien stellen die individuelle Sicht eines Sachverhaltes durch einen Nutzer dar. Die Verknüpfung dieser Ontologien mit Ontologien von Firmen oder bestimmten Domänen ist eine weitere Herausforderung, die noch nicht gelöst ist. Letztlich ist eine einfache Nutzbarkeit und eine Interoperabilität zu allen Anwendungen des Nutzers eine weitere Problemstellung. Zusammenfassend befindet sich der semantische Desktop derzeit in einer entscheidenden Entwicklungsphase.[42]

6.3.2 Entwicklungschancen

Bei keinem der heutigen Betriebssysteme ist eine Unterstützung von Ontologien zu finden. Semantische Technologien müssen derzeit als "Add-On" nachinstalliert werden. Ziel und Vision des semantischen Desktop ist jedoch die vollständige Integration semantischer Technologien in die Desktop-Umgebung. Damit würde eine Verschmelzung von Desktop-Computer und dem semantic web realisierbar sein. Der semantische Desktop soll damit als "Erweiterung des Gedächnisses des Benutzers"[43] dienen. Entwicklungschancen sind dabei unter zwei verschiedenen Gesichtspunkten zu betrachten. Auf der einen Seite gibt es den monolithischen Ansatz. Im Rahmen dieses Ansatzes soll unter dem "Dach" einer Anwendung möglichst viel Funktionalität vereint werden. Beispiel dafür ist Microsoft Outlook, welches durch verschiedene Plugin's mehrere Funktionalitäten vereint. Der zweite Gesichtpunkt ist der integrative Ansatz. Die jeweilige Anwendung versucht dabei bestehende Strukturen zu nutzen und zu integrieren. Google Desktop ist hierfür ein Beispiel. Es setzt auf die bestehenden Anwendungs-Strukturen auf und durchsucht diese. Kommt ein weiterer Bereich dazu, wird dieser auch durchsucht. In der derzeitigen Forschung- und Entwicklungsphase befindet sich zum Beispiel das Projekt "Haystack". Im Rahmen dieses Projektes wurde ein semantischer Desktop geschaffen, der alle wichtigen und konkreten Anwendungen vereint und dementsprechend dem monolithischen Ansatz verfolgt. Alle Applikationen sind in einer übersichtlichen Benutzeroberfläche integriert. Im Hintergrund ist eine Datenbank in Zusammenhang mit einer klar strukturierten Ontologie modelliert. Alle Programme bauen auf diese auf. Vorteil und Entwicklungschance dieses Konzeptes ist die Integration aller Funktionalitäten. Das heißt in jedem Programm ist von einem Objekt, wie einem Bild, ein direkter Rückschluss über die zentralen Ontologien auf alle weiteren Verbindungen schließbar. Nachteil hingegen ist, dass alle Funktionalitäten, die durch einen Programmierer ergänzt werden sollen, in einer Haystack-Umgebung realisiert werden müssen.

Ein weiteres Projekt mit Entwicklungschancen ist das EPOS-Projekt. Zentraler Gedanke dieser Idee ist, dass der Nutzer seine gewohnten Anwendungen weiter nutzen kann und die Informationen aus diesen, welche durch den Nutzer hinterlegt wurden, in RDF umgewandelt werden und in eine zentrale Sicht gebracht werden. Die verschiedenen Anwendungen werden dabei durch Adaptoren integriert. Eindeutiger Vorteil und damit eine große Entwicklungschance besteht in der weiteren Nutzung der aktuellen Anwendungen für den Nutzer, also lediglich eine Erweiterung bei der dem Nutzer zusätzlich die RDF-Repräsentation zur Verfügung steht. Als Nachteil ist die weniger gute Benutzerfreundlichkeit anzuführen und die Schwierigkeit einer hundertprozentigen Integration aller existierenden Anwendungen im vollen Umfang der jeweiligen Funktionalitäten.

Das Projekt "NEPOMUK" versucht die Vorteile der beiden vorangegangenen Beispiele zu vereinen, um einen zukunftsfähigen semantischen Desktop zu entwickeln. Im Rahmen dieses Projektes wird auch auf den sozialen Aspekt der Desktopumgebung eingegangen, wie Kommunikation und Datenaustausch. Somit wird den aktuellen Entwicklungen der Inaktivität der Benutzer Rechnung getragen und zeigt weitere Entwicklungschancen des semantischen Desktop auf.[44]

6.3.3 Beispiele

Neben den bereits oben erläuterten Projekten als Beispiel für Entwicklungen im Rahmen des semantischen Desktop gibt es noch weitere Tools, die Ontologien und damit semantische Information in den täglichen Arbeitsablauf integrieren. Ein wesentliches Beispiel ist OntoOffice. Dieses Tool bindet Ontologien direkt ein. Grundprinzip ist dabei dem Benutzer direkt in Textverarbeitungsprogrammen oder Kalkulationsprogrammen, wie Microsoft Word oder Microsoft Excel, Hinweise zur Wissensbasis zu geben. Das heißt, der Nutzer hat jederzeit die Möglichkeit zu prüfen, ob zu den eingegebenen Inhalten bereits weitere Informationen innerhalb der Ontologie vorliegen, welche nützlich für die weitere Verarbeitung und Bearbeitung des Dokumentes sind. Dem Nutzer ist es dabei möglich die erlangten Zusatzinformationen in die aktuelle Bearbeitung einfließen zu lassen oder eine weitere direkte semantische Suche zu veranlassen.[45]

Ein weiteres Beispiel aus dem Gebiet des semantischen Desktop ist der USU Knowledge Miner. Diese Anwendung ist auf einen programmübergreifenden Suchmechanismus spezialisiert, aber widmet sich auch der Strukturierung von Themen. Der Zugang wird dabei über eine zentrale Weboberfläche gewährleistet. Eine Suche in mehreren Datenquellen gleichzeitig stellt eine weitere Funktion dar. Letztlich wird das System durch eine Funktion des Selbstlernens ergänzt. Dabei werden vergangene Suchanfragen mit in die aktuelle Anfrage integriert.[46] Grundsätzlich ist jedoch festzustellen, dass es Beispiele für semantische Desktopanwendungen gibt, aber diese Anwendungen noch keine ganzheitliche Lösung darstellen, aber ausgehend von den vielseitigen Forschungsinitiativen davon auszugehen ist, dass eine steigende Entwicklung von neuen Beispielen entstehen wird.

7 Herausforderungen

7.1 Mensch

Ähnlich wie beim Wissensmanagement in KMU stellt auch im semantic web der Mensch einen entscheidenden Faktor über den Erfolg des Ganzen dar. Von der Motivation des Einzelnen hängt ab, ob das semantic web richtig gepflegt wird oder nicht. Die Herausforderung besteht darin, die Menschen zu motivieren, um mit einer guten Qualität an Inhalten dem semantic web zu seinem Durchbruch zu verhelfen. Motiviert werden kann der Mensch auf zwei verschiedene Arten. Zum einen können intrinsische Gründe vorliegen, da sich der einzelne durch seinen Beitrag eine gewisse Selbstverwirklichung verspricht. Zum anderen kann eine extrinsische Motivation vorhanden sein, die das Streben nach Anerkennung und Macht als Ursache hat.[47] Eine weitere Herausforderung die der Mensch bewältigen muss, ist der zusätzliche Aufwand bei der Einstellung von Informationen in das semantic web[48]. Zusätzlich zu den normalen Informationen muss die Semantik der einzelnen Daten gepflegt werden. Einen direkten Gegennutzen hat der Menschen bei der Einstellung von Informationen nicht, so dass eine hohe Motivation erforderlich ist.

Für die Erstellung von Ontologien-Schemen werden den Menschen große Konflikte bevorstehen, denn jeder sieht die Welt mit seinen eigenen Augen und beschreibt sie demzufolge mit seinem eigenen Ontologie-Schema. Für das semantic web sind verschiedene Ontologie-Schemen zu einem Thema aber kontraproduktiv. Durch unterschiedlich beschriebene Welten werden semantische Inhalte ungleich interpretiert, so dass im schlechtesten Fall falsche Ergebnisse erzielt werden. Zur Minimierung der Aufwende muss es Ziel sein, pro Thema lediglich ein allgemein gültiges Ontologie-Schema zu entwickeln, welches als Grundlage für die Erstellung von Mappings verwendet werden kann. Aufgrund der Tatsache, dass erst einmal ein motivierter Mensch da sein muss, der die Ontologien beschreibt, wird dieser versuchen seine Welt der Dinge als die Richtige zu verteidigen, so dass ein anderer motivierter Mensch ähnlich vorgehen wird. Falls es bei dem Konflikt zu keiner Einigung kommt, besteht die Gefahr, dass beide Personen im schlechtesten Fall die Motivation verlieren und nicht weiter für das semantic web arbeiten.

7.2 Softwaretechnisch

Für die semantische Technologie muss die Software sehr flexibel gestaltet sein, damit eine hohe Kompatibilität mit anderen Softwareprodukten gewährleistet wird [49]. Die Reihe der Medienbrüche und Schnittstellen ist so gering wie möglich zu halten, denn sonst erhöhen sich die Prozesskosten und Informationen können abhanden kommen. Ein Punkt an dem das semantische Web scheitern könnte, liegt in der Integrationsfähigkeit und der Akzeptanz der Software begründet.

7.2.1 Erstellung von Ontologien

Für die Erstellung von Ontologien existieren noch keine Standards. Was zu verschiedenen Ontologien für gleiche Domänen führt. In diesem Zusammenhang wird über "Ontology Mapping" gesprochen, welches das Ziel verfolgt die verschiedenen Ontologiesysteme zu verknüpfen.[50] Die Schwierigkeit bei der Zusammenführung der verschiedenen Ontologiemodelle besteht darin, dass als erstes die Beziehung zwischen den Modellen erkannt werden muss. Teilweise können hier Suchalgorithmen helfen diese Beziehungen aufzufinden, aber im Endeffekt muss ein Mensch darüber entscheiden, ob hier eine wirkliche Verbindung vorliegt. Der zweite Schritt besteht darin, die Beziehungen in einer guten Darstellungsform aufzubereiten. Bei kleinen übersichtlichen Ontologien ist dies relativ einfach. Hingegen geht bei komplexen Ontologien schnell die Übersichtlichkeit und die Aussagekraft verloren, da durch die vielen Beziehungen schlussendlich ein Linienchaos entsteht. Als letzter Schritt muss ein Mapping geschrieben werden.[51]

Eine Möglichkeit Ontologien zu erstellen, bietet das Wissensmanagement-Werkzeug OntoWiki. Es nutzt nicht das verbreitete Verfahren vorhandene Inhalte lediglich um deren Semantik zu erweitern, sondern verwendet die klassischen Knowledge Engineering Methoden basierend auf der Wiki-Methode. Dadurch kann über eingestellte Informationen diskutiert und Änderungen können rückgängig gemacht werden.[52]

Eine andere Technik zur Entwicklung von Ontologie bietet das webbasierte Werkzeug SOBOLEO (SOcial BOokmarking and Lightweight Engineering of Ontologies), welches den kollaborativen Ansatz zur Entwicklung gemeinsamer Ontologien verfolgt. Das Werkzeug bietet die Möglichkeit Ontologien zu entwickeln sowie zu ändern. Zusätzliche Funktionalitäten sind das Annotieren von Webressourcen, die Suche nach annotierten Ressourcen und das Durchforsten von Ontologien und Bookmark-Sammlungen.[53]

Softwaretechnische Herausforderungen für die Erstellung von Ontologien sind aktuell nicht ersichtlich, denn für die Erstellung von Ontologien besteht bereits jetzt eine gewisse Auswahl an Werkzeugen. Der einzige Punkt der noch kritisch werden könnte, ist die Gefahr, dass vielleicht auf falsch erstellten Ontologie-Schemen bereits Mappings für Informationssysteme implementiert wurden und Jahre später festgestellt wird, dass das Schema ganz anders aussehen muss. In solch einem Fall muss die Arbeit erneut durchgeführt werden. Verfügbare Software-Programme bietet viele Möglichkeiten den Anwendern Arbeit abzunehmen und sind in der Lage technische Fehler zu erkennen, aber semantische Fehler können vorerst nur von Menschen erkannt und behoben werden.

Die Erstellung von Ontologien wird softwaretechnisch unterstützt, es handelt sich um einen schwerfälligen Pflegeprozess, der von den Nutzern nur geringe Akzeptanz erfährt.[54] Für die Erstellung von Ontologien kann das Werkzeug Protége verwendet werden, es ist aber für einen Großteil der Nutzer zu kompliziert. Bei Ontologien werden zwei getrennte Prozesse unterschieden, die von jeweils unterschiedlichen Nutzergruppen durchgeführt werden. Zum einen entwickeln und pflegen Wissensingenieuren zusammen mit Domänenexperten die Domänen für die Ontologien. Im nächsten Schritt verwenden Nutzer die Ontologien für die Annotation ihrer Ressourcen. Dieser Prozess ist relativ langwierig, so dass häufig aktuelle Ontologien fehlen. Änderungswünsche und neue Vorschläge müssen gesammelt werden, das Entwicklungs- und Pflegegremium muss im nächsten Schritt verstehen, was die Nutzer mit den Ontologien aussagen wollen und entscheiden danach, ob die Änderungen durchgeführt werden. [55]

Mit Hilfe von Ontologiereifung, was die Vorteile von Tagging - einfache Handhabung - und Ontologien - Berücksichtigung der Semantik - vereinigt, wird der Mensch eine nur noch eine kleine Hürde überwinden müssen, um Ontologien zu erstellen und Ressourcen zu annotieren. Bei der Ontologiereifung geht es darum, dass neu aufkommende Ideen als neue Tags zu den bekannten Ressourcen hinzugefügt werden. Im nächsten Schritt erfolgt die Konsolidierung durch die Gemeinschaft, dabei werden Synonyme entfernt und ein einheitliches Vokabular festgelegt. Danach erfolgt die Formalisierung, indem Ober- und Unterbegriffe gebildet werden und als Ergebnis leichtgewichtige Ontologien entstehen. Wissensingenieure fügen zum Schluss Axiome hinzu, so dass als Ergebnis des Ontologiereifungsprozesses eine schwergewichtige Ontologie entsteht. Abbildung 6 stellt den Ontologiereifungsprozess dar.[56]

In Anlehnung an: Braun, Schmidt et al. (2008), S. 167. Abbildung 6: „Ontologiereifungsprozess“
In Anlehnung an: Braun, Schmidt et al. (2008), S. 167. Abbildung 6: „Ontologiereifungsprozess“

Mit Hilfe von Ontologiereifung kann effektiver an gemeinsamen Ontologien gearbeitet werden, trotzdem ist ein einziges Domänenmodell aktuell nicht absehbar. So dass weiterhin in heterogenen Landschaften gearbeitet wird und der Mensch für Entscheidungen über die Mappings von verschiedenen Modellen nötig sein wird, denn nur dieser erzielt die besten Mapping-Ergebnisse. Unterstützt werden sollte der Mensch bei seiner Arbeit durch intelligente Suchagenten.

7.2.2 Datenhaltung

Mit Hilfe von Ontologien ist es möglich die verschiedensten Datensysteme miteinander zu verknüpfen. Die Verknüpfung erfolgt nicht nur über normale Schnittstellen auf technischer Ebene, sondern auf Grundlage der Inhalte in den Systemen. Auf diese Weise kann der Zwiespalt zwischen zentraler und dezentraler Datenhaltung umgangen werden, da die Daten aus allen Systemen genutzt werden können.[57]

Zur Überprüfung, ob auch eine relationale Datenbank wie MySQL für die Speicherung von semantischen Daten geeignet ist, wurde im Forschungsprojekt Semantic Wikipedia ein Performanztest mit den Datenspeichern Jena in-memory, Jena in Apache Derby DB, MySQL, Sesame2 in-memory und Sesame native b-tree vorgenommen. Für den Test wurden 13 Millionen Tripel, die auf 3 Millionen Elementen basierten in die Datenspeicher eingestellt. Anschließend wurden einfache und verschachtelte Abfragen mit wenigen bis vielen Ergebnissen durchgeführt.

Der Datenspeicher Sesame2 in-memory war bei den normalen Abfragen mit Abstand die Schnellste, sie war 10 bis 50 Mal schneller als MySQL. Jedoch bei verschachtelten Abfragen war Sesame2 5 Mal langsamer als MySQL. Jena in Apache Derby DB war lediglich ein wenig schneller als MySQL. MySQL verhielt sich 2 Mal langsamer als Semame2 native, MySQL ist aber deutlich einfach implementiert und kostengünstiger. Sesame native war trotz verschiedenster Index-Einstellungen 40 Mal langsamer. Für Jena in-memory war es nicht möglich 6 GB an Daten in den Speicher zu laden und anschließend ein Ergebnis auf die Anfrage zu liefern. Überraschenderweise verhielt sich MySQL im Vergleich zu anderen Datenspeichern ziemlich gut, da allen Anfragentypen im Durchschnitt konstant gute Antwortzeiten erzielt wurden. Datenspeicher die sich die Daten in den Speicher laden, sind zwar weit aus schneller, aber bei den immensen Datenmengen ist das nicht durchführbar.[58] Der Test ergab, dass relationale Datenbanken für die Haltung von semantischen Daten geeignet sind.

7.2.3 Indizierung

Für die Indizierung von Internetinhalten existieren verschiedene Herangehensweisen, eine ist es Schlagworte einer Internetseite mit einem Tag zu versehen. Die Tags werden in Katalogen verwaltet und erleichtern das schnell wieder auffinden von Inhalten. Auf diese Weise werden Internetseiten von verschiedenen Anwendern kategorisiert. Die Herangehensweise ist ähnlich wie bei der Kategorisierung von Büchern in Bibliotheken, nur das dort Schlagworte für die einzelnen Bücher vergeben werden. Im Internet erfolgt die Vergabe von Tags durch eine größere Gruppe von Menschen, in diesem Zusammenhang wird der Begriff Folksonomy verwendet. Der Begriff ist ein Kunstwort und setzt sich aus den Wörtern Folk und Taxonomie zusammen und steht für eine kollaborative Schlagwortsammlung. Unter dem Begriff Social Tagging ist eine virtuelle Gemeinschaft zu verstehen, die einen gemeinsamen Katalog aufbaut.[59]

So einfach das Taggen auch ist, dennoch hat es seine Grenzen. Zum Beispiel können Phrasen mit Hilfe von Tags nicht als ein Tag beschrieben werden, sondern müssen in ihre einzelnen Wörter zerlegt werden. So ist es nicht möglich den Slogan "We love to entertain you" von ProSieben zu taggen. Da das Taggen der einzelnen Wörter keinen Sinn ergibt, besteht nur die Möglichkeit in diesem Falle einen Tag für die Firma anzulegen.

Bei Folksonomie ist problematisch, dass die Tags mehrdeutig sein können. So kann unter dem Tag apple sowohl das Obst als auch der Hardwarehersteller verstanden werden. Die Mehrdeutigkeit kann nur durch zusätzliche Tags oder ein starres Kategorisierungsschema verringert werden. Ähnlich verhält es sich mit Synonymen, wenn zum Beispiel nach Mercedes gesucht wird, werden die Autos vom Hersteller Daimler und auch Daimler Benz nicht berücksichtigt. Eine Lösung für Synonyme stellen Taxonomien dar, sie gleichen die semantische Diskrepanz der Tags aus. Taxonomien grenzen die einfache Idee des Taggen ein.

Gefährlich sind falsche Tags, die durch Konkurrenten mutwillig erstellten wurden, um einen Marktvorteil zu erlangen. Zur Vermeidung solcher Vorkommnisse müssen regulierende Maßnahmen ergriffen werden.[60]

Für die Unterstützung beim Taggen existieren verschiedene Ansätze von Softwareprodukten. Zum einen gibt es Software wie Faviki, welche aus einem Katalog, der auf der Datenbank DBPedia basiert, dem Anwender Tag-Vorschläge unterbreitet. Der Nachteil bei dieser Vorgehensweise besteht darin, dass keine eigenen Tag-Vorschläge gemacht werden können, sondern dass lediglich die Einträge aus Wikipedia zur Verfügung stehen. Andererseits existiert der Ansatz, dem Anwender die Freiheit zur Erstellung von eigenen Tags zu geben. Die Software Zigtag hat diesen Ansatz umgesetzt. Diese Vorgehensweise bürgt die Gefahr, dass jeder seine eigenen Begriffe zum Taggen verwendet und Synonyme vergeben werden. Die Vergabe von Synonymen basiert auf der Natur der Menschen, denn der eine Nutzer verwendet eher den einen und ein anderer eher einen anderen Begriff in seinem Wortschatz.

Tagging-Ansätze sind durch kollaborative Plattformen für die Nutzer sehr zugänglich, kommen aber bei semantischen Zusammenhängen an ihre Grenzen.[61]

Für die Ermittlung des Inhaltes von Bildern wurde bereits viel geforscht. Hierbei wurden unter anderem einige Algorithmen entwickelt, die automatisch die Inhalte von Bildern erfassen und dem Anwender mehrere Vorschläge unterbreiten was auf den Bildern enthalten ist. Auf diese Weise wird den Anwendern bei der Beschreibung von Bildern sehr viel Arbeit abgenommen. Die Treffsicherheit der Algorithmen ist nicht vollkommen, so dass vorerst ein Mensch die Auswahl treffen muss, was wirklich auf einem Bild zu sehen ist.[62] Im Projekt Imagenotion vom Forschungszentrum Informatik (FZI) wurden die Algorithmen weiterentwickelt und für eine konkrete Anwendung umgesetzt. Beschriebene Bilder können anschließend in Bildsuchmaschinen aufgefunden werden und mit Hilfe der Ontologien können über die Relationen weitere Bilder betrachtet werden. Das Projekt soll dieses Jahr für professionelle Fotoagenturen zur Verfügung stehen, um die Suche in Bildarchiven zu vereinfachen.[63]

7.3 Hardwaretechnisch

Die Kapazität der Speicher steigt stetig an, so dass aktuell 3,5 Zoll-Festplatten mit 1,5 TB auf dem Markt erhältlich sind[64]. Ähnlich verhält es sich auf bei Arbeitsspeichern, hier kann das Mooresche Gesetz angewendet werden, welches besagt, dass sich die Anzahl der Transistoren pro Chipfläche alle zwei Jahre verdoppelt[65]. Aktuell werden bereits 4 GB Speicherbausteine verkauft.

Vor einigen Jahren war es noch nicht möglich das Wissen der gesamten Menschheit in einer Datenbank abzuspeichern, aber seit dem Erscheinen der Oracle 10.1 Datenbank im Januar 2004 besteht seitens der Datenbank keine Begrenzung bezüglich der Speicherkapazität.[66]

Die Taktrate von Rechner steigt stetig an, somit können auch immer mehr Daten verarbeitet und die Antwortzeiten von Datenbanken gesenkt werden. Durch die ebenso steigende Menge an Daten verhält sich das Antwortverhalten der Datenbank nach außen fast konstant. Mit dem aktuellen Entwicklungsstand ist es möglich die immensen Datenmengen des semantic web mit vertretbaren Antwortzeiten zu durchsuchen.

Im semantic web liegt ähnlich wie im Internet ein Maschennetz vor, bei dem jeder Knoten mit mindestens zwei weiteren Knoten direkt verbunden ist. Durch diese Topologie wird eine relativ hohe Ausfallsicherheit gewährleistet. Mit Hilfe von komplexer Software wird sicher gestellt, dass Informationen weitergeleitet werden. Das Internet Protocol garantiert, dass die Informationen ihr Ziel erreichen. Eine schnelle Übertragung der Daten wird erreicht, indem die einzelnen Pakete unterschiedliche Übertragswege nutzen. Die Informationen werden im semantic web dezentral vorgehalten. Jetzt könnte die Annahme getroffen werden, dass hierdurch ein Ausfall von einzelnen Knoten kein Problem darstellen sollte. Diese Annahme ist allerdings falsch, da im semantic web nicht nur Informationen wie im Internet gespeichert werden, sondern auch deren Semantik. Aus diesem Grund kann eine Information nicht einfach von einem Knoten auf einen anderen verschoben werden, denn auf diese Weise geht die Semantik verloren.[67] Die dezentrale Struktur bringt zusätzlich das Problem der Heterogenität mit sich, denn die Informationen liegen in den unterschiedlichsten Sprachen, Formaten und Kodierungen vor.[68]

7.4 Fachlich

7.4.1 Programmiersprachen

Es existieren sehr viele Programmiersprachen, die auf den semantic web Sprachspezifikationen aufsetzen und in den verschiedensten Softwareprodukten zum Einsatz kommen. Viele Softwareprodukte verwenden sogar die gleiche Programmiersprache und sind trotz gleicher Schnittstellen nicht miteinander kompatibel. Ursache hierfür ist der syntaktische Aspekt. Für eine richtige Kompatibilität müssen zwischen den einzelnen Softwareprodukten Konverter entwickelt werden. [69] Diese Aufgabe kostet im ersten Schritt erst einmal kostbare Zeit, verfolgt aber ein sehr wichtiges Ziel - die Softwareunabhängigkeit, denn ohne diese müsste sich ein Produkt als weltweiter Standard etablieren, wobei dann das eigentliche Ziel des semantic web vernachlässigt werden würde.

7.4.2 Wahrhaftigkeit der Annotation

Der Prozess für die Erstellung der Ontologien ist sehr zeitaufwändig und mit vielen Schnittstellen versehen, da aktuell nicht der Annotierende auch die Ontologien erstellen darf. Auf diese Weise gehen bei den Schnittstellen Informationen verloren, so dass Ontologie von den Nutzern fehlerhaft, unvollständig und nicht nachvollziehbar verstanden werden.[70] Das führt dazu, dass Ressourcen falsch annotiert werden, als Schlussfolgerung werden in semantischen Suchmaschinen falsche Suchergebnis erzielt, was die Bedeutung des semantic web sinken lässt. Ein anderer Grund für unwahre Annotationen kann von Unternehmen verursacht werden, die verhindern wollen, dass der Wettbewerber unter den gleichen Annotationen zu finden ist, wie das Unternehmen selbst.

Für die Gewährleistung der Wahrhaftigkeit von Annotationen muss es möglich sein, dass die Vergabe der Annotationen durch die Gemeinschaft erfolgt. Ähnlich wie bei Wikipedia werden falsche Aussagen in kurzer Zeit durch die Gemeinschaft entfernt und korrekt dargelegt. Um dies zu ermöglichen müssten die Ressourcen von den Annotationen getrennt sein, was nach aktuellen Forschungsstand noch nicht gegeben ist, da die Annotationen direkt in den Ressourcen abgelegt werden.

7.4.3 Reasoning

Mit Hilfe von Reasoning ist es möglich aus dem zugrundeliegenden Daten anhand der Semantik Schlussfolgerungen zu ziehen. Hierfür werden zwei verschiedene Ansätze verfolgt. Zum einen wird die Gesamtheit aller Grundsätze in einer Ontologie bewertet und zum anderen werden implizite Schlüsse abgeleitet. [71]

Beim Reasoning gibt es verschiedene Methoden, an dieser Stelle soll lediglich auf Drei eingegangen werden. Der erste Algorithmus im Bereich des Reasoning wurde für das Abtesten von Zusammenfassungen und ihren komplexen Konzepten entwickelt und basiert auf der Analyse der Syntaktik. Dabei wird die syntaktische Struktur in die Normalform überführt und anschließend überprüft, ob ein Ausdruck in einem anderen bereits eingebettet ist.[72] Mit dieser Vorgehensweise können zwar nur syntaktische Konflikte aufgespürt werden, aber dabei handelt es sich bereits um einen wichtigen Teil für die gesamte Analyse einer Ontologie.

Mit Tableau-Beweisverfahren wird die Ontologie auf Basis der Semantik analysiert. Dabei wird geprüft, ob ein vollständig aufgeblätterter Ast (Branch) irgendwelche zusammengesetzten Regeln beinhaltet, wenn das nicht der Fall ist, liegt kein Konflikt vor, ansonsten muss die Ontologie überarbeitet werden.[73] Für das Überprüfen von Regeln kann das Forward und Backward Reasoning durchgeführt werden. Dabei wird beim Forward Reasoning eine Lösung betrachtet und anhand des Modells überprüft, ob für die Lösung entsprechende Regeln zu Grund liegen, wenn das der Fall ist, kann die Lösung in das Modell aufgenommen werden. Beim Backward Reasoning wird von der Hypothese zu den Lösungen gearbeitet. Auf diese Weise können die Konsequenzen von Regeln untersucht werden.[74]

Die Behebung von Ontologie Konflikten gestaltet sich aktuell als eher schwierige Aufgabe, da die Anzahl der Axiome bereits sehr hoch ist.

Zum einen kann das Reasoning genutzt werden um Widersprüche in Ontologien aufzuspüren und zum anderen um Schlüsse aus den Informationen zu ziehen. Wie Widersprüche in Ontologie entdeckt werden können, wurde im oberen Teil beschrieben, so dass jetzt auf die Schlussfolgerungen näher eingegangen wird.

Ob eine Entscheidung getroffen werden kann, hängt von der verwendeten Ontologiesprache ab. In OWL Full können alle syntaktischen Kombinationen von RDFS und OWL DL angewendet werden, was dazu führt, dass die Meta-Modelle nicht mehr für das Treffen von Entscheidungen verwendet werden können. [75] Eine andere Sprache ist OWL DL, welche sich nur mit Schlüssen auf Basis der generischen Atome beschäftigt, dabei aber die anwendungsabhängigen Schlussregeln unbeachtet lässt.

Eine weitere Herausforderung neben der Frage, ob überhaupt eine Entscheidung getroffen werden kann, stellt die akzeptable Effizienz dar. Es ist zwar möglich diverse Webseiten und Ontologien zu durchsuchen, aber die Frage ist, was ist eine akzeptable Antwortzeit. Jeder Menschen hat ein anderes subjektives Verhältnis zu akzeptablen Antwortzeiten, so dass an dieser Stelle nur der Fakt genannt werden kann, aber kein genaues Zeitfenster. Auch wenn mit Hilfe von Reasoning Schlüsse aus Informationen gezogen werden können, so stellt sich als nächstes die Frage, handelt es sich bei den Daten um alle existierenden Daten "Open-World" oder liegt nur ein Ausschnitt an Daten "Closed-World" vor und es ist noch nicht bekannt, welche Informationen fehlen. Entscheidungen werden nur auf Basis der "Closed-World" getroffen und müssen entsprechend formuliert werden.[76] Ein Beispiel für eine Formulierung ist: "Anhand der vorliegenden Daten bietet Verkäufer Z das Produkt X am günstigsten an". Wenn jetzt aber noch weitere Daten gefunden werden, so kann die Schlussfolgerung bereits falsch sein.

Auch mit Hilfe von Reasoning wird es im semantic web keine einfache Aufgabe sein, die richtigen Schlussfolgerungen auf konfliktfreien Ontologie zu ziehen.

8 Machbarkeitsanalyse

8.1 Semantische Suchmaschine

In Hinblick, dass ein Nutzen einer direkten Beteiligung, zum Beispiel durch Annotation, bei öffentlichen semantischen Suchmaschinen nicht direkt für den Nutzer und hauptsächlich für andere und nicht einen selbst einen Vorteil bringt, ist es fraglich, ob sich das semantic web in Suchmaschinen durchsetzen wird. Suchmaschinen die in Unternehmen zum Einsatz kommen, werden eher auf semantic web Technologien zurückgreifen, da hier der Nutzen wie zum Beispiel kürzere Suchzeiten und qualifiziertere Ergebnisse zum Unternehmenserfolg beitragen. Die Investition und der Nutzen stehen hier näher im Zusammenhang als bei öffentlichen Suchmaschinen, außerdem kann hier Kapital sinnvoll in die Zukunft investiert werden. Hingegen muss in öffentlichen Suchmaschinen der Mensch beginnen die Inhalte zu annotieren. Zur Erzielung von guten Suchergebnissen müssen die Informationen durch Annotationen genauer beschrieben werden. Die Annotationen können nur durch Menschen erstellt werden, da Programme kein Kontextwissen herstellen können. Bei der Erstellung der Annotationen durch die Autoren besteht die Gefahr, dass es zu einer schlechten Qualität der Annotationen kommt und diese anschließend auch falsche beziehungsweise schlechte Suchergebnisse ergeben würde. Einzige Motivation für den Nutzer eine gute Annotation zu erstellen, wäre die Darstellung des eigenen Nutzens von guten Suchergebnissen in einer semantischen Suchmaschine. Hier können vor allem gewerbliche Nutzer des Webs eine große Rolle spielen. Der Nutzer-Kreis des gewerblichen Nutzers hat die größte Motivation möglichst gut gefunden zu werden und somit einen Anreiz qualitativ hochwertige Annotationen zu schaffen. An dieser Stelle könnte es jedoch zu Missbrauch kommen, um zum Beispiel konkurrierende Teilnehmer vom Markt zu verdrängen. Daher wäre in diesem Zusammenhang eine zertifizierende Instanz nötig, die die Qualität der Annotationen prüft. Diese Prüfung der Korrektheit der Annotationen ist bei nicht-gewerblichen Nutzern nahezu nicht durchführbar. Hier könnte "das Wissen der Masse" einen entscheidenden Teil zur besseren Annotation beitragen. So könnte die semantische Annotation einer jeden Webseite frei für jeden annotierbar sein. Hier ist neben dem hohen Missbrauchsfaktor vor allem das Problem der Synonyme zu betrachten. Für einen Gegenstand gibt es mehrere gleiche Begriffe. Jeder Nutzer verwendet einen anderen Begriff für den gleichen Gegenstand. Dies macht eine semantische Annotation nicht fehlerfrei möglich.

Abschließend ist festzustellen, dass Vision und Wirklichkeit einer weltweiten semantischen Suche weit auseinander liegen. Vor allem die Wahrhaftigkeit der Annotation stellt eine zentrale Herausforderung dar. Andererseits sind Suchmaschinen mit semantischen Ansatz, wie die personalisierte Suche, eine mittelfristig umgesetzt zu sehende Technologie, da der Nutzer daran interessiert sein könnte, aufgrund seines persönlichen Verhaltens bessere Suchergebnisse nutzen zu können.

8.2 E-Commerce

Der E-Commerce Bereich bietet mit Hilfe des semantic web Vorteile sowohl auf der Kundenseite als auch auf der Anbieterseite. Er bürgt aber auch die Gefahr in sich, dass durch die Vergabe der Tags von einzelnen Nutzern übergreifende Profile angefertigt werden und somit der gläserne Mensch immer realistischer wird. Die Voraussetzung zur Vergabe eines Tags in den Onlineshops, ist das Anlegen eines Benutzers, so dass alle vergebenen Tags durch den Benutzer jederzeit betrachtet werden können. Durch das ständige Zusammenschließen von einzelnen Unternehmen entstehen mit der Zeit riesige Konzerne. Häufig vergeben Menschen immer einen ähnlichen Anmeldename, so dass das Zusammenführen von einzelnen Profilen zu einem Gesamtprofil keine komplexe Aufgabe darstellen würde. Aktuelle Vorfälle im Bereich des Datenschutzes zeigen, dass die Benutzerdaten bei den Unternehmen Gefahren des Missbrauchs unterworfen sind, so dass solche Szenarien durchaus denkbar sind. Menschen die das Internet eher als Gefahr betrachten, werden vermutlich keinen wesentlichen Beitrag zum semantic web leisten. Auf der anderen Seite sind diejenigen Menschen zu finden, welche positiv mit dem Informationsmedium Web umgehen und demzufolge auch Informationen über sich im Internet bereitstellen, so dass diese gute Informationslieferanten für das semantic web darstellen. Wenn in Onlineshops viele Tags vergeben werden, kann jeder davon profitieren. So gäbe es dann die Möglichkeit semantische Suchanfragen wie zum Beispiel „bequeme Schuhe“ zu stellen und eine Selektion an Schuhen als Ergebnis ausgegeben zu bekommen, welche schon andere Nutzer als bequem empfunden haben. Zwei Nachteile im Bereich des B2C sind, dass der Nutzen erst später sichtbar wird und sich eine große Menge an Nutzern am Tagging beteiligen muss bevor dieser Nutzen eintritt. Dem gegenüber stehen die Vorteile, der semantischen Suchmöglichkeiten und dass es sich bei den Informationen um Erfahrungen von anderen Nutzern handelt, die einen höheren Wahrheitsgehalt enthalten als finanzierte und gesteuerte Werbebotschaften. Letztlich entscheidet der Nutzer darüber, ob im B2C Bereich sich semantic web Technologien durchsetzen.

Erfolgversprechendere Aussichten liegen im B2B Bereich, hier liegt für alle Beteiligten eine „win win“-Situation vor. Alle Geschäftspartner arbeiten auf einer Augenhöhe zusammen und können jederzeit entscheiden welche Informationen sie der Gemeinschaft bekannt geben. In der Reise- und Tourismusindustrie ist das eigentliche Produkt eine Zusammenstellung von vielen Informationen. Durch semantic web Technologien ist es möglich die Informationen gezielt zu finden. Hierfür werden Mappings eingeführt, die die eigenen Daten aus den verschiedenen operativen Systemen in die Ontologie der Gemeinschaft übersetzen. Auf diese Weise können in den Unternehmen die Prozesse und Softwareprodukte unverändert verwendet werden. Die einzige Investition muss in die Erstellung der Mappings und in ein einheitliches Ontologieschema erfolgen. Durch die ständig steigenden Informationsmengen und den immer kostbareren Faktor Zeit, wird sich die Investition bereits nach kurzer Zeit rentieren. Die Produktivität für jedes einzelne Unternehmen nimmt ständig an Priorität zu, um am Markt bestehen zu können. Eine schnellere Informationssuche stellt in dieser Branche bereits einen Wettbewerbsvorteil dar. Die semantic web Technologie stellt für den B2B Bereich die notwendige Innovation zur Verfügung.

Als Ergebnis kann festgehalten werden, dass sich das semantic web im B2B Bereich vermutlich schneller durchsetzen wird als im B2C Bereich, da sich der Nutzen in Form von Kostenreduktion direkt auswirken wird.

8.3 Semantischer Desktop

Im Gegensatz zu Tagging oder anderen benutzerabhängigen semantischen Technologien hat der semantic Desktop den Vorteil, dass sofort für den Nutzer ein Nutzen herauszuarbeiten ist. Im Hinblick auf die Machbarkeit stellt sich in diesem Themengebiet weniger der Nutzer als kritischer Punkt dar, sondern mehr der technische Entwicklungsstand für den Alltag gebrauchsfähiger Anwendungen. Das heißt, nicht die Erkenntnis des Nutzers über die Notwenigkeit ist die Herausforderung, sondern die effektive und einfache Einbindungen des Nutzens in den Alltag. Erste Schritte sind dabei bereits durch Anwendungen wie OntoOffice getan, die auf die aktuellen Anwendungen wie Microsoft Word Ihren semantischen Ansatz aufbauen. Auch Forschungsprojekte wie Haystack oder EPOS treiben die Entwicklung des semantic Desktop voran. Die umgesetzte Vision eines integrierten semantischen Desktop, der sowohl mit dem Nutzer als auch mit dem Web interagiert und dabei benutzerfreundlich ist, ist nicht erkennbar. Zusammenfassend kann festgestellt werden, dass es im Rahmen des semantic Desktop an ganzheitlichen Lösungen fehlt, die sowohl die Vorteile des monolithischen als auch des integrativen Ansatzes vereinen. Aus Sicht der Machbarkeit ist die Schlussfolgerung zu ziehen, dass es grundsätzlich eine mit hoher Wahrscheinlichkeit machbare Technologie ist, die jedoch in unterschiedlichen Projekten und Anwendungen in einer Entwicklungsphase ist und konkrete Lösungen für den Anwender nur eingeschränkt zur Verfügung stehen.

9 Fazit und Ausblick

Das semantic web ist ein vielfältiges Themenfeld. Auch diese Arbeit zeigt wie komplex die Betrachtungen des semantic web sind und wie weit sich die verschiedenen Forschungsgebiete auffächern. Es wurden Chancen im Themengebiet semantische Suchmaschinen aufgezeigt, wie die personalisierte Suche oder die mobile semantische Suche. Möglichkeiten der semantischen Weiterentwicklung im Bereich E-Commerce, vor allem im B2B-Bereich, sind ebenfalls gewürdigt worden. Letztlich stellten sich auch die Chancen im Gebiet des semantischen Desktop dar, welche lediglich noch Entwicklungsbedarf in der Schaffung eines ganzheitlichen Systems haben. Dem gegenüberzustellen waren die Herausforderungen. Diese sind vor allem beim Faktor Mensch, aber auch im fachlichen Bereich der Wahrhaftigkeit der Annotationen zu sehen, welche mit dem Faktor Mensch eng verwoben ist.

Bei der Bewertung der Umsetzung der drei zentralen Ziele von Tim Berners-Lee besagt das erste Ziel, dass das semantic web nur eine Erweiterung des heutigen Webs darstellen soll. Die bereitgestellten Informationen des Internet können ohne das semantic web existieren, da die semantischen Informationen getrennt zu den Internetinhalten gespeichert sind und auf die aktuelle Form des Web aufbauen. Das erste Ziel ist bereits jetzt erfüllt. Die Datenanreicherung bildet das zweite Ziel, unter welcher die Anreicherung der Daten mit semantischen Inhalten zu verstehen ist. Die Standards RDF und OWL wurden zu diesem Zwecke entwickelt und werden in semantic web Projekten eingesetzt. Projekte wie Harmonise und OntoOffice zeigen, dass das semantic web praxistauglich ist und eine Datenanreicherung erfolgreich umgesetzt werden kann. Das letzte Ziel ist die maschinelle Lesbarkeit der Daten, das bedeutet, dass die Maschine die Semantik der Daten versteht und eigene Schlussfolgerungen ziehen kann. Hierfür ist es erforderlich sämtliche Daten für die Maschine verständlich aufzubereiten, dass heißt, als erstes muss ein einheitliches Ontologieschema vorliegen, um anschließend die Internetinhalte mit Annotationen zu versehen. Dieses Ziel ist zum aktuellen Zeitpunkt noch nicht erfüllt, da zum einen noch das Ontologieschema fehlt, welches die gesamte Welt beschreibt und zum anderen wurden bisher nur wenige Annotationen für Daten vorgenommen.

Abschließend hat das semantic web in vielen Bereichen Chancen, die sich in unterschiedlichen Entwicklungsphasen befinden. Einige von Tim Berners-Lee gesteckten Ziele des semantic web sind bereits erfüllt. Aber vor allem der Nutzer des Webs ist entscheidender Faktor für die Zukunftsfähigkeit des semantic web. Gelingt es den Nutzer so zu motivieren, beziehungsweise Anreize zu schaffen, dass es dem semantic web dient und wird eine Lösung zur Prüfung oder Qualitätssicherung der Wahrhaftigkeit der Annotationen gefunden, so wären zwei weitere wichtige Herausforderungen für die Umsetzung des semantic web gegeben. In Gebieten wie semantischer Desktop oder E-Commerce ist demnach kurz- bis mittelfristig mit weiteren konkreteren Umsetzungen zu rechnen. Hingegen ist im Bereich semantische Suche eher eine längerfristige Umsetzung zu prognostizieren, unter der Voraussetzung der Lösung oben genannter Herausforderungen.

10 Fußnoten

  1. Vgl. Hitzler, Krötzsch et al. (2008), S. 9-11.
  2. Vgl. Wahlster (2008), S. 63.
  3. Vgl. Wahlster (2008), S. 63.
  4. Vgl. Dostal, Jeckle et al. (2004), http://www.sigs.de/publications/os/2004/05/dostal_melzer_OS_05_04.pdf, S. 30-31.
  5. Vgl. Hitzler, Krötzsch et al. (2008), S. 11-12.
  6. Vgl. John (2006), http://publica.fraunhofer.de/eprints/urn:nbn:de:0011-n-534743.pdf, S. 9.
  7. Vgl. Dittmann, Schütte et al. (2003), http://ftp.informatik.rwth-aachen.de/Publications/CEUR-WS/Vol-85/dittmann.pdf, S. 3.
  8. Vgl. Hitzler, Krötzsch et al. (2008), S. 11.
  9. Vgl. Dostal, Jeckle et al. (2004), http://www.sigs.de/publications/os/2004/05/dostal_melzer_OS_05_04.pdf, S. 34.
  10. Vgl. Meyer (2005), S. 150.
  11. Vgl. John (2006), S. 9.
  12. Vgl. Blumauer, Pellegrini (2006), S. 12-16.
  13. Vgl. o.V. (2008), http://www.altova.com/de/semantic_web.html.
  14. Vgl. Birkenbihl (2006), S. 78.
  15. Vgl. Dostal, Jeckle et al. (2004), http://www.sigs.de/publications/os/2004/05/dostal_melzer_OS_05_04.pdf, S. 33.
  16. Vgl. Dostal, Jeckle et al. (2004), http://www.sigs.de/publications/os/2004/05/dostal_melzer_OS_05_04.pdf, S. 33.
  17. Vgl. Hitzler, Krötzsch et al. (2008), S. 40.
  18. Vgl. Dostal, Jeckle et al. (2004), http://www.sigs.de/publications/os/2004/05/dostal_melzer_OS_05_04.pdf, S. 33.
  19. Vgl. Dostal, Jeckle et al. (2004), http://www.sigs.de/publications/os/2004/05/dostal_melzer_OS_05_04.pdf, S. 33.
  20. Vgl. Birkenbihl (2006), S. 78.
  21. Vgl. Hitzler, Krötzsch et al. (2008), S. 66f.
  22. Vgl. Manola, Miller et al. (2004), http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#rdfschema.
  23. Vgl. Hitzler, Krötzsch et al. (2008), S. 119f.
  24. Vgl. Hitzler, Krötzsch et al. (2008), S. 125-127f.
  25. Vgl. Birkenbihl (2006), S. 83-85.
  26. o.V. (2008), http://www.w3c.de/Press/2008/sparql-pressrelease.de.html.
  27. Vgl. o.V. (2008), http://www.w3c.de/Press/2008/sparql-pressrelease.de.html.
  28. Vgl. Hitzler, Krötzsch et al. (2008), S. 202f.
  29. Vgl.Fikes, Hayes et al. (2003), ftp://ftp.ksl.stanford.edu/pub/KSL_Reports/KSL-03-14.pdf.gz, S. 1.
  30. Vgl. Mattern (2008), S. 9f.
  31. Vgl. Machill, Beiler et al. (2008), S. 23ff.
  32. Vgl. Mattern (2008), S. 14.
  33. Vgl. Wahlster (2008), S. 60.
  34. Vgl. o.V. (2007), http://www.semager.de/blog/impressum/was-ist-semager/.
  35. Vgl. o.V. (2008), http://www.powerset.com/about/.
  36. Vgl. Werthner, Borovicka (2006), S. 315.
  37. Vgl. Werthner, Borovicka (2006), S. 308ff.
  38. Vgl. Werthner, Borovicka (2006), S. 313ff.
  39. Vgl. Tschetschonig, Ladengruber et al. (2008), S. 125f.
  40. Vgl. Tschetschonig, Ladengruber et al. (2008), S. 127f.
  41. Sauermann (2006), S. 162.
  42. Vgl. Sauermann (2006), S. 163ff.
  43. Sauermann (2006), S. 166.
  44. Vgl. Sauermann (2006), S. 166ff.
  45. Vgl. o.V. (2008), http://www.electronic-office.net/html/anbieter/produkt_full.cfm?Detail_ID=503&SubPortal=0.
  46. Vgl. o.V. (2008), http://www.usu.de/knowledge_business/knowledgecenter/knowledgeminer.html.
  47. Vgl. Meyer (2005), S. 112f.
  48. Vgl. Book, Gruhn (2003), S. 138.
  49. Vgl. Baier (2008), http://www.fazit-forschung.de/fileadmin/_fazit-forschung/downloads/FAZIT-Schriftenreihe_Band_13.pdf, S. 22.
  50. Vgl. John (2008), http://publica.fraunhofer.de/eprints/urn:nbn:de:0011-n-534743.pdf, S. 28.
  51. Vgl. Bock, Müller (2007), http://www.lulu.com/items/volume_62/1969000/1969742/1/print/SemanticsAtWork3.pdf, S. 38.
  52. Vgl. Braun, Schmidt et al. (2008), http://www.informatik.uni-leipzig.de/~auer/publication/ontowiki.pdf, S. 12.
  53. Vgl. Braun, Schmidt et al. (2008), S. 168f.
  54. Vgl. Braun, Schmidt et al. (2008), S. 163.
  55. Vgl. Braun, Schmidt et al. (2008), S. 165.
  56. Vgl. Braun, Schmidt et al. (2008), S. 167f.
  57. Vgl. Biesalski (2004), http://www.fzi.de/KCMS/kcms_file.php?action=link&id=426, S. 4f.
  58. Vgl. Krötzsch, Vrandecic et al. (2007), http://korrekt.org/papers/KroetzschVrandecicVoelkelHaller_SemanticMediaWiki_2007.pdf, S. 17f.
  59. Vgl. Gaiser, Hampel et al. (2008), S. 11f.
  60. Vgl. Tschetschonig, Ladengruber et al. (2008), S. 123f.
  61. Vgl. Braun, Schmidt et al. (2008), S. 163.
  62. Vgl. Papadopoulos, Mezaris et al. (2006), S. 199ff.
  63. Vgl. Koch (2008), http://www.imagenotion.com/publication/2008/imagenotionIXMagazin112008.pdf.
  64. Vgl. Hansen, Neumann et al. (2005), S. 204ff.
  65. Vgl. Hansen, Neumann et al. (2005), S. 63.
  66. o.V. (2008), http://www.oracle.com/support/library/brochure/lifetime-support-technology.pdf, S. 7.
  67. Vgl. Maicher, Heyer (2003), S. 28f.
  68. Vgl. Hitzler, Krötzsch et al. (2008), S. 10.
  69. Vgl. York, Hitzer et al. (2004), http://www.aifb.uni-karlsruhe.de/WBS/phi/resources/publications/sw_inoneday.pdf, S. 5.
  70. Vgl. Braun, Schmidt et al. (2008), S. 165.
  71. Vgl. Grimm, Sintek et al. (2007), http://www.lulu.com/items/volume_62/1969000/1969742/1/print/SemanticsAtWork3.pdf, S. 59.
  72. Vgl. Grimm, Sintek et al. (2007), http://www.lulu.com/items/volume_62/1969000/1969742/1/print/SemanticsAtWork3.pdf, S. 65f.
  73. Vgl. Grimm, Sintek et al. (2007), http://www.lulu.com/items/volume_62/1969000/1969742/1/print/SemanticsAtWork3.pdf, S. 66.
  74. Vgl. Grimm, Sintek et al. (2007), http://www.lulu.com/items/volume_62/1969000/1969742/1/print/SemanticsAtWork3.pdf, S. 72f.
  75. Vgl. May (2006), S. 499.
  76. Vgl. May (2006), S. 500.

11 Literatur- und Quellenverzeichnis

Auer, Dietzold, Riechert (2006): OntoWiki - A Tool for Social, Semantic Collaboration, http://www.informatik.uni-leipzig.de/~auer/publication/ontowiki.pdf (Abruf am 26.12.2008)
Avrithis, Yannis; Kompatsiaris, Yiannis; Staab, Steffen; O'Connor, Noel E. (Hrsg.) (2006): Semantic multimedia. First International Conference on Semantic and Digital Media Technologies, SAMT 2006, Athens, Greece, December 6 - 8, 2006 ; proceedings. Springer, Berlin
Baier (2008): Semantische Technologien in Wissensmanagementlösungen. Einsatzpotentiale für den Mittelstand, http://www.fazit-forschung.de/fileadmin/_fazit-forschung/downloads/FAZIT-Schriftenreihe_Band_13.pdf (Abruf am 28.12.2008)
Biesalski (2004): Ontologien als Bindeglied bei der Personalentwicklung, http://www.fzi.de/KCMS/kcms_file.php?action=link&id=426 (Abruf am 09.12.2008)
Birkenbihl, Klaus (2006): Standards für das Semantic Web. In: Pellegrini, Tassilo; Blumauer, Andreas (Hrsg.). Semantic Web. Wege zur vernetzten Wissensgesellschaft. Springer-Verlag Berlin Heidelberg, Berlin, Heidelberg, S. 73–88
Blumauer, Andreas; Pellegrini, Tassilo (2006): Semantic Web und semantische Technologien: Zentraler Begriff und Unterscheidungen. In: Pellegrini, Tassilo; Blumauer, Andreas (Hrsg.). Semantic Web. Wege zur vernetzten Wissensgesellschaft. Springer-Verlag Berlin Heidelberg, Berlin, Heidelberg, S. 9–25
Bock, Jürgen; Müller, Wolfgang (2007): Ontology Mapping. In: Volz, Raphael (Hrsg.). Semantics At Work, http://www.lulu.com/items/volume_62/1969000/1969742/1/print/SemanticsAtWork3.pdf (Abruf am 28.12.2008), S. 37–45
Book, Matthias; Gruhn, Volker (2003): Überblick über psychologische und organisatorische Barrieren beim Einsatz von Wissensmanagement-Systemen. In: Fähnrich, Klaus-Peter (Hrsg.). Content- und Wissensmanagement. Arbeiten aus dem Forschungsvorhaben PreBIS und Beiträge auf den Leipziger Informatik-Tagen 2003. LIV Leipziger Informatik Verbund, Leipzig, S. 131–138
Braun, Simone; Schmidt, Andreas; Walter, Andreas; Zacharias, Valentin (2008): Von Tags zu semantischen Beziehungen: kollaborative Ontologiereifung. In: Gaiser, Birgit; Hampel, Thorsten; Panke, Stefanie (Hrsg.). Good Tags - Bad Tags. Social Tagging in der Wissensorganisation. Waxmann, Münster, S. 163–173
Dittmann, Schütte, Zelewski (2003): Darstellende Untersuchung philosophischer Probleme mit Ontologien, http://ftp.informatik.rwth-aachen.de/Publications/CEUR-WS/Vol-85/dittmann.pdf (Abruf am 28.12.2008)
Dostal, Wolfgang; Jeckle, Mario; Melzer, Ingo; Zengler, Barbara (2004): Semantic Web. In: OBJEKTspektrum. 2004 (05/2004), S. 30–35, http://www.sigs.de/publications/os/2004/05/dostal_melzer_OS_05_04.pdf (Abruf am 28.12.2008)
Fähnrich, Klaus-Peter (Hrsg.) (2003): Content- und Wissensmanagement. Arbeiten aus dem Forschungsvorhaben PreBIS und Beiträge auf den Leipziger Informatik-Tagen 2003. LIV Leipziger Informatik Verbund, Leipzig
Fikes, Hayes, Horrocks (2003): OWL-QL – A Language for Deductive Query Answering on the Semantic Web, ftp://ftp.ksl.stanford.edu/pub/KSL_Reports/KSL-03-14.pdf.gz (Abruf am 18.01.2009)
Gaiser, Birgit; Hampel, Thorsten; Panke, Stefanie (2008): Vorwort. In: Gaiser, Birgit; Hampel, Thorsten; Panke, Stefanie (Hrsg.). Good Tags - Bad Tags. Social Tagging in der Wissensorganisation. Waxmann, Münster, S. 11–14
Gaiser, Birgit; Hampel, Thorsten; Panke, Stefanie (Hrsg.) (2008): Good Tags - Bad Tags. Social Tagging in der Wissensorganisation. Waxmann, Münster
Grimm, Stephan; Sintek, Michael; Forcher, Björn (2007): Ontology Reasoning. In: Volz, Raphael (Hrsg.). Semantics At Work, http://www.lulu.com/items/volume_62/1969000/1969742/1/print/SemanticsAtWork3.pdf (Abruf am 28.12.2008), S. 59–75
Hansen, Hans Robert; Neumann, Gustaf; Hansen-Neumann (2005): Wirtschaftsinformatik 2. Informationstechnik. 9., neu bearb. Aufl. Lucius & Lucius, Stuttgart
Hitzler, Pascal; Krötzsch, Markus; Rudolph, Sebastian; Sure, York (2008): Semantic Web. Grundlagen. Springer-Verlag Berlin Heidelberg, Berlin, Heidelberg
John (2006): Semantische Technologien in der betrieblichen Anwendung. Ergebnisse einer Anwenderstudie, http://publica.fraunhofer.de/eprints/urn:nbn:de:0011-n-534743.pdf (Abruf am 28.12.2008)
Koch, Daniel (2008): Bildannotation im semantischen Web. Weltbeschreibung. In: IX Magazin. 2008 (11), S. 126–130, http://www.imagenotion.com/publication/2008/imagenotionIXMagazin112008.pdf
Krötzsch, Vrandecic, Völkel, Haller, Studer (2007): Semantic Wikipedia, http://korrekt.org/papers/KroetzschVrandecicVoelkelHaller_SemanticMediaWiki_2007.pdf (Abruf am 27.12.2008)
Machill, Marchel; Beiler, Markus; Zenker, Martin (2008): Suchmaschinenforschung: Überblick und Systematisierung eines interdisziplinären Forschungsfeldes. In: Mattern, Friedemann (Hrsg.). Wie arbeiten die Suchmaschinen von morgen? Informationstechnische, politische und ökonomische Perspektiven. Fraunhofer IRB Verl., Stuttgart, S. 23–58
Maicher, Lutz; Heyer, Gerhard (2003): Produktion und Nutzung von Inhalten für das Semantische Web Entwicklung eines Ordnungsschemas. In: Fähnrich, Klaus-Peter (Hrsg.). Content- und Wissensmanagement. Arbeiten aus dem Forschungsvorhaben PreBIS und Beiträge auf den Leipziger Informatik-Tagen 2003. LIV Leipziger Informatik Verbund, Leipzig, S. 27–37
Manola, Miller, McBride (2004): RDF Primer, http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#rdfschema (Abruf am 28.12.2008)
Mattern, Friedemann (2008): Suchmaschinen - Eine kurze Einführung. In: Mattern, Friedemann (Hrsg.). Wie arbeiten die Suchmaschinen von morgen? Informationstechnische, politische und ökonomische Perspektiven. Fraunhofer IRB Verl., Stuttgart, S. 11–22
Mattern, Friedemann (2008): Vorwort. In: Mattern, Friedemann (Hrsg.). Wie arbeiten die Suchmaschinen von morgen? Informationstechnische, politische und ökonomische Perspektiven. Fraunhofer IRB Verl., Stuttgart, S. 9–10
Mattern, Friedemann (Hrsg.) (2008): Wie arbeiten die Suchmaschinen von morgen? Informationstechnische, politische und ökonomische Perspektiven. Fraunhofer IRB Verl., Stuttgart
May, Wolfgang (2006): Reasoning im und für das Semantic Web. In: Pellegrini, Tassilo; Blumauer, Andreas (Hrsg.). Semantic Web. Wege zur vernetzten Wissensgesellschaft. Springer-Verlag Berlin Heidelberg, Berlin, Heidelberg, S. 485–503
Meyer, Jörn-Axel (Hrsg.) (2005): Wissens- und Informationsmanagement in kleinen und mittleren Unternehmen. Jahrbuch der KMU-Forschung und -Praxis 2005 in der Edition "Kleine und Mittlere Unternehmen". 1. Aufl. Eul, Lohmar
o.V. (2007): Was ist Semager « Semager - semantisches für SEO und SEM, http://www.semager.de/blog/impressum/was-ist-semager/ (Abruf am 04.01.2009)
o.V. (2008): Electronic Office, http://www.electronic-office.net/html/anbieter/produkt_full.cfm?Detail_ID=503&SubPortal=0 (Abruf am 04.01.2009)
o.V. (2008): W3C erschliesst Daten über das Web mit SPARQL. Leistungsstarke Technologie zur Abfrage verteilter und verschiedenartiger Daten, http://www.w3c.de/Press/2008/sparql-pressrelease.de.html (Abruf am 30.12.2008)
o.V. (2008): USU - Knowledge Business - USU KnowledgeMiner: Recherche, http://www.usu.de/knowledge_business/knowledgecenter/knowledgeminer.html (Abruf am 04.01.2009)
o.V. (2008): Wer hat die Glühlampe erfunden? - Google-Suche, http://www.google.de/search?q=Wer+hat+die+Gl%C3%BChlampe+erfunden%3F&ie=utf-8&oe=utf-8&aq=t&rls=org.mozilla:de:official&client=firefox-a (Abruf am 18.01.2009)
o.V. (2008):http://www.oracle.com/support/library/brochure/lifetime-support-technology.pdf (Abruf am 27.12.2008)
o.V. (2008): Wer ist der Erfinder der Glühlampe? - Google-Suche, http://www.google.de/search?num=100&hl=de&client=firefox-a&rls=org.mozilla%3Ade%3Aofficial&hs=Zjh&q=Wer+ist+der+Erfinder+der+Gl%C3%BChlampe%3F&btnG=Suche&meta= (Abruf am 18.01.2009)
o.V. (2008): Was ist das Semantic Web?, http://www.altova.com/de/semantic_web.html (Abruf am 28.12.2008)
o.V. (2008): About - Powerset, http://www.powerset.com/about/ (Abruf am 04.01.2009)
Papadopoulos, G. Th; Mezaris, V.; Dasiopoulou, S.; Kompatsiaris, I. (2006): Semantic Image Analysis Using a Learning Approach and Spatial Context. In: Avrithis, Yannis; Kompatsiaris, Yiannis; Staab, Steffen; O'Connor, Noel E. (Hrsg.). Semantic multimedia. First International Conference on Semantic and Digital Media Technologies, SAMT 2006, Athens, Greece, December 6 - 8, 2006 ; proceedings. Springer, Berlin, S. 199–211
Pellegrini, Tassilo; Blumauer, Andreas (Hrsg.) (2006): Semantic Web. Wege zur vernetzten Wissensgesellschaft. Springer-Verlag Berlin Heidelberg, Berlin, Heidelberg
Sauermann, Leo (2006): Semantic Desktop - Der Arbeitsplatz der Zukunft. In: Pellegrini, Tassilo; Blumauer, Andreas (Hrsg.). Semantic Web. Wege zur vernetzten Wissensgesellschaft. Springer-Verlag Berlin Heidelberg, Berlin, Heidelberg, S. 161–175
Tschetschonig, Karl; Ladengruber, Roland; Hampel, Thorsten; Schulte, Jonas (2008): Kollaborative Tagging-Systeme im Electronic Commerce. In: Gaiser, Birgit; Hampel, Thorsten; Panke, Stefanie (Hrsg.). Good Tags - Bad Tags. Social Tagging in der Wissensorganisation. Waxmann, Münster, S. 119–129
Volz, Raphael (Hrsg.) (2007): Semantics At Work, http://www.lulu.com/items/volume_62/1969000/1969742/1/print/SemanticsAtWork3.pdf (Abruf am 28.12.2008)
Wahlster, Wolfgang (2008): Von Suchmaschinen zu Antwortmaschinen: Semantische Technologien und Benutzerpartizipation im Web 3.0. In: Mattern, Friedemann (Hrsg.). Wie arbeiten die Suchmaschinen von morgen? Informationstechnische, politische und ökonomische Perspektiven. Fraunhofer IRB Verl., Stuttgart, S. 59–75
Werthner, Hannes; Borovicka, Michael (2006): E-commerce und Semantic Web. In: Pellegrini, Tassilo; Blumauer, Andreas (Hrsg.). Semantic Web. Wege zur vernetzten Wissensgesellschaft. Springer-Verlag Berlin Heidelberg, Berlin, Heidelberg, S. 307–319
York, Hitzer, Eberhart, Studer (2004): The Semantic Web in One Day, http://www.aifb.uni-karlsruhe.de/WBS/phi/resources/publications/sw_inoneday.pdf (Abruf am 18.01.2009)
Persönliche Werkzeuge