Anwendungsfelder Semantic Web

Aus Winfwiki

Wechseln zu: Navigation, Suche

Inhaltsverzeichnis


1 Titel

Name des Autors / der Autoren: Thorsten Steen, Timo Cordes
Titel der Arbeit: "Anwendungsfelder Semantic Web"
Hochschule und Studienort: FOM Hamburg


2 Einführung

Das Semantic Web hat in den letzten Jahren in mehreren Anwendungsfeldern an Bedeutung gewonnen. Ziel dieser Arbeit ist es, die Umsetzbarkeit der Idee des Semantic Webs in verschiedenen Systemen zu betrachten. Hierzu werden mögliche Semantische Funktionen einzelner Systeme aufgezeigt und erläutert sowie mögliche Einsatzgebiete skizziert. Abschließend erfolgt eine Aufwands- und Umsetzbarkeitsprüfung für die einzelnen Systeme.

3 Prolog

Das World Wide Web (WWW) hat die Gesellschaft und die Wirtschaft in den letzten Jahren erheblich beeinflusst und verändert. Während 1989 noch etwa 100 Seiten das WWW bildeten, bilden heutzutage über 8 Milliarden Seiten das WWW.

Grenzen wurden überwunden, räumliche Distanzen und Sprachbarrieren verschwanden und Wissen wird in Echtzeit ausgetauscht. Dieses ständig wachsende Datenaufkommen macht es immer schwieriger, relevante Informationen zu finden und auf diese zuzugreifen, ob nun als Privatperson oder als Unternehmen.

Eine Hilfe bei der Suche von Informationen sind die modernen Suchmaschinen, wie z.B. Google oder Yahoo, die mit Hilfe ausgefeilter Algorithmen große Indexe durchsuchen. Dabei liegen große Teile der Daten und Informationen unstrukturiert vor und nur ein begrenzter Teil strukturiert in Datenbanken und CMS Systemen.

Das primäre Problem ist, dass der Großteil der Daten im World Wide Web zum Lesen und Deuten durch den Menschen konzipiert ist und von Maschinen respektive Computern inhaltlich weder interpretiert noch weiter verarbeitet werden können.

Um diese Probleme zu lösen gibt es grundsätzlich 2 unterschiedliche Ansätze.

Eine Lösungsmöglichkeit wäre, die Inhalte so zu belassen, wie sie heute sind und künstlicher Intelligenz in die bestehenden Systeme (Der Begriff Systeme wird synonym für CMS, Datenbanken, Suchmaschinen usw. benutzt) zu implementieren, damit diese die Daten und Informationen deuten und verarbeiten können.

Diesen Ansatz verfolgt die Wissenschaft bereits seit einiger Zeit, allerdings wurde bis auf einige kleine Verbesserungen kein wesentlicher Durchbruch erzielt.

Der andere Ansatz ist, die Inhalte des World Wide Web so abzubilden, dass sie von Systemen interpretiert und verarbeitet werden können. Tim Berner – Lee verfolgte diesen Ansatz mit der Vorstellung des Semantic Webs seit dem Jahre 1999.

4 Kriterien für den Einsatz von semantischen Techniken

Um Techniken aus dem Semantic Web (SW) in verschiedenen Anwendungsfeldern einsetzen zu können, bedarf es der Erfüllung einiger wichtiger Kriterien. Dazu zählen: Datenqualität, Standardisierung, Metadaten und Werkzeuge.

4.1 Serendipität

Serendepität bezeichnet die Entdeckung von etwas, dass nicht explizit gesucht wird jedoch eine große Entdeckung oder Neuerung darstellt.

Im Falle des Semantic Web mit der Möglichkeit, durch standardisierte Bedeutungskennzeichnung bedeutet Serendepität die Entdeckung von Überschneidungen von Wissensbereichen mit anderen Wissensbereichen, die jeder für sich mit den Bedeutungen und Beziehungen der zu diesem Wissensbereich gehörenden Begriffe ein geschlossenes System bilden, auf der Bedeutungsebene z.B. eines bestimmten Begriffes.

Das Neue wird in den Bereichen entdeckt, in denen es nicht vermutet wird und die eigentlich als Ballast angesehen werden.

4.2 Datenqualität

Um die Rolle der Datenqualität für das Semantic Web beantworten zu können, muss zu Beginn der Zusammenhang der Begriffe Daten, Informationen und Wissen dargestellt werden. Als Daten versteht man allgemein Funktionen oder Zeichen. Informationen sind interpretierte Daten, das heißt es kommt Semantik zu den Daten hinzu. Um von Informationen zu Wissen zu kommen, müssen die Informationen zueinander in Bezug, bzw. in einen Kontext gesetzt werden.

Bild:Datenqualität.jpg

Abbildung 1.0

Die Abbildung zeigt diesen Zusammenhang anhand eines Beispiels. Die Daten sind 60 und MS2. Werden diese Daten interpretiert, so könnten sie zu den Informationen Geschwindigkeit 60 km/h und Messstelle mit Namen MS2 werden. Setzt man diese Informationen zueinander in Beziehung könnte man das Wissen erhalten, dass ein Fahrzeug mit 60 km/h über die Messstelle MS2 gefahren ist.

Der Grund, warum die Zusammenhänge dieser Begriffe veranschaulicht wurden, ist folgender: Datenqualität bezieht sich nicht nur, wie man aufgrund des Namens vermuten könnte, auf Daten. Da diese sich stark am Benutzer orientiert, bezieht sie sich natürlich auch auf die für den Benutzer interessanten, sich aus den Daten ergebenden Informationen und auf das daraus resultierende Wissen (Der Kerngedanke von Semantik).

Da im Semantic Web informationsverarbeitende Systeme aus der Flut an Daten die korrekten Informationen interpretieren sollen, um diese komplex zu Wissen zu komprimieren, ist es wichtig, dass die Datenqualität stimmt.

4.3 Standardisierung

Das World Wide Web hat seit der Gründung des World Wide Web Consortiums (W3C)[1] eine erhebliche Standardisierung erfahren. Als Beispiel kann die Hyper Text Markup Language (HTML)[2] oder Extensible Markup Language (XML)[3] genannt werden. Semantic Web benötigt aufgrund seines Einsatzgebietes einer weitergehenden und tiefergehende Standardisierung! Die Ziele sind hier:

- Standardisierte Architektur für Informationsverarbeitung

- Standardisierte Vokabularien

- Standardisierte Sprachen für Kontextbedingungen

Dazu hat das World Wide Web Consortium in den letzten Jahren im Bereich Semantic Web federführend mehrere Standards verabschiedet und Empfehlungen ausgesprochen. Das Resource Description Framework (RDF)[4], Web Ontology Language (OWL)[5], Resource Description Framework Schema (RDFS)[6] und der Uniform Ressource Identifier (URI)[7] sind hier die wichtigsten.

4.3.1 RDF

Einfach ausgedrückt ist das Resource Description Framework eine auf XML basierende Sprache zur Beschreibung von Ressourcen. Unter einer Ressource könnte z.B. eine elektronische Datei im Internet verstanden werden. Auf eine solche Datei wird über eine URL (Uniform Resource Locator)[8] zugegriffen. Während es mit XML möglich ist, Metadaten an einzelne Teile eines Dokuments anzuhängen, ist ein Vorteil von RDF, dass es Metadaten über das gesamte Dokument anhängen kann, etwa Informationen wie Autor, Erstellungsdatum und Art des Dokuments. Ein gelungenes Beispiel für den Nutzen von RDF ist die Beschreibung eher undurchsichtiger Dateien wie etwa Bild- oder Audiodateien. Ein RDF Dokument beschreibt einen gerichteten Graphen, dabei sind sowohl Knoten als auch Kanten beschriftet[9]. Die Abbildung zeigt dies anschaulich:

Bild:Graph.jpg

Abbildung 2.0

Die Namensgebung in RDF wird dabei über URI gelöst[10]. Der wichtigste Baustein von RDF ist allerdings ein RDF Tripel. Ein RDF Tripel ist ein RDF Graph dessen Kanten vollständig beschrieben wurde. Die nachfolgende Abbildung macht die Zusammensetzung eine RDF Tripels durch Subjekt Prädikat Objekt deutlich:

Bild:Tripel.jpg

Abbildung 3.0

4.3.2 RFDS

Das RDF-Schema (RDFS) ist eine Erweiterung des RDF Ansatzes. RDFS ist, ähnlich wie RDF, eine W3C-Konsortium Recommendation und damit ein offizieller Standard. Neben RDF-Schema wird mittlerweile auch der Begriff “RDF Vocabulary Description Language” für das dahinterstehende Konzept verwendet. RDF-Schema ist eine auf RDF aufgesetzte Vokabular-Beschreibungssprache, die aus einem einfachen Bündel von gewöhnlichen RDF Ressourcen und Eigenschaften besteht. Hat man mit RDF die Möglichkeit, Aussagen (statements) über Ressourcen, deren Eigenschaften und Werte zu treffen, so bietet RDFS nun die Möglichkeit, ein speziell verwendetes Vokabular für diese Aussagen festzulegen, in dem spezielle Klassen oder Arten von Ressourcen verankert sind. Unter einer Klasse kann in diesem Zusammenhang eine Gruppe von Dingen mit ähnlichen Eigenschaften verstanden werden. RDF Schema ist eine Erweiterung von RDF um mit Hilfe von RDF Tripel einfache Ontologien abbilden zu können.

4.3.3 OWL

OWL ist eine Spezifikation um Ontologien in einer formalen Sprache abbilden und verteilen zu können. Ziel ist es innerhalb eine Domäne (Wissensgebiet) Terme und ihre Beziehungen so abzubilden das diese Maschinenlesbar werden. Allerdings ist die Komplexität von OWL oftmals zu hoch, daher wurde OWL in drei Klassen eingeteilt:

OWL Full

Dies ist die vollständigste OWL Sprache. OWL Full ist so mächtig nicht jede OWL-Full Ontologie hinsichtlich ihrer Schlussfolgerungsmöglichkeiten überhaupt computergestützt verwendet werden kann. Es besteht eine 100 % Kompatibilität zu RDF und RDFS.

OWL DL

Diese Sprache zur Formulierung von Ontologien umfasst auch die vollständigen OWL Modellierungsprimitive. Diese können jedoch nur eingeschränkt verwendet und interpretiert werden. Damit wird das Ziel verfolgt, dass ein OWL DL Programmiercode hinsichtlich seiner Schlussfolgerungen noch in akzeptabler Zeit ausgeführt werden kann. Diese Beschränkungen gehen jedoch wiederum zu Lasten einer vollständigen Kompatibilität mit RDF und RDFS.

OWL Lite

OWL Lite ist die einfachste OWL Sprache und ist darauf beschränkt, Hierarchien von Konzepten mit einfachen Beschränkungseigenschaften (Nebenbedingungen) auszudrücken. OWL Lite dient hauptsächlich der schnellen Integration bereits existierender Klassifikationssysteme

Die Abbildung macht die Überlappung bzw. Unterschiede zwischen RDFS und OWL deutlich:

Bild:Owl.jpg

Abbildung 4.0

4.3.4 URI

Ein URI (Uniform Resource Identifier) besteht aus einer Kette von Zeichen, die eine abstrakte oder physikalische Ressource identifiziert. Eine solche Quelle könnten Dokumente, Bilder, herunterladbare Dateien oder ähnliches im Web sein oder auch physikalische Geräte wie Fernseher, Kühlschrank oder Rundfunkradio. Der URI macht diese verschiedenen Quellen verfügbar und teilt ihnen eine eindeutige Adresse zu. Dabei verwendet der URI eine Vielzahl von unterschiedlichen Namensschemata und Zugangsmethoden wie etwa HTTP oder FTP. Die wohl bekannteste Unterkategorie von Uniform Resource Identifiern (URI) ist der Uniform Resource Locator (URL), der zur Adressierung und Identifikation von Webseiten im Internet genutzt wird.

Das Cake Layer Diagramm der W3C macht deutlich das die einzelnen Standards in Layer angeordnet sind (wie zum Beispiel das Layer Modell für Netzwerke) und diese aufeinander aufbauen und Abhängigkeiten besitzen:

Bild:Cakelayer.jpg

Abbildung 5.0

4.4 Metadaten

Dass die heutige Informationsgesellschaft täglich gewaltige Mengen von Daten produziert und austauscht, wurde bereits im Prolog näher erläutert. Dabei wird mit den heutigen Techniken es immer schwieriger, diese Daten zu klassifizieren und zu organisieren, damit diese nutzbar werden. Im Web 1.0 oblag diese Aufgabe dem menschlichen Betrachter, allerdings soll diese Aufgabe im Semantic Web von informationsverarbeitenden Systemen erfüllt werden. Eine der möglichen Wege, um dieses Problem zu lösen, sind Metadaten. Metadaten können gemäß einer weit verbreiteten ersten Definition als Beschreibungen von Daten verstanden werden, also „Daten über Daten“ (Daten wird hier analog zu Information benutzt) oder Daten, die eine Datenquelle oder eine Datensammlung näher beschreiben. Sie dienen dazu, die eigentlichen, darunterliegenden Daten besser verstehen, verwalten und verwenden zu können. Tim Berner Lee beschreibt Metadaten so: "Metadaten sind maschinenlesbare Informationen über elektronische Ressourcen oder andere Dinge."


Bild:Metadaten.jpg

Abbildung 6.0

Allerdings ist die Klassifikation von Metadaten nicht absolut. Wie bereits im Absatz Datenqualitäten beschrieben sind Daten benutzerorientiert. Ob nun Daten Metadaten sind ist entsprechend ebenfalls benutzerorientiert! Ein Beispiel: Für den Bibliothekar einer Bibliothek sind ein Autor bzw. das Erscheinungsdatum eines Buches Daten. Für einen Leser dieses Buches wären diese Daten allerdings Metadaten. Im Semantic Web werden Metadaten dazu genutzt, um Daten anzureichern, damit diese durch Informationssysteme verarbeitet und zu Wissen kombiniert werden können. Einer der wichtigsten Standards für die Kategorisierung von Metadaten ist der Dublin Core Metadata Initiative[11]. Die Dublin Core Initative wurde 1994 am Rande einer World-Wide-Web-Konferenz in Chicago gegründet.

4.5 Werkzeuge

Im World Wide Web gibt es Heute eine große Anzahl an Werkzeugen die es Administratoren, Entwicklern und Anwendern erlaubt, ohne großes technisches Vorwissen Informationen zu veröffentlichen und zu verbreiten. Im Gegensatz dazu ist gerade im Semantic Web noch sehr viel technisches Know How und Handarbeit von Nöten, um Vorteile aus dem Semantic Web ziehen zu können. Seitdem das Semantic Web in einigen Anwendungsfelder an Bedeutung gewonnen hat, ist zu Beobachten das aus der Wirtschaft vermehrt Werkzeuge entwickelt werden, um den Umgang mit Semantic Web und seinen Technologien zu vereinfachen und zu verbessern. Hier gibt es unzählige Klassen von Werkzeugen, als Beispiel: RDF Generatoren, OWL Reasoners, RDF/OWL Browsers, OWL Syntaxconverter usw. Soll das Semantic Web so erfolgreich sein wie das Web 2.0 ist, ist es gerade bei den Werkzeugen wichtig, noch erhebliche Anstrengungen zu unternehmen um eine Automatisierung und Vereinfachung zu erreichen, damit auch Anwender die Vorteile des Semantic Webs einsetzen können.

5 Anwendungsfelder

5.1 Content Management System

Content ist Inhalt in digitaler Form. Ein Content Management System (CMS) organisiert digitale Inhalte und gibt diese i.d.R. browserbasiert wieder aus. Inhalte in CMS können sich aus einzelnen Bausteinen (z.B. Texte, Bilder) zusammensetzen. Aus Sicht des Inhaltsanbieters muss ein CMS dabei folgende wesentliche Merkmale aufweisen[12]:

- Zentrale Speicherung im Datenbankmanagementsystem bei dezentraler Pflege

- Verwaltung der Benutzer- und Zugangsberechtigungen

- Versionskontrolle der Inhalte

- Trennung von Inhalt, Struktur und Layout

- Strukturierung und Verknüpfung von Inhalten (=>“Assets“)

- Anreicherung der Inhalte mit Metadaten

- Mehrfachverwendung von systemeigenen und externen Inhalten (Content-Syndikation)

- Workflow Management zur Unterstützung von Geschäftsprozessen

5.1.1 Warum CMS mit SW-Funktionalitäten?

Wie Eingangs (siehe 3. Prolog) angeführt, wächst das Internet und damit die Fülle der Daten und Informationen. Ein CMS organisiert sowohl systemeigene als auch externe Inhalte. Durch Standardisierung in der maschinell lesbaren Beschreibung von Ressourcen und Beziehungen (siehe 5.3) können auch dezentral gespeicherte Daten verwaltet werden. Es ergeben sich eine Fülle neuer Möglichkeiten der Art der Zusammenstellung von Inhalten. (siehe nächster Punkt).

5.1.2 Semantische Funktionen in einem Semantic Web CMS (SW-CMS)

Semantische Funktionen setzen semantisch strukturierte Informationen in Datenbeständen voraus. Viele Daten liegen in HTML-Dokumenten unstrukturiert im Sinne des SW vor. Ein CMS legt derzeit Daten jedoch strukturiert in relationalen Datenbanken ab. Datenbanken sind ein existenziell wichtiger Bestandteil von CMS. Für den weiteren Text wird von der Möglichkeit zur Speicherung semantisch aufbereiteter Daten in einem Semantic Web CMS ausgegangen[13].

5.1.2.1 Daten in einem SW-CMS

Daten, das in einen Kontext Setzen von Daten zur Erlangung von Informationen und damit dann auch die Informationen (siehe 4.3 Standardisierung) selbst, sind die „Arbeitsgrundlage“ eines SW-CMS. Semantisch korrekte Metadaten (siehe 4.3 Standardisierung) werden hierbei vorausgesetzt.

5.1.2.1.1 Umwandlung unstrukturierter Daten in einem SW-CMS

Ein Weg unstrukturierte Daten für das SW-CMS nutzbar zu machen, liegt in der Information Extraction (IE)[14]. IE setzt im Vergleich mit dem in 5.4.2.1 beschriebenen Information Retrieval (IR) eine Ebene tiefer an und zieht strukturierte Fakten aus HTML-Dokumenten, die mit Hilfe von IR als Fundament von Suchmaschinen, gefunden wurden.

Der Kern der Extraktion ist die (semi)automatische Übersetzung von Daten aus HTML in das gewünschte Format (z.B. RDF, XML etc.). Realisiert wird dieser Vorgang mit Programmen, die als Wrapper bezeichnet werden. Nach Definition einer Transformation durch einen Wrapper können die Daten in Datenbanken abgelegt, von Applikationen verwendet oder als Instanzen von Ontologien verwendet werden[15].

Eine weitere Möglichkeit neben der oben beschriebenen semantischen Annotation[16][17] stellt die manuelle semantische Annotation mit entsprechenden Tools dar.

5.1.2.1.2 Strukturierte Daten in einem SW-CMS

Eine weitere semantische Funktion eines CMS ist das automatische Erkennen von SW-Informationen in Form von z.B. RDF-Annotationen im Quelltext einer Website. Von diesem Umstand darf ausgegangen werden, da der Betrieb eines SW-CMS ansonsten keinen Sinn ergeben würde.

5.1.2.2 Personalisierung

Ein wesentliches Merkmal von SW-CMS ist die personalisierte Ausgabe von Informationen. Ein Merkmal von CMS ist strikt Inhalte, Struktur und Layout zu trennen (siehe Punkt 6). Ein weiteres Merkmal ist die Content-Syndikation. Hierbei handelt es sich um die Mehrfachnutzung von Inhalten (interne- und externe Inhalte).

Strukturierte Inhalte in einem SW-CMS enthalten Metadaten. Eine Ressource wird durch die Metadaten maschinenlesbar beschrieben. In den Metadaten sind auch Informationen über die der Metadaten zugehörigen Ontologie enthalten (siehe 4.3 Standardisierung). Durch diese eindeutige Beschreibung kann z.B. nach der Überschneidung der Kernkompetenzen zweier Forschungszentren gesucht werden, ohne dass diese Begriffe als Literale angegeben werden müssen.

Metadaten werden auf der Bedeutungsebene aufgelöst. Das ist die Ebene, die durch standardisierte Syntax Informationen darstellt (siehe 4.3 Standardisierung). Die hinter den Metadaten stehenden Ontologien und deren Verbindungen werden gefunden[18]. Dahinter stecken Ontologiemapping und Ontologiematching[19].

Die Bedeutung von Content-Syndikation erhöht sich durch Content mit Metadaten nochmals erheblich. Da der Content wiederverwendet wird und die Suche wie oben beschrieben auf der Bedeutungsebene aufgelöst wird, entstehen immer neue Zusammenstellungen von Inhalten mit Verbindungen, die mit einer hohen Wahrscheinlichkeit nicht erwartet wurden. Durch diese Gewinnung von Wissen (siehe 4.2 Datenqualität) werden Serendipitäts-Effekte erzielt.

Durch die Trennung des Layouts von den Inhalten, kann das Layout der Ausgabe der Informationen im Browser frei gestaltet werden. So kann man die Auswahl zwischen templates- oder der individuellen Gestaltung durch den User ermöglichen. Dies hängt dann vom Content-Bereitsteller und/oder vom System ab.

Zum Abschluss eine Grafik mit einer schematischen Darstellung eines Web Content Management System:


Bild:Contrexx_WCMS_Strukturbild_v2.png

Abbildung 7.0

5.2 Datenbanken

Datenbanken sind das Herzstück vieler betrieblicher Prozesse um Daten und Informationen zu Sammeln und strukturiert abzulegen. Neben dem relationalen Datenbankmodel gibt es auch andere Ansätze wie hierarchisch aufgebaute- oder objektrelationale Datenbankentwürfe. Das derzeit dominierende Konzept für Datenbanken ist jedoch das relationale Datenbankmodell[20]. Große integrierte Informationssysteme wie SAP bauen die strukturierte Ablage der Daten und Informationen auf einem relationalen Datenbankmodell auf.

5.2.1 Semantische Funktionen

Content Management Systeme (CMS) stützen sich auf eine strukturierte Datenablage (siehe 5.1 CMS). Sämtliche Funktionalitäten des CMS werden auf Daten- und ggf. durch die daraus kontextsensitiv generierten Informationen (siehe Datenqualität) gesteuert ausgeführt. Aufgrund dieser essentiellen Abhängigkeit wird im folgenden Text die Einbringung von Semantik in Datenbanken ausgehend vom relationalen Datenbankmodell (rDBM) betrachtet.

5.2.1.1 Struktur von Semantik Markups vs. relationaler Datenbankstruktur

RDFS, OWL und andere Markup-Systematiken dienen zur Erzeugung und Abbildung von Beziehungen zwischen Ressourcen in maschinenlesbarer Form (siehe Standardisierung). Diese Ressourcen stellen im Kontext des Semantic Web (SW) Entitäten als Instanzen von Klassen dar, die zu anderen Entitäten in Beziehungen stehen. Die Klassen sind in einer Baumstruktur von Ober- und Unterklassen eingeteilt. (siehe 4.3 Standardisierung)

In der Relationalen Datenbank (rDB) stellen Relationen, dargestellt als Tabellen, eine Entität dar. Eine Relation ist eine Kombination von Attributen, organisiert in Spalten, mit Attributwerten. Auf der Waagerechten bildet jede zeilenweise Kombination der Attribute eine einmalige Zusammenstellung, einen sogenannten Tupel, sofern die Relation nach den Regeln der Normalisierung erstellt worden sind. Stellt man jetzt eine Beziehung mit Hilfe von Fremdschlüsseln zwischen zwei Relationen her, so bildet auch diese Beziehung eine neue Relation mit Tupeln als Kombination der gemeinsamen Attribute (Schnittmenge).

Beispielhafte Abbildung eines Entity-Relationship Models (ERM)

Bild:Erm_scheer.gif

Abbildung 8.0


In der Graphischen Darstellung erscheint es, als ob große Ähnlichkeiten zwischen einem RDF-Graphen (siehe 4.3.1 RDF) und einem ERM bestehen. Ein Mensch würde diese Grafik auch leicht wie folgt lesen: Der KD mit dem Namen Name wohnt unter der Adresse Adresse. Der KD kauft eine Menge Artikel. Der Artikel hat die Bezeichnung Bezeichnung.

Maschinell sind diese Information aus der Datenstruktur des rDBM nicht auslesbar. Die Zweidimensionale Struktur bietet keine Möglichkeit zur Hinterlegung maschineninterpretierbarer Daten.

5.2.1.2 Metadaten in relationalen Datenbankmodellen - ein Ansatz

Tupel sind, wie oben beschrieben wurde, einmalig innerhalb der Relation. Tupel können als Exemplare einer Entität verstanden werden. Die Idee des SW gründet sich auf eine strenge Syntax im Rahmen von u.A. OWL. Die Tripel-Struktur ermöglicht, domänenspezifische Abhängigkeiten nach übergreifenden Regeln zu gestalten.

Ein SW-fähiges CMS wird in der Lage sein, diese Ontologien zu verstehen und zu implementieren. Ein CMS generiert seine Ausgaben i.d.R. in einem Browserfenster. Es erstellt so personalisierte Zusammenstellungen von Informationen als website, die in semantischer Syntax am CMS als Abfrage gestellt wurden. Inhalte sollten aus rDB herauslesbar- und umwandelbar in RDF-Schema mit Hilfe von einfachen Skripts sein[21].

Anstatt einer Umwandlung in ein RDFS-Format gibt es den Ansatz, Attribute einer Relation anfragewertig zu gestalten[22]. Bei der Weiterentwicklung der relationalen Algebra, wurden formale Grundlagen für diese Idee entwickelt. Die zwei Lösungen haben konträre Wirkungen auf das Verhältnis von Ausdrucksstärke vs. Typsicherheit. Die „Reflektive Algebra“ verschiebt das Verhältnis zugunsten der Typensicherheit, indem relationsalgebraische Ausdrücke in eigene Programmrelationen gespeichert werden. Umgekehrt verschiebt die „Meta-Algebra“ das Verhältnis durch die Speicherung der relationsalgebraischen Ausdrücke wie Werte in Spalten von Relationen. Der inzwischen in einem kommerziellen Protoyp eines Datenbanksystems implementierte Kompromiss ist Meta-SQL[23]. Anfragen werden behandelt wie in der Meta-Algebra. Die Anfragen werden jedoch mit einer geeigneten XML-Kodierung versehen. So wird eine Verarbeitung geschachtelter Strukturen, die in diesem Zusammenhang entstehen, realisiert. Diese erlauben wiederum eine dynamische Auswertung. Diese wiederum wird in die betreffende Datenbank als XSLT- oder XQuery-Funktionen integriert. Die Formulierung einer „Meta-Anfrage“ als „Anfrage über Anfragen“ wird durch die Verwendung verschiedener Bausteine vorgenommen. Die Wahl der Bausteine erfolgt abhängig davon, ob eine Abfrage syntaktischer oder semantischer Art ist. Semantische Abfragen verarbeiten, über die Struktur einer Anfrage syntaktischer Natur hinaus, auch die Ergebnisse einer Anfrage.

Diese im Prototyp zur Verfügung stehenden Mechanismen sollen in anderen Anwendungen Ihre Umsetzbarkeit beweisen. Im speziellen wird dabei untersucht, ob Web-Services in einer, die oben genannten Erweiterungen enthaltende Meta-SQL Datenbank vollständig realisieren können[24].

Ein weiterer Ansatz beschäftigt sich mit der Nutzung fraktaler semantischer Netze für alle vorkommenden Datenbank-Anwendungen. Dieser etwas komplexere Ansatz wird für Interessierte an dieser Stelle genannt und ist optional zu lesen. Um einen kleinen Ausblick auf den Inhalt zu geben, werden hier Auszüge aus dem Dokument[25] zitiert:

„Die vorliegende Erfindung bezieht sich auf ein computerimplementiertes Verfahren zur Nutzung von fraktalen semantischen Netzen für alle Arten von Datenbank-Anwendungen.“

„Es besteht die Möglichkeit, besondere semantische Einheiten in das fraktale semantische Netz aufzunehmen, die in der Lage sind, an anderen semantischen Einheiten bestimmte Operationen auszuführen. Diese besonderen semantischen Einheiten werden im weiteren Verlauf als Janus-Einheiten bezeichnet.“

In diesem Zusammenhang bezeichnet eine Janus-Einheit eine besondere semantische Einheit, die einen Algorithmus oder eine Sammlung von Algorithmen aufweist, die den Informationsinhalt von semantischen Einheiten verändern und/oder neue semantische Einheiten erzeugen bzw. bestehende semantische Einheiten vernichten können. Eine Janus-Einheit ist über jeweils eine besondere Verknüpfungseinheit eines Typs "hat Janus/Funktion/ist Janus/Funktion von" mit einer oder mehreren semantischen Einheiten verbunden, in deren Nachbarschaft die Janus-Einheit operieren soll.

5.2.2 Aufwand und Nutzen

Der Aufwand für die Realisierung- und ferner der resultierende Nutzen sind nur schwerlich zu beziffern. Auch bedarf es einer genauen Überlegung, welche Einheiten zur Skalierung herangezogen werden sollten/müssen, sofern skalierbare Einheiten sinnvoll einzusetzen sind.

Die Schlussfolgerung von Nicola Henze[26] trifft den Kern: Profitieren sollen die Benutzer von den neuen Technologien des SW. Derzeit stehen noch die Techniken zu sehr im Fokus des Interesses. Erst mit den verbesserten Applikationen, und implizit mit eingeschlossen die Anwender, können einen Nachweis erbringen, ob das SW ein hohes Maß an Nützlichkeit aufweist.

5.3 Soziale Netze

Die Soziale Netze und Ihre Dienste sind das was umgangssprachlich Heute als Web 2.0 angesehen wird. Viele der sozialen Netze wie Facebook, Flickr oder Wikipedia haben das World Wide Web technisch nicht neu erfunden sondern die Wahrnehmung des World Wide Webs verändert und revolutioniert. Die Inhalte der Sozialen Netze werden von Menschen ohne großes technisches Wissen erstellt und verbreitet.

5.3.1 Semantische Funktionen

Der praktische Nutzen von Semantischen Funktionen ist auf den ersten Blick nicht erkenntlich. Generell ist zu sagen das die Sozialen Netze vielleicht am stärksten von dem Web 2.0 Boom profitiert haben und zahlreich neue Funktionen implementiert haben. Während es bei den meisten Anwendungsfelder für Semantic Web um die Erweiterung und Anreicherung von Funktionen geht, steht bei den Sozialen Netzen vor allem die Standardisierung und Vereinfachung von Funktionen im Vordergrund.

5.3.2 Aufwand und Nutzen

Der Aufwand Nutzen für die Technologien des Semantic Web in den Sozialen Netzen soll anhand von zwei Beispielen aus diesem Bereich verdeutlicht werden:

5.3.2.1 FOAF – Friend of a Friend

Friend of a Friend (FOAF)[27] und ist ein Projekt, das semantischen Technologien nutzt, um Menschen und ihre Beziehungen untereinander sowie ihre Interessen und Aktivitäten, in System Interpretierbarer Form darzustellen. Es könnte als eine Art dezentrales soziales Netzwerk (social network) beschrieben werden. Gegründet wurde FOAF von Dan Brickley and Libby Miller als Opensource Initiative. Aus technischer Sicht ist FOAF ein auf RDFS basierendes Vokabular, das die Klassen und Eigenschaften der Menschen und ihrer Beziehungen untereinander allgemeingültig und eindeutig definiert. Die persönlichen Informationen werden in einer RDF Datei gespeichert. Diese wird auf einen Webserver abgelegt und auf diese Weise im World Wide Web verfügbar. Neben persönlichen Informationen wie Name, E-Mail Adresse und Website kann diese RDF Datei alle möglichen Beschreibungen enthalten wie zum Beispiel die Beschreibung der Arbeitsstelle, der Schule und Universität und der Menschen, die man kennt. Durch die semantische Beschreibung der Daten werden diese durch Systeme interpretier und kombinierbar. Die generelle Problematik, dass RDF und Ontologien nicht von Anwender verstanden werden und damit auch nicht angewendet werden können, wurde mittlerweile durch eine Art Editor (Javascript basierte Anwendung) zum Erstellen der RDF Datei (FOAF-a-Matic) umgangen. Semantische Web Crawler, Programme, die das WWW nach Informationen durchsuchen und die Metadaten aufnehmen, können dann den Verlinkungen zu den FOAF-Dateien der Freunde folgen und dadurch sozialen Netzwerke abbilden. Hier steigt der Wert, den FOAF bietet, mit jedem weiteren Teilnehmer, das Netzwerk profitiert also vom Netzwerkeffekt. Je mehr Menschen sich und ihre Beziehungen zu anderen Menschen beschreiben, desto mehr Wert entsteht insgesamt und komplexe Anfragen werden möglich. Sind in der RDF Datei zum Beispiel die Freunde und in deren RDF Dateien deren Interessen enthalten, könnten komplexe Anfrage wie: “Zeige mir alle Freunde von Timo Cordes, die sich für Basketball und Reisen interessieren.”, ausgeführt werden. Die Anwendungsmöglichkeiten könnten in Zukunft noch weit über diese Zwecke hinausgehen, und überall dort eine wichtige Rolle spielen, wo personenbezogene Daten relevant sind. Mit der Zeit wird die Integration von Informationen in die eigene FOAF-Datei einfacher werden. Es könnten dann zum Beispiel die Kontakte aus dem E-Mail Programm, vom Handy und vor allem auch aus den diversen zentralen sozialen Netzwerken (Xing, Facebook, LinkedIn, StudiVZ, Friendster, Orkut etc.) in die eigene FOAF Datei überführt werden. Somit wäre es möglich, sein gesamtes persönliches Netzwerk in einer zentralen FOAF Datei abzubilden und dadurch bei der Anmeldung in einem neuen Netzwerk das bestehende Netzwerk einfach zu importieren. Ob das im Sinne der zentralen sozialen Netzwerke ist und diese die semantischen Technologien komplett integrieren, ist sicherlich stark zu bezweifeln. Für die einzelnen Netzwerke sind die Nutzer und Ihre Aktivitäten untereinander (social graph) das Kapital. Durch den Import und Export dieser Daten würde der Wert dieser Daten drastisch sinken, da Sie universell exportier und importierbar wäre. Die primäre Aufgabe ist es Werkzeuge zum Benutzen und Finden der FOAF-Angaben zu entwickeln damit die Kritische Masse (für die der Anwender zwingend notwendig ist) schnellstmöglich erreicht wird.

5.3.2.2 Noserup

Dank der sozialen Netzwerke bleibt man mit Freunden und Bekannten auf der ganzen Welt in Kontakt und kann neue Freunde aufgrund gleicher Interessen schneller und einfacher finden. Die meisten dieser zentralen Netzwerke bedienen allerdings nur einen bestimmten Zweck, eine Nische, wie etwa das Hochladen und Diskutieren über Fotos (flickr.com) oder das bilden von Netzwerken unter Studenten (studivz.de). Das Aufkommen von immer mehr spezialisierten sozialen Netzwerken bringt den Nachteil mit sich, dass der Aufwand, diese zentralen Netzwerke einzelnen zu pflegen, stetig steigt. Teilweise interessiert die Thematik des Netzwerkes nicht, sondern man möchte mit bestimmten Freunden in Kontakt bleiben und über deren Aktivitäten informiert sein. Noserub ermöglicht es, die Vielzahl der verschiedenen zentralen sozialen Netzwerke in ein dezentrales Noserub Netzwerk zu importieren. Die Kontrolle über die eigenen Daten wird dadurch gewährleistet, dass Noserubv auf einem eigenen Server installiert werden kann. Aus technischer Sicht ist Noserub ein Protokoll, also eine Vereinbarung zwischen zwei Parteien, wie die Kommunikation, die Verbindung und die Übertragung von Daten geregelt wird. Noserub baut hierbei auf verfügbare Standards wie etwa FOAF (siehe FOAF), OpenID und RSS auf. OpenID wird genutzt um das Problem der vielen verschiedenen Benutzer Accounts eines Nutzers im Internet zu lösen, in dem es eine eindeutige digitale Identität zur Verfügung stellt, mit der sich der Anwender bei Webseiten einzig mit der Angabe der OpenID anmelden Kann. Damit würde das merken von Benutzernamen und Passwörtern entfallen. RSS steht für “really simple syndication” und ist eine Technik zum Senden und Empfangen von Neuigkeiten und Informationen genutzt werden kann. Ein RSS-Feed kann abonniert werden, und man bekommt die letzen Neuigkeiten automatisch zugestellt. RSS Feeds sind seit dem Web 2.0 im Einsatz und mittlerweile auf vielen Webseiten vorhanden Problem ist ähnlich wie bei FOAF das es derzeit Anwendern kaum eine Möglichkeit bietet ein Noserub-Netzwerk aufzusetzen, ohne ein mindestmaß an Programmierkenntnisse zu besitzen. Es mangelt also an den richtigen und leichtbedienbaren Werkzeugen um dieses Problem zu lösen. Sobald dieses Problem gelöst ist, steht dem Wachstum und dem damit verbundenem Nutzen für die Teilnehmer nichts mehr im Wege.

5.4 Suchmaschinen

Wie bereits in der Einleitung beschrieben war das durch Berners-Lee 1989 entwickelte WWW nur knapp 100 Webseiten groß, während es heutzutage mehr als 8 Milliarden Webseiten sein sollen. Auch moderne Desktop Systeme halten oftmals mehre Terabyte an Daten. In dieser Menge an Daten, die richtige Information zu finden, ist eine Aufgabe, die ohne moderne Suchmaschinen nicht zu erreichen wäre. Der größte und bekannteste Vertreter der modernen Suchmaschinen (sowohl für Network Search als auch Desktop Search) ist Google von Google Inc. Google ist dabei so erfolgreich das der Duden 2004 das Wort „Googlen“ als Verb für das Suchen im World Wide Web aufgenommen hat. Wie ein Großteil der heutigen Suchmaschine ist die Google Suchmaschine eine Index basierte Suchmaschine. Dank der ausgefeilten Suchalgorithmen arbeiten Suchmaschinen wie Google sehr zuverlässig und liefern sehr häufig korrekte Antworten. Allerdings lassen oftmals die Suchergebnisse bei natürlichen Sätzen und mehrdeutigen Worten stark nach.


Bild:Web.jpg

Abbildung 9.0


5.4.1 Semantische Funktionen

1999 veröffentlichte Tim Lee Berner seine Idee von der Weiterentwicklung des World Wide Web zum Semantischen Web. Dort beschrieb er auch die Möglichkeiten einer Semantischen Suche, bei der die Suchmaschine die Suchanfrage Menschenähnlich interpretieren soll um ein möglichst genau Antwort zu liefern. So genannte Semantische Agenten sollten dieses Wissen nun nutzen, um bestimmte Dinge automatisiert zu tun. Eines der häufig genannten Beispiele eines Semantischen Agenten, ist die Unterstützung bei der Buchung einer Geschäftsreise. Durch den Anwender wird ein entsprechender Suchbefehl ausgegeben, der dazu führt, dass der semantische Agent den günstigsten Flug für ein bestimmtes Datum raussucht, entsprechend der Vorliebe des Reisenden einen Fensterplatz bucht und diesen mit der Kreditkarte des Anwenders bezahlt. Am Zielort bucht und bezahlt der Semantische Agent einen Mietwagen und blockt darauf hin in dem Kalender des Anwenders die Zeit als Geschäftsreise, informiert entsprechend den Chef bzw. Geschäftspartner und sagt evtl. vorhandene Termine ab.

5.4.2 Aufwand und Nutzen

Die Entwicklung von Suchmaschinen für das Semantic Web schreitet fort, allerdings deutlich langsamer als zu Beginn der Entwicklung des World Wide Webs, derzeit behindern diverse Probleme den breiten und erfolgreichen Einsatz von Semantischen Suchmaschinen:

5.4.2.1 Problemstellung 1: Suche im Semantic Web:

Suchansätze für das Semantic Web basieren darauf, auf der Basis von semantischen Metadaten Ressourcen im Web zu finden bzw. semantische Annotationen als zusätzliche Information in den Suchprozess einfließen zu lassen. Derzeit existiert ein breites Spektrum an Suchansätzen dieses neuen Suchparadigmas, welche unterschiedliche Charakteristika aufweisen. Auch besteht kein einheitlicher Zugang zum Thema Suche im Semantic Web. Eine Möglichkeit der Differenzierung bildet die Unterscheidung zwischen Information Retrieval und Data Retrieval: Der Fokus im Information Retrieval liegt auf der Suche nach Information, welche die Informationsbedürfnisse des Nutzers eines Information Retrieval Systems befriedigt. Beim Data Retrieval wird nicht eine gereihte Liste an Informationsobjekten ausgegeben, sondern eine Menge an Ergebnissen, welche alle exakt auf eine Anfrage passen. Der Grossteil der aktuell existierenden Retrieval-Ansätze für das Semantic Web, wie beispielsweise die Semantic Web Abfragesprache SPARQL Protocol and RDF Query Language (SPARQL)[28] sind Daten-Retrieval-lastig. Die Zentrale Charakteristika des Information Retrieval wie Vagheit, Unschärfe und Unsicherheit fallen bei diesen Suchansätzen weg, Anfragen an das Semantic Web gleichen denen an einer Datenbank. Dies kann damit zusammenhängen, dass davon ausgegangen wird, dass im Semantic Web jede Art von Information mit genügend Metadaten versehen ist (siehe 4.4 Metadaten) und eine ausreichende Datenqualität gegeben ist (siehe 4.2 Datenqualität), um detaillierte Aussagen über diese Information ableiten zu können. Das Semantic Web befindet sich gegenwärtig in einer frühen Entwicklungsphase und derzeit ist noch unklar, wie formal die semantische Schicht über dem bisherigen Web ausfallen soll. Hieraus resultiert auch das breite Spektrum der Suchansätze für das Semantic Web. Ein Semantic Web mit hohem Formalisierungsgrad würde es ermöglichen, diese wie eine Datenbank zu behandeln. Je mehr exakte Schlüsse aus den maschineninterpretierbaren Daten im Semantic Web durch ein Programm abgeleitet werden können, desto weniger besteht der Bedarf für Information-Retrieval-Ansätze, welche Vagheit und Unsicherheit beinhalten. Ein Semantic Web mit niedrigerem Formalisierungsgrad hingegen erfordert Information-Retrieval-Ansätze, welche in der Lage sind, jene zusätzlichen semantischen Metadaten, die im Semantic Web angeboten werden, für die Suche und Reihung von Ergebnissen zu nutzen.

5.4.2.2 Problemstellung 2: Sparse Annotationen

Ansätzen für die Suche im Semantic Web ist gemein, dass sie semantische Metadaten für den Prozess der Suche nutzen. Die Anreicherung von Ressourcen mit semantischen Metadaten bietet zusätzliche Information, die in den Suchprozess eingebunden werden kann. Dies kann und soll wiederum zu einer Steigerung der Retrieval-Leistung von Systemen für das Semantic Web führen. Es wird von Experten kontrovers diskutiert ob nun die semantischen Annotation[29] von Ressourcen im Web die zentrale Komponente für die Realisierung des Semantic Web ist. Allerdings stellen sowohl Kritiker als auch Befürworter des Semantic Web fest, dass im aktuellen Web nur ein kleiner Anteil an Ressourcen semantisch annotiert und somit für Maschinen interpretierbar ist. In diesem Zusammenhang spricht man von einem niedrigen Durchdringungsgrad (coverage) des Webs mit semantischen Metadaten oder graphentheoretisch betrachtet von spärlichen (sparse) Annotationen der Ressourcen in jenem (Semantic-Web-)Graphen, der aus Ressourcen und den Konzepten aufgespannt wird, mit denen die Ressourcen semantisch annotiert sind. Spärliche Annotation von Ressourcen stellt ein zentrales Hindernis für die Realisierung von Suchansätzen für das Semantic Web dar, welche auf Basis semantischer Metadaten operieren. Eine Suche basierend auf einer Menge von Konzepten kann zu keinem Ergebnis kommen, wenn die zu suchenden Ressourcen nicht mit semantischen Metadaten annotiert sind. Szenarien, in denen nur semantische Metadaten und kaum Text Inhalte von Ressourcen zur Verfügung stehen, wie zum Beispiel das Auffinden von Bildern oder (Semantic) Web Services, werden hierdurch kompliziert oder unmöglich. Aber auch die Vorteile von semantischer Zusatzinformation für die text-basierte Suche, wie die Erhöhung der Anzahl der gefundenen Ergebnisse, die Verbesserung der Reihfolge der Suchergebnisse oder das miteinander in Beziehung setzen von sonst isolierte Informationen mit Hilfe von Ontologien, kommen nicht oder nur zu geringen Maße zum Tragen. Aus diesen beiden Problemstellungen abgeleitet, zeigt sich das die Nutzung von Semantic Web Technologien im Bereich Suchmaschinen Vorteile versprechen, diese allerdings derzeit noch nicht nutzbar sind aufgrund der fehlenden Vorraussetzungen und des hohen Aufwandes. Es wird schon seit längerem diskutiert wie diese generellen Probleme des Semantic Webs gelöst werden können. Herauskristallisiert haben sich dabei 3 mögliche Lösungsansätze:


Der Bottom-Up Ansatz

Alex Iskold, hat mit seinem Artikel[30] erstmalig das Umsetzungsszenario mit dem Namen “bottom-up approach” geprägt. Entsprechend des Namens beschreibt das Szenario wie die vorhandenen Daten semantisch erfasst werden sollen und das die manuelle Eingabe von Metadaten eine nicht bewältigbare Aufgabe ist. Alex Iskold vertritt die Meinung das eine Anreicherung der Daten mit Metadaten nur über einen zentralen Web Crawler, ähnlich derer die die Suchmaschinen einsetzen, erfolgen könnte. Allerdings zweifelt Alex Iskold selbst stark daran, dass es in naher Zukunft einen solchen automatischen Algorithmus geben wird, der die Bedeutung aus Text – menschenähnlich auslesen und daraus Metadaten für die zurzeit noch semantisch uncodierten Informationen ableiten kann. Technisch Problematisch ist weiterhin die hohe Komplexität von OWL und RDF und die mangelnde Kommunikation der Nutzer aus dem Semantic Web. Aufgrund dieser Probleme entwickelte Alex Iskold den zweiten Ansatz, den Top-Down Ansatz.

Der Top-Down Ansatz

Der Top-Down Ansatz (top-down approach) beschreibt das umgekehrte Szenario, nämlich von oben nach unten. Bei dem Top-Down Ansatz handelt es sich um einen praktikableren Ansatz, der vom Marktpotenzial und den Erwartungen der Unternehmer angetrieben werden soll sowie eher auf den Nutzen für den Endnutzer fokussiert ist, als der klassische Ansatz. Der Top-Down Ansatz ist im Grunde genommen nichts anderes als die Verwirklichung des semantischen Webs durch nützliche, von Unternehmen entwickelte und auf Profit ausgerichtete semantische Webservices. Unternehmen greifen die semantischen Technologien auf, weil sie sich davon Profit versprechen und entwickeln deswegen auf den Kundennutzen ausgerichtet Webservices.

Der hybride Ansatz

Das durch die beiden Ansätze gezeichnete Bild verwendet nur die Farben Schwarz und Weiß. In der Praxis werden sich beide beschriebene Ansätze vermischen. Auch wenn Kritik am klassischen Bottom-Up Ansatz verständlich und teilweise begründet ist, befinden wir uns in einer Übergangszeit zwischen zwei Standards. Ein Teil der Anwender und Unternehmen werden die neuen Standards, insbesondere die Standards zur Verwirklichung des semantischen Webs, noch nicht verwenden, weil ihnen zurzeit der klare Nutzen fehlt. Andere Anwender und Unternehmen erkennen allerdings den Nutzen und verwenden die neuen Standards. Je früher das Thema aus der Nische in der allgemeinen Öffentlichkeit und vor allem in Forschung und Ausbildung kommt, desto eher wird ein Bewusstsein für die neuen Technologien und Standards geschaffen. Universitäten vermitteln dann das nötige Wissen und Unternehmen verwenden semantische Technologien. Der Bottom-Up Ansatz ist also eher als Prozess zu verstehen und ist schwerfälliger als der Top-Down Ansatz. Der Top-Down Ansatz betont die Verwirklichung des semantischen Webs vom Markt her. Neue Technologien erlangen selten den Durchbruch, weil sie so vielversprechend sind. Vielmehr werden sie von Unternehmen adaptiert, wenn ein klarer Nutzen erkenntlich und somit Profit damit verbunden ist. Hat es ein bestimmtes Unternehmen einmal geschafft, eine neue Technologie zu kapitalisieren, werden weitere Unternehmen folgen. Auf der anderen Seite wissen die Unternehmen, dass sie einen Webservice nur dann gewinnbringend am Markt platzieren können, wenn er einen klaren Vorteil für die Endnutzer bietet. Somit werden die Endnutzer zu Nutznießern. Das Bewusstsein für den Nutzen der semantischen Technologien steigt dadurch auch bei den Endnutzern. Sicherlich steckt in dem Top-Down Ansatz mehr Dynamik als in dem Bottom-Up Ansatz. Schlussendlich wird aber eine Mischung aus diesen beiden Ansätzen die Entwicklung bis zur vollständigen Realisation des semantischen Webs voranbringen.

6 Fazit

Seit der Vorstellung des Semantic Web Gedanken 1999 von Berner Lee, hat sich die Idee des Semantic Web entwickelt. Sowohl Forschung als auch Entwicklergemeinschaft haben die Grundlagen, Methoden und Standards weiterentwickelt und verbessert. Die Unternehmen und Benutzer haben sich mit der Benutzung der Standards und der Entwicklung von Semantischen Produkten zurückgehalten. Dies lag vorallem daran, das der Nutzen nicht kommuniziert wurde und damit auch die Profit Möglichkeiten nicht identifiziert werden konnten. Mittlerweile findet hier ein Umdenken statt und die ersten Unternehmen entwickelt semantische Produkte. Dadurch gewinnt die gesamte Thematik Sematic Web an Dynamik, um die Weiterentwicklung der Technologien und Standards schneller als bisher voran zu treiben. Die Entwicklergemeinschaft des semantischen Webs ist aber noch mit diversen Herausforderungen konfrontiert. Die Auseinandersetzung mit den Technologien des Semantic Webs geht daher weiter. OWL wird für zu komplex gehalten und der Fokus richtet sich auf die Weiterentwicklung von OWL Lite. Auch wird derzeit diskutiert, ob die Kombination von Logik und Ableitungsregeln nicht doch zu komplex ist und alternativ RDFS mit Ableitungsregeln für diesen Zweck besser geeignet wäre.

Eine weitere Herausforderung liegt in der Entwicklung und Verbreitung von Standard Ontologien. Auch wenn es schon einige Standard-Ontologien beispielsweise aus der Medizin gibt, fehlt bis heute das Wissen in Unternehmen zur Entwicklung von speziellen Ontologien und der Anpassung an Standard Ontologien. Ebenso ist noch unklar, wie sich Benutzer in riesigen Ontologien zurechtfinden sollen und können.

Die grösse Herausforderung liegt allerdings in der Entwicklung von einfach zu handhabenden Werkzeugen für die Benutzer. Diese müssen in Zukunft eine Möglichkeit haben, ohne die Kenntnisse von Informatik Inhalte im semantischen Web zu produzieren.

Sobald diese Herausforderungen gelöst sind, könnte das Semantic Web die nötige kritische Masse erreichen, um das heutige bestehende World Wide Web abzulösen.

7 Abbildungsverzeichnis

AbkürzungBedeutung
1.0 Daten, Informationen, Wissen. Eigene Zeichnung eingefügt am 20.01.09
2.0 RDF Graph. Eigene Zeichnung eingefügt am 20.01.09
3.0 RDF Tripel aus Präsentation von Dipl.-Wirtsch.Inf. Stefan Hartman von dem Wissenschaftlichen Institut für Hochschulsoftware der Universität Bamberg vom 08.05.08
4.0 OWL Schema, aus Präsentation von Dipl.-Wirtsch.Inf Stefan Hartman von dem Wissenschaftlichen Institut für Hochschulsoftware der Universität Bamberg vom 08.05.08
5.0 Semantic Web Cake Layer eingefügt von http://www.w3.org/2007/03/layerCake.png am 20.01.09
6.0 Medatdaten eingefügt von http://www.swisseduc.ch/informatik/internet/internet_recherche/informationsbeschaffung_im_internet/icons/img66.png am 20.01.09
7.0 CMS Struktur http://www.comvation.com/images/content/websolutions/Contrexx_WCMS_Strukturbild_v2.png
8.0 ERM Modell eingefügt von: http://erp.wu-wien.ac.at/download/erm_d/gr/erm_scheer.gif eingefügt am 20.01.2009
9.0 Vergleich Semantic Web vs. WWW von: http://www.w3.org/2001/12/semweb-fin/w3csw eingefügt am 20.01.2009

8 Fußnoten

  1. http://www.w3.org/ zu letzt geprüft am 20.01.09
  2. http://www.w3.org/TR/1999/REC-html401-19991224/ zu letzt geprüft am 20.01.09
  3. http://www.w3.org/TR/2006/REC-xml11-20060816/ zu letzt geprüft am 20.01.09
  4. http://www.w3.org/TR/WD-rdf-syntax-971002/ zu letzt geprüft am 20.01.09
  5. http://www.w3.org/TR/owl-semantics/ zu letzt geprüft am 20.01.09
  6. http://www.w3.org/TR/rdf-schema/ zu letzt geprüft am 20.01.09
  7. http://www.w3.org/Addressing/URL/uri-spec.html zu letzt geprüft am 20.01.09
  8. http://tools.ietf.org/html/rfc3986#section-3.3 zu letzt überprüft am 20.01.09
  9. Hitzler,Krötzsch,Rudolph,Sure (2008), Seite 36
  10. Hitzler,Krötzsch,Rudolph,Sure (2008), Seite 39
  11. http://dublincore.org/documents/dcmi-terms/ zuletzt überprüft am 20.01.09
  12. Pellegrini,Blumauer (2006), Seite 374 - 376
  13. Möglichkeiten zur Einbringung semantischer Metainformationen in relationale Datenbankmodelle werden unter dem Punkt Datenbanken näher diskutiert
  14. HPellegrini,Blumauer (2006), Seite 419 - 423
  15. Pellegrini,Blumauer (2006), Seite 420
  16. Beschreibt den Prozess des Hinzufügens von Metadaten zu Dokumenten, die den Inhalt des Dokumentes in maschinen-verarbeitbarer Form beschreiben
  17. HPellegrini,Blumauer (2006), Seite 405-406
  18. Pellegrini,Blumauer (2006), Seite 141
  19. Pellegrini,Blumauer (2006), ab Seite 469
  20. Erstmals 1970 vorgeschlagen von Edgar F Codd
  21. Pellegrini,Blumauer (2006), Seite 380
  22. Idee von Stonebraker 1984 als Vorschlag für die Anfragewertigkeit von Attributen den Datentyp Quel zuzulassen
  23. Entwickelt in Kooperation mit dem Universitair Centrum in Limburg (Belgien)
  24. Van den Bussche, Vansummeren, Vossen 2005 Towards Practical Meta-Querying. Information Systems 30, Seiten 317-332
  25. http://www.freepatentsonline.com/EP1166228.html zuletzt aufgerufen am 20.01.2009
  26. Pellegrini,Blumauer (2006), Seite 140
  27. http://xmlns.com/foaf/spec/ zu letzt geprüft am 20.01.09
  28. http://www.w3.org/TR/rdf-sparql-query/ zu letzt geprüft am 20.01.09
  29. Pellegrini,Blumauer (2006), Seite 406-409
  30. “Semantic Web: Difficulties with the Classic Approach” vom 19. September 2007 http://www.readwriteweb.com/archives/semantic_web_difficulties_with_classic_approach.php geprüft am 20.01.09


9 Literaturverzeichnis

AbkürzungTitel
Hitzler,Krötzsch,Rudolph,Sure (2008) Hitzler, Pascal; Krötzsch, Markus; Rudolph, Sebastian; Sure, York: Semantic Web Grundlagen, Springer-Verlag, Berlin Heidelberg, 2008
Pellegrini,Blumauer (2006) Pellegrini, Tassilo; Blumauer, Andreas: Semantic Web: Wege zur vernetzten Wissensgesellschaft, Springer-Verlag, Berlin Heidelberg New York, 2006
Persönliche Werkzeuge