Semantic Web Entwicklung in der W3C
Aus Winfwiki
Inhaltsverzeichnis
|
1 Titel
FOM Fachhochschule für Ökonomie und Management
Standort: Hamburg
Fallstudie im Fachbereich Wirtschaftsinformatik
| Titel der Arbeit: | Semantic Web Entwicklung im W3C |
| Name der Autoren: | D. Djordjevic und J. Schlegel |
| Prüfungszeit: | Wintersemester 2008/09 |
| Termin der Abgabe: | 23.01.2009 |
| Dozent: | Prof. Dr. Uwe Kern (Dekan) |
2 Einleitung
Das World Wide Web - ein phantastische Plattform, die Millionen von Internet-Usern täglich nutzen. Während dieser manchmal so einfachen Handhabung, ist jeder schon mal an einem einfachen Suchbegriff, über eine gängige Suchmaschine, verzweifelt. Anstatt ein übersichtliches Suchergebnis zu erhalten, erscheint eine unübersichliche Vielzahl von möglichen Treffern.
Wenn man die Begriffsfolge "Umsatz von Siemens 2005 in Deutschland" in eine Suchmaschine eingibt, erhält man alle möglichen Resultate, jedoch keine richtige Antwort auf die ziemlich präzise gestellte Anfrage
[1].
Um diesen Zustand zu verbessern, wurde die Idee des "Semantic Web" geboren.
3 Sematic Web
3.1 Vision
Der World Wide Web Erfinder Tim Berners-Lee hat die Vision, das Internet soweit in die Lage zu versetzen, eigenständig Informationen und Inhalte erkennen zu lassen, um im Anschluss eine genaue Zuordnung treffen zu können. Seine Vision nennt er selbst "Der Traum hinter dem Web". Die Vereinigung zwischen den spontanen Einfällen der Menschen und der Reaktionen der Maschinen wäre das Resultat - das World Wide Web ein globales Gehirn.[2]. Es besteht aus einer Reihe von Dokumenten, die auf verschiedenen Computern überall im Internet hinterlegt sind. Diese Dokumente enthalten Daten, die in verschiedenen Formaten abgelegt sind, wie z.B. Texte, Bilder, Musik und Videos. Jedes Dokument hat seine eigene Adresse oder einen "Link", der wiederum auf ein anderes Dokument verweist. Damit alle Internet-User diese Informationen auch nutzen können, werden die Informationen nach dem Web Standards formatiert, um dies zu gewährleisten. Der nächste Schritt zum Semantic Web ist, die Informationen in Form von Dokumenten mit Metadaten zu versehen. Die daraus resultierende selbstständige Erkennung durch die Maschinen, setzt sematische Technologien voraus. [3].
3.2 Grundlagen
3.2.1 Zentrale Begriffe
3.2.1.1 Semantik
Die Semantik im klassischen Sinne ist ein Teil der Sprachwissenschaft, der sich mit der Bedeutung von Wörtern und Sätzen befasst
[4].
Der Begriff leitet sich aus dem grich. "semainein" für "bedeuten" ab, nach dem Aristotelischen Grundmodell der Bedeutung- und Bezeichnungsrelation[5]. Die Semantik ist nach diesem Modell eine Relation.
Im Web dient die Semantik dazu, die Informationen, die für einen Menschen sofort verständlich sind, in maschinensprache umzuwandeln, um somit das Internet zu verbessern. Die gesuchten Begriffe werden dann von den Suchmaschinen eindeutig klassifiziert, nicht relevante Ergebnisse sowie überdimensionale Ergebnismengen reduziert.
Dieser höhere Automatisierungsgrad wird durch verschiedene Schichten und Technologien im Semantic Web ermöglicht
[6]. Hierbei fällt der Begriff "machine-understandable", der die Maschinen befähigen soll, Informationen mit Hilfe von anderen Informationen in Beziehen zu setzten.
3.2.1.2 Metadaten
Mit Metadaten werden strukturierte Daten bezeichnet, die über die Art von anderen Informationsressourcen Auskunft geben. Das Wort "meta" kommt aus dem grich. und bedeutet soviel wie "nach, neben, hinter, mit"[7]. Zusammen mit dem Wort "Datum" entsteht der Ausdruck "von einer anderen Ebene her berachtet". Somit sind Metadaten - Daten über Daten.
Um ein bestimmtes Ergebnis zu erreichen werden Metadaten benötigt, sozusagen deskriptive Informationen über Quellen. Die Metadaten beziehen sich jedoch nicht nur auf Texte, sondern im Web auch auf beliebige Objekte, die Beziehungen beschreiben. Hierbei gibt es verschiedene Kategorien von Metadaten:[8]
3.2.1.3 Ontologien
Text
3.2.1.4 Taxonomien
Text
3.3 Technologien
3.3.1 Hypertext Web Technologien
3.3.1.1 IRI / URI
Die Abkürzung IRI steht für "Internationalized Resource Identifier" und ist die internationalisierte Form des URI "Uniform Resource Identifier". Die internationalisierte Form berücksichtigt noch zusätzliche Zeichen als im ASCII-Zeichensatz enthalten sind. Diese werden unter dem Unicode geführt.
Die URIs (auch URLs genannt) sind einfache Zeichenketten, die auf Internet Ressourcen verweisen. Sie sind Bezeichner für sogenannte Objekte erster Klasse. Diese Objekte beziehen sind nicht nur auf Dokumente oder Dateien, sondern können sich auch auf Personen beziehen[9], und indirekt auf alles mögliche. Das gesamte Web wird durch die URIs zusammengehalten. Die IRIs erweitern das Web, indem auf Internet Ressourcen in der eigenen Sprache referenziert werden kann.
3.3.1.2 Unicode
Da der Computer nur Zahlen verstehen und zuordnen kann, war es notwendig ein System zu entwickeln, um Zeichen und Elemente verschiedener Schriftkulturen darstellen zu können. Dadurch entstand der Unicode, der einem beliebigen Programmgestützten Computer dazu bringt, ein bestimmtes Zeichen darzustellen. Hierbei steht die vollständige Erfassung aller weltweit bekannten Zeichen im Vordergrund. Dazu gehören die Leerzeichen wie auch mathematische Zeichen und fernöstliche Wortzeichen. Diese werden katalogisiert und mit einem Code (Zeichennummer) versehen.
Man kann Zeichen auch dynamisch kombinieren, somit kann ein „ä“ auch mit einem „a“ und einem Doppelpunkt dargestellt werden, obwohl ein „ä“ im System vorhanden ist.
Zusätzlich werden beim Unicode auch die Eigenschaften eines Zeichen hinterlegt, wie z.B. die Schreibrichtung.
Im Jahr 1991 wurde ein Unicode-Konsortium gebildet, dass die aufzunehmenden Zeichen ermittelt. Mittlerweile sind die Zeichencodes verbindlich und besitz die internationale Norm ISO/IEC 10646. Zusätzlich ist dies sehr wichtig, da HTML seit Version 4.0 und XML ab Version 1.0 darauf aufbauen.
In der Unicode-Zeichentabelle sind die Zeichennummern hinterlegt, mit dem ein bestimmtes Zeichen in HTML oder XML darstellen möchte. Die Zeichennummer wurden früher durch eine zwei Byte lange Zahl gekennzeichnet. Aktuell wurde dies auf eine vier Byte lange Zahl erweitert, somit ist eine Darstellung von rund 4.294.967.296 Zeichen möglich. [10]
3.3.1.3 XML
XML ist ein Schema um Auszeichnungssprachen zu definieren und steht für Extensible Markup Language. Solche Sprachen müssen bestimmte Konventionen einhalten und nach einem gewissen Schema definiert werden – hier XML. Für die Definitionen eigener Auszeichnungssprachen können eigene Namen vergeben werden. Um Elemente zu definieren, muss genau festgelegt werden, welche Eigenschaften dieses Element hat, wie z.B. eine Musiknote oder eine chemische Formel.
Mit XML können deren Eigenschaften definiert werden und beschreibt ein Dokument, jedoch nicht die Darstellung des Elements bei der Formatierung durch die verwendete Software (Browser). Daher benötigt XML auch eine Style Sprache um eine optisch brauchbare Darstellung zu ermöglichen.
Unter den eigenen XML-basierten Sprachen, wurden seitens der W3C gleich mehrere Auszeichnungssprache für die Allgemeinheit angeboten, um eine breite Anwendung zu fördern.
Im Bezug zum Semantik Web stellt XML eine Technologie zur Realisierung der Objektschicht dar, sowie als Basistechnologie für die höheren Schichten RDF/RDFS und QWL.[11]
3.3.2 Standardisierte Sematic Web Technologien
3.3.2.1 RDF
Text
3.3.2.2 RDFS
Text
3.3.2.3 OWL
Text
3.3.2.4 SPARQL
Text
3.3.3 Unrealisierte Sematic Web Technologien
3.3.3.1 RIF / SWRL
Text
3.3.3.2 Kryptographien
Text
3.3.3.3 Trust
Text
3.3.3.4 User Interface & Application
Text
4 World Wide Web Consortium (W3C)
4.1 Organisation
4.1.1 Gründung
Im Jahre 1989 hat Tim Berners-Lee das World Wide Web (WWW) erfunden, es geprägt und 1990 das erste Client-Programm (Browser und Editor) geschrieben, sowie die erste HTML (Hypter Text Markup Language) Version. Heute ist diese Dokumentenformatierungssprache die Weitverbreitteste im Web.
Um weitere Standards einzuführen und das WWW zu einem effizienten und globalen Informationssystem zu fördern, gründete Tim Berners-Lee 1994, in Zusammenarbeit mit CERN (European Organization for Nuclear Research) - wo das Web entstand -[12], DARPA (Defende Advanced Research Projects Agency)[13] und der Europäischen Kommission das World Wide Web Consortium – das W3C.
Das Konsortium wurde gegründet um alle Möglichkeiten des Web zu erschließen, und zur Entwicklung einheitlicher Technologien, wie z.B. Spezifikationen, Richtlinien, Software und Tools[14]. Zusätzlich wird ein stetiges Wachstum und Förderung des WWW sichergestellt.
Als regionaler Ansprechpartner dient das Deutsch-Österreichische Büro - Sitz ist das Fraunhofer Institut für intelligente Analyse und Informationssysteme nahe Bonn.
4.1.2 Team
Mit mehr als 60 Forschern und Ingenieuren ist das W3C Team weltweit aufgestellt, wobei diese die technischen Aktivitäten leiten und die Arbeitsabläufe kontrollieren. An drei Standorten bzw. Institutionen arbeitet der Großteil des Teams:
- MIT/CSAIL (Massachusetts institute of technology for computer science and artificial intelligence laboratory)[15] in den Vereinigte Staaten
- ERCIM (the european research consortium for informatics and mathematics)[16] Hauptsitz in Frankreich
- Keio Universität[17] in Japan.
Nicht nur die Zusammenarbeit des Teams ist international, sondern auch die Nationalität der Teammitglieder, stammend aus mehr als 10 verschiedenen Ländern. Der Direktor ist Tim Berners-Lee und der leitende Geschäftsführer ist Steve Bratt.
4.1.3 Mitglieder
Das W3C hat z.Z. 407 Mitglieder, mit stetigem Wachstum. Darunter befinden sich mehrere internationale Firmen[18], wie z.B. Adobe Systems, Apple, Cisco, Deutsche Telekom, Fujitsu, Google, HP, Lexmark, Motorola, Nokia, Oracle, Siemens, Sony Ericsson, Vodafone sowie viele Universitäten weltweit.Um hochqualitative Standards zu entwickeln, ist eine große globale Interessenvertretung von Vorteil. Die Stärke und Richtung des W3C wird durch Investitionen und aktive Teilnahme der Mitglieder gesichert.
Unter der Abbildung 4 sind die Mitgliedsorganisationen aus 28 Ländern aufgeführt.[19]
4.1.4 Management
Das Management des W3C teilt sich wie folgt auf:[21]
- Steve Bratt, Chief Executive Officer – in erster Linie für die weltweiten Aktivitäten und Öffentlichkeitsarbeit zuständig, sowie der allgemeinen Verwaltung der Mitgliedschaften, Prozesse, rechtliche Fragen und größerer Veranstaltungen
- Tim Berners-Lee, Director – Vorsitzender des W3C
- Judy Brewer, WAI Domain Leader – Direktorin der Web Accessibility Initiative, Koordination der Tätigkeiten in Bezug zur Webzugänglichkeit, Entwicklung der Leitlinien für Web Inhalte und Browser, Verbesserung der Werkzeuge für die Bewertung und Reparatur von Web Seiten
- Jérôme Chailloux, Site Manager for W3C/ERCIM – Leiter der Softwareentwicklung und wissensbasierte Systeme, Erfinder und Entwickler der Programmiersprache Le-Lisp
- Daniel Dardailler, Associate Chair for Europe – Leiter der Abteilung für internationale Beziehungen, Software-Architekt
- Ted Guild, Head of Systems Team – Leiter der System Abteilung
- Tatsuya Hagino, Deputy Director for Asia – stellvertretender Direktor für die Abläufe in Asien, Prof. an der Keio Universität für Umwelt Informationen
- Philipp Hoschka, Deputy Director for Europe; Ubiquitous Web Domain Leader– stellvertretender Direktor des W3C, Hauptaugenmerk Vorteile der Web Technologien für Mobile und andere technische Geräte, Integration von Audio und Video in das Internet
- Masao Isshiki, Site Manager for W3C/Keio
- Ian Jacobs, Head of W3C Communications – Leiter der Kommunikationsabteilung, einschließlich der Presse, Publikationen und Marketing
- Philippe Le Hégaret, Interaction Domain Leader – Leiter der Herstellung von Softwaretechnologien mehrerer Bereiche im W3C
- Mauro Nunez, Business Manager – Manager der kaufmännischen Abteilung in den Bereichen Geschäfts- und Rahmenbedingungen, Kennzahlen- und Wirtschaftlichkeitsrechnung für die operativen W3C Standorte
- Nobuo Saito, Associate Chair for Asia – Leiter des W3C Team an der Keio Universität, Professor an dieser Universität und Dekan der Fakultät für globales Medienverhalten, Softwareentwicklung und Digitale Medien Umgebung
- Ralph Swick, Technology and Society Domain Leader – Leiter der Abteilung Technologie und Gesellschaftsentwicklung, Verantwortlicher für das RDF Schema, Architekt für User Interfaces, Softwareingenieur
4.1.5 Einrichtungen
Außer den drei großen Geschäftsstellen auf drei Kontinenten (siehe 4.1.2 Team), gibt es noch diverse regionale Verwaltungsstellen bzw. Büros des W3C. Diese gelten als lokale Ansprechpartner, und stellen sicher, dass das Konsortium und ihre Spezifikationen in der Region einen höheren Bekanntheitsgrad erreichen.[22]
Die wichtigste Aufgabe der Verwaltungsstellen ist, die Öffentlichkeits-Annahmen von W3C Empfehlungen unter den Software- und Anwendungsentwicklern zu stärken und die Förderung zum Beitritt anderer Organisation. Die W3C Büros kann man somit als regionale Stütze betrachten, die dabei helfen, neue Mitglieder zu rekrutieren und die W3C Technologie zu fördern, mit einem besonderen Augenmerk auf die regionalen Sprachen und Kulturen.
Die Büros sind in folgenden Ländern vertreten: Australien, Benelux, Brasilien, China, Finnland, Deutschland und Österreich, Griechenland, Ungarn, Indien, Israel, Italien, Korea, Marokko, Südliches Afrika, Spanien, Schweden, und Großbritannien und Irland.
Des weiteren werden aktuelle und relevante Ereignisse bzw. Informationen an das Konsortium.
Die regionale W3C Büros werden von anderen Organisationen/Institutionen – als Gastgeber (Host) – aufgenommen, die sich neutral verhalten. Jede dieser Organisation hat eine vertragliche Beziehung mit dem W3C. Folgende Kriterien werden seitens des W3C bei einer Gasteinrichtung für ein Büro geprüft:
- Herstellerneutralität: Meistens handelt es sich bei den Gastgebern um eine Forschungscenter, eine Abteilung der Universität oder eine Technologische Institution.
- Beitrag W3C Mitglieder: Die Synergien zwischen dem Beitrag zur W3C und Förderung dieser Arbeit steht im Mittelpunkt des Büro Konzepts. Die Institutionen müssen nachweislich Erfahrung im Bereich der W3C Technologien bezitzen.
- Etabliertes Netzwerk von Kontakten: Eine wirksame Förderung der Technologien in einer Region, beruht auf einem etablierten regionalen Netzwerk von Kontakten, dazu sollten Forschungseinrichtungen, Industrielle Unternehmen, Staatliche Stellen sowie die Presse dazugehören.
4.2 Historie
Das W3C hat im Dezember 2004 sein 10jähriges Bestehen gefeiert. Anbei einige wichtige Ereignisse des W3C:[23]
- Okt. 1996: Entwicklung von PNG (Portable Network Graphics) – ein erweiterbares Format für die verlustfreie, tragbare und gut komprimierte Speicherung von Rasterbildern – um eine Plattformübergreifende Alternative zu den, zu dieser Zeit, verbreiteten Grafikformaten
- Dez. 1996: Das CSS (Cascading Style Sheets) – einfacher Mechanismus, um Farben, Zeichensätze und Abstände in Webdokumenten hinzuzufügen – wird veröffentlicht.
- Feb. 1997: Die WAI (Web Accessibility Initiative) – Zugänglichkeit des Webs durch vier Bereiche: Technologie, Werkzeuge, Ausbildung & Verbreitung, und Forschung & Entwicklung – wird gestartet.
- Dez. 1997: Neue HTML 4.0 Version – erweitert Funktionen in den Bereichen Tabellen, Skripte, Style Sheets – um die Internationalisierung und behindertengerechten Inhalte zu fördern.
- Feb. 1998: Einführung von XML 1.0 - wird später als Basis für viele Standards verwendet
- Aug. 2000: SVG (Scalable Vector Graphics) 1.0 diese Sprache dient zur Beschreibung von zweidimensionalen Grafiken und Applikationen – bereichert.
- Mai 2001: Herausgabe zum vollen Potential von XML – wichtige Spezifikation von standardisierten Weg zur Erstellung und Mischen von XML Dialekten.
- Jan. 2002: Start der Web Service Aktivität vom W3C – Standardweg zur Zusammenarbeit zwischen unterschiedlichen Software-Applikationen.
- Mai 2003: Einführung einer lizenzkostenfreie Patentpolitik und Förderung der Entwicklung offener Standards.
- Feb. 2004: Semantic Web Applikationen bilden durch RDF und OWL ein tragfähiges Fundament.
- März 2004: Einführung von Voice XML 2.0 – Möglichkeit Webbasierte Entwicklung auf Stimmbasierte Applikationen zu übertragen.
- Dez. 2004: Beschreibung Grundlagen der Webarchitektur – komprimierte Einschätzung und Beobachtung des Webs über einem Zeitraum von 15 Jahren.
4.3 Ziele
Zum WWW hat sich das W3C Ziele gesetzt, insbesondere die Nutzungsmöglichkeiten im Web zu erweitern, es jedem zugänglich zu machen, unabhängig der Hard- oder Software, der Muttersprache oder Kultur, ebenso wie geographischen Standort oder dem geistigen Fähigkeiten.[24]
Das Web ist eine Kommunikationsplattform, und bietet viele Möglichkeiten zum Informations- und Wissensaustausch.
Zusätzlich wird die Verbreitung von Webtechnologien gefördert sowie die Einführung in Entwicklungsländern unterstützt.
Einige Standards, Reports und Pressemitteilungen sind in bis zu 40 Sprachen übersetzt worden, um die Internationalisierung voranzutreiben bzw. den Bekanntheitsgrad zu erhöhen.
Durch die ständig steigende Anzahl von verschiedenen Gerätetypen, die auf das Web zugreifen können, ist es ein Ziel des W3C, den Webzugriff Geräteunabhängig so einfach wie möglich zu gestalten. Darunter fallen z.B. Mobiltelefone, PDAs (Personal Digital Assistant), interaktive Fernsehsysteme und auch Heimgeräte.
Ein weiteres Ziel ist es, die immensen Informationen im Web – eine art großer Datenbank – soweit zu pflegen, den Computern eine maschinelle Verarbeitung zu ermöglichen, um auch Probleme zu lösen, die sehr komplex und aufwendig sind.
Ein langfristiges Ziel ist es, Technologien zu fördern, die das Web sicherer gestalten und die auch das Vertrauen und die Vertraulichkeit beinhalten.
4.4 Aktivitäten
Die Aktivitäten und Aufgaben des W3C sind in Gruppen organisiert, die sich in Arbeitsgruppen (technische Entwicklung), Interessegruppen (allgemeine Arbeiten) und Koordinationsgruppen (Kommunikation thematisch ähnlicher Gruppen) unterteilen lassen.[25]
Die Teilnehmer dieser Gruppen setzten sich aus dem W3C Team, Personen der Mitgliedsorganisationen und eingeladenen Experten zusammen. Der größte Teil der Ergebnisse wird durch die Gruppen erarbeitet, wie z.B. technische Berichte und Publikationen sowie Open-Source-Software und Dienstleistungen.
Die Koordination mit anderen Standardisierungsgremien und technische Vereinigungen wird durch die Gruppen zusätzlich gesichert.
Einige Aktivitäten sind nach größeren Bereichen gruppiert, wie der Architektur, Interaktion, Technologie und Gesellschaft und die WAI (Web Accessibility Initiative).
Zur Architektur gehören z.B. URI, Web Services und XML.
Die Interaktion beinhaltet zusammengesetzte Dokumentenformate, Geräteunabhängigkeit, Grafik und HTML.
Bei der Technologie und Gesellschaft steht die Patentpolitik, der Datenschutz und das Semantische Web im Vordergrund.
Die Web-Zugänglichkeits-Initiative weißt auf ein internationales Programmbüro zu dieser Thematik, sowie Förderung der Technologie in diesem Bereich.
Jede dieser Aktivitäten ist die QA (Quality Assurance) – Qualitätssicherung von großer Wichtigkeit. Die Hauptaufgabe ist die Verbesserung der Qualität bei der Implementierung von W3C Spezifikationen, sowie die Förderung von Testwerkzeugen und –umgebungen für die Implementierer.
Das W3C Team präsentiert einen Statusbericht über alle Aktivitäten auf einem Beratungsausschuss, der zweimal im Jahr stattfindet. Die Berichte werden vor jedem Treffen erneuert. Jede dieser Aktivitäten hat einen Leiter, der Mitglied im Team des W3C ist.
5 Sematic Web Entwicklung im W3C
5.1 Ansätze
5.1.1 Kommentierung Metadaten
Bei der Entwicklung lässt sich der Fortschritt aus zwei Perspektiven betrachten: Von unten, wo die infrastrukturelle und architektonische Arbeit vom W3C koordiniert wird, und von oben, wo in anwendungsspezifischer Arbeit unterschiedliche Semantic-Web-Technologien weiterentwickelt werden. Die grundlegenden Bestandteile im Web sind URIs, die die Basis für das Sematic Web bilden.[26]
Um die Ansätze fortzuführen, werden Standards festgelegt, die sich an allgemein gültige Regeln und Richtlinien halten. Die Plattformunabhängigkeit ist von wichtiger Bedeutung, um die Daten in andere System importieren und integrieren zu können. Das RDF (Resource Description Framework) ist der Metadaten Standard. Die Daten werden so definiert und miteinander verknüpft, dass diese für effektive Such-, Automatisierungs- und Integrationsprozesse genutzt werden können, sogar über mehrere Anwendungen hinweg, zwecks Widerverwendbarkeit.
RDF legt eine Syntax für den gemeinsamen Datenaustausch zwischen URI und XML fest, somit können die Informationen ohne Bedeutungsverlust zwischen den Anwendungen ausgetauscht werden. Mit Hilfe von URI können Informationen im Web identifiziert werden, über Webressourcen ist die Darstellung von Metadaten (Titel, Person, Datum usw.) möglich – dies alles beinhaltet RDF.
Das RDF Schema ist zur Interpretation von RDF formulierten Aussagen notwendig, und benötigt ein gemeinsames Vokabular, hier der Bezug zur Ontologie. Die OWL (Ontology Web Language) ist seitens des W3C ein Vorschlag auf die basierende Sprache des RDF Schemas.
5.1.2 Datenbearbeitung
Das RDF-Daten-Modell ist eine Syntax. Die Modell Darstellung, im Sinne der Gleichwertigkeit, dient zur Beurteilung. Zwei RDF Ausdrücke sind äquivalent, wenn ihre Darstellungen gleich sind. Diese Definition der Gleichwertigkeit erlaubt eine syntaktische Unterscheidung im Ausdruck, ohne dabei den Sinn zu ändern.[27]
Das Datenmodell besteht aus drei Objekttypen, den Ressourcen, den Eigenschaften und einem Objekt. Die Ressource kann z.B. eine gesamte Webseite sein, ein bestimmtes Element dieser Seite oder ein Objekt.
Die Eigenschaften sind ein spezifisches Merkmal oder Attribut einer Ressource. Jede dieser Eigenschaften hat eine spezielle Bedeutung, definiert die möglichen Werte, die Art der beschreibenden Ressource und deren Beziehung zu anderen möglichen Eigenschaften.
Wenn man dies alles berücksichtigt, dann ergibt eine spezifische Ressource inkl. der Eigenschaften und dem Objekt ein RDF Statement.
Diese drei Teile können als Subjekt, Prädikat und Objekt definiert werden.
Anhand eine Beispiels kann dies folgendermaßen dargestellt werden:
Ora Lassila ist Erstellerin der Ressource http://www.w3.org/home/Lassila.
| Subjekt (Ressource) | http://www.w3.org/Home/Lassila |
| Prädikat (Eigenschaft) | Erstellerin |
| Objekt (Literal) | "Ora Lassila" |
Bei Abbildung 8 ist die Richtung des Pfeils wichtig. Der Handlungsstrang beginnt immer vom Subjekt, und verweist auf das Objekt des Ausdrucks.
Um hier zusätzliche Informationen über das Objekt zu speichern, wird eine Erweiterung zum Objekt notwendig. In diesem Beispiel wird die E-Mail Adresse als Zusatz angegeben.
Das Individuum mit Namen Ora Lassila, E-Mail lassila@w3.org ist die Erstellerin der Ressource http://www.w3.org/Home/Lassila.
Hintergrund und Intention ist, die Angabe einer zusätzlichen Beschreibung zu der Erstellerin - hier zum Objekt.
In RDF wird eine Entität (Objekt) als eine zusätzlich Ressource ausgewiesen. Der oben angegeben Satz gibt dieser zusätzlichen Ressource keinen Namen, daher bleibt sie anonym.
Auf der Abbildung 9 wird diese als leeres Oval dargestellt.
Die Objektstruktur des vorliegenden Beispiels kann durch einen identifier eindeutigen zugewiesen werden (Primärschlüssel). Diese Anwendung unterliegt der freien Gestaltung. Um bei dem Beispiel zu bleiben, wird nun eine Mitarbeiter ID als eine Eindeutige Zuweisung einer „Personen“ Ressource hinzugefügt. Dieser Primärschlüssel für jeden Mitarbeiter wird in dem URI festgelegt.
Dadurch entstehen jetzt zwei Sätze:
Die individuelle Ressource referenziert zur Mitarbeiter ID 85740 namens Ora Lassila und hat die E-Mail Adresse lassila@w3.org. Die Ressource http://www.w3.org/home/Lassila wurde von dieser individuelle Ressource erstellt.
Diese wird auf der Abbildung 10 dargestellt:
Das RDF - Datenmodell bietet einen abstrakten, konzeptionellen Rahmen für die Festlegung und Nutzung von Metadaten.
5.1.3 Prozessbeschreibung
Die Arbeitsweise bzw. Prozessbeschreibung richtet sich vorrangig an das Hauptprodukt des W3C – den Empfehlungen. Diese werden von den Mitgliedern begutachtet und gebilligt. Hieraus ergeben sich die Standards für Protokolle und Anwendungen. Jede Spezifikation muss ein bestimmtes Verfahren durchlaufen. Am Ende werden die Ergebnisse von Implementationen verarbeitet – aus einer Vorschlag-Empfehlung wird eine Empfehlung.[28]
Um die Ergebnisse so schnell wie möglich zu präsentieren, und hierbei die Vorreiterposition innezuhalten, werden die Zeitpläne zum Teil sehr eng bemessen. Das Ziel ist es, die Technologie und Standards im Web richtungweisend für Entwickler und Anwender anzugeben. Die Empfehlung der Semantic Web Technologien sind richtungweisend.
5.1.4 Software Integration
Die semantische Erweiterung steht im Fokus der Unternehmen und Endanwender, um wirtschaftliche Herausforderungen zu lösen und eine leichtere Suche im Web zu ermöglichen. Bei der Integration gibt es mehrer Punkte die beachtet werden müssen, wie z.B. die Authentizität von (Meta-)Informationen. Hierbei geht es um die Verlässlichkeit von Aussagen während der Datenweitergabe. Der nächste Punkt wäre die Optimierung von Suchprozessen, wie die Suchraumeinschränkung durch Bevorzugung vertrauenswürdiger Aussagen. Durch Integration wird die Ergebnisqualität gesteigert.[29]
Die Eigenschaften von vertrauenswürdigen Aussagen können im Web hinterlegt werden. Die Aussagen werden von einem Autor getroffen, der Autor ist ohne Zweifel identifizierbar. Somit stehen die Aussagen mit dem Autor im Verhältnis, und können eindeutig zugeordnet werden – Fälschungssicherheit ist gegeben. Die Aussagen können vom Autor nicht abgestritten werden – Vertrauensverlust beim Autor bei einer falschen Aussage.
Ein Lösungsansatz sind Konzepte, die sich auf die Zuordnung von Aussagen und Autoren spezialisieren. Diesbezüglich sind eindeutige Identifikationen von RDF Aussagen oder Graphen notwendig. Die Kennzeichnung beliebiger RDF Graphen (persistente Bezeichner - Named Graphs) werden über URIs abgebildet, wobei SPARQL diese Graphen unterstützt.
5.2 Realisierung
5.2.1 Popularisation
Die Erweiterung des gegenwärtigen Webs ist das Semantische Web. Die Semantic Web Activity seitens des W3C, ist mit großer Anzahl von Forschern und Industriepartner vertreten.
Das Konzept der zusätzlichen Datenintegration, verschiedene Dokumente, Bilder, Objekte und Konzepte semantisch zu verknüpfen, ist sehr bedeutend. Dies ist notwendig um dies Idee eines Semantic Webs zu realisieren. Ein semantisches reichhaltiges Web wäre das Endergebnis, wobei eine schrittweise Annäherung realistisch wäre. Diese würden zu vollständig neuen Sätzen von Beziehungen zwischen Ressourcen führen, wie z.B. ist abhängig von, ist Autor von, ist dort, hat zum Thema, wobei die textlichen Bezüge bereits vorhanden sind.
Neue Möglichkeiten der effizienteren Informationsintegration sowie Informationsverwaltung und automatische Dienstleistungen, wären geöffnet.
5.2.2 Transparenz
Die Semantic Web Activity weißt dem W3C, eine Führungsrolle beim Entwerfen von Spezifikationen und der gemeinschaftlichen Entwicklung von Technologien, zu. Die RDF Standards sind bereits eine W3C Empfehlung. Die RDF Core Working Group erarbeitet die Formalisierung der RDF Modelle und Syntax Empfehlungen.
Die Arbeitsgruppe definiert hierzu einfache Wege, um RDF Vokabulare (beschreibende Begriffe, wie z.B. Bild, Buch, Titel) zu deklarieren.
Eine zusätzliche Aufgabe der Arbeitsgruppe ist, eine exakte semantische Theorie der Standards und eine Einführung veröffentlichen, die der Öffentlichkeit die Grundlagen und seine Anwendungen erläutert.
5.2.3 Schnittstelle
Bei der Einführung der RDF Standards werden einfache Datenintegration, Datensammlung und die Interoperabilität möglich. Unter der Interoperabilität versteht man Erstellung von neutrale bzw. Marktführerunabhängigen Computersprechen und Protokollen, um eine Austauschbarkeit der weltweit verschiedenen Softwarekomponenten, zu gewährleisten.
In der Vergangenheit wurde von den Anwendern nur die Software gekauft, die mit einer anderen Software kompatibel war, möglicherweise noch vom gleichen Hersteller. Da das W3C eine Herstellerunabhängige Organisation ist, fördert das Konsortium die Interoperabilität in Kooperation durch die Ermunterung zu öffentlichen Diskussionen.
Da das Web mit seinen steigenden Nutzern immer weiter wächst, trifft diese Förderung und der Einsatz auf großen Zuspruch. Somit besteht eine gesteigerte Notwendigkeit, die Interoperabilität auf ein ausdrucksvolles und beschreibende Niveau zu bringen.
Im Zuge dessen, wurde die Web Ontology Woking Group gegründet, die auf die RDF Core Arbeiten aufbauen. Die Ontologien unterstützen die erweiterte Dienstleistung durch automatisierte Werkzeuge, verbessert die Suchmaschinen und intelligente Software Agenten. Die Anforderungen stammen von bereits vorhandenen Webportalen, intelligente Agenten und überall verfügbare Netzzugänge.
5.3 Implementierung
5.3.1 Umwandlung
Das W3C investiert viel in die Erstellung und Verbreitung der Kernkomponenten, die zur Basis des Semantic Web benötigt werden.
Diesbezüglich wurde die Semantic Web Advanced Development (SWAD) Initiative gegründet. Hierzu zählen eine große Anzahl von Wissenschaftlern, Industriepartner und Entwicklern. Diese Kooperation und Ergänzungen in den verschiedenen Bereichen, führt zu einer Verbreitung und Verbesserung der Standards für das Semantische Web.
Das SWAD teilt sich noch in Untergruppen auf, die u.a. einen Austausch zwischen zwei oder mehreren unterschiedlichen Anwendungen ermöglichen. Eine weitere Anwendung beruht auf der personalisierten Informationsumgebung bei der Dokumentenverwaltung. Die eingesetzten Werkzeuge erlauben es dem Autor, die Bedingungen zu kontrollieren, in denen persönliche oder sensible Informationen von anderen Usern genutzt werden können.
5.3.2 Automatisierung
Eine weitere Gruppe, das SWAD Europe, beleuchtet praktische Beispiele, um damit den Einsatz von Semanatic Web Technologien im aktuellen Web zu fördern und zu implementieren.
Hauptaugenmerk ist die praktische Demonstration dieser Technologien und dessen Verbesserung, in den Bereichen der Inhaltsverzeichnisse von Webseiten, Kalenderfunktionalitäten, Kommentierungen und Qualitätsbewertungen usw., aufzuführen. Die Konzentration auf zusätzliche Implementationen und Design in Bereichen der Abfragen und Integration von Semantic Web Technologien, liefert wertvolle Informationen und Erfahrungen für die Standardisierungsarbeit in der Zukunft.
Die Gruppe SWAD Smilie ist für die Erweiterung der Interoparabilität zwischen Digitalen Gütern, Metadaten und Dienstleistungen über verschiedene bzw. gemeinschaftliche Speicher, zuständig. Die Arbeiten fokussieren sich auf reale Anwendungen im Bereich der Bibliotheken. Bei erfolgreichen Einsätzen dieser Art, wird dies eine weitere Verbreitung der Technologien bedeuten, die einer globalen Gemeinschaft zugute kommt und eine sichtbare Erweiterung des Semantic Webs darstellt.
5.3.3 Standardisierung
Wie vor geraumer Zeit die globalen Indexe oder Google´s Suchalgorithmen für die Menschen noch nicht vorstellbar waren, so ist jetzt das Semantic Web an diese Stelle getreten. Die Vision ist es, mit dem Web Dinge zu tätigen, die sich die Menschen z.Z. noch nicht vorstellen. Eine neue Welt der Forschungsherausforderungen und aufregende Produktbereiche entsteht.
Am Anfang des Semantic Web gab es ein einfaches Diagramm mit Kreisen und Pfeilen, die Beziehungen darstellen. Dieses Diagramm wird durch die Standardisierung und den damit verbundenen Verknüpfungen riesig und global. Was damals als Revolution galt, den Menschen im Web lesbaren Dokumenten zur Verfügung zu stellen, möchte man mit dem Semantic Web und den Maschinen erreichen.
Der Vorteil ist, dass die Leistungen beider Akteure nicht verändert wird – sondern eine Verbesserung der Suche, die es einem nahezu ermöglicht, in Bruchteilen von Sekunden, alles zu finden.[30]
6 Ausgewählte Aktivitäten
6.1 Abgeschlossene Entwicklungen
6.1.1 GRDDL Working Group
Text
6.1.2 RDF Data Access Working Group
Text
6.2 Laufende Entwicklungen
6.2.1 RIF Working Group
Text
6.2.2 OWL Working Group
Text
6.2.3 POWDER Working Group
Text
7 Anwendungen
7.1 Case Studies
Text
7.2 Use Cases
Text
7.3 Corporate Semantic Web
Text
8 Ergebnisse
8.1 Schlussfolgerung
Text
8.2 Nutzen
Text
8.3 Risiken
Text
8.4 Kritische Würdigung & Ausblick
Text
9 Fazit
Die Idee diese Vision umzusetzen ist sehr groß und umfangreich, jedoch nicht unrealisierbar. Ein steigendes globales Interesse ist bereits vertreten. Mit der Unterstützung der Öffentlichkeit, und alle anderen involvierenden Personen, ist es sicherlich kein Wunschdenken.
Die Frage die sich hierbei stellt, ist die benötigte Dauer, Akzeptanz und die internationale Integration, die dieses Vorhaben variabel erscheinen lassen. Die Vision des Semantic Web ist durch RDF und Ontologien ein ganzes Stück näher gekommen. Der volle Nutzen wird jedoch erst erreicht, wenn alle Standards integriert sind. Einige werden kontinuierlich entwickelt oder werden bereits verwendet.
Es wird sich in der Zukunft zeigen, wie weit sich das Semantic Web entwickelt, eines ist jedoch ganz gewiss, eine Bereicherung für die Menschheit ist es allemal.
10 Anhang
10.1 Abkürzungsverzeichnis
| Abkürzung | Bedeutung |
|---|---|
| ASCII | American Standard Code for Information Interchange |
| CERN | Europäische Organisation für Kernforschung |
| CSS | Cascading Style Sheets |
| DARPA | Defense Advanced Research Projects Agency |
| ERCIM | The european research consortium for informatics and mathematics |
| HTML | Hypertext Markup Language |
| IRI | Internationalized Resource Identifier |
| ISO/IEC | Internationale Organisation für Normung/Internationale Elektrotechnische Kommission |
| IRI | Internationalized Resource Identifier |
| MIT/CSAIL | Massachusetts Institute of Technology/Computer Science and Artificial Intelligence Laboratory |
| OWL | Web Ontology Language |
| PDA | Personal Digital Assistant |
| PNG | Portable Network Graphics |
| QA | Quality Assurance |
| RDF | Resource Description Framework |
| RDFS | Resource Description Framework Schema |
| SPARQL | Protocol and RDF Query Language |
| SVG | Scalable Vector Graphics |
| SWAD | Semantic Web Advanced Development |
| URI | Uniform Resource Identifier |
| WAI | Web Accessibility Initiative |
| W3C | World Wide Web Consortium |
| WWW | World Wide Web |
| XML | Extensible Markup Language |
10.2 Abbildungsverzeichnis
| Abb.-Nr. | Abbildung |
|---|---|
| 1 | Kategorien von Metadaten |
| 2 | Tim Berners-Lee |
| 3 | W3C Team Foto Okt. 2008 |
| 4 | W3C Mitgliederorganisationen aus 28 Ländern |
| 5 | W3C Aufteilung Wirtschaftssektoren |
| 6 | Übersicht W3C Geschäftsstellen und Büros |
| 7 | W3C Zeitstrahl |
| 8 | RDF einfaches Beziehungsdiagramm |
| 9 | RDF Eigenschaft mit strukturiertem Wert |
| 10 | RDF Strukturierter Wert mit Bezeichner |
10.3 Fußnoten
- ↑ Vgl. Merschmann (2008), Internetartikel
- ↑ Vgl. Berners-Lee (1996), Internetartikel
- ↑ Vgl. Pellegrini/Blumauer (2006), S. 15 ff.
- ↑ Vgl. ohne Verfasser (2005), Duden-Literatur, S.346
- ↑ Vgl. Trabant (1996), S.25
- ↑ Vgl. Grütter (2008), S.75
- ↑ Vgl. Grütter (2008), S.110
- ↑ Vgl. Grütter (2008), S.111
- ↑ Vgl. Grütter (2008), S.104
- ↑ Vgl. Grütter (2008), S.102
- ↑ Vgl. Grütter (2008), S.140
- ↑ http://public.web.cern.ch/public/en/About/Web-en.htm/
- ↑ http://www.arpa.mil/
- ↑ http://www.w3c.de/about/overview.html
- ↑ http://www.arpa.mil/
- ↑ http://www.ercim.org/
- ↑ http://www.keio.ac.jp/
- ↑ http://www.w3.org/Consortium/Member/List
- ↑ http://www.w3c.de/about/org.html
- ↑ http://www.w3c.de/about/org.html
- ↑ http://www.w3.org/People/domain?domain=Management
- ↑ http://www.w3.org/Consortium/Offices/role.html
- ↑ http://www.w3c.de/about/history.html
- ↑ http://www.w3c.de/about/mission.html
- ↑ http://www.w3c.de/about/activities.html
- ↑ http://www.w3.org/Metadata/Activity.html
- ↑ http://www.w3.org/RDF/
- ↑ http://www.w3c.de/about/process.html
- ↑ http://www.w3c.de/Press/swrules-pressrelease.de.html
- ↑ http://www.w3c.de/Misc/tbl-em-sw.html
10.4 Literatur-/ Quellenverzeichnis
| Berners-Lee (1996) | Berners-Lee, Timothy J: Declaration presented by Tim Berners-Lee, W3C; URL: http://www.w3.org/People/Berners-Lee/9602affi.html |
| Grütter (2008) | Grütter, Rolf: Semantic Web zur Unterstützung von Wissensgemeinschaften, 1. Auflage, Oldenbourg Verlag, R /VM |
| Hitzler et al. (2008) | Hitzler, Pascal; Krötzsch, Markus; Rudolph, Sebastian, Sure, York: Semantic Web, 1. Auflage, Springer Verlag Berlin Heidelberg |
| Merschmann (2008) | Merschmann, Helmut: Semantic Web - Das klügere Netz, Manager-Magazin; URL:http://www.manager-magazin.de/it/artikel/0,2828,563728,00.html |
| ohne Verfasser (2005) | Duden-Literatur, 4. Auflage, Bibliographisches Institut |
| Pellegrini/Blumauer (2006) | Pellegrini, Tassilo; Blumauer, Andreas: Sematic Web, 1. Auflage, Springer Verlag Berlin |
| Tikwinski (2008) | Tikwinski, Thomas: W3C Deutsch-Österreichisches Büro Homepage; URL: http://www.w3c.de/ |
| Trabant (1996) | Trabant, Jürgen: Elemente der Semiotik, 1. Auflage, A. Franke Verlag Tübingen und Basel |




