Analyse der Suchmaschine Wolfram Alpha

Aus Winfwiki

Wechseln zu: Navigation, Suche
Name des Autors / der Autoren: Erik Nagler, Davor Serdar
Titel der Arbeit: "Analyse der Suchmaschine Wolfram Alpha"
Hochschule und Studienort: FOM Essen


Inhaltsverzeichnis


1 Einleitung

Suchmaschinen sind für viele Internetnutzer aus dem täglichen Leben nicht mehr wegzudenken. Egal ob für Preisvergleiche oder für den Kauf von Konzertkarten um nur zwei kleine Beispiele zu nennen. Suchmaschinen helfen fast immer weiter oder geben zumindest die richtige Richtung vor. Die Möglichkeiten der Nutzung von Suchmaschinen sind nahezu grenzenlos. Dabei konzentriert sich die Nutzungen primär auf semantische Suchmaschinen. Spitzenreiter in diesem Bereich ist der Suchdienst von Google[1]. In den vergangenen Jahren wurden Suchmaschinen massiv weiterentwickelt und haben nur noch wenig mit den Suchmaschinen vor einigen Jahren gemein. Der Suchmaschinen- Markt ist hart umkämpft. Zukünftige Entwicklungen sind schwer abzuschätzen, denn es scheint, als wäre die aktuelle Entwicklungsstufe von Suchmaschinen kaum weiter ausbaufähig und die marktbeherrschende Stellung von Google ist damit nur schwer anzufechten. Wolfram Alpha ist eine Suchmaschine die sich nur schwer mit anderen Suchmaschinen vergleichen lässt. Vielmehr handelt es sich dabei um eine neue Art von Suchmaschine, die es sich zum Ziel gesetzt haben, Fragen auf Basis von wissenschaftlichen Datencontainern zu beantworten. Wolfram Alpha Erfinder Stephen Wolfram sieht seinen Suchdienst ebenfalls nicht als Google- Konkurrent. Vielmehr sieht er Wolfram Alpha als Antwortmaschine[2]. Damit ließe sich Wolfram Alpha eher mit Wissensdatenbanken wie Wikipedia vergleichen. Allerdings ist nur allzu bekannt, dass die Datenbasis von Wolfram Alpha für einen direkten Vergleich mit Wikipedia zu klein und unausgereift ist [3].

Wolfram Alpha ist eine von Wolfram Research entwickelte Suchmaschine. Das Besondere ist, dass die zu Grunde liegende Datenbank nicht maschinell sondern größtenteils von Menschen gefüllt wird, wie es bereits der Fall war, als Suchmaschinen rar waren und keine Suchroboter das Internet durchsuchten[4]. Wolfram Alpha basiert auf der mathematisch- wissenschaftlichen Software Mathematica, welche ebenfalls aus dem Repertoire von Wolfram Research stammt.

Ziel der vorliegenden Fallstudie ist es, die Suchmaschine Wolfram Alpha zu durchleuchten. Analogien und Unterschiede zu anderen weit verbreiteten Suchmaschinen sollen aufgezeigt werden. Ein abschließendes Fazit soll die Alltagstauglichkeit von Wolfram Alpha aufzeigen. Einleitend werden grundlegende Begriffe geklärt, um ein gemeinsames Verständnis zu schaffen. Im weiteren Verlauf sollen typische Anwendungsbeispiele der Suchmaschine Wolfram Alpha aufgezeigt werden.

2 Grundlagen

2.1 Suchmaschinenarten

2.1.1 Volltextsuchmaschinen

Mit dieser Form der Suchmaschine respektive der Art des Suchens, wird Wortgenau nach dem gesucht was man der Suchmaschine mitgibt. Es werden keine Polymorphien in die Suche integriert und somit spiegeln die Suchergebnisse bei einer Volltextsuchmaschine auch nur Ergebnisse wieder die den genauen Wortlaut der Suche enthalten. Auf den ersten Blick ist es genau das Verhalten was wir erwarten und auch erzielen wollen. Im Laufe der Zeit hat sich jedoch herausgestellt, dass viele Suchergebnisses nicht die Resultate liefern die gewünscht waren. Um an sein gewünschtes Suchergebnis zu gelangen mussten die Suchkriterien manuell verfeinert und abgeändert werden. Der nächste Schritt, das Suche in Wortfamilien beziehungsweise in verwandten Themengebieten führt zu den heutzutage allgegenwärtigen semantischen Suchmaschinen.[5]

2.1.2 Semantische Suchmaschinen

Abb. 1: Beispiel einer semantischen Vernetzung
Abb. 1: Beispiel einer semantischen Vernetzung [6]

Nachdem also die reine Volltextsuche nicht mehr die gewünschten Ergebnisse lieferten oder die Ergebnisse einfach ein zu geringes Suchumfeld umfassten, entwickelten sich die semantischen Suchmaschinen. Diese "neue Art" von Suchmaschinen betrachtete die Suchworte nicht als einfachen Zeichensatz der in der Ergebnismenge auftauchen sollte. Vielmehr sollten diese Wort beziehungsweise Zeichenketten nicht mehr alleine dastehen, sondern in Verbindung mit Wort- und Themenverwandten zur Suche genutzt werden. Dazu gehören Synonyme, Antonyme, oder einfach Worte die in Verbindung mit dem gesuchten Wort überdurchschnittlich häufig auftreten. Wenn also nach zum Beispiel nach Auto gesucht wird, werden Begriffe mit in die Suchmenge integriert, welche alle die Semantik des gesuchten Wortes, in diesem Fall "Auto", haben. Dies wären zum Beispiel Wörter wie "KFZ", "PKW", "Fahrzeug", "Limousine" und viele mehr. Dadurch wird das Spektrum der Suche auf ein vielfaches erweitert und bringt dem Anwender somit ein umfangreicheres Ergebnis. Es wird also vielmehr nach der Bedeutung als nach dem Wort an sich gesucht.

Nun ergibt sich aus der stark erweiterten Ergebnismenge eventuell auch ein Nachteil für den Anwender. Er muss sich nun mühsam durch den Berg aus Informationen wählen um die Informationen zu finden die seiner Bedeutung am ehesten entgegen kommt. Deshalb ist die Kombination mehrerer Worte für eine gezielte Trefferauswahl von Bedeutung. Denn auch die Kombination von mehreren Worten zu einer einzigen Semantik ist heute möglich. Gibt der Anwender zum Beispiel "Auto" und "mieten" ein, könnten semantische Ergebnisse Wörter wie "Sixt" oder "Europcar" sein.

Auch wenn man diese Entwicklung eigentlich für selbstverständlich hält, wird es von der "Internetindustrie" noch längst nicht so gesehen. Branchenprimus Google setzt zum Beispiel immer noch auf Volltextsuche. Eine semantische Suche ist allerdings schon in der Entwicklung. Auch das sogenannte personal ranking wird von Google bereits experimentell implementiert. Das heißt, der User kann jeden einzelnen Punkt im Suchergebnis nach oben oder nach unter innerhalb des Suchergebnisses verschieben. Ganz auf sein subjektives Befinden abgesehen, ob das jeweilige Suchergebnis gut oder schlecht zu dem gesuchten Begriff(en) passt.[7]

2.1.3 Meta Suchmaschinen

Eine Meta Suchmaschine liefert keine eigenen Suchergebnisse aus dem Web, sondern bedient sich der Suchergebnisse anderer Suchmaschinen. Es kombiniert also die Suchergebnisse verschiedener Suchmaschinen (zum Beispiel Google, Yahoo, Bing und Ask) um ein möglichst großes Spektrum an Ergebnissen zu liefern. Die Reihenfolge wie die Suchergebnisse angezeigt werden hängt davon ab, wie häufig und wie hoch gerankt die Suchergebnisse bei den einzelnen Suchmaschinenergebnissen sind. Zu den einzelnen Ergebnissen wird angezeigt von welchen Suchmaschinen diese stammen. Das Problem bei Meta Suchmaschinen ist, dass man teilweise nicht erkennen kann ob es sich bei den Ergebnissen um qualifizierte oder gekaufte Links handelt.

Das heißt, Suchmaschinen wie Google verkaufen hochrangige Suchergebnisstellen an den Höchstbietenden. Somit könnte sich zum Beispiel Microsoft bei dem Suchbegriff "Betriebssystem" den ersten Platz sichern indem es am meisten bietet. Diese gekauften Links lassen sich von qualifizierten (Durch den Suchalgorithmus gefunden) Links auf der eigentlichen Seite wie zum Beispiel www.google.com voneinander unterschieden. Viele Meta Suchmaschinen liefern diese Links allerdings einfach so als normale qualifizierte Links zurück.[8]

2.2 Wissensmanagement

2.2.1 Knowledge Warehouse

Betrachtet man die Suchmaschinen genau, so sind diese eigentlich nichts weiter, als riesige digitale Schaufelräder die eine große Massen an Daten zu Tage fördern. Meistens sucht man jedoch etwas ganz bestimmtes, eine Antwort auf seine Fragen. Man sucht also bestimmte Informationen. Das Problem bei Suchmaschinen ist somit, seine gezielten beziehungsweise gewünschten Informationen aus diesen ganzen Daten zu ziehen. Google liefert zum Beispiel zum Begriff Auto (Stand 09.11.2009) 832.000.000 Einträge. Ist man allerdings nun auf der Suche nach ganz einfachen Informationen über das Auto, zum Beispiel wann es erfunden wurde, so kann es unter Umständen mühsam sein, diese Unmenge an Daten durchzuarbeiten und in brauchbare respektive gewünschte Informationen zu wandeln.

Abhilfe schaffen da sogenannte Knowledge Warehouse Systeme. Im Prinzip riesige Lagerhäuser von Daten die bereits durch Personen gefiltert und ausgewertet worden sind und auf einen essentiellen Teil komprimiert wurden. Die bekanntesten Beispiele solcher "Wissenslagerhäuser" sind Wikipedia und Google Knol. Der Grundlegende Unterschied zu einer Suchmaschine ist wohl derjenige, dass Suchmaschinen maschinell das Web nach dem Suchbegriff durchsuchen und einfach alles im Zusammenhang stehende auflisten. Der Inhalt von Knowledge Warehouse Systemen wurde durch Personen/Menschen manuell angelegt. Eine subjektive Einschränkung des Autors in Bezug auf den Inhalt ist man somit ausgeliefert.

Sucht man jedoch dort nach dem Begriff Auto findet man sofort einen relevanten Artikel und kann hier seine gewünschten Informationen beziehen. Unter der Voraussetzung, dass der Autor des Artikels die Information für relevant hielt und eingebaut hat.

2.2.2 Computational Knowledge Engine

Abb. 2: Veranschaulichung einer Computational Knowledge Engine
Abb. 2: Veranschaulichung einer Computational Knowledge Engine[9]

Der Sprung zu einer Computational Knowledge Engine ist gar nicht so weit. Wenn man es genau betrachtet, ist es eine Kombination aus einer Suchmaschine und einem Knowledge Warehouse. Es lässt den Anwender nach bestimmten Kriterien suchen und gibt im besten Falle genau die Information aus, die der Anwender gewünscht hat. Eine Computational Knowledge Engine durchsucht nicht nur das Web nach Daten und trägt diese zusammen. Es verarbeitet (engl. compute) diese und bereitet sie so auf das der Anwender sofort die relevanten Informationen entnehmen kann. Zum einen bedient sich die Computational Knowledge Engine auf Daten aus Web und aus Knowledge Warehouse Systmen und zum Anderen auch aus der eigenen Datenbank, die ständig weiter gefüllt wird.

Die zurückgelieferten Informationen sind dementsprechend auch nur so gut wie die Engine sie als Rohfassung zur Verfügung hat. Allerdings ist die Qualität des Suchkontextes von Bedeutung. Sucht der Anwender grob nach einem Begriff so bekommt er mehr Informationen als er sucht und muss diese dann alle durcharbeiten um seine gewünschte Information zu erhalten. Abgesehen davon das diese komprimiert dargestellten Informationen der Computational Knowledge Engine dennoch viel geringer sind als bei herkömmlichen Suchmaschinen oder Knowledge Warehouse Systemen kann es trotzdem noch zu viel sein. Der Anwender hat jedoch die Möglichkeit eine gezielte Frage einzugeben um eine gezielte Antwort darauf zu erhalten. Anstatt der Eingabe Fahrrad, bei der alle möglichen Informationen wie Erfindungsland, Erfinder, Erfindungszeit, etc. zurückgegeben werden, könnte er auch einfach eine gezielte Frage eingeben. Zum Beispiel: "Wann wurde das Fahrrad erfunden?". Die Computational Knowledge Engine kann diese Frage verarbeiten (engl. compute) und diese dann auf die zur Verfügung stehenden Informationen anwenden. Das Ergebnis wäre dann einfach eine Zahl: "1885". Der Anwender hätte exakt das Ergebnis was er gesucht hat und müsste nicht unendlich viele unnötige Informationen durcharbeiten.

Ein weiterer, darüber hinaus gehender Punkt, ist die rein theoretisch unendliche Datenquelle von Computational Knowledge Engines. Es verfügt nicht nur über die in der Datenbank abgespeicherten Daten oder die im Netz befindlichen Daten, sondern kann auch aus Logik, Regeln und Mathematik eigene Daten erschaffen. Das Ergebnis zu 2+2 steht mit Sicherheit auch irgendwo im Web. Computational Knowledge Engines suchen sich diese Ergebnisse allerdings nicht, sondern berechnen diese soweit dies möglich ist selbst. So ist zum Beispiel das Ergebnis von "Die Länge der Golden Gate Bridge" geteilt durch "die Anzahlt der Tage im Jahre 1984" im Web höchstwahrscheinlich nicht hinterlegt. Eine Computational Knowledge Engine erkennt allerdings die Semantik dahinter, besorgt sich die benötigten Daten und führt die Berechnung durch.

3 Analysekriterien

3.1 Funktionsweise

Um Unterschiede und Gemeinsamkeiten zwischen der Funktionsweise von Wolfram Alpha und anderen Suchmaschinen festzuhalten, soll im Folgenden die typische Funktionsweise einer Volltextsuchmaschine aufgezeigt werden. Weiter in der Arbeit wird die Funktionsweise von Wolfram Alpha erläutert.

Üblicherweise funktionieren Suchmaschinen nach dem Indexierungsprinzip. Dabei werden sämtliche im Internet befindlichen Seiten mit sog. Crawlern abgesucht. Dies geschieht ausgehend von einigen Seiten. Alle Verknüpfungen dieser Seiten zu anderen Webseiten werden ebenfalls abgesucht und sämtlicher Text auf diesen Seiten wird indexiert. Dabei werden übliche Füllwörter ohne Bedeutung wie "und", "oder", "bis" usw. aus der Indexierung ausgenommen. Damit sind alle Wörter, die den Inhalt einer Seite beschreiben indexiert und über die Suchmaschine des jeweiligen Betreibers auffindbar. Problematisch wird es bei Seiten, zu denen kein Link existiert. Solche Seiten werden nicht indexiert und sind damit für Nutzer einer Suchmaschine unsichtbar.

Um trotz der Masse an indexierten Seiten dem Benutzer schnelle Ergebnisse bei Suchabfragen zu ermöglichen, werden bei vielen Suchanbietern teilweise mehrere hundert Rechner für die Bedienung von Suchanfragen eingesetzt[10]. Dies zeigt einen einfachen Überblick zur Funktionsweise von Suchmaschinen, welche im Laufe der Arbeit mit der Funktionsweise von Wolfram Alpha verglichen werden soll.

3.2 Datenquelle

Volltextsuchmaschinen beziehen ihre Daten und Informationen üblicherweise aus dem Inhalt von Webseiten. Demnach ist die zentrale Datenquelle jede Webseite im Internet, auf die durch einen Link verwiesen wird. Suchmaschinenanbieter setzen hier Crawler ein, die in regelmäßigen Abständen Webseiten durchsuchen und den Inhalt der Webseiten in eigenen Datenbanken speichern und indexieren, um sie für den Nutzer der Suchmaschine sichtbar zu machen[11]. Ob eine Webseite in die Datenbank des Suchmaschinenanbieters aufgenommen wird, und welches Ranking der Seite zugewiesen wird, hängt von vielen unterschiedlichen Faktoren ab. Dies können sein[12]:

  • Aktualität der Seite
  • Validität des eingesetzten HTML
  • Themenrelevanz der Inhalte
  • Seitenstruktur
  • Aussagekraft der Datei- und Verzeichnisnamen
  • Navigations- und Linkstruktur
  • Linktitel
  • uvm.

Folglich beziehen moderne und bekannte Suchmaschinen ihre Daten aus dem Internet. Inwieweit sich das mit den Datenquellen von Wolfram Alpha deckt oder unterscheidet, soll im Laufe der vorliegenden Arbeit aufgezeigt werden.

3.3 Zielgruppe

42,2 Millionen Menschen in Deutschland haben im Jahr 2008 das Internet aktiv genutzt. Davon nutzten zwei Drittel Suchmaschinen mehrmals am Tag. Die Bandbreite an Menschen, die Suchmaschinenanbieter allein in Deutschland mit ihren Diensten erreichen, ist also sehr groß und übertrifft alle anderen Bereiche im Internet bei Weitem[13]. Daher ist es kaum verwunderlich, dass viele Unternehmen aber auch Privatpersonen aktiv investieren, um Ihre Internetpräsenz für Suchmaschinen und damit für Anwender interessanter zu machen. Suchmaschinen sind nicht abhängig von dem Alter, Geschlecht oder sozialem Status des Nutzers, was sie sehr interessant macht.

Wolfram Research gibt an, dass Wolfram Alpha ebenfalls für jedermann geeignet ist, da die Suchengine Fragen in natürlicher Sprache versteht und für die Benutzung von Wolfram Alpha keine spezielle Syntax nötig ist. Ziel ist es dabei, allen Nutzern Expertenwissen zu vermitteln. Auf die Frage, für wen Wolfram Alpha geeignet ist, antwortet Wolfram Research mit "Any level, from kindergarten to graduate school and beyond. On the elementary end, Wolfram|Alpha can do arithmetic showing steps, make clocks, work with colors, and so on."[14].

Experten bezweifeln dies jedoch und behaupten teilweise spöttisch, dass man für die ausgiebige Nutzung von Wolfram Alpha einen IQ haben muss, der so hoch ist wie der des Gründers Stephen Wolfram[15]. Fakt ist jedoch, dass der Suchdienst tatsächlich sehr viele Bereiche abdeckt und damit auch eine sehr breite Zielgruppe anspricht. Schüler könnten Wolfram Alpha verwenden, um Aufgaben aus dem Mathematik- Bereich nachzuvollziehen. Wissenschaftler könnten Wolfram Alpha verwenden, um komplexe Berechnungen anzustellen und wissenschaftliche Modelle anzuwenden.

Dennoch kann davon ausgegangen werden, dass Wolfram Alpha nie eine so große Zielgruppe wie heutige Suchmaschinen erschließen kann. Allein durch die Tatsache, dass Wolfram Alpha nicht auf Internetseiten verweist, die möglicherweise nähere Informationen bereitstellen, sondern aktiv Ergebnisse präsentiert und Berechnungen anstellt lässt die Vermutung zu, dass Wolfram Alpha nur dann verwendet wird, wenn auch tatsächlich Ergebnisse gewünscht sind. Internetnutzer, die Suchmaschinen ausschließlich für die Einholung von Informationen nutzen, werden vermutlich Wolfram Alpha meiden.

3.4 Generik der Eingabe

Abb. 3: Eingabemaske bei der BMI Berechnung in Wolfram Alpha
Abb. 3: Eingabemaske bei der BMI Berechnung in Wolfram Alpha

Das Kriterium der Generik der Eingabe beschreibt wie variabel und diffus eine Eingabe sein darf. Die Generik der Eingabe hängt auch stark mit den semantischen Fähigkeiten der Suchmaschine ab. Analysiert werden müssen zum Beispiel die Verarbeitung ganzer Fragestellungen oder unklare oder zusammenhangslose Verarbeitung von einzelnen Begriffen.

Wolfram Research gibt an, das die Anwender der Suchengine von Wolfram Alpha echte Fragen in natürlicher Sprache stellen sollen. Die Auswertung der Frage und der benutzten Begriffe werden vom Linguistic processing system (LPS) vorgenommen. Es hat sich allerdings gezeigt, dass Wolfram Alpha so die Eingabe oft nicht versteht. So ist es besser, nur Stichworte zu verwenden und auf besonders komplexe Fragestellungen zu verzichten. Die Suchanfragen sollten nach dem "do what I might mean" (DWIMM) Prinzip aufgebaut sein und sich auf das Nötigste beschränken. Möchte man beispielsweise über das BIP (Englisch GDP) Deutschlands informiert werden, ist eine Eingabe von "GDP germany" erfolgversprechender als die Eingabe von "What was germanys GDP in 2007?". [16].

In einigen Bereichen gibt Wolfram Alpha dem Anwender Hilfestellung in Form von Eingabemasken. Möchte man beispielsweise seinen body mass index (BMI) errechnen, so reicht die Eingabe von "BMI" in der Suchmaske. Im darauf folgenden Fenster hat man die Möglichkeit, die für die BMI-Berechnung notwendigen Daten wie Größe und Gewicht einzugeben (siehe Abbildung rechts). Auch wenn eine Benutzereingabe von Wolfram Alpha nicht verstanden wurde, werden hilfreiche Tipps zum richtigen Umgang mit Wolfram Alpha angezeigt. Zudem hat der Benutzer bei sehr allgemeinen Begriffen die Möglichkeit, das gemeinte Themenfeld des Begriffes auszuwählen. Gibt man beispielsweise als einzigen Suchbegriff „rose“ ein, so kann man im Folgefenster auswählen, ob man die Pflanze, den Namen oder vielleicht die Farbe „rose“ gemeint hat.

Ein großer Nachteil für deutschsprachige Anwender von Wolfram Alpha ist, das die Suchengine derzeit nur englische Suchabfragen akzeptieren und verstehen kann. Künftig sollen aber auch andere Sprachen implementiert werden[17].

4 Analyse von Wolfram Alpha

4.1 Überblick

Wolfram Alpha ist die neueste Entwicklung von Stephen Wolfram, dem Gründer des Unternehmens Wolfram Research Inc. Stephen Wolfram ist ein Britischer Physiker und Mathematiker mit Ambitionen zur Entwicklung hilfreicher Werkzeuge für die Unterstützung wissenschaftlicher Arbeit. Mit der Entwicklung des Programmepakets Mathematica stellt Stephen Wolfram durch sein Unternehmen Wolfram Research Inc. eines der meist verwendeten Softwarepakete für Mathematik und Naturwissenschaften zur Verfügung. Wolfram Research, dessen Geschäftsführer und Hauptaktionär Stephen Wolfram ist hat nun mit einem neuen Produkt den Bereich der "thinking men" in Aufruhr versetzt. Im Frühjahr 2009 stellte Wolfram Research eine Suchmaschine vor, die Suchen nach wissenschaftlichen Fragestellungen ermöglicht und dem Anwender innerhalb von Sekunden oder Bruchteilen von Sekunden eine wissenschaftlich fundierte Antwort liefert. Natürlich nur innerhalb des bereits Bekannten und Möglichen. Diese Entwicklung, Wolfram Alpha (www.wolframalpha.com), ist also keine Forschungsmaschine, sondern vielmehr ein Werkzeug zur Unterstützung von wissenschaftlichen Zwecken.

Wolfram Alpha ist laut Stephen Wolfram nicht nur eine einmalige Entwicklung, sondern stellt ein Langzeitprojekt dar welches gerade einmal begonnen hat. Wolfram Alpha soll die Zukunft der Informationsbeschaffung revolutionieren und auch so manchem Primus in bestimmten Bereichen den Rang ablaufen.

Wolfram Alpha setzt auf semantischen Suchanfragen auf. Das klingt natürlich hilfreich kann jedoch unter Umständen auch zu Problemen führen. Die Semantik ist natürlich nur so gut, inwieweit diese gepflegt ist. Sind zum Beispiel tags verschiedener Begriffe nicht vorhanden, können entweder keine oder falsche Relationen hergestellt werden.

Ein weiteres Problem ist das Verständnis von der Frage die der Anwender stellt. Eine Maschine kann immer nur das Verstehen was Ihr vorher beigebracht wurde. Insbesondere im Bereich der Semantik. Eine Maschine oder in diesem Fall Wolfram Alpha kann nicht darauf schließen, das zum Beispiel ein Erdbeben das verschieben tektonischer Platten darstellt. Die Suche nach Erdbeben (engl. earthquakes) lieft im Vergleich zu "Verschiebung tektonischer Platten" (engl. "shifting tectonic plates") keine Treffer.

Wolfram Alpha setzt für die Berechnung und Interpretation der Ergebnisse zwei Supercomputer mit 10.000 CPUs ein[18]. Die Ziele des Unternehmens sind auf der Webpräsenz aufgeführt. So verfolgt Wolfram Research langfristig das Ziel, alles systematische Wissen berechenbar und für jeden zugänglich zu machen. Jedes bekannte Modell, jede bekannte Methode und jeder bekannte Algorithmus sollen implementiert werden. Dabei soll Wolfram Alpha zu einer integeren Datenquelle wachsen, die wissenschaftliches Arbeiten vereinfachen soll[19]. Wolfram Research gibt an, dass Wolfram Alpha nie fertig entwickelt sein wird, da kontinuierlich neue Daten aufgenommen werden. So wird die zugrundliegende Software Mathematica seit 1988 kontinuierlich weiterentwickelt. Als Anwender merkt man die stetige Entwicklung, denn teilweise sind die Suchergebnisse von einem Tag auf den anderen unterschiedlich.

4.2 Funktionsweise

4.2.1 Informationsquelle

Abb. 4: Quellinformationen einer Suchabfrage
Abb. 4: Quellinformationen einer Suchabfrage

Das besondere an den verwendeten Datenquellen von Wolfram Alpha ist, dass für die Ergebnissuche auch hauseigene Quellen herangezogen werden. Damit ist Wolfram Alpha kein Suchdienst, sondern setzt auf eigenen Datenbanken auf, welche zum Großteil von Menschenhand gefüllt werden. Wolfram Alpha ist auch keine Enzyklopädie, denn die gelieferten Ergebnisse der Suchanfragen sind stets berechenbar[20]. So liefert eine Suchanfrage nach einem Land sämtliche Zahlen über Bewohner, Hauptstadt und verwendete Währungen, aber über die Geschichte des Landes erfährt man von Wolfram Alpha nichts, wovon man bei einer Enzyklopädie ausgehen würde.

Über die Datenquellen, welche von Wolfram Alpha benutzt werden ist leider nicht viel bekannt. Es ist lediglich bekannt, dass die data curation pipeline von Mitarbeitern von Wolfram Research manuell gefüllt wird. Die Mitarbeiter suchen nach vertraulichen Datenquellen, welche anschließend geprüft und in den internen Datenbanken festgeschrieben werden. Daneben existiert euch eine Schnittstelle welche dem Anwender Daten in Echtzeit zur Verfügung stellt, wie z.B. Informationen über das Wetter oder Aktienkurse. Diese Daten werden zur Laufzeit mittels APIs von Wolfram Alpha abgefragt und dem Anwender zur Verfügung gestellt. Experten gehen davon aus, dass die Wolfram Research Mitarbeiter manuell das sog. Deep Web durchsuchen. Das Deep Web bezeichnet dabei einen Bereich des Internets, der auf Anfragen dynamische Inhalte erzeugt und dadurch nicht von Standard- Suchmaschinen gefunden werden kann, welche mithilfe von Crawlern lediglich das sog. Surface Web erreichen können. Diese Crawler sind nicht in der Lage, dynamische Inhalte abzufangen, da sie die Schnittstellensprache der dynamischen Seite nicht kennen / verstehen und damit die Informationen des Deep Web nicht automatisiert erschlossen werden können.

Das eigentliche Problem ist, dass die Deep Web Inhalte in durchsuch- und sortierbaren Datenbanken gespeichert sind und sich damit wesentlich besser für eine Suche eignen als statische Inhalte. Zudem existieren im Deep Web rund 400 – 550 mal mehr Inhalte als im Surface Web[21].

Wolfram Research gibt an, bei Suchabfragen des Benutzers mehrere Trillionen automatisch und manuell erfasste Datensätze zu durchsuchen. Es kann davon ausgegangen werden, dass es sich bei automatisch erfassten Daten um Informationen aus dem Surface Web und bei den manuell erfassten und evaluierten Daten um Informationen aus dem Deep Web handelt[22]. Bei einer Suchabfrage in Wolfram Alpha werden die Daten mit einer internen Knowledge Base abgeglichen. Einige Daten dieser Knowledge Base stammen von privaten oder öffentlichen Webseiten. Wie groß der Anteil an Webquellen ist, ist jedoch nicht bekannt. Am unteren Bildschirmrand einer Suchabfrage hat man die Möglichkeit herauszufinden, aus welcher Quelle die verwendeten Informationen stammen. In r.s. Abbildung werden beispielhaft die genutzten Quellen einer Suchabfrage nach amerikanischen Namen angezeigt.

Problematisch ist, dass nicht gezeigt wird, welche Informationen des Suchergebnisses aus welcher Quelle stammen. Besonders da Wolfram Alpha primär auf Daten aus dem mathematischen und naturwissenschaftlichen Bereich aufsetzt, sollte dies transparenter sein.

4.2.2 Informationsverarbeitung

Abb. 5: Weg der Quellinformationen zum Anwender
Abb. 5: Weg der Quellinformationen zum Anwender

Auf den ersten Blick erscheint Wolfram Alpha wie eine herkömmliche "Suchmaschine". Allerdings steckt nicht einfach ein "normaler" Suchalgorithmus hinter der Verarbeitung, sondern vielmehr eine komplexe Engine zur Er- und Verarbeitung von Daten. Es soll geprüft werden welche Funktionen die Engine zur Verfügung stellt und wie diese angewandt werden.

Als Kerntechnologie von Wolfram Alpha beschreibt Wolfram Research 4 wesentliche Bereiche die nicht näher erläutert werden. Dennoch soll versucht werden, Vermutungen über die Funktionsweise der Bereiche anzustellen. Abbildung 5 zeigt, wie die Verarbeitung von Anfragen in Wolfram Alpha aussehen könnte.

  • Data curation pipeline (DCP)

Nach eigenen Angaben von Wolfram Research sind mehrere hundert Mitarbeiter damit beschäftigt, integere Primärquellen ausfindig zu machen und sie in den entsprechenden Kontext und die dafür vorgesehenen Datenbanken einzupflegen. Anwender und Unternehmen haben die Möglichkeit, Wolfram Research Informationen zur Verfügung zu stellen, welche in die Datenbanken eingepflegt werden. Diese Informationen durchlaufen ebenfalls die data curation pipeline.

  • Algorithmic computation system (ACS)

Das algorithmic computation system wird wohl hauptsächlich aus der Software Mathematica bestehen.

  • Linguistic processing system (LPS)

Das linguistic processing system ist verantwortlich für die Interpretation der Benutzereingaben, welche Suchabfragen in natürlich formulierter Sprache erfassen. Zudem übersetzt das linguistic processing system im Bedarfsfall die Benutzereingabe in die Mathematica- eigene Syntax, sodass der Benutzer nicht die Syntax von Mathematica lernen muss. Beispiel: Ein Anwender möchte die ersten 100 Stellen von PI angezeigt bekommen. Die Eingabe in das Wolfram Alpha Suchfeld lautet also "100 digits of pi". Das linguistic processing system übersetzt diese Eingabe in N[Pi, 100], was der Mathematica Syntax entspricht.

  • Automated presentation system (APS)

Das automated presentation system stellt dem Anwender die Ergebnisse zur Verfügung und bereitet diese im Bedarfsfall tabellarisch oder grafisch auf. Der Output der Daten (Grafiken und Modelle) lassen sich nach Mathematica exportieren. Zu reinen Anzeige kann der kostenlose Mathematica Player verwendet werden. Die in der Ausgabe erscheinenden Bereiche, sog. Pods können über weitere Unterbereiche, sog. Subpods verfügen.

Wolfram Alpha sucht jedes einzelne Wort einer Suchabfrage in einem allgemeineren Kontext von Oberbegriffen. Gibt man bspw. in die Suchmaske den Begriff "Romeo and Juliet" ein, so erkennt Wolfram Alpha zwei Namen, die es prompt miteinander vergleicht. Gibt man aber "Romeo and Juliet vs. Titanic" ein, so erkennt Wolfram Alpha, dass es sich bei "Romeo and Juliet" um einen Film handelt, der mit den Daten zum Film Titanic verglichen wird. Dies bedeutet, dass Wolfram Alpha eingegebene Suchbegriffe stets im Zusammenhang betrachtet und einen Zusammenhang zwischen den Wörtern sucht[23]. Wolfram Alpha zeigt dem Benutzer auch an, in welchem Kontext die Suchbegriffe verstanden wurden.

4.2.3 Data Curators

Als Data Curators (zu Deutsche etwa „Datenverwalter“)werden meist Unternehmen bezeichnet, welche sich auf das Sammeln, Bündeln und Verarbeiten von Informationen spezialisiert haben. Die Informationen können dabei sehr unterschiedlicher Natur sein und erstrecken sich von Umlaufbahnen und Größe von Planeten bis hin zu Informationen über börsennotierte Unternehmen. Leider ist nicht bekannt, ob Wolfram Alpha Data Curators in Form von externen Unternehmen einsetzt. Es ist lediglich bekannt, dass mehrere hundert eigener Mitarbeiter damit beschäftigt sind, Informationen aus den verschiedensten Themengebieten zu sammeln und zu verarbeiten. Da das Themenfeld der Data Curators noch sehr neu ist, gibt es nur eine Handvoll meist staatlicher Unternehmen, welche sich auf die Sammlung, Verdichtung und Zurverfügungstellung von derartigen Informationen und Daten spezialisiert haben. Klar ist auch, dass sowohl Unternehmen als auch Privatanwender die Möglichkeit haben, Wolfram Research Informationen und Daten zu bestimmten Themengebieten zur Verfügung zu stellen, sodass diese in die Datenbanken von Wolfram Alpha aufgenommen werden. Inwieweit solche Arbeiten vergütet werden, ist nicht bekannt. Das liegt vor allem auch daran, dass Wolfram Alpha ein noch sehr junges Projekt ist. Wolfram Research muss hier zunächst eine globale Strategie zur Datenbeschaffung ausarbeiten.

4.2.4 Data Grids

Als Data Grid wird die verteilte Berechnung, Sammlung und Verwaltung von Informationen bezeichnet. Dabei handelt es sich meist um eine Unmenge von Informationen, welche Mithilfe von Data Grid- Computing verdichtet und strukturiert werden sollen[24]. Dies soll mit der Unterstützung von Informationssystemen geschehen. Im Zusammenhang mit Wolfram Alpha trifft diese Beschreibung von Data Grid nur bedingt zu. Hier stehen Data Grids in direktem Zusammenhang mit den Data Curators. Data Grids sind im Fall von Wolfram Alpha Datenpools zu bestimmten Themengebieten. Sobald eine Data Grid einen bestimmten Füllstand erreicht hat, der mittels der Masse der zur Verfügung stehenden Daten zu einem Themenfeld gemessen wird, wird dieses Data Grid in die Datenbanken von Wolfram Alpha aufgenommen[25]. Ab diesem Zeitpunkt kann das Data Grid von den Wolfram Alpha Anwendern genutzt werden.

4.2.5 Module

Wolfram Alpha bietet seinen Nutzern Informationen und Daten aus vielen verschiedenen Themengebieten an. Im Einzelnen sind dies Folgende[26]:

  • Mathematik
  • Datums- und Zeitangaben
  • Statistik
  • Geographie
  • Physik
  • Sozioökonomie
  • Chemie
  • Wetter
  • Materialien
  • Gesundheit und Medizin
  • Ingenieurwesen
  • Ernährung
  • Astronomie
  • Linguistik
  • Geologie
  • Kultur
  • Tierreich
  • Historische Personen
  • Technologie
  • Bildung
  • Transportwesen
  • Organisationen
  • Informatik
  • Sport
  • Computersysteme
  • Musik
  • Maße und Einheiten
  • Farbenlehre
  • Finanzen

Die Datenbreite ist je nach Themengebiet unterschiedlich groß, doch die Schwerpunkte bzw. der Großteil der Daten liegen in den Bereichen Mathematik und Naturwissenschaften.

4.3 Einsatzweise

4.4 Einführung

Wolfram Alpha versucht Antworten auf die vom Anwender eingegebenen Fragen zu liefern. Allerdings ist nicht zwingend eine Frage erforderlich um ein Resultat zu erhalten. Es wäre zum Beispiel möglich zu Fragen: "Was ergibt 2+2?" ("What is 2 + 2"). Wolfram Alpha erkennt das es sich um eine Rechenaufgabe handelt und filtert die relevanten Informationen, in diesem Fall 2+2, heraus und liefert ein Ergebnis. Eine Eingabe von 2+2 hätte in diesem Fall jedoch auch gereicht. Wolfram Alpha hätte die Aufgabe bzw. die implizierte Frage gleich beantwortet. Wolfram Alpha versucht die Antwort so konkret wie möglich zu liefern und bedient sich daher verschiedener Hilfsmittel. Das Ergebnis 4 zu der Frage 2+2 würde zum Beispiel auch als Wort "four" dargestellt werden und grafisch durch 4 Punkte.

Da Stephen Wolfram sein Wissen aus seinem großen Software Produkt Mathematica mit in die Entwicklung von Wolfram Alpha eingebracht hat, eignet sich Wolfram Alpha also wirklich für mathematische Zwecke. Auch komplexe mathematische Aufgaben löst Wolfram Alpha problemlos und zügig. Wichtig ist dabei immer die korrekte Eingabe, sodass Wolfram Alpha die Frage interpretieren kann.


Aber Wolfram Alpha ist nicht nur eine Mathematik Software, sondern kombiniert die Eingaben um mit allen möglichen Daten ein genaues Ergebnis auf die Frage des Anwenders zu liefern. Wolfram Alpha versteht zum Beispiel gdp france (zu Deutsch: BIP Frankreich) und liefert das Ergebnis zurück. Allerdings würde man auch gerne vergleichen oder Relationen aufstellen können. Zum Beispiel wie ist die Relation zwischen dem BIP von Frankreich und BIP von Italien. Es würde funktionieren mit gdp france / italy (deutsch BIP Frankreich / Italien), allerdings auch mit einer Frage wie "what is the gdp of france / italy?" (deutsch: Was ist das BIP von Frankreich / Italien ?). Das Ergebnis ist das gleiche. Das Erstaunliche ist allerdings das die Daten innerhalb Wolfram Alpha wirklich so organisiert und strukturiert sind, dass diese verarbeitet (englisch: computed) werden können. Dadurch lassen sich schnell Ergebnisse und Antworten auf Fragen erhalten die ansonsten manuell in mehreren Schritten durchgeführt werden müssten.


4.4.1 Bildung

Ein anderes Anwendungsgebiet ist zum Beispiel die Geographie. Gibt man als Schlagwort einfach nur "Essen" ein, erkennt Wolfram Alpha das es sich um eine Stadt handelt. Jetzt gibt es allerdings mehrere "Essen" auf der Welt, zum Beispiel auch in Belgien. Allerdings erkennt Wolfram Alpha anhand der IP Range wo derjenige sich befindet und kann somit das "Essen" was sich am nächsten befindet anzeigen. In diesem Fall das "Essen" in Deutschland, NRW. Natürlich lässt sich auch das andere Essen wählen. Informationen über die Essen sind zum Beispiel Wetterdaten, Einwohnerzahl, Lage (eingeblendet auf einer Länderkarte), Höhenmeter, nächstgelegene größere Städte, etc. Ein weiteres Beispiel wäre die Frage nach dem drittgrößten Land in Europa. Da hier die Frage nicht eindeutig auf ein bestimmtes Kriterium ist, liefert Wolfram Alpha alle Ergebnisse zu dieser Frage unabhängig vom Kriterium (Bevölkerungsanzahl, Fläche, etc.).


Wer zum Beispiel wissen möchte wie das Wetter in einer bestimmten Gegend war zum Zeitpunkt seiner Geburt einer bestimmten Person oder eines Datums, könnte fragen "weather in Essen when Angelina Jolie was born?" (deutsche: "Wie war das Wetter in Essen zum Zeitpunkt als Angelina Jolie geboren wurde?"). Wolfram Alpha verknüpft somit beide Fragen Wo und Wann und kombiniert diese zu einem präzisen Ergebnis.


4.4.2 Wissenschaft und Forschung

Im Bereich der Physik lassen sich Maße, Einheiten, Größen miteinander kombinieren und mühelos umrechnen. Es reichen jedoch auch einfache Schlagworte aus. Eine Eingabe wie zum Beispiel 130 km/h liefert Einheitsumrechnungen, Vergleiche zu anderen ähnlichen Geschwindigkeiten und weiter Informationen die man in Zusammenhang bringen kann um somit dem Leser eine möglichst präzise Antwort zu liefern. Würde man jedoch die genaue Frage kennen, zum Beispiel was ist 130 km/h in Meilen pro Stunde (englisch: what is 30 km/h in miles per hour?", wäre die Frage so präzise das Wolfram Alpha diese auch genau beantworten würde. Eingabe von Elementen oder Stoffen liefert unzählige Informationen. Die Eingabe von Wasser (englisch: Water) liefert zum Beispiel entweder die Chemische Verbindung und weiter chemische Informationen.


Unabhängig vom Einsatzgebiet lassen sich Korrelationen herausfinden die so ohne größeren Aufwand nicht möglich wären. Möchte man zum Beispiel einmal die Korrelationen zwischen der Länge der Zugschienen und dem Bruttoinlandsprodukt aller Europäischen Länder erfahren, müsste man sich erst für alle Länder die benötigten Informationen besorgen und diese dann irgendwie so graphisch aufbereiten das man als Mensch die Information gut verarbeiten kann. Wolfram Alpha erledigt dies alles zusammen in einem Schritt und liefert direkt die graphische Aufbereitung.


4.4.3 Täglicher Informationsbedarf

Auch im Wirtschafts- und Finanzbereich lässt sich Wolfram Alpha einsetzen. Auch in diesen Gebieten sind präzise Informationen wichtig. Gibt man beispielsweise das Finanzsymbol MSTF für Microsoft ein, erscheinen zahlreiche wichtige wirtschaftliche Daten über dieses Unternehmen. Dazu gehören der aktuellen Aktienkurs, die Marktkapitalisierung des Unternehmens, die Zahl der Mitarbeiter, und vieles mehr. Gibt man noch ein weiteres Firmensymbol in die Suchmaske ein vergleicht Wolfram Alpha beide Unternehmen. Wolfram Alpha erkennt, dass beide Suchparameter vom gleichen Typ sind und bereitet das Ergebnis in einer Vergleichsform auf.

Aufgrund der mathematischen Grundlage von Wolfram Alpha kann es nahezu alle möglichen finanziellen Verarbeitungen/Berechnungen durchführen. Auch Zins- und Ratenzahlungen kann Wolfram Alpha verarbeiten. Durch Angabe eines Zinssatzes und der abzutragenden Last errechnet Wolfram Alpha alle möglichen Daten und stellt diese entweder numerisch oder graphisch dar. Rendite Betrachtungen von Anleihen lassen sich ebenfalls mühelos berechnen.


Weitere Möglichkeiten liegen auch im Bereich des Designs und der Kunst. Farben lassen sich kombinieren und "errechnen". Die Suchanfrage von Rot + Gelb liefert das Ergebnis Orange. Darüberhinaus noch viele weitere Informationen zu diesen Farben. Ein weiterer Bereich der Kunst ist die Musik. Wolfram Alpha kennt alle Noten und kann detaillierte Informationen diesbezüglich liefern. Diese lassen sich auch abspielen.


Der Bereich Gesundheit und Ernährung ist auch ein Gebiet wo Zahlen und Fakten eine Rolle spielen. Die Suchanfragen an Wolfram Alpha zu einem Glas Orangensaft zum Beispiel liefert Informationen über Makronährstoffe, Mikronährstoffe, Kalorien, etc. Und natürlich lässt sich alles weiterhin miteinander vergleichen. Die Eingabe "1l OJ vs. 1l water" liefert ein Vergleich beider Getränke/Flüssigkeiten in meist tabellarischer Form (englisch: OJ = orange juice). Allerdings ist für die Nahrungsinformation auch eine additive Suchanfrage sinnvoll. Wolfram Alpha kann auch dieses. Gibt man ein: "2 cups OJ + 1 slice cheddar cheese" (deutsch: Zwei Becher Orangensaft und eine Schreibe Cheddar Käse") addiert Wolfram Alpha direkt die Gesamt Nährstofffakten und bereitet dieses tabellarisch auf. So ist eine manuelle Zusammenrechnung zum Beispiel der Kalorien nicht nötig. Man erhält direkt das "gewünschte" Gesamtergebnis.


Eine analytische Funktion ist die Erkennung von Muster und Möglichkeiten. Stellt man Wolfram Alpha ein Wort mit fehlenden Buchstaben als Suchanfrage zur Verfügung, überprüft Wolfram Alpha die dazu passenden Worte. Durch die Eingabe von "ch__se" findet Wolfram Alpha drei passende Möglichkeiten in der Datenbank: "cheese" (deutsch: Käse), "choose" (deutsch: auswählen) und "chaise" (deutsch: verfolgen). Weitere Beispiele für alltägliche mathematische und statistische Funktionen wären die Wahrscheinlichkeiten von Münzwürfen oder Würfeln. Möchte man gerne wissen wie hoch die Wahrscheinlichkeit ist bei zehn Münzwürfen zweimal Kopf zu treffen. Wolfram Alpha berechnet das Ergebnis und bereitet es graphisch auf. Oder eine Sequenz von Zahlen die fortgeführt werden muss wie bspw. 3,7,15,31.

5 Fazit

5.1 Schlussbetrachtung

"Wolfram Alpha ist phantastisch, wenn es die Fakten hat, die man sucht." Problematisch dagegen ist, dass es bislang sehr oft keine Fakten hat. Wahlergebnisse, Regierungen, Unternehmer - nie davon gehört. Weinbergers skeptisches Zwischenfazit: "Die Frage ist, ob normale Anwender oft genug neue Anläufe starten, um zu erfahren, welche Fragen Wolfram Alpha beantworten kann. Falls nicht, wird es ein wunderbares Werkzeug für Experten bleiben, aber nicht zu dem allgemeinen Allzweckwerkzeug werden, das es sein will[27]."

Obwohl Wolfram Alpha schon viele Funktionen bietet ist es laut Gründer Stephen Wolfram ein Langzeitprojekt welches sich gerade einmal am Anfang befindet. Es wird versucht soviel Informationen und Wissen wie möglich einzuspeisen und zu verarbeiten. Alle Daten, Methoden, Algorithmen, Modelle, etc. welche sich in unserer Zivilisation bewiesen haben, sollen von überall aus, zu jeder Zeit und von jedem zugänglich gemacht werden. Um eine spezifische Frage beantwortet zu haben, muss lediglich in das Internet gegangen und Wolfram Alpha aufgerufen werden. Eine universelle Antwortmaschine.

Ein grundsätzliches Problem für deutsche Nutzer ist jedoch, dass Wolfram Alpha derzeit nur in englischer Sprache vorliegt. Es ist aber bereits angekündigt, dass auch andere Sprachen implementiert werden sollen. Es wird sehr deutlich, dass Wolfram Alpha aufgrund der Mathematica- Basis seine Stärken in Zahlen, Modellen und Algorithmen hat. Die Datenbasis ist derzeit noch in vielen Themengebieten schwach. Diese wird aber kontinuierlich erweitert.

Der Service von Wolfram Alpha soll noch weiter ausgebaut werden. Wolfram Alpha wird aber auch einen kostenpflichtigen Service anbieten, mit bspw. der Möglichkeit, die Ergebnisse nach Excel zu exportieren o.ä. Weiterhin hat Stephen Wolfram kein Interesse daran, den Dienst an andere Suchanbieter zu verkaufen, um deren Suchdienst auszuweiten[28].

Als problematisch erweist sich, dass Wolfram Alpha sich bei den Informationen zu Quellen der Ergebnisse zurückhält und nicht eindeutig ist, aus welcher Quelle welche Teile der Antwort stammen. Somit muss der Anwender der Berechnung / dem Ergebnis der Suche trauen. Dies ist aber auch bei anderen Suchdienten wie Google und vor allem bei Wikipedia auch der Fall[29].

Schließlich bleibt fraglich, ob Wolfram Alpha von einem durchschnittlichen Internetnutzer benutzt wird und wie häufig man auf die Berechnung bspw. mathematischer Gleichungen angewiesen ist. Deswegen wird Wolfram Alpha wohl nie zu einer Selbstverständlichkeit wie der Suchdienst von Google oder Wikipedia. Wolfram Alpha ist damit nicht wirklich alltagstauglich, obwohl Wolfram Research behauptet, alle Zielgruppen über alle Bevölkerungsschichten ansprechen zu wollen.

5.2 Ausblick

Abb. 24: Strukturierte Daten mit Hilfe von Google Squared (Länder)
Abb. 24: Strukturierte Daten mit Hilfe von Google Squared (Länder)

Mit der Veröffentlichung von Wolfram Alpha hat Stephen Wolfram gezeigt, dass die Möglichkeiten für Anwendungen und insbesondere Internetanwendungen noch lange nicht ausgereizt ist. Das Wissen der Menschheit wächst sekündlich und mit jeder Frage tauchen neue Fragen auf. Stephen Wolfram hat also eine "Maschine" entwickelt die versucht die rasant anwachsende Informationsflut zu verarbeiten und für den Menschen verständlich aufzubereiten. Unglücklich ist jedoch, dass die hinter Wolfram Alpha steckenden Informationen zum größten Teil von Menschen Hand eingepflegt wurden. Das Thema aus unstrukturierten Informationen strukturierte Informationen zu generieren bleibt offen. Auch wenn der Endanwender nicht mehr davon betroffen ist, so sind es die Mitarbeiter von Wolfram Alpha die strukturiert Informationen in der Datenbank hinterlegen, damit die computational knowledge engine ihren Dienst verrichten kann.

Die nächste Stufe wäre wohl eine Mischung aus Wolfram Alpha und Google Squared. Google Squared versucht aus den Weiten des Internets unstrukturierte Daten zu lesen und diese selbst zu strukturieren und in Tabellenform auszugeben. Das funktioniert nicht immer und erfordert auch eine ziemlich beschränkte Eingabe von Suchkriterien. Überschreitet die Semantik der Suche mehrere Worte wird dies selbst für den "allmächtigen" Google Algorithmus ein Problem. Einfach Suchen nach Planeten oder Früchten erledigt es allerdings problemlos.[30]

Würde diese strukturierte Datenlieferung von Google Squared mit den verarbeitenden Funktionen von Wolfram Alpha kombiniert, und käme dazu noch die Möglichkeit semantisch komplexe Anfragen im Sinne des Anwenders sinnvoll zu interpretieren, würde dies im wahrsten Sinne des Worte zu der "wahren" Wissensmaschine führen.

6 Anhang

6.1 Abkürzungsverzeichnis

AbkürzungBedeutung
ACSAlgorithmic computation system
APSAutomated presentation system
BIPBruttoinlandsprodukt
BMIBody Mass Index
CPUCentral Processing Unit
DCPData curation pipeline
DWIMMDo What I Might Mean
GDPGross Domestic Product
HTMLHyper Text Markup Language
IQIntelligenzquotient
km/hKilometer pro Stunde
LPSLinguistic Processing System
NRWNordrhein-Westfalen

6.2 Abbildungsverzeichnis

Abb.-Nr.Abbildung
1Beispiel einer semantischen Vernetzung
2Veranschaulichung einer Computational Knowledge Engine
3Eingabemaske bei der BMI Berechnung in Wolfram Alpha
4Quellinformationen einer Suchabfrage
5Weg der Quellinformationen zum Anwender
6Veranschaulichung eines Rechenbeispiels mit Wolfram Alpha
7Integralrechnung mit Wolfram Alpha
8Veranschaulichung eines von Vergleichen in Wolfram Alpha an Hand des GDPs von Frankreich und Italien
9Veranschaulichung von geographischen Kenntnissen von Wolfram Alpha
10Darstellung von Mehrfachselektion durch Wolfram Alpha bei ungenauer Parameterangabe
11Kombination verschiedener Ergebnisse zu einem Ergebnis durch Wolfram Alpha
12Veranschaulichung der Eingabe simpler Maße und dazugehöriger Einheiten
13Umrechnung einer Einheit in Wolfram Alpha
14Darstellung Chemischer Stoffe in Wolfram Alpha
15Korrelationsdarstellung mit Hilfe von Wolfram Alpha
16Vergleich zweier börsennotierter Unternehmen an Hand Ihrer Symbole mit Hilfe von Wolfram Alpha
17Darstellung einer Hypothek von 5% über 30 Jahre mit Hilfe von Wolfram Alpha
18Darstellung einer 5% Anleihe mit Hilfe von Wolfram Alpha
19Veranschaulichung von Farbkombinationen mit Wolfram Alpha
20Nährwertvergleich zwischen einem Glass Orangensaft und einem Glas Wasser mit Hilfe von Wolfram Alpha
21Additive Nährstoffangabe von 2 Gläsern Orangensaft und einer Scheibe Cheddar Käse
22Wortanalyse mit Wolfram Alpha
23Statistisches Beispiel mit Wolfram Alpha für die Wahrscheinlichkeiten beim Münzwurf
24Strukturierte Daten mit Hilfe von Google Squared (Länder)

6.3 Fußnoten

  1. Vgl. http://www.webhits.de/deutsch/index.shtml?webstats.html
  2. Vgl. http://www.spiegel.de/netzwelt/web/0,1518,623122,00.html
  3. Vgl. http://www.spiegel.de/netzwelt/web/0,1518,625407,00.html
  4. Vgl. http://www.spiegel.de/netzwelt/web/0,1518,625407,00.html
  5. Vgl. Fernges, 2007, S.7
  6. Vgl. http://www.philognosie.net/index.php/article/articleview/831/
  7. Vgl. Guha, McCool, & Miller, o.J., Seite 700-702
  8. Vgl. Fernges, 2007, S.8 f.
  9. S. http://www.adc-technologies.co.uk/images/stories/mi/warehouse1.gif
  10. Vgl. http://www.informationsarchiv.net/magazin/38
  11. Vgl. http://www.suchmaschinenkompetenz.de/Funktionsweise-Suchmaschine-Suchmaschinenkompetenz.htm
  12. S. http://www.designbetrieb.de/webdesign/suchmaschinenoptimierung.php
  13. Vgl. http://www.seowelt.de/blog/suchmaschinenmarketing/nutzt-meine-zielgruppe-suchmaschinen/
  14. S. http://www.wolframalpha.com/faqs.html
  15. Vgl. http://www.twine.com/item/122mz8lz9-4c/wolfram-alpha-is-coming-and-it-could-be-as-important-as-google
  16. Vgl. http://www.semanticuniverse.com/blogs-i-was-positively-impressed-wolfram-alpha.html
  17. Vgl. http://www.wolframalpha.com/faqs.html
  18. Vgl. http://www.topnews.de/wolfram-alpha-ist-online-351442
  19. Vgl. http://www.wolframalpha.com/about.html
  20. Vgl. http://bytesizebio.net/index.php/2009/05/09/test-driving-the-wolfram-alpha/
  21. Vgl. http://www.brightplanet.com/images/uploads/12550176481-deepwebwhitepaper.pdf
  22. Vgl. http://opus.kobv.de/zib/volltexte/2009/1220/pdf/ZR_09_39.pdf
  23. Vgl. http://bytesizebio.net/index.php/2009/05/09/test-driving-the-wolfram-alpha/
  24. Vgl. http://en.wikipedia.org/wiki/Data_grid
  25. Vgl. http://de.wikipedia.org/wiki/Wolfram_Alpha
  26. Vgl. http://www.wolframalpha.com/examples/
  27. S. http://www.spiegel.de/netzwelt/web/0,1518,625407,00.html
  28. Vgl. http://www.boston.com/business/technology/articles/2009/05/05/a_hungry_little_number_cruncher/?page=2
  29. Vgl. http://www.handelsblatt.com/technologie/it-internet/start-frei-fuer-wissensmaschine-wolfram-alpha;2277606;2
  30. Vgl. http://googleblog.blogspot.com/2009/06/square-your-search-results-with-google.html

6.4 Literatur- und Quellenverzeichnis

Bergman, M. (2001) Bergman, M. (2001): The Deep Web: Surfacing Hidden Value, http://www.brightplanet.com/images/uploads/12550176481-deepwebwhitepaper.pdf, 12.01.2010
Bray, H. (2009) Bray, H. (2009): A hungry little number cruncher, http://www.boston.com/business/technology/articles/2009/05/05/a_hungry_little_number_cruncher/?page=2, 13.01.2010
Gottwald, S. (2009) Gottwald, S. (2009): Die Wissensberechnungsmaschine Wolfram Alpha, http://opus.kobv.de/zib/volltexte/2009/1220/pdf/ZR_09_39.pdf, 09.01.2010
GRIN Verlag (2007) Fernges, D. (2007): Suchmaschinen-marketing
Guha, R. McCool, R. Miller E. o.J. Guha, R. McCool, R. Miller E. o.J.: Semantic Search, http://www.cs.uga.edu/~pdoshi/Courses/CSCI%204900_6900/GuhaSemanticWWW03.pdf
Henkel, M. (2009) Henkel, M. (2009): Semantische Suchmaschinen: Ist Google & Co. veraltet?, http://www.philognosie.net/index.php/article/articleview/831/, 07.01.2010
Komoroske, A. (2009) Komoroske, A. (2009): Square your search results with Google Squared , http://googleblog.blogspot.com/2009/06/square-your-search-results-with-google.html, 12.01.2010
Lenat, D., o.J. Lenat, D., o.J.: I was positively impressed with Wolfram Alpha, http://www.semanticuniverse.com/blogs-i-was-positively-impressed-wolfram-alpha.html, 07.01.2010
Lischka, K. (2009) Lischka, K. (2009): Suchmaschine Wolfram Alpha - Hype um den Wissenszwerg, http://www.spiegel.de/netzwelt/web/0,1518,625407,00.html, 04.01.2010
Lischka, K. / Kremp, M. (2009) Lischka, K. / Kremp, M. (2009): Suchmaschine Wolfram Alpha. Was der Google-Gegner weiß - und was nicht, http://www.spiegel.de/netzwelt/web/0,1518,623122,00.html, 04.01.2010
o.A. o.J. o.A. o.J.: Wolfram Alpha - About Page, http://www.wolframalpha.com/about.html, 12.01.2010
o.A. o.J. o.A. o.J.: Wolfram Alpha - Frequently Asked Questions (FAQs), http://www.wolframalpha.com/faqs.html, 07.01.2010
o.A. o.J. o.A. o.J.: Funktionsweise von Suchmaschinen, http://www.suchmaschinenkompetenz.de/Funktionsweise-Suchmaschine-Suchmaschinenkompetenz.htm, 21.12.2009
o.A. o.J. o.A. o.J.: Wikipedia Artikel: Data Grid, http://en.wikipedia.org/wiki/Data_grid, 12.01.2010
o.A. o.J. o.A. o.J.: Wikipedia Artikel: Wolfram Alpha, http://de.wikipedia.org/wiki/Wolfram_Alpha, 12.01.2010
o.A. o.J. o.A. o.J.: Wolfram Alpha - Examples, http://www.wolframalpha.com/examples/, 03.01.2010
o.A. o.J. o.A. o.J.: Suchmaschinenoptimierung (SEO), http://www.designbetrieb.de/webdesign/suchmaschinenoptimierung.php, 29.12.2009
o.A. (2009) o.A. (2009): Wolfram Alpha ist online, http://www.topnews.de/wolfram-alpha-ist-online-351442, 12.01.2010
o.A. (2009) o.A. (2009): Test driving the Wolfram Alpha, http://bytesizebio.net/index.php/2009/05/09/test-driving-the-wolfram-alpha/, 12.01.2010
o.A. (2009) o.A. (2009): Nutzt meine Zielgruppe Suchmaschinen?, http://www.seowelt.de/blog/suchmaschinenmarketing/nutzt-meine-zielgruppe-suchmaschinen/, 29.12.2009
o.A. (2009) o.A. (2009): Start frei für Wissensmaschine Wolfram Alpha , http://www.handelsblatt.com/technologie/it-internet/start-frei-fuer-wissensmaschine-wolfram-alpha;2277606, 12.01.2010
o.A. (2010) o.A. (2010): Web Barometrer, Stand: 13.01.2010, http://www.webhits.de/deutsch/index.shtml?webstats.html, 13.01.2010
Schwarz, T. (2008) Schwarz, T. (2008): Suchmaschinen Grundlagen - Arbeitsweise, Funktion und Bedeutung, http://www.informationsarchiv.net/magazin/38, 07.01.2010
Spivack, N. (2009) Spivack, N. (2009): Wolfram Alpha is Coming -- and It Could be as Important as Google (But It's Completely Different), http://www.twine.com/item/122mz8lz9-4c/wolfram-alpha-is-coming-and-it-could-be-as-important-as-google, 11.01.2010
Persönliche Werkzeuge