SEO-Strategien für Google
Aus Winfwiki
1 Titel
| Name der Autoren: | Robert Nietzke, Marco Tiel |
| Titel der Arbeit: | "SEO-Strategien für Google" |
| Hochschule und Studienort: | FOM Essen |
2 Inhaltsverzeichnis
Inhaltsverzeichnis |
3 Abkürzungsverzeichnis
| HTML | Hypertext Markup Language | |
| PHP | Hypertext Preprocessor | |
| o.V. | ohne Verfasser | |
| SEO | Search Engine Optimization (dt. Suchmaschinenoptimierung) | |
| SERP | Search Engine Result Page (dt. Ergebnisseiten der Suchmaschinen) | |
| URL | Uniform Resource Locator | |
| WWW | World Wide Web |
4 Abbildungsverzeichnis
| Abb. 1: | Suchmaschinen | ||
| Abb. 2: | Metasuchmaschine MetaGer | ||
| Abb. 3: | Beispiel von Google Anzeigen | ||
| Abb. 4: | SEO-Kreislauf | ||
| Abb. 5: | Marktanteile von Google in Deutschland | ||
| Abb. 6: | Architektur der Google-Suchmaschine | ||
| Abb. 7: | Eye Tracking der Suchmaschine Google | ||
| Abb. 8: | BMW HTML-Quelltext | ||
| Abb. 9: | Zirkelbezug bei der Verlinkung | ||
| Abb. 10: | Auszug eines Google Analytics Reports |
5 Tabellenverzeichnis
| Tab. 1: | Einfluss der Verzeichnistiefe auf Bedeutung und Crawling |
6 Einführung
In der Informationsgesellschaft bietet das Internet der Informations- und Kommunikationstechnologie unbegrenzte Möglichkeiten. Das Informationsangebot im World Wide Web (WWW) hat in den letzten Jahren rasant zugenommen. Vorsichtigen Schätzungen zufolge verdoppelt sich die Zahl der Webauftritte weltweit innerhalb von sechs Monaten.[1] Die exponentiell wachsenden Informationen im WWW haben dazu geführt, dass Suchmaschinen zu einem nahezu unverzichtbaren Instrument zur Bewältigung der Informationsflut werden. Ohne Suchmaschinen wäre diese Informationsmenge nicht mehr beherrschbar und die gezielte Suche nach Informationen quasi undenkbar. Einer repräsentativen Umfrage der Bertelsmann Stiftung nach, gaben 91 Prozent der Befragten an, zumindest gelegentlich Suchmaschinen zu nutzen.[2] Einer ComScore Studie nach wurden im Dezember 2007 weltweit 66,2 Milliarden Suchanfragen getätigt.[3] Somit gehören Suchmaschinen zu den meist besuchtesten Seiten im WWW. Aufgrund dessen und der weiteren Steigerung der Suchmaschinen-Nutzung gewinnt insbesondere die Suchmaschinenoptimierung zunehmend an Bedeutung. Eine Website die nicht in Suchmaschinen gefunden wird, schöpft das Besucherpotenzial nicht aus. Jede Webpräsenz muss aber grundsätzlich das Ziel haben seine Besucherzahlen zu maximieren. Der Markt der Suchmaschinen hat einen rasanten Konzentrationsprozess hinter sich. Innerhalb der letzten Jahre hat sich die Suchmaschine Google eine überragende Stellung erarbeitet. Google kontrolliert mit seinem derzeitigen Marktanteil quasi das World Wide Web.
Vor diesem Hintergrund ist die vorliegende Arbeit auf Google fokussiert und hat das Ziel Methoden und Techniken für die Suchmaschinenoptimierung bei der Suchmaschine Google vorzustellen. Es sollen sowohl die positiven und negativen Einflussfaktoren als auch Maßnahmen zur Verbesserung des Suchergebnisses herausgestellt werden. Hierbei kommen der Aufbereitung von Webdokumenten, der Suchmaschinen-Architektur sowie der verwendeten Gewichtungsverfahren eine besondere Bedeutung zu.
Zu Beginn der Arbeit wird zunächst einführend auf das Themengebiet der Suchmaschinen und der Suchmaschinenoptimierung eingegangen, wobei wichtige Zusammenhänge erläutert und für das Verständnis der Arbeit notwendige Begriffe definiert werden. Anschließend wird ein kürzer Überblick über die Suchmaschine Google gegeben. Im den darauffolgenden Kapiteln sollen ausgewählte Kriterien und Methoden zur Onpage- und Offpage-Optimierung vorgestellt werden. Im vorletzten Kapitel werden Methoden zur Überwachung und Kontrolle der Suchmaschinenoptimierung aufgezeigt. Im letzten Kapitel werden die wesentlichen Erkenntnisse der gewonnenen Informationen zusammengefasst und ein Ausblick auf die Zukunft gegeben.
7 Grundlagen
7.1 Suchmaschinen
Grundsätzlich sind Suchmaschinen "[...] umfangreiche Computerprogramme, mit denen man im Web systematisch suchen kann."[5] Suchmaschinen geben nach Eingabe von Suchbegriffen eine Suchergebnisliste zurück. Die Suchergebnisliste enthält Verweise auf – nach Auffassung der Suchmaschine – relevante Dokumente. Je nach Art der Suchmaschine sind die Verweise mit dem Titel des Dokuments sowie einem automatisch generierten Auszug oder einer manuell eingepflegten Beschreibung dargestellt. Suchmaschinen bzw. Suchdienste unterscheiden sich im Hinblick auf den Aufbau des Datenbestands sowie in der Methodik der Relevanzbeurteilung in vier Grundtypen:[6]
- Roboter-Suchmaschinen
- Metasuchmaschinen
- Webkataloge
- Payed Placement Suchmaschinen
Neben diesen Grundtypen haben sich weitere, spezielle Suchmaschinen herauskristallisiert. Hier sind insbesondere Weblog-Suchmaschinen wie beispielsweise Technorati[7] zu nennen, die Weblog-Inhalte durchsuchen. Nachfolgend werden grundlegende Aspekte der Suchmaschinen-Typen behandelt um ein besseres Verständnis der Gesamtzusammenhänge zu erreichen.
Roboter-Suchmaschinen
Roboter (engl. Robots), oftmals auch Crawler oder Spider genannt, sind "[...] auf extreme Hochleistung getrimmte Systeme, die laufend das World Wide Web und andere Elemente des Internet analysieren."[8] Erlhofer definiert diese Art von Suchmaschinen als "[...] indexbasierte Softwareprogramme, die automatisch das World Wide Web durchsuchen und somit ihren Datenbestand stetig und selbstständig erweitern."[9]
Die bekannteste und meistgenutzte Suchmaschine Google ist vom Typ Roboter. Das hat mit dazu beigetragen, dass im allgemeinen Sprachgebrauch der Begriff Suchmaschine mit diesem Grundtyp gleichgesetzt wird. Oftmals wird dieser Typ auch automatisierte Suchmaschine[10] genannt. Alle derzeit neben Google wichtigen Suchmaschinen wie beispielsweise Yahoo, Bing, MSN, oder Ask.com lassen sich dem Typ Roboter zuordnen. Das rasante Wachstum des WWW hat es erforderlich gemacht automatisierte Verfahren einzusetzen und die menschliche Tätigkeit durch Software zu ersetzen. Anders wäre die gigantische Informationsmenge auch gar nicht zu bewältigen. Theoretisch können Roboter-Suchmaschinen das gesamte WWW erfassen. Roboter-Suchmaschinen bestehen i.d.R. aus drei Systemkomponenten:[11]
- 1. Webrobot-System:
- Das Webrobot-System ist für die Datengewinnung zuständig. Die Daten werden zum Aufbau eines Datenbestands aus dem WWW generiert. Eine weitere Funktion besteht darin, bereits vorhandene Webdokumente hinsichtlich ihrer Existenz sowie auf Veränderungen zu überprüfen.
- 2. Information Retrieval System:
- Roboter-Suchmaschinen basieren auf Information Retrieval Systemen, welche anhand der vom Webrobot-System gefundenen Webdokumente durchsuchbare Datenstrukturen aufbauen. Der Begriff retrieval (dt. Wiedergewinnung) sagt, dass Informationen in großen Datenbeständen zunächst verloren sind und wieder gewonnen werden müssen. Information Retrieval Systeme analysieren Textdokumente über spezielle Methoden und weisen ihnen mit Hilfe von automatisierten Verfahren Gewichte zu. Diese Gewichte gelten in Bezug auf einen Deskriptor und spielen hinsichtlich der Suchmaschinenoptimierung eine wichtige Rolle. Die Zuordnung der Deskriptoren wird als Indexierung bezeichnet.
- 3. Query Processor:
- Der Query-Processor stellt die Schnittstelle zum User dar, welche im allgemeinen Sprachgebrauch als Suchmaschine bezeichnet wird. Nachdem der User seine Suchanfrage an die Suchmaschine gerichtet hat, greift der Query Processor auf den Index des Retrievalsystems zu und liefert dem User eine zu der Suchanfrage passende Suchergebnisliste zurück, die nach absteigender Relevanz geordnet ist.
Die Suchmaschinenoptimierung ist ausgerichtet auf den Typ Roboter, da dieser frei von manuellen Eingriffen ist und durch die automatisierten Verfahren jedes Webdokument gleich behandelt wird.
Metasuchmaschinen
Metasuchmaschinen stellen einen weiteren Grundtyp von Suchmaschinen dar und lassen sich wie folgt definieren:
"Metasuchmaschinen sind dadurch gekennzeichnet, dass sie über keinen eigenen Datenbestand verfügen, sondern gezielt auf die Daten anderer Suchmaschinen und Webkataloge zugreifen. Eine Metasuchmaschine ist ein Recherchetool, das über eine eigene Benutzeroberfläche verfügt, Suchanfragen jedoch via HTTP-Request an verschiedene Suchmaschinen und Webkataloge sendet. Sie greift dabei auf den Datenbestand der anderen Suchdienste zu, fragt sie parallel ab und agregiert die zurückgelieferten Suchergebnisse in einer eigenen Suchergebnisliste. Dabei werden doppelte Ergebnisse eliminiert und eigene mathematische und statistische Kriterien zur Bestimmung der Rangreihenfolge angewendet."[13]
Eine der bekanntesten deutschen Metasuchmaschinen ist MetaGer[14], die über deutschsprachige Suchdienste sucht. Zu den Vorteilen dieses Suchmaschinen-Typs gehören die unterschiedlichen Datenbasen der Suchdienste, die zu umfangreicheren Suchergebnissen führen. Die Auswahl und Anzahl an relevanten Dokumenten erhöht sich erheblich.[15] Hier ist zu beachten, dass ein besserer Grad an Vollständigkeit (Recall) zu einem schlechteren Grad an Genauigkeit (Precision) bzw. Ballast führt.[16] Ein weiterer Vorteil sind die umfangreichen Einstellungsmöglichkeiten für den User. Die gewünschten Suchdienste können vorher ausgewählt werden. Nachteilig wirkt sich die Performance von Metasuchmaschinen aus. Die Ergebnisse müssen zusammengetragen und aufbereitet werden, weshalb die Antwortzeiten nicht mit den schnellen Roboter-Suchmaschinen konkurrieren können.[17]
Für die Suchmaschinenoptimierung haben Metasuchmaschinen eine geringe Bedeutung. Dies liegt zum einen an den vernachlässigbaren Marktanteilen von Metasuchmaschinen und zum anderen an der Relevanzbeurteilung der Verweise. Oftmals wird die Relevanzbeurteilung einfach von den verwendeten Suchmaschinen übernommen. Dies bedeutet letztendlich, dass eine hohe Relevanz bei Roboter-Suchmaschinen auch die Relevanz für die Metasuchmaschinen verbessert.
Webkataloge
Webkataloge, oftmals auch Webverzeichnisse genannt, sind thematisch geordnete Linklisten, die hierarchisch in einzelne Rubriken gegliedert sind. Der Suchende kann entweder über die Rubriken vom Allgemeinen zum Speziellen gelangen und dadurch seinen gewünschten Themenkomplex erreichen oder eine Suchfunktion nutzen, die eingetragene Websites nach den eingegebenen Suchbegriffen durchsucht.[18]
Das besondere an Webkatalogen ist die manuelle Pflege des Datenbestands. Erweitert wird der Datenbestand durch Redakteure, die Websites ohne automatisierte Verfahren hinzufügen. Die Redakteure können selbst nach potenziellen Websites suchen oder sie prüfen eingesendete Vorschläge hinsichtlich der Aufnahmekriterien wie Qualitätsstandards, Bezug zur Rubrik etc. Vorschläge können bei den meisten Webkatalogen grundsätzlich von jedem unterbreitet werden. Bei einigen Webkatalogen ist eine vorherige Registrierung notwendig. Die vorgeschlagene Website wird anhand eines Webformulars an die Redakteure übermittelt. Bestandteil der Übermittlung sind i.d.R.:
- der URL (Uniform Resource Locator) der Website,
- der Titel der Website,
- eine Beschreibung der Website,
- die vorgeschlagene Rubrik.
Viele Webkataloge verlangen außerdem die Angabe einer gültigen E-Mail-Adresse sowie einer Kontaktperson. Bei der Eintragung in einen Webkatalog gibt es unterschiedliche Möglichkeiten des Listings, d.h. Variationen hinsichtlich der Art und Weise wie der Eintrag aufgenommen und dargestellt wird. Viele Webkataloge verlangen außerdem die Angabe einer gültigen E-Mail-Adresse sowie einer Kontaktperson. Bei der Eintragung in einen Webkatalog gibt es unterschiedliche Möglichkeiten des Listings, d.h. Variationen hinsichtlich der Art und Weise wie der Eintrag aufgenommen und dargestellt wird. Während Befürworter der Webkataloge die intellektuelle Bewertung und damit die höhere Präzision der Suchergebnisse als klaren Vorteil gegenüber den Roboter-Suchmaschinen ansehen, weisen Kritiker darauf hin, dass von Menschen gepflegte Linklisten nicht dem Wachstum des World Wide Webs standhalten können.[19]
Im Hinblick auf die Suchmaschinenoptimierung sind Webkataloge ein nützliches Instrument, insbesondere beim Aufbau der sogenannten Linkpopularität. Des Weiteren sind die Datenbestände vieler Webkataloge mit anderen Suchdiensten verflochten. So nutzt beispielsweise das Google Verzeichnis die Datenbestände des Open Directory Project[20].
Payed Placement Suchmaschinen
Payed Placement, oftmals auch Payed Listing genannt, bezeichnet den Kauf von Rangpositionen, die bei vielen Suchmaschinen und Webkatalogen an speziellen Bereichen erscheinen.[22] Häufig erscheinen die Platzierungen unmittelbar vor den eigentlichen Suchergebnissen oder am rechten Rand der Suchergebnisliste und sind i.d.R. durch einen Hinweis, wie beispielsweise durch das Wort Anzeigen, oder eine farbliche Hervorhebung zu erkennen. Die nachfolgende Abbildung soll dies an dem Suchbegriff Kfz-Versicherung veranschaulichen. Während Google mit seinem AdWords-Programm[23] schon immer auf eine klare und deutliche Trennung zwischen bezahlten Platzierungen und Ergebnissen gesetzt hat, war die Trennung bei anderen Suchmaschinenbetreibern wie Microsoft mit MSN (Microsoft Network)[24] nicht immer eindeutig. Der Grund hierfür ist, dass verschleierte Werbeformen auch höhere Klickraten bewirken.[25] Inzwischen sind aber auch bei MSN und anderen großen Suchmaschinen die bezahlten Platzierungen klar gekennzeichnet. Die Idee zum Verkauf von Platzierungen hatte erstmals das Unternehmen Goto.com. Goto.com versteigerte die Platzierungen über eine Online-Auktion.[26] Obwohl Payed Placement grundsätzlich nicht für eine Suchmaschinenoptimierung notwendig ist, stellt sie doch eine interessante Alternative dar.
7.2 Suchmaschinenoptimierung
Der Begriff Suchmaschinenoptimierung kann leicht missverstanden werden, da er eine Optimierung von Suchmaschinen suggeriert. Es werden hierbei aber keine Suchmaschinen optimiert sondern vielmehr Webdokumente für Suchmaschinen. Im allgemeinen Sprachgebrauch bedeutet Suchmaschinen-Optimierung, die Inhalte und Struktur einer Website gezielt zu verändern, sodass sie bei Suchmaschinen eine obere Rangposition erhält.[27] Kaiser versteht unter Suchmaschinenoptimierung die Optimierung von Seiten im Internet für eine bessere Platzierung in den redaktionellen Ergebnissen der Suchmaschinen und weist explizit darauf hin, dass der Begriff nicht den Kauf hoher Platzierungen bei Suchmaschinen umfasst.[28] Eine häufig verwendete Abkürzung für Suchmaschinenoptimierung und den entstandenen Berufszweig[29] ist SEO (engl. Search Engine Optimization). Der Begriff SEO wird oftmals auch für Search Engine Optimizer benutzt. Search Engine Optimizer entwickeln Optimierungsverfahren, um Website-Anbietern durch eine an die Suchalgorithmen angepasste Aufbereitung der Inhalte eine höhere Trefferquote bei Suchmaschinen zu ermöglichen.[30]
Weitere verwendete Begriffe für Suchmaschinenoptimierung sind Suchmaschinen- Promotion bzw. Web-Promotion, Weboptimierung oder Web-Ranking. Die Suchmaschinenoptimierung lässt sich dem Oberbegriff Suchmaschinen-Marketing (engl. Search Engine Marketing bzw. SEM) zuordnen. Kaiser versteht unter Suchmaschinen-Marketing alle Internetmarketing-Maßnahmen, die die Funktion der Suchmaschinen nutzen, um höhere Besucherzahlen zu erzielen, um so neue Kunden zu gewinnen und letztlich die Umsatzzahlen zu steigern. Neben der Suchmaschinenoptimierung enthält das Suchmaschinen-Marketing als zweites Instrument das bereits in Kapitel 7.1 beschriebene Payed Placement, das oftmals auch als Keyword-Advertising bezeichnet wird.[31]
Eine erfolgreiche Suchmaschinenoptimierung ist nur durch eine strukturierte Arbeitsweise möglich und stellt einen fortlaufender Prozess beispielsweise in Form eines Kreislaufes dar, wie nebenstehende Abbildung zeigt.
Website- und Keywordanalyse
Der erste Schritt einer erfolgreichen Suchmaschinenoptimierung liegt in einer umfangreichen Analyse. Zuerst wird ein Status Quo der zu optimierenden Homepage angefertigt. Anschliessend erfolgt als Basis der Optimierung eine Keywordrecherche, die verbunden ist mit einer Wettbewerbsanalyse.
Onpage-Optimierung
Die Onpage-Optimierung bezeichnet alle Optimimierungsmaßnahmen die direkt an einer Homepage vorgenommen werden. Um eine Homepage suchmaschinenfreundlicher zu gestalten, muss das Profil geschärft und etwaige Programmierungen, die Topplatzierungen entgegenwirken, ausgebessert werden. Dabei handelt es sich häufig um substanzielle Änderungen der Webseit, die im Sinne einer erfolgreichen Optimierung korrigiert werden müssen. Wichtig ist, dass der Programmiercode fehlerfrei und nach neusten Stand der Technik programmiert ist. Dazu wird die Webseite zunächst ausführlich analysiert und daraufhin ein Maßnahmenkatalog erstellt und umgesetzt.
Offpage-Optimierung
Die Offpage-Optimierung dient dem Ziel, eine umfangreiche Backlinkstruktur der Website aufzubauen. Um die Linkpopularität einer Homepage nachhaltig zu stärken und damit die Platzierungen zu verbessern, werden Linkverweise auf die entsprechende Webseite geschaffen. Dies funktioniert u.a. durch Linkpartnerschaften oder Verlinkungen von Partnerseiten.
Monitoring und Tracking
Ein wesentlicher Bestandteil einer erfolgreichen Suchmaschinenoptimierung ist die kontinuierliche Betreuung der Homepage. Durch ständiges Beobachten der Statistiken und Reports, die Aussage über die Ranking-Positionen und Besucherzahlen auf der Homepage sowie über weitere wichtige Daten der Webseite geben. Die laufenden Modernisierungen der Suchmaschinen sowie die sich häufig ändernden Ranking-Kriterien bedingen regelmäßige Überarbeitungen und Anpassungen.[33]
7.3 Suchmaschine Google
Die Suchmaschine Google resultierte aus einem akademischen Projekt der Google-Gründer Lawrence Page und Sergey Brin. Als Doktoranden der Computerwissenschaft trafen sich Page und Brin erstmals 1995 an der Universität Stanford in Kalifornien.[34]
Die Erfolgsstory von Google beginnt im Jahr 1996. Page und Brin nehmen ihre Arbeit an einer neuartigen und mächtigen Suchmaschine auf. Sie beschrieben im Rahmen ihrer Arbeiten die mathematisch-theoretischen Grundlagen und implementierten ein erstes Suchmaschinensystem auf der Grundlage ihrer Technik. Der Google-Prototyp mit dem Namen BackRub hatte die damals einzigartige Fähigkeit sog. Backlinks (Verweise auf ein Webdokument) auszuwerten. Page hatte die innovative Idee die Anzahl und Qualität der Backlinks eines Webdokuments zu analysieren und daraus die Platzierung der Webdokumente in der Suchergebnisliste abzuleiten. Ein Webdokument ist bei dem von ihm entwickelten Verfahren umso wichtiger, je mehr andere Webdokumente darauf verweisen und je höher die Qualität der verweisenden Webdokumente ist. Die Qualität wird dabei anhand eines Algorithmus bestimmt. In Anlehnung an seinen Familiennamen und die untersuchten Webdokumente benannte Page den elementaren Bestandteil der Suchtechnologie PageRank. Während damalige Suchmaschinen nur die Wörter einer Suchanfrage mit den Wörtern in den Webdokumenten verglichen, wurde mit PageRank eine neue Dimension eingeführt. Zum ersten Mal konnten User bei der Suche sehr schnell auf relevante Ergebnisse zugreifen, die in einer logischen Reihenfolge angeordnet waren.[35]
Im Jahr 1998 veröffentlichten Page und Brin ihre Arbeit[36] The Anatomy of a Large-Scale Hypertextual Web Search Engine in der sie die Systemkomponenten und den PageRank-Algorithmus ihres Prototypen vorstellten. Für die Wissenschaft und andere Suchmaschinenbetreiber stellt dieses Werk eine wichtige Grundlage dar.[37]
Nachdem Page und Brin ihre Suchmaschine im ersten Halbjahr 1998 verfeinerten, wollten sie Interessenten für ihre neuartige Suchtechnologie gewinnen. Obwohl der Zeitpunkt aufgrund des damaligen Dotcom-Fiebers günstig war, äußerten potentielle Investoren Desinteresse. So befand beispielsweise der Yahoo-Gründer David Filo die Suchtechnologie für grundsolide, empfahl jedoch für das Wachstum des Suchdienstes ein Unternehmen zu gründen. Page und Brin entschieden sich aufgrund des Desinteresses eigene Wege zu beschreiten. Doch auch hierfür war Startkapital notwendig. Andreas von Bechtolsheim, Mitbegründer von Sun Microsystems, erkannte das große Potenzial und stellte nach einer kurzen Demonstration der Technologie einen Scheck in Höhe von 100.000 US Dollar auf ein Unternehmen mit dem Namen Google Inc. aus. Da dieses Unternehmen noch nicht existierte, konnte der Scheck erst eingelöst werden, nachdem alle Formalitäten zur Gründung erledigt waren. Page und Brin gelang es durch ihre Familien, Freunde und weitere Investoren ein Startkapital von nahezu einer Million US Dollar für das neue Unternehmen aufzubringen. Schließlich wurde am 7. September 1998 das Unternehmen Google Inc. als klassisches Garagen-Startup mit Sitz in Menlo Park, Kalifornien, gegründet. Das Wort Google stellt im Amerikanischen die umgangssprachliche Form des Wortes Googol dar. Der Ausdruck wurde im Jahr 1938 von Milton Sirotta erdacht. Der damals neunjährige Sirotta sollte für seinen Onkel, den amerikanischen Mathematiker Edward Kasner, einen Namen für die Zahl 10¹ºº finden. Der Name Googol war ursprünglich für das neue Unternehmen geplant, um damit das Ziel zu symbolisieren, eine Suchmaschine mit einem größtmöglichen Datenbestand zu realisieren. Aufgrund eines Schreibfehlers wurde aus Googol der Name Google.[38]
Google stellt heute die mit Abstand führende Suchmaschine im WWW dar und hat sich innerhalb weniger Jahre von einem Garagen-Startup zu einem sehr profitablen Global Player entwickelt.
Die Suchmaschine Google ist für Millionen von Menschen nicht mehr aus dem Alltag wegzudenken. Stellvertretend für die Suche im Internet steht das Wort googlen, welches als reguläres Verb im Duden und als to google im amerikanischen Webster’s Dictionary sowie im englischen Oxford Dictionary aufgeführt ist.
Die Tatsache, dass der Name des Unternehmens im Englischen und Deutschen und in anderen Sprachen zu einem Verb geworden ist, lässt seinen Einfluss auf die globale Kultur erkennen.[40] Bereits 2002 wurde das Verb to google von der American Dialect Society zum nützlichsten Wort des Jahres gewählt.[41] Somit ist Google zu einer der einflussreichsten Marken weltweit geworden und besitzt in Deutschland einen Marktanteil von über 80 Prozent, wie nebenstehende Abbildung veranschaulicht.
7.3.1 Technik von Google
Die Architektur der Suchmaschine wurde in der für Google grundlegenden Arbeit The Anatomy of a Large-Scale Hypertextual Web Search Engine[43] von Brin und Page dargestellt. Es ist verständlich, dass die ursprüngliche Systemzusammenstellung an die fortschreitende Entwicklung im WWW angepasst wurde und auch weiterhin modifiziert wird. Die genaue aktuelle Systemzusammenstellung wird von Google geheim gehalten. Für ein besseres Verständnis der Grundprinzipien stellt die Veröffentlichung von Brin und Page jedoch eine wichtige Basis dar. Abbildung 6 zeigt schematisch, wie Webdokumente beschafft, verarbeitet und gespeichert werden.
Bevor eine Auswertung von Webdokumenten stattfindet, müssen diese zunächst aus dem WWW beschafft werden. Hierfür ist das Webrobot-System zuständig, welches oftmals auch als Webcrawler-System[44] bezeichnet wird. Google setzt mehrere als Googlebot bezeichnete Crawler ein, die Webdokumente nach Erhalt von durch URL Server bereitgestellte URL-Listen herunterladen und an die Store Server senden. Die Store Server komprimieren die Webdokumente und speichern diese im Repository ab. Jedes Webdokument das von Google erfasst wird, erhält eine Identifikationsnummer, die sog. docID. Die Indexierung wird durch den Indexer und den Sorter realisiert. Der Indexer liest das Repository, dekomprimiert die Webdokumente und wandelt diese mit Hilfe eines Parsers in einen Satz von Wortvorkommen um, welche hits genannt werden. Die hits speichern neben den Wörtern auch die Position von diesen Wörtern im Webdokument sowie einen Näherungswert für die Schriftgröße. Durch den Indexer werden die hits in die sog. Barrels verteilt, wodurch eine teilweise Vorsortierung (Forward Index) erreicht wird. Eine weitere wichtige Funktion des Indexer ist die Analyse der Linkstruktur eines Webdokuments. Wichtige Informationen für Google sind die Herkunft von Links, das Linkziel und der Linktext. Diese Informationen werden in der Anchors-Datei abgelegt. Der URL Resolver liest die Anchors-Datei und wandelt unter gleichzeitiger Vergabe einer docID relative URLs in absolute um. Der Linktext wird, verbunden mit der docID, auf die der Linktext zeigt, in den vorsortierten Index gesetzt. Die durch den URL Resolver erzeugte Linkdatenbank (Links) wird genutzt um den PageRank für alle Webdokumente zu berechnen. Der Sorter vewendet die Barrels, um diese nach wordIDs neu zu sortieren und dadurch einen invertierten Index (Inverted Index) zu erzeugen. Der Sorter erstellt auch eine Liste mit wordIDs und versetzt diese in den invertierten Index. Ein Programm vermischt diese Liste mit dem Lexicon, das durch den Indexer erstellt wurde und erzeugt ein neues Lexicon, das vom Searcher genutzt wird. Der Searcher ist durch einen Webserver realisiert und nutzt neben dem Lexikon den invertierten Index sowie die PageRank-Werte, um Suchanfragen der User zu beantworten.[45]
7.3.2 Ranking von Google
Die Platzierung in der Suchergebnisliste entscheidet über die Anzahl der zu erwartenden Besucher. Der Großteil der User begnügt sich mit der ersten Seite der Suchergebnisliste. So wurde bereits 2001 in einer von der Firma Netbooster Web Positioning in Auftrag gegebenen Studie[47] festgestellt, dass rund 80 Prozent der User nur die ersten beiden Seiten der Suchergebnisliste einsehen und den weiteren Seiten keine Beachtung schenken. In einem Laborexperiment[48] der Bertelsmann Stiftung wurde in mehr als 80 Prozent der Suchsequenzen sogar nur die erste Seite der Suchergebnisliste beachtet. In der Standardeinstellung von Google und vieler anderer Suchmaschinen werden 10 Treffer je Seite angezeigt. Es ist daher zwingend erforderlich zumindest unter den Top 20 platziert zu sein. Neuere Studien zeigen, dass die konkrete Position in der Suchergebnisliste darüber entscheidet, ob ein User den Treffer beachtet oder überhaupt nicht wahrnimmt.[49] Die amerikanischen Suchmaschinen-Marketing-Agenturen Enquiro und Did-it.com untersuchten in Zusammenarbeit mit der Softwarefirma Eyetools wie die Suchergebnisliste vom Auge wahrgenommen wird.[50] Die Ergebnisse des Eye Tracking (Blickbewegungsregistrierung) sind in Abbildung 5 dargestellt.
PageRank
PageRank stellt das Herzstück der Google-Technologie dar und ist der wichtigste Einzelfaktor hinsichtlich der Auswahl, der von Google indizierten Webdokumente.[51] Aufgrund seiner zentralen Bedeutung für das Ranking ist eine detaillierte Kenntnis dieses Verfahrens für die Suchmaschinenoptimierung unabdingbar. PageRank ist ein Warenzeichen von Google. Das Verfahren wurde von der Stanford University patentiert (United States Patent 6,285,999).[52]
Das PageRank-Verfahren "[...] basiert auf der in der akademischen Welt geltenden Prämisse, dass die Wichtigkeit einer Forschungsarbeit daran gemessen werden kann, wie oft sie in anderen Arbeiten zitiert wird."[53]
Die grundlegende Idee des Verfahrens geht zurück auf Eugene Garfield und die Arbeit an wissenschaftlichen Zitationsindexen. Garfield nimmt an, dass durch das Zitieren einer Quelle die Wertschätzung für diese Quelle ausgedrückt wird. Indem die Häufigkeit der Zitierungen berücksichtigt wird, lässt sich der Wert der zitierten Quelle ableiten.[54] Die eigentliche Herausforderung für Google bestand darin, das Grundprinzip auf das WWW zu übertragen. Im einfachsten Fall wird mit dem Verfahren der sog. Linkpopularität (engl. Link-Popularity) die Bedeutung eines Webdokuments anhand der Anzahl an Hyperlinks gemessen, die von anderen Webdokumenten darauf verweisen.
Da die Linkpopularität bereits vor Googles Durchbruch vereinzelt eingesetzt wurde.[55] und heute bei vielen Suchmaschinen zum Einsatz kommt, wird oftmals das PageRank-Verfahren mit der Linkpopularität gleichgesetzt. Wie Erlhofer darstellt, werden bei der reinen Linkpopularität allerdings ausschließlich quantitative Aspekte des hypertextuellen Mediums betrachtet. Das Grundprinzip der Bewertung stellt Google selbst wie folgt dar:
"[...] interpretiert PageRank einen Link von Seite A auf Seite B als Votum für Seite B durch Seite A. Anschließend bewertet PageRank die Wichtigkeit einer Seite anhand der erzielten Voten."[56]
In dieser Form kann die Linkpopularität bereits einigermaßen objektiv die Gewichtung von Webdokumenten messen. Allerdings ist das Verfahren anfällig gegenüber Manipulationsmaßnahmen. So könnte beispielsweise ein Website-Betreiber Millionen Webdokumente automatisiert erstellen, die lediglich zur Erhöhung der Linkpopularität dienen und damit die Popularität eines Webdokuments vortäuschen. Um dies zu verhindern berücksichtigt das PageRank-Verfahren nicht nur die Anzahl der eingehenden Verweise, sondern zusätzlich die Güte bzw. Qualität der Verweise:
"PageRank berücksichtigt auch die Wichtigkeit jeder Seite, die ein Votum abgibt, da die Voten von einigen Seiten einen höheren Wert haben und deshalb auch der Seite, auf die der Link verweist, einen höheren Wert geben. Wichtige Seiten werden von PageRank höher eingestuft und demnach auch in den Suchergebnissen an einer vorderen Position aufgeführt. Die Google-Technologie nutzt zur Ermittlung der Wichtigkeit einer Seite die kollektive Intelligenz des Internets. Keiner unserer Mitarbeiter greift persönlich in diesen Prozess ein oder manipuliert die Ergebnisse, weshalb die Nutzer auf Google als objektive Informationsquelle vertrauen, die frei ist von bezahlten Platzierungen."[57]
PageRank unterscheidet sich von Zitationsanalysen folglich durch die zusätzlicheBewertung der Wichtigkeit der Webdokumente, die Empfehlungen abgegeben haben. Die Gewichtung einer Empfehlung ist davon abhängig, welchen PageRank und damit wie viele eigene Empfehlungen das verweisende Webdokument erhalten hat. Der PageRank stellt dabei einen numerischen Wert dar, der durch einen Algorithmus berechnet wird.[58]
PageRank-Algorithmus
Der ursprüngliche PageRank-Algorithmus von Brin und Page wurde verständlicherweise an die fortschreitende Entwicklung im WWW angepasst und wird auch hinsichtlich zukünftiger Erfordernisse modifiziert werden. Für die Suchmaschinenoptimierung ist das ursprüngliche Konzept aber immer noch grundlegend.[59]
Der ursprüngliche Algorithmus wurde von den Google-Gründern wie folgt definiert:
PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))[60]
Hierbei ist:[61]
PR(A) = der PageRank Wert von A berechnet aus allen eingehenden Verweisen.
A = das Dokument für den der PageRank Wert ermittelt wird.
d = ein Dämpfungsfaktor zwischen 0 und 1 (oftmals ~ 0,85).
PR(T1) = der PageRank Wert des Dokuments T1 das auf A verweist.
C(T1) = die Gesamtanzahl aller ausgehenden Verweise von T1.
"PR(TN)/C(Tn) bedeutet, dass der Verweiswert für jede Seite die auf A zeigt, aus dem PageRank der Seite n, unter Berücksichtigung der Anzahl aller ausgehenden Verweise von Tn berechnet wird."[62]
Die Formel verdeutlicht, dass es sich beim PageRank-Verfahren um eine iterative Berechnung des Wertes PR(A) handelt, da die Berechnung des Wertes für Webdokument A alle PageRank-Werte PR(n) derjenigen Webdokumente erfordert, die auf A verweisen. Ein neues Webdokument besitzt zunächst keinen PageRank-Wert, weshalb neu indexierten Webdokumenten ein initialer Wert zugeordnet wird. Der Dämpfungsfaktor d kann einen Wert zwischen 0 und 1 aufweisen und wird manuell definiert. In Brin und Page wird als regulärer Dämpfungsfaktor 0,85 verwendet. Der Faktor stellt im Rahmen des Algorithmus eine Individualisierungsvariable dar und reflektiert den Faktor, den ein Webdokument einem anderen Webdokument von dem eigenen PageRank-Wert vererben kann. Es soll damit eine Feineinstellung der Berechnungsmethode erreicht werden, so dass ein Webdokument mit einem Verweis nicht seinen vollen PageRank-Wert weiterreichen kann.[63]
8 Onpage-Optimierung
Als Onpage-Optimierung werden alle Optimierungen an dem eigentlichen Dokument bezeichnet. D.h. Onpage-Optimierung bezieht sich konkret auf den Inhalt und Aufbau von Webdokumenten.
8.1 Keywords
Eine zentrale Aufgabe im Rahmen der Onpage-Optimierung ist die Auswahl von geeigneten Keywords. Damit ein Webdokument überhaupt in der Suchergebnisliste aufgeführt werden kann, müssen die Suchbegriffe zwingend im Text bzw. im Verweistext anderer Webdokumente enthalten sein. Google weist darauf explizit hin: "Die Suchmaschine von Google analysiert auch den Inhalt von Seiten. Anstatt nur den seitenbasierten Text einzulesen (der über Metatags von Website-Publishern manipuliert werden kann), wird aber der gesamte Inhalt einer Seite unter Berücksichtigung von Faktoren wie Schriftarten, Unterteilungen und der genauen Position aller Begriffe analysiert. Google analysiert außerdem den Inhalt der benachbarten Websites, um sicherzustellen, dass die ausgegebenen Ergebnisse die Suchanfrage des Nutzers am treffendsten beantworten."[64]
Ein Website-Betreiber muss Keywords wählen, die den Inhalt eines Webdokuments optimal repräsentieren und gleichzeitig häufig von Usern bei der Suche eingegeben werden.[65] Es ist hierzu erforderlich sich in die Lage der User hineinzuversetzen, da die Keywords, die einem Website-Betreiber spontan einfallen, oftmals nicht mit den von Usern gesuchten Begriffen übereinstimmen. Erlhofer weist auf die Gefahr einer Betriebsblindheit hin.[66] Eine detaillierte Kenntnis über die angebotenen Produkte und Dienstleistungen, die fokussierte Zielgruppe sowie spezifische Fachausdrücke und die entsprechenden Synonyme als auch ihre umgangssprachlichen Bezeichnungen ist für die Auswahl von geeigneten Keywords wichtig. Die wichtigste Frage für einen Website-Betreiber lautet daher: "… welche Begriffe verwenden potentielle Kunden, wenn sie mein Produkt oder meine Dienstleistung suchen?"[67]
Die Suchmaschinenoptimierung wird nutzlos, wenn eine Top-Platzierung mit bestimmten Keywords erreicht wurde, aber kein User diese Keywords verwendet. Es ist deshalb erforderlich das größte Suchvolumen zu finden.[68] Hierzu eignen sich spezielle Keyword-Tools wie beispielsweise das Keyword-Tool von Google Adwords[69] oder Miva[70], um die Keywordwertigkeit zu bestimmen.
Website-Betreiber begehen oftmals den Fehler Webdokumente für zu viele verschiedene Keywords zu optimieren. Sie erhoffen sich davon, bei möglichst vielen Suchanfragen von Google berücksichtigt zu werden. Im Allgemeinen kann ein Webdokument aber nur für einige wenige Keywords eine Top-Platzierung erreichen, da der Term Frequency Algorithmus Webdokumente bevorzugt, die nur ein Thema bzw. einige wenige Themen behandeln und mit einigen wenigen Keywords abbilden. Glöggler nennt circa drei bis fünf Keywords, die verstärkt je Webdokument verwendet werden sollen um die Gewichtung für diese Keywords zu steigern. Wird diese Vorgabe eingehalten, wird ein Webdokument zwar nur für einige wenige Variationen von Suchanfragen berücksichtigt, es erreicht aber eine deutlich höhere Platzierung, was folglich zu einer insgesamt höheren Besucherzahl führt.[71]
8.2 HTML
Eine Webseite ist in den Kopf- und Körper-Bereich eingeteilt. Im Kopf-Bereich sind die beschreibenden Informationen einer Webseite, diese werden durch den HTML (Hypertext Markup Language) <head></head> begrenzt. In diesem Bereich findet man die Meta-Tags. Der Meta-Tag hat zwei wichtige Attribute. Das eine ist name und das andere content. Für Suchmaschinen-Crawler ist nur das name-Attribut mit dem dazu gehörigen content-Attribut interessant. Die wichtigsten name-Attribute sind keywords, author, description und date. Früher wurden keyword Meta-Tags von den Suchmaschinen für die Keywords einer Seite herangezogen. Da dies jedoch häufig missbraucht wurde, nutzen die großen Suchmaschinen diese Methode heute nicht mehr für das Ranking. Der Inhalt des content-Attributs und des description Meta-Tags wird von Suchmaschinen als beschreibender Text auf der SERP ausgegeben. Die im titel-Tag stehenden Informationen werden in der SERP (Search Engine Result Page) als Link zu der Seite dargestellt. So ist der Titel-Tag und der description Meta-Tag die Entscheidungsgrundlage der Besucher auf der SERP, ob sie die Seite besuchen oder nicht. Hinzu kommt, dass der Inhalt des titel-Tags von Suchmaschinen bei der Relevanz von Keywords stark berücksichtigt wird. [73] Die nebenstehende Abbildung zeigt als Beispiel einen Auszug des HTML-Quelltext der BMW Website.
Im body-Tag sollten alle Möglichkeiten von HTML zur Strukturierung und Auszeichnung genutzt werden. Denn Keywords welche in den Überschriften-Tags (h1 bis h6) oder in den Tags der differenzierten Textauszeichnung stehen, werden bei der Relevanzbewertung stärker gewichtet. Zur differenzierten Textauszeichnung gehören die Tags mit denen man Textpassagen oder Wörter kursiv (<i>), fett (<b>), unterstrichen (<u>) oder betont (<em> <strong>) darstellt. Um Inhalte von Bildern erfassen zu können, benötigen Crawler alternative Texte, die erfasst und verwertet werden können. Hierbei hilft das alt-Attribut für alternativen Text des img-Tags, denn dieses wird ausgewertet. [74]
Das Dokument sollte aus syntaktisch richtigem HTML bestehen[75], da das Information Retrieval System der Suchmaschine sonst Probleme haben könnte, das Dokument richtig auszuwerten.
8.3 Inhalt
Neben dem Dokumententitel ist vor allem der Dokumentenkörper bei der Onpage-Optimierung ein wichtiger Bereich hinsichtlich der Relevanzbeurteilung. Innerhalb des <BODY>-Tags ist der Fließtext enthalten. Dieser muss, passend zum Thema des Webdokuments, die entsprechenden Keywords aus der erstellten Keyword-Liste enthalten. Die Gewichtungsmodelle beachten hierbei die relative Worthäufigkeit sowie die Lage und Auszeichnung von Keywords. Wie hoch die relative Worthäufigkeit bzw. Keyword-Dichte (engl. Keyword Density) gewählt werden soll, lässt sich nicht generell festlegen. Werden die Keywords zu häufig eingesetzt, droht eine Abstrafung aufgrund von Keyword-Stuffing. Ist die Keyword-Dichte dagegen zu gering, kann Google das Webdokument als nicht relevant genug einstufen. Glöggler empfiehlt als Obergrenze für eine erlaubte relative Keyword-Dichte im Dokumentenkörper 10 bis maximal 15 Prozent.[76] Speziell für Google kann diese Grenze als zu hoch angesehen werden. Erlhofer nennt einen Wert zwischen drei und acht Prozent.[77] Obwohl die Keyword-Dichte mit speziellen Tools sehr einfach gemessen werden kann, ist es im Allgemeinen nicht möglich festzustellen, ob eine Platzierung durch die Keyword-Dichte oder andere Faktoren zustande gekommen ist.
Für einen Website-Betreiber ist es nach Erstellung des Inhalts wichtig, zu prüfen, welche Keywords am häufigsten im Webdokument auftreten. Dadurch lässt sich erkennen, ob bestimmte Keywords ungewollt sehr häufig im Text auftreten oder ob der Anteil bestimmter Keyword-Kombinationen zu gering ist. Des Weiteren ist darauf zu achten, dass der Seiteninhalt für den Besucher ansprechend und verständlich ist. Die eigentliche Anforderung besteht darin, eine Seite mit hochwertigem Inhalt zu erstellen und diesen für eine Suchmaschine zu optimieren.
8.4 Interne Verlinkungen
Eine gute Verlinkung der einzelnen Seiten einer Webseite untereinander hilft den Besucherstrom zu lenken. Hierbei ist aber zu beachten, dass wegen seiner Konzeption der PageRank nicht an unwichtige Seiten wie z. B. Impressum weitergegeben werden sollte. Hier wird die Methode des PageRank-Sculptings genutzt. Dabei werden ganze Links oder Webseiten für den Crawler als nicht weiter zu verfolgen gekennzeichnet. Dies macht man, indem man dem rel-Attribut des anchor-Tags den Wert nofollow zuweist. Diese Methode wird auch von PageRank Siloing genutzt, hier geht es aber darum, eine Website in mehrere Inhaltskategorien einzuteilen. Hier ist aber dann der Zweck, die einzelnen Silos von einander abzutrennen, da diese für verschiedene Keywords optimiert sind. An statt mit nofollow Dokumente auszuschließen, ist dies auch mit dem Robots Exclusion Protocol und einer robots.txt genannten Datei möglich.[78]
"Google analysiert außerdem den Inhalt der benachbarten Websites, um sicherzustellen, dass die ausgegebenen Ergebnisse die Suchanfrage des Nutzers am treffendsten beantworten."[79]
9 Offpage-Optimierung
Die Offpage-Optimierung wird im Gegensatz zu der Onpage-Optimierung nicht direkt auf den Inhalt bzw. Aufbau eines Webdokuments angewendet[80], sondern auf bestimmte Umgebungsbedingungen[81]. Eine hohe Linkpopularität bzw. ein hoher PageRank-Wert stellen zwar anfrageunabhängige Faktoren[82] dar, für ein gutes Ranking bei Google sind diese aber unverzichtbar. Nachfolgend werden zentrale Methoden der Offpage-Optimierung vorgestellt.
9.1 Hosting
Bevor eine Website zur Verfügung gestellt werden kann, muss sich der Website-Betreiber zunächst für eine geeignete Webhosting-Lösung entscheiden. Die Vor- und Nachteile der geläufigsten Webhosting-Lösungen sollen im Folgenden besprochen werden:[83]
- Eigener Webserver:
- Der Website-Betreiber nutzt einen eigenen Webserver, für dessen Unterbringung und Administration er selbstständig verantwortlich ist. Vorteilhaft ist hierbei die Unabhängigkeit von Dritten. Der Website-Betreiber muss sich allerdings auch um Sicherheitsaspekte wie z. B. Einbruch, Brand und unterbrechungsfreie Stromversorgung bemühen sowie die Kosten für eine schnelle Anbindung an das Internet übernehmen. Berücksichtigt man diese Aspekte lohnt sich der Aufwand eines eigenen Webservers für die Mehrzahl der Website-Betreiber nicht.
- Webhosting-Paket bei einem Webhoster:
- Bei einem ausgewählten Webhoster erhält der Website-Betreiber ein oftmals hinsichtlich des Speicherplatzes und des Trafficvolumens eingeschränktes Paket auf einem Webserver, welcher mit anderen Kunden geteilt werden muss. Diese Aufteilung ist hinsichtlich der Suchmaschinenoptimierung ein entscheidender Nachteil, da es sich technisch um einen sog. virtuellen Webserver handelt und somit viele andere, nicht beeinflussbare, Websites unter derselben IP-Adresse verwaltet werden. Versuchen beispielsweise Website-Betreiber des Servers die Suchmaschinen mit Spam-Techniken zu täuschen, kann sich dies negativ auf andere Websites auswirken, ohne dass diese etwas verschuldet haben.
- Root-Server bei einem Webhoster:
- Dem Website-Betreiber wird ein eigener Webserver zur Verfügung gestellt, dessen Administration er selbstständig vornehmen muss. Der Website-Betreiber ist der alleinige Administrator (root) und hat daher alle Rechte. Vorausgesetzt der Website-Betreiber verfügt über das entsprechende Know-How zur Administration eines Webservers, sind Root-Server hinsichtlich der Suchmaschinenoptimierung sehr empfehlenswert.
- Managed-Server bei einem Webhoster:
- Analog zu einem Root-Server wird auch bei dem sog. Managed-Server ein eigener Server zur Verfügung gestellt. Allerdings wird hier die Administration vom Webhoster vorgenommen, so dass der Website-Betreiber nur eingeschränkte Rechte besitzt. Managed-Server sind i.d.R. teurer als Root-Server, da dem Website-Betreiber die Pflege und Wartung abgenommen wird. Managed-Server sind für den Zweck der Suchmaschinenoptimierung ebenfalls sehr geeignet.
- Kostenlose Hosting-Angebote:
- Der kostenlose Service wird meist über eingeblendete Werbung finanziert und unterliegt zahlreichen Einschränkungen. Neben langen und ungeeigneten Domainnamen kann oftmals auch die Geschwindigkeit dieser kostenlosen Angebote nicht mit professionellen Lösungen konkurrieren. Ein weiteres Problem ergibt sich, wenn der kostenlose Service im Laufe der Zeit eingestellt wird und damit die aufgebaute Linkpopularität verloren geht. Diese Form des Webhostings ist hinsichtlich der Suchmaschinenoptimierung grundsätzlich nicht geeignet. Ein wichtiger Aspekt der bei der Auswahl einer Webhosting-Lösung berücksichtigt werden muss, ist die ständige Verfügbarkeit sowie das Antwortzeitverhalten des Webservers. Suchmaschinen können nur Webdokumente indexieren, die auch erreichbar sind. Erreichen die Google-Crawler ein Webdokument mehrfach nicht, kann dies eine Löschung aus dem Index nach sich ziehen. Bei einem längerfristigen Serverausfall kann gar die komplette Website gelöscht werden. Ein nicht erreichbares Webdokument ist insbesondere ärgerlich, wenn eine Top-Platzierung in Google erreicht wurde, da die potenziellen Besucher dann nicht auf die entsprechende Information bzw. das Produkt aufmerksam gemacht werden können und somit das eigentliche Ziel der Suchmaschinenoptimierung nicht erreicht wird.
Besucher können auch verloren gehen wenn die Antwortzeit zu lange ist. So empfiehlt beispielsweise Tabke, dass innerhalb von drei bis vier Sekunden jeder Request beantwortet werden sollte, da sonst für jede weitere Sekunde 10 Prozent der Besucher abgezogen werden können.[84] Dieser Wert kann bereits über Erfolg oder Misserfolg einer Website entscheiden.
9.2 Aktualität
Es wurde bereits beschrieben, dass die Aktualität von Webdokumenten von Google hinsichtlich der Wiederbesuchsfrequenz der Crawler sowie der Relevanz berücksichtigt wird. Google honoriert es, wenn ein Webdokument aktuelle Inhalte präsentiert. Dies ist neben der guten Verlinkung beispielsweise einer der Hauptgründe, weshalb Weblogs sehr oft auf vorderen Suchergebnisplatzierungen anzutreffen sind.
Dagegen ändern sich die Inhalte von vielen Firmenwebsites oftmals über Monate nicht. Teilweise wird angenommen, dass die identische Datei täglich neu auf den Webserver kopiert werden kann und somit Google das letzte Änderungsdatum berücksichtigt. Diese Vorgehensweise hat keinerlei Vorteile, da mit Hilfe eines Hashwerts überprüft werden kann, ob tatsächlich eine inhaltliche Änderung stattgefunden hat.[85].
Ein Website-Betreiber muss demzufolge bestrebt sein, die Webdokumente regelmäßig inhaltlich zu ändern. Ist dies in der Praxis nicht möglich, sollte zumindest ein Zeitstempel in das Webdokument integriert werden. Hierzu kann bei statischen Webdokumenten beispielsweise ein einfaches Script erstellt werden, welches automatisch per Cronjob das aktuelle Datum integriert, während bei dynamisch erstellten Webdokumenten die Umsetzung mittels PHP (Hypertext Preprocessor) oder einer vergleichbaren Sprache erfolgen kann. Weiterhin eignen sich beispielsweise Statistiken wie die aktuelle Besucherzahl um den Crawlern regelmäßig und mit wenig Aufwand veränderte Inhalte zu präsentieren. Weitaus empfehlenswerter ist es, dass der Website-Betreiber Zeit in die Aktualisierung der Texte investiert, damit auch die Besucher einen Anreiz haben, die Website regelmäßig zu besuchen und somit die Chance steigt, durch Verweise die Linkpopularität bzw. den PageRank-Wert zu steigern.[86].
9.3 Verzeichnistiefe
Die Verzeichnistiefe hat Einfluss auf die Bedeutung eines Webdokuments und damit auch auf die Wiederbesuchsfrequenz durch Webcrawler. Die Startseite ist auf der obersten Ebene (Root-Ebene) einer Website angesiedelt und hat folglich die höchste Bedeutung für Google. Mit jeder weiteren Verzeichnisebene sinkt die Bedeutung der Webdokumente in diesen Ebenen. Nachfolgendes Beispiel soll dies verdeutlichen:
| URL | Verzeichnisebene | Bedeutung | Crawling |
| www.domain.de/kunst.html | 0 | höher | häufiger |
| www.domain.de/kunst/kunst.html | 1 | ||
| www.domain.de/kunst/kunstsparten/kunst.html | 2 | ||
| www.domain.de/kunst/kunstsparten/fotografie/kunst.html | 3 | geringer | seltener |
Tab. 1: Einfluss der Verzeichnistiefe auf Bedeutung und Crawling [87]
Ein Website-Betreiber nimmt oftmals eine Verschachtelung vor, damit er sich innerhalb seiner Websites bzw. seines FTP-Programms besser zurecht findet. Dies ist verständlich, es sollte aber bei Webdokumenten die gut platziert werden sollen, konsequent darauf verzichtet werden, da sonst wertvolle Ranking-Punkte verloren gehen. Im Beispiel könnte das am stärksten verschachtelte Webdokument (Verzeichnisebene 3) auch in der höchsten Ebene platziert werden. Hierfür würde sich ein Dateiname wie kunst-fotografie.html anbieten. Dies hat den Vorteil, dass Google das Webdokument höher einstuft und inhaltliche Änderungen schneller erfasst werden. Google arbeitet nach dem Prinzip der Tiefensuche. Hierbei bewegen sich die Crawler einen Ast bis zum letzten Webdokument hinunter, um anschließend zur höher liegenden Ebene zurückzukehren und auf einem Alternativweg erneut nach unten zu gehen. Obwohl es dadurch möglich ist eine komplette Website zu erfassen, sollten nicht zu viele Verzeichnisebenen verwendet werden. Erlhofer empfiehlt beispielsweise maximal zwei bis drei Verzeichnisebenen.[88]
9.4 Linkpopularität
Das Prinzip der Linkpopularität und das PageRank-Verfahren wurden in Kapitel 7.3.2 vorgestellt. Dieses Gewichtungsverfahren ist schwer durch den Website-Betreiber beeinflussbar, da nur durch die Mithilfe anderer Website-Betreiber eine hohe Anzahl qualitativ hochwertiger eingehender Verweise möglich ist. Google baut deshalb besonders auf dieses Gewichtungsverfahren:"Webmaster können im Allgemeinen die Platzierung ihrer Website verbessern, indem sie die Anzahl an qualitativ hochwertigen Websites, die auf ihre Seiten verweisen, erhöhen."[89]
Für einen Website-Betreiber stellt sich die Frage, welche Möglichkeiten es grundsätzlich gibt, um die Linkpopularität von Webdokumenten zu erhöhen. Nachfolgend sollen diese Möglichkeiten vorgestellt werden:[90]
- Natürliches Linkwachstum:
- Hierbei wird nicht versucht eine hohe Anzahl an Verweisen durch Tausch oder Kauf zu erwerben, sondern mit Hilfe von interessanten Inhalten den anderen Website-Betreibern einen Anreiz zu bieten, auf die eigenen Webdokumente zu verweisen. Erlhofer führt beispielsweise das sog. KAKADU-Prinzip ins Feld, nachdem Kostenlose Informationen, Aktuelles, Künstlerisches, Außergewöhnliches, Downloads und nicht zuletzt auch Unerlaubtes Faktoren sind, die für die Linkpopularität förderlich sind. Unter Unerlaubtem versteht Erlhofer keine illegalen Inhalte, sondern vielmehr den Bruch gesellschaftlich anerkannter Normen.
- Kostenlose Links:
- Eine empfehlenswerte Methode kostenlos und effektiv die Linkpopularität zu erhöhen ist die Eintragung in Webkataloge. Insbesondere eine Eintragung in das Open Directory Project ist empfehlenswert, da sowohl Googles Verzeichnis als auch zahlreiche andere Verzeichnisse auf dem frei verfügbaren Datenbestand des ODP aufbauen und der Verweis somit auf vielen anderen Webdokumenten erscheint. Google bewertet es sehr hoch, wenn eine Website in das ODP aufgenommen wurde. Dies ist verständlich, wenn berücksichtigt wird, dass freie Editoren jeden Eintrag prüfen und dadurch bedenkliche bzw. irrelevante Websites nicht aufgenommen werden. Neben den renommierten Webkatalogen, sollten auch die weniger bekannten Webkataloge berücksichtigt werden. Grundsätzlich ist jeder Verweis zur Steigerung der Linkpopularität wertvoll. Weitere Möglichkeiten kostenlose Links zu erhalten sind angezeigte Signaturen in Foren oder Kommentare in Weblogs. Oftmals können auch Freunde und Bekannte einen Verweis auf ihrer Website setzen.
- Kostenpflichtige Links:
- Der hohe Stellenwert des PageRank-Verfahrens führte dazu, dass es mittlerweile unzählige Anbieter solcher kostenpflichtigen Services gibt.
- Tausch von Links mit Linkpartnern:
- Sehr verbreitet ist der Tausch von Links mit anderen Website-Betreibern. Im Gegensatz zu kostenpflichtigen Links ist kein finanzieller Aufwand notwendig. Als Gegenleistung wird ein Backlink auf das gewünschte Webdokument des Linkpartners gesetzt. Gegenseitig verlinkte Webdokumente können von Google als Zirkelbezug interpretiert und nicht gewertet werden. Ein Zirkelbezug entsteht, wenn ein Webdokument wieder direkt oder indirekt auf das verweisende Webdokument verlinkt. In nebenstehender Abbildung 8 wird das Webdokument D wieder auf A verlinkt, wodurch ein Zirkelbezug entsteht und somit keines der Webdokumente von der Verlinkung profitiert. Google ist in der Lage Zirkelbezüge über mehrere Webdokumente hinweg zu erkennen. Bei einem Tausch mit Linkpartnern sollte darauf geachtet werden Zirkelbezüge zu verhindern.[92]
10 Monitoring und Controlling
Nachdem Webdokumente in den Index von Google aufgenommen wurden, ist es notwendig kontinuierlich die Existenz sowie die Platzierungen in der Suchergebnisliste über den gesamten Lebenszyklus der Website hinweg zu beobachten (Monitoring) bzw. zu steuern (Controlling).[93]
Mit Hilfe des Monitoring und Controlling ist ein Website-Betreiber in der Lage aus dem Index gelöschte Webdokumente mit zeitnahen Maßnahmen zu reindexieren und verschlechterte Rangpositionen mit veränderten Optimierungsmaßnahmen zu verbessern. Glöggler stellt die Bedeutung des Monitoring und Controlling besonders heraus: "Das Monitoring und Controlling von Websites darf [...] nicht als ein notwendiges Muss betrachtet werden, sondern es stellt ein wichtiges Kriterium zur dauerhaft erfolgreichen Indexierungsstrategie dar."[94]
Nachfolgend sollen die zentralen Aspekte des Monitoring und Controlling besprochen werden, bevor der hierfür von Google bereitgestellten Service Google Analytics vorgestellt wird.
10.1 Standard Methoden
- Server Monitoring
- Eine Überwachung der Erreichbarkeit von Webdokumenten ist aus mehreren Gründen notwendig. Wurde ein Webdokument noch nicht indexiert, führt die Nichterreichbarkeit dazu, dass die Google-Crawler das Webdokument nicht abrufen können und folglich kann es auch nicht in den Datenbestand aufgenommen werden. Bei einem bereits indexierten Webdokument kann eine häufige Nichterreichbarkeit dazu führen, dass die betreffende URL aus dem Index von Google gelöscht wird. Weiterhin muss berücksichtigt werden, dass nicht erreichbare Webdokumente, die gut platziert sind, potentielle Besucher außen vor lassen. Die Suchmaschinenoptimierung wäre in diesem Fall nutzlos. Es wird deutlich, dass eine ständige Verfügbarkeit des Webservers unabdingbar ist. Mit Hilfe des Server Monitoring kann entweder manuell oder automatisiert die Erreichbarkeit überprüft werden. In der Praxis wird hierzu häufig Software eingesetzt, welche in kurzen regelmäßigen Abständen das Antwortverhalten von bestimmten Ressourcen oder Protokollen überprüft. Der Website-Betreiber erhält dann beispielsweise über E-Mail oder SMS eine Benachrichtigung.
- Logfile-Analyse
- Mit Hilfe der Logfile-Analyse kann der Erfolg der Suchmaschinenoptimierung überprüft werden. Logfiles sind Textdateien die von Webservern automatisch erstellt werden. Der Webserver protokolliert darin Anfragen (HTTP-Requests), die jeweils als Zeile in der Datei aufgeführt sind. Die Logfiles können mit speziellen Analyse-Programmen ausgewertet werden, wodurch sich interessante Erkenntnisse ableiten lassen. Ein Website-Betreiber kann entweder auf die vom Webhoster zur Verfügung gestellte und bereits aggregierte und visualisierte Form der Auswertung zurückgreifen, oder er installiert und nutzt eines der zahlreichen Logfile-Analyse-Programme wie beispielsweise AWStats oder Webalizer.[95] Die Analysemöglichkeiten können in quantitative und qualitative Analysen unterteilt werden.[96] Mit quantitativen Analysen sollen u.a. folgende Aspekte ermittelt werden:
- Besucher (Visits): Die Anzahl der Besucher ist im Hinblick auf den Erfolg einer Website natürlich eine entscheidende Kenngröße. Es werden hierbei oftmals Zeiträume[97] definiert, nach deren Ablauf eine identische IP-Adresse als neuer Besucher gewertet wird.
- Seitenaufrufe (Page Impressions): Die Seitenaufrufe repräsentieren, wie häufig auf eine Ressource zugegriffen wurde, d.h. wie viele HTTP-Requests im Logfile aufgezeichnet wurden. Im Gegensatz zu den Besuchern wird die IP-Adresse hierbei nicht berücksichtigt. Wenn ein User zehnmal hintereinander ein Webdokument abruft, ergeben sich folglich zehn Seitenaufrufe. Die Zahl der Seitenaufrufe ist daher immer größer als die Zahl der Besucher. Die Kenngrößen können i.d.R. pro Tag, Woche, Monat oder Jahr dargestellt werden.
- Weitere quantitative Kenngrößen sind das Transfervolumen (Traffic) und die fehlerhaft oder unvollständig übertragenen Webdokumente. Eine besondere Bedeutung für die Suchmaschinenoptimierung haben qualitative Analysen. Hierzu zählen u.a. die Herkunft von Verweisen und Top Suchbegriffe.
- Rank Monitoring
- Eine weitere wichtige Aufgabe im Rahmen der Suchmaschinenoptimierung ist die permanente Beobachtung der Platzierungen in der Suchergebnisliste. Verschlechtern sich die Platzierungen müssen die entsprechenden Optimierungsmaßnahmen verstärkt bzw. überprüft werden. Das Rank Monitoring kann entweder manuell oder automatisiert erfolgen. Die manuelle Variante bietet sich vor allem bei kleineren Websites an, da hier relativ wenige Webdokumente im Datenbestand von Google sind und der Aufwand noch vertretbar ist. In der Praxis wird das optimierte Keyword bzw. die Keyword-Kombination als Suchanfrage an Google gerichtet und anschließend die Platzierung des Webdokuments ermittelt.
- Bei größeren Websites ist die manuelle Methode aufgrund des hohen Aufwandes nicht mehr empfehlenswert. Für automatisierte Abfragen bieten sich eine Vielzahl von Programmen und frei verfügbaren Online-Tools an. Bei dem Einsatz von diesen Programmen sind die Hinweise und Richtlinien[98] von Google für Webmaster zu beachten.
10.2 Google Analytics
Mit Google Analytics[99] stellt Google eine sehr umfangreiche Webanalyse-Lösung bereit, die für das Monitoring und Controlling geeignet ist. Der Service ist für Website-Betreiber mit einem aktiven Google-AdWords-Konto kostenlos verfügbar. Ist kein aktives Google-AdWords-Konto vorhanden, kann der Service bis maximal 5 Mio. Seitenaufrufe pro Monat kostenfrei genutzt werden. Voraussetzung für die Nutzung ist aber in jedem Fall ein Google-Konto. Aufgrund der großen Nachfrage beschränkt Google die Zahl der Neuanmeldungen. Interessenten können Name und E-Mail hinterlassen und werden dann von Google eingeladen. Es kann deshalb durchaus mehrere Monate dauern bis der Service genutzt werden kann. Im Gegensatz zu der in Kapitel 10.1 vorgestellten Logfile-Analyse verwendet Google Analytics keine Logfiles. Der Website-Betreiber bindet auf jedem Webdokument, das analysiert werden soll, einen von Google zur Verfügung gestellten Tracking-Code ein. Dies hat den Vorteil, dass sämtliche Daten auf den Rechnern von Google gespeichert werden und somit keine Ressourcen des Website-Betreibers beanspruchen. Google Analytics bietet über 80 Berichte[100] mit denen u.a. folgende Fragen beantwortet werden können:
- Woher kommen die Besucher und wie agieren sie auf der Website?
- Wie sehen die genauen Traffic-Muster/-Tendenzen auf den Websites aus?
- Welche Keywords ziehen Interessenten an und wandeln sie in Kunden um?
- Weshalb verlassen so viele Besucher die Website, ohne die beabsichtigten Aktionen auszuführen?
- Gibt es Elemente im Design der Website, die Besucher abschrecken?
- Welcher Website-Content interessiert die Besucher am meisten?
Die Berichte werden von Google-Analytics einer Funktion im Unternehmen zugeordnet, d.h. leitende Angestellte, Marketingverantwortliche und Webmaster können sehr schnell auf die jeweiligen Berichte zugreifen. Nebenstehende Abbildung soll einen Einblick in die Google Analytics Report geben und stellt einen Auszug dar.
11 Fazit
Das Ziel dieser Arbeit war es aufzuzeigen, welche Faktoren die Relevanz von Webdokumenten bei der Suchmaschine Google beeinflussen und mit welchen Maßnahmen die Platzierungen in den Suchergebnislisten verbessert werden können. Nach einer Einführung in das Themengebiet wurden die Besonderheiten des Gewichtungsverfahren der Suchmaschine Google vorgestellt, die bei der Onpage- und Offpage-Optimierung berücksichtigt werden müssen. Abschließend wurden Möglichkeiten beschrieben, um den Prozess der Suchmaschinenoptimierung zu beobachten und zu steuern. Es konnte belegt werden, dass für das Ranking bei Google insbesondere folgende Aspekte entscheidend sind:
- PageRank und Linkpopularität:
- Im Rahmen von Googles PageRank-Verfahren wird ein Webdokument dann als wichtig für eine Suchanfrage betrachtet, wenn eine hohe Anzahl an qualitativ hochwertigen eingehenden Verweisen vorhanden ist. Die Relevanz für eine Suchanfrage ist dabei umso höher, je eher der Verweistext mit dem Inhalt des verlinkten Webdokuments und der Suchanfrage übereinstimmt. Bei der Linkpopularität ist vor allem die Distanz von Webdokumenten entscheidend.
- Keyword-Strategie und Inhalte:
- Eine umfassende Keyword-Strategie ist bereits vor Erstellung der Webdokumente festzulegen. Das ausgewählte Keywordspektrum muss dann konsequent im Titel des Webdokuments, im Dokumentenkörper, in den internen und externen Verweisen sowie möglichst in den URLs der Webdokumente vorkommen. Dabei gilt es insbesondere die relative Worthäufigkeit und den Abstand von Keywords bei Keyword-Kombinationen zu beachten. Des Weiteren sollte der Website-Betreiber auf interessante, ausreichend lange und gut strukturierte Inhalte achten, die zur Vermeidung von Duplicate Content im WWW einzigartig sein sollten.
Auffällig ist bei Googles Relevanzbeurteilung die Fokussierung auf Offpage-Faktoren. Ohne einen ausreichend hohen PageRank-Wert ist es derzeit nicht möglich bei sehr umkämpften Suchbegriffen eine Top-Platzierung zu erreichen. Bei weniger umkämpften Suchbegriffen bzw. Keyword-Kombinationen lassen sich dagegen bereits mit einer Onpage-Optimierung sehr gute Platzierungen erzielen.
Zusammenfassend lässt sich feststellen, dass die Suchmaschinenoptimierung von Webdokumenten in den letzten Jahren zunehmend an Bedeutung gewonnen hat. Viele Website-Betreiber erkennen, dass die speziellen Anforderungen der Suchmaschinen bei der Realisierung einer Website berücksichtigt werden müssen. Die Suchmaschinenoptimierung hat sich zu einem komplexen Prozess entwickelt. Vorbei sind die Zeiten in denen einige Meta-Tags für vordere Platzierungen ausreichten. Ein generelles Erfolgsrezept für eine Top-Platzierung existiert nicht. Es gilt eine Vielzahl an Faktoren und Umgebungsbedingungen zu berücksichtigen, weshalb die Suchmaschinenoptimierung grundsätzlich von Experten vorgenommen werden muss. Erschwerend kommt hinzu, dass Google die genauen Algorithmen nicht nur geheim hält, sondern kontinuierlich modifiziert oder ihnen eine andere Gewichtung zuordnet. Optimierungsmaßnahmen sind mit hohem Zeitaufwand verbunden und wirken sich oftmals erst längerfristig aus. Aus diesen Gründen vertrauen immer mehr Firmen auf professionelle Agenturen, welche auf Suchmaschinenoptimierung spezialisiert sind.
Google ist im Markt der Suchmaschinen klarer Marktführer. Da zu erwarten ist, dass Google auch in den nächsten Jahren seine überragende Position beibehält bzw. weiter ausbaut, ist eine speziell ausgerichtete Suchmaschinenoptimierung für Google sehr zu empfehlen.
12 Fußnoten
- ↑ Vgl. Erlhofer (2005), S. 21.
- ↑ Vgl. Machill / Welp (2003), S. 135.
- ↑ Vgl. Lipsman (2008), http://www.comscore.com/Press_Events/Press_Releases/2008/01/Baidu_Ranked_Third_Largest_World_Wide_Search_Engine, Stand 09.01.2010.
- ↑ Quelle: Eigene Darstellung.
- ↑ Erlhofer (2005), S. 21.
- ↑ Vgl. Glöggler (2003), S. 1.
- ↑ Technorati (http://technorati.com) ist eine Weblog-Suchmaschine die verschiedene Weblog durchsucht. Eine Suchmaschine für deutschsprachige Blogs ist beispielsweise Blog-Sucher.de (http://www.blog-sucher.de).
- ↑ Lehmann / Lehmann (2002), S. 53.
- ↑ Erlhofer (2005), S. 13.
- ↑ Vgl. Glöggler (2003), S. 3.
- ↑ Vgl. Glöggler (2003), S. 6 f.; Erlhofer (2005), S. 24 f.
- ↑ Quelle: Entnommen von: MetaGer (2010), http://www.metager.de, Stand 11.01.2010.
- ↑ Glöggler (2003), S. 8.
- ↑ MetaGer (http://www.metager.de) ist eine deutschsprachige Metasuchmaschine. Dieser Service wird vom Regionalen Rechenzentrum für Niedersachsen (RRZN) und der Leibniz Universität Hannover zur Verfügung gestellt.
- ↑ Vgl. Glöggler (2003), S. 9.
- ↑ Vgl. Stock (2000), S. 122.
- ↑ Vgl. Lehmann & Lehmann (2002), S. 58.
- ↑ Vgl. Erlhofer (2005), S. 15.
- ↑ Vgl. Erlhofer (2005), S. 16.
- ↑ Das Open Directory Project (http://www.dmoz.org), auch bekannt als dmoz (für „Directory Mozilla“), ist nach eigenen Angaben das größte von Menschen gepflegte Webverzeichnis des World Wide Webs. Die Inhalte des Projekts sind Open-Content und werden von freiwilligen Redakteuren, den so genannten Editoren, bearbeitet und aktualisiert.
- ↑ Quelle: Entnommen von: Google (2010a), http://www.google.de/search?hl=de&source=hp&q=Kfz-Versicherung&meta=&aq=f&oq=, Stand 11.01.2010.
- ↑ Vgl. Glöggler (2003), S. 9 f.
- ↑ Google AdWords (http://adwords.google.de) ist ein Werbeservice um Anzeigen bei Google und im Google-Werbenetzwerk zu schalten. Der Service ist nur dann kostenpflichtig, wenn die Anzeige angeklickt wird.
- ↑ MSN (http://de.msn.com), ursprünglich The Microsoft Network, ist Microsofts Webportal, das verschiedene Chat- und Kommunikationsservices anbietet und gleichzeitig als Internetdienstanbieter auftritt.
- ↑ Vgl. Kaiser (2004), S. 11.
- ↑ Vgl. Kaiser (2004), S. 7.
- ↑ Vgl. Erlhofer (2005), S. 21.
- ↑ Vgl. Erlhofer (2005), S. 21 f.
- ↑ Vgl. Machill / Welp (2003), S. 26.
- ↑ Vgl. Machill / Welp (2003), S. 27.
- ↑ Vgl. Kaiser (2004), S. 23 ff.
- ↑ Quelle: Entnommen von: Webnetz (2010), http://www.web-netz.de/suchmaschinenoptimierung.html, Stand 12.01.2010.
- ↑ Vgl. Webnetz (2010), http://www.web-netz.de/suchmaschinenoptimierung.html, Stand 12.01.2010.
- ↑ Vgl. Google (2010b), http://www.google.com/corporate/history.html, Stand: 12.01.2010.
- ↑ Vgl. Google (2010b), http://www.google.com/corporate/history.html, Stand: 12.01.2010.
- ↑ Vgl. Brin & Page (1998), http://infolab.stanford.edu/~backrub/google.html, Stand: 12.01.2010.
- ↑ Vgl. Erlhofer (2005), S. 65.
- ↑ Vgl. Hannemann / Jutzi / Körner (2005), S. 112-116.
- ↑ Quelle: Entnommen von: Webhits (2010), http://www.webhits.de/deutsch/index.shtml?/deutsch/webstats.html, Stand: 13.01.2010.
- ↑ Vgl. Vise / Malseed (2006), S. 22.
- ↑ Vgl. American Dialect Society (2003), http://www.americandialect.org/index.php/amerdial/2002_words_of_the_y, Stand: 13.01.2010.
- ↑ Quelle: Entnommen aus: Brin / Page (1998), http://infolab.stanford.edu/~backrub/google.html, Stand: 12.01.2010.
- ↑ Vgl. Brin / Page (1998), http://infolab.stanford.edu/~backrub/google.html, Stand: 12.01.2010.
- ↑ Vgl. Erlhofer (2005a), S. 66 f.
- ↑ Vgl. Brin / Page (1998), http://infolab.stanford.edu/~backrub/google.html, Stand: 12.01.2010.
- ↑ Quelle: Entnommen von: PRWeb (2005), http://www.prweb.com/releases/2005/03/prweb213516.htm, Stand: 12.01.2010.
- ↑ Vgl. o.V. (2001), http://www.suchfibel.de/news/NurdieerstenPltzezhlen.htm, Stand 12.01.2010
- ↑ Vgl. Machill / Welp (2003), S. 255 f.
- ↑ Vgl. Zunke (2006), S. 18.
- ↑ Vgl. PRWeb (2005), http://www.prweb.com/releases/2005/03/prweb213516.htm, Stand: 12.01.2010.
- ↑ Vgl. Google (2010e), http://www.google.com/support/webmasters/bin/answer.py?answer=34432&hl=de, Stand 13.01.2010.
- ↑ Vgl. Page (1998), http://patft.uspto.gov/netacgi/nph-Parser?patentnumber=6,285,999, Stand 12.01.2010.
- ↑ Calishain / Dornfest (2003), S. 330.
- ↑ Vgl. Lewandowski (2005), S. 118.
- ↑ Vgl. Erlhofer (2005), S. 122 f.
- ↑ Google (2010c), http://www.google.com/corporate/tech.html, Stand 13.01.2010.
- ↑ Google (2010c), http://www.google.com/corporate/tech.html, Stand 13.01.2010.
- ↑ Vgl. Glöggler (2003), S. 82.
- ↑ Vgl. Glöggler (2003), S. 81-87; Erlhofer (2005), S. 122-133.
- ↑ Vgl. Brin / Page (1998), http://infolab.stanford.edu/~backrub/google.html, Stand: 12.01.2010.
- ↑ Glöggler (2003), S. 83.
- ↑ Glöggler (2003), S. 83.
- ↑ Vgl. Glöggler (2003), S. 83 ff.
- ↑ Google (2010c), http://www.google.com/corporate/tech.html, Stand: 13.01.2010.
- ↑ Vgl. Glöggler (2003), S. 125-128.
- ↑ Vgl. Erlhofer (2005), S. 197.
- ↑ Glöggler (2003), S. 126.
- ↑ Vgl. Selbach (2006), S. 24.
- ↑ Vgl. Google (2010d), http://adwords.google.de, Stand 13.01.2010.
- ↑ Vgl. Miva (2010), http://www.miva.com, Stand 13.01.2010.
- ↑ Vgl. Glöggler (2003), S. 127 ff.
- ↑ Quelle: Entnommen von: BMW (2010), http://www.bmw.de, Stand: 13.01.2010.
- ↑ Vgl. Lewandowski (2005), S. 90 f.
- ↑ Vgl. Lewandowski (2005), S. 91.
- ↑ Mit dem kostenlosen HTML-Validator des W3C (http://validator.w3.org) kann der HTML-Code auf syntaktische Richtigkeit geprüft werden.
- ↑ Vgl. Glöggler (2003), S. 190.
- ↑ Vgl. Erlhofer (2005), S. 272.
- ↑ Vgl. Baumann (2008), http://linkspiel.de/index.php/onetomarket-auf-der-ses-in-hamburg.html, Stand: 13.01.2010.
- ↑ Google (2010c), http://www.google.com/corporate/tech.html, Stand 13.01.2010.
- ↑ Vgl. Glöggler (2003), S. 169.
- ↑ Vgl. Erlhofer (2005), S. 239.
- ↑ Vgl. Lewandowski (2005), S. 94.
- ↑ Vgl. vgl. Erlhofer (2005), S. 239f.
- ↑ Vgl. Tabke (2003), S. 335.
- ↑ Vgl. Erlhofer (2005), S. 246.
- ↑ Vgl. Erlhofer (2005), S. 247 ff.
- ↑ Quelle: Entnommen aus: Erlhofer (2005), S. 246.
- ↑ Vgl. Erlhofer (2005), S. 247.
- ↑ Google (2010e), http://www.google.com/support/webmasters/bin/answer.py?answer=34432&hl=de, Stand 13.01.2010.
- ↑ Vgl. Erlhofer (2005), S. 258-263.
- ↑ Quelle: In Anlehnung an: Glöggler (2003), S. 181.
- ↑ Vgl. Glöggler (2003), S. 180 f.
- ↑ Vgl. Glöggler (2003), S. 257; Erlhofer (2005), S. 309.
- ↑ Glöggler (2003), S. 257.
- ↑ Sowohl AWStats (http://awstats.sourceforge.net) als auch Webalizer (http://www.webalizer.org) sind kostenlose Open-Source-Projekte.
- ↑ Vgl. Glöggler (2003), S. 257.
- ↑ Vgl. Erlhofer (2005), S. 316.
- ↑ Vgl. Google (2010e), http://www.google.com/support/webmasters/bin/answer.py?hl=de&answer=35769, Stand 13.01.2010.
- ↑ Vgl. Google (2010f), http://www.google.de/analytics, Stand 14.01.2010.
- ↑ Vgl. Google (2010g), http://www.google.de/analytics/features.html, Stand 14.01.2010.
- ↑ Quelle: Entnommen von: Google (2010g), http://www.google.de/analytics/features.html, Stand 14.01.2010.
13 Literatur- und Quellenverzeichnis
| Calishain / Dornfest (2003) | Calishain, Tara / Dornfest, Rael (2003): Google Hacks, O'Reilly Verlag, Köln u. a. 2003 |
| Erlhofer (2005) | Erlhofer, Sebastian: Suchmaschinen-Optimierung für Webentwickler: Grundlagen, Funktionsweisen und Ranking-Optimierung, Galileo Press, Bonn 2005 |
| Glöggler (2003) | Glöggler, Michael: Suchmaschinen im Internet: Funktionsweise, Ranking-Methoden, Top-Positionen, Springer Verlag, Berlin 2003 |
| Hannemann / Jutzi / Körner (2005) | Hannemann, Ulf / Jutzi, Sebastian / Körner, Andreas: Das große Googlen, in: Focus, 2005, o. J., Nr. 46, S. 112-116 |
| Kaiser (2004) | Kaiser, Thomas: Effizientes Suchmaschinen-Marketing: Erfolgreiches Direktmarketing mit Suchmaschinen und Paid Placements, BusinessVillage Verlag, Göttingen 2004 |
| Lehmann / Lehmann (2002) | Lehmann, Oliver / Lehmann, Antje: Top-Platzierungen in Suchmaschinen: Der suchmaschinengerechte Webauftritt, Addison-Wesley Verlag, München u. a. 2002 |
| Lewandowski (2005) | Lewandowski, Dirk: Web Information Retrieval, DGI Schrift Verlag, Frankfurt am Main 2005 |
| Machill / Welp (2003) | Machill, Marcel / Welp, Carsten (Hrsg.): Wegweiser im Netz : Qualität und Nutzung von Suchmaschinen, Bertelsmann-Stiftung Verlag, Gütersloh 2003 |
| Selbach (2006) | Selbach, Johannes: Die richtigen Keywords, in: Internet Professionell, 2006, o. J., Heft Nr. 3, S. 24 |
| Tabke (2003) | Tabke, Brett: 100 Insider-Tricks & Tools, in: Google Hacks, O'Reilly Verlag, Köln u. a. 2003 |
| Vise / Malseed (2006) | Vise, David A. / Malseed, Mark: Die Google-Story, Murmann Verlag, Hamburg 2006 |
| Zunke (2006) | Zunke, Karsten: Gesucht und gefunden, in: Acquisa – Das Magazin für Marketing und Vertrieb, 2006, o. J., Heft Nr. 2, S. 18-20 |
| Internetquellen | |
| American Dialect Society (2003) | American Dialect Society: http://www.americandialect.org/index.php/amerdial/2002_words_of_the_y, Stand: 13.01.2010. |
| Baumann (2008) | Baumann, Nina: http://linkspiel.de/index.php/onetomarket-auf-der-ses-in-hamburg.html, Stand: 13.01.2010. |
| BMW (2010) | BMW (2010), http://www.bmw.de, Stand: 13.01.2010. |
| Brin / Page (1998) | Brin, Sergey / Page, Lawrence (1998): The Anatomy of a Large-Scale Hypertextual Web Search Engine, http://infolab.stanford.edu/~backrub/google.html, Stand: 12.01.2010. |
| Google (2010a) | Google: http://www.google.de/search?hl=de&source=hp&q=Kfz-Versicherung&meta=&aq=f&oq=, Stand 11.01.2010. |
| Google (2010b) | Google: http://www.google.com/corporate/history.html, Stand 11.01.2010. |
| Google (2010c) | Google: http://www.google.com/corporate/tech.html, Stand 13.01.2010. |
| Google (2010d) | Google: http://adwords.google.de, Stand 13.01.2010. |
| Google (2010e) | Google: http://www.google.com/support/webmasters/bin/answer.py?answer=34432&hl=de, Stand 13.01.2010. |
| Google (2010f) | Google: http://www.google.de/analytics, Stand 14.01.2010. |
| Google (2010g) | Google: http://www.google.de/analytics/features.html, Stand 14.01.2010. |
| Lipsman (2008) | Lipsman, Andrew: Baidu Ranked Third Largest Worldwide Search Property by comScore in December 2007, 2008, http://www.comscore.com/Press_Events/Press_Releases/2008/01/Baidu_Ranked_Third_Largest_World_Wide_Search_Engine, Stand 09.01.2010. |
| MetaGer (2010) | MetaGer: http://www.metager.de, Stand 11.01.2010. |
| Miva (2010) | Miva: http://www.miva.com, Stand 13.01.2010. |
| o.V. (2001) | o.V.: Nur die ersten Plätze zählen, http://www.suchfibel.de/news/NurdieerstenPltzezhlen.htm, Stand 12.01.2010. |
| Page (1998) | Page, Lawrence: Method for node ranking in a linked database, http://patft.uspto.gov/netacgi/nph-Parser?patentnumber=6,285,999, Stand 12.01.2010. |
| PRWeb (2010) | PRWeb: Did-it, Enquiro and Eyetools Uncover Google's Golden Triangle, http://www.prweb.com/releases/2005/03/prweb213516.htm, Stand 12.01.2010. |
| Webnetz (2008) | Netzwelt: Suchmaschinenoptimierung, 2008, http://www.web-netz.de/suchmaschinenoptimierung.html, Stand 12.01.2010. |
| Webhits (2010) | Webhits: http://www.webhits.de/deutsch/index.shtml?/deutsch/webstats.html, Stand: 13.01.2010. |

