2.1 Begriffsdefinition

Suchmaschinen – Begriffserklärung

Unter dem Begriff Suchmaschine versteht man eine speziell entwickelte Software mit der man Daten und Informationen anhand von Suchbegriffen oder anderen Satzteilen, die auf einem Rechner oder einem Netzwerk.

Im Anschluss an die Sucheingabe wertet das Programm nach bestimmten Faktoren die Suchergebnisse aus und stellt diese in einer Liste mit Verweisen auf die relevanten Dokumente dar. Dabei werden diejenigen vorne angezeigt, die am besten zu dem Suchtext passen. Da das World Wide Web unbegrenzt ist, wird ein Register angelegt, damit je nach Veränderung der Suchanfrage die Rankingkriterien stetig aktualisiert werden können. Die Suchmaschinen basieren auf einem eigenen Algorithmus sowie einem eigenen Index. Infolgedessen haben sich auch Metasuchmaschinen entwickelt, die sich auf die Daten der schon vorhandenen Suchmaschinen beziehen und den Inhalt auflisten.

2.2 Techniken der Suchmaschinen

Wie tickt eine Suchmaschine?

Wie funktioniert eine Suchmaschine? Im Folgenden werden Ihnen die Einzelheiten einer Suchmaschine erläutert.

Die Bestandteile einer Suchmaschinen fügen sich zusammen aus einem URL-Server, dem Parser, mehreren Crawlern (z.B. Robots, Spider, Bots) und einem Store Server.

Hierbei verwaltet der URL-Server die Internetadressen (URLs), die noch nicht in den Register enthalten sind. Somit werden die Webseiten, welche neu angemeldet sind, direkt an den zuständigen Server übermittelt. Der URL-Server leitet diese Daten anschließend an die jeweiligen Crawler weiter.

Die URLs werden dann mit Hilfe des Crawlers in eine IP-Adresse umgewandelt, um mit den Servern in Verbindung treten zu können. Damit die Datenübertragung schneller voran geht und der Server nicht überlastet wird, öffnet der Crawler mehr als hundert Verbindungen im selben Moment. Sollten doch Verbindungsprobleme zum Vorschein kommen, können diese zügig auf eine andere Verbindung zurückgreifen. Infolgedessen kann ein Robot bis zu dreißig Seiten pro Sekunde erfassen. Sobald die Übergabe erfolgt ist, lässt der Crawler die Daten der Internetseiten dem Parser zukommen.

Jede HTML-Seite erhält nun durch der Parser eine simple Form, die direkt an den Store Server weitergeleitet wird. Dieser hat die Aufgabe die Informationen auf den vereinfachten Seiten zu extrahieren. Sollten Links enthalten sein, werden diese an den URL-Server weitergeleitet und im Falle von unbekannten Inhalten werden diese dem Index zugefügt.

Dieser Register ist zusammengesetzt aus dem Repository, den Hit Lists sowie einem Lexikon, welches als eine Art Hashtabelle demonstriert wird, in der sich die Auflistung von den gesamten Begriffen im Internet befindet. Somit liefern auch nur die Begriffe eigenständig Suchergebnisse, die auch in diesem Lexikon enthalten sind. Die Wörter in dem Lexikon sind mit einem Vermerk auf die jeweilige Hit List versehen. Diese verweisen die entsprechenden Wörter auf die Seiten des Repositorys, wo die Internetseiten gespeichert werden. Zeitgleich wird in den Hit Lists festgelegt, welches Suchwort welche Bedeutung zugesprochen bekommt.

Eine Suchmaschine kann lediglich mit einem Frontend oder einem Searcher interagieren. Als Benutzeroberfläche, also die sichtbare Komponente der Suchmaschine, wird das Frontend bezeichnet. Der Searcher ist dafür zuständig, zu den Suchanfragen der Suchmaschinennutzer eine Ergebnisliste, welche aus dem Lexikon sowie den Hit Lists erstellt wurde, anzuzeigen.

Wie die Ergebnisse aufgelistet werden, wird durch einen suchmaschinenspezifischen Algorithmus festgelegt, welches auch das „Herzstück“ einer Suchmaschine ist. Der Algorithmus ist abhängig von vielen Faktoren die entscheiden, an welchen Positionen die Internetseiten in der Suchliste angezeigt werden.

2.3 Entwicklung und Ausblick

Suchmaschinen – Entwicklung u. Ausblick

Entwicklung:

Die erste Suchmaschine wurde um das Jahr 1995 programmiert, denn zu dem Zeitpunkt hatte das Internet schon eine Dimension erreicht, welche es den Internetusern unmöglich macht, gewünschte Details in kurzer Zeit aufzufinden.

Lycos, Alta Vista sowie WebCrawler waren eine der ersten Suchmaschinen, wovon Alta Vista eine der kommerziellen Metasuchmaschinen sowie Marktführer war. Mittlerweile existieren kaum Metasuchmaschinen die von Erfolg gekrönt sind.

Die weltweit bekannteste Suchmaschine Google wurde im Jahr 1998 von Sergey Brin sowie Larry Page entwickelt. Damals waren die zwei noch Studenten und erstellten eine simple Benutzeroberfläche (GUI) sowie eine unfassbar schnelle Suchgeschwindigkeit, welches den Erfolg von Google sicherte. Des Weiteren verwendet Google Algorithmen beziehungsweise die Rankingkriterien, wie man es vorher noch nicht kannte. Darunter fällt beispielsweise der PageRank.

Kurze Zeit später merkten auch MSN und Yahoo, dass sich die Technik von Google durchsetzen wird. Doch aufgrund der Patentierung der Google-Erfinder waren die anderen Suchdienste von Google abhängig und mussten dort einkaufen. Nach einigen Jahren hat auch Yahoo einen eigenen Algorithmus erstellt, was den Marktführer Google allerdings keine große Konkurrenz ist. Denn der Marktanteil von Google beträgt 90%, was verdeutlicht wie klein der Anteil anderer Suchmaschinen ist.

Ausblick:

Das Google seit Jahren ungeschlagener Marktführer in Sachen Suchmaschinenoptimierung ist, steht außer Frage. Doch ob das auch so bleibt, kann keiner genau sagen. Denn Alta Vista kennt und nutzt heutzutage auch keiner mehr, was sich damals niemand hätte vorstellen können. Ebenso schnell kann es Google passieren, dass die neuen Technologien die Suchmaschine einholt und diese weichen muss. Noch ist es undenkbar, aber sicher ausschließen kann man es nicht. Die Vermarktung, Branding, beherrscht Google zwar wie kein anderes Unternehmen, denn Google ist längst nicht mehr nur eine Suchmaschine sondern bietet auch weitere Dienste an. Darunter fallen zum Beispiel Google Maps, Froogle, ein E-Mail Dienst (GMail), Communities wie blogger.com und noch viele mehr. Zudem stehen auch Softwareprogramme wie Google Desktop oder auch Picasa, ein Bildbearbeitungsprogramm, kostenlos von Google zur Verfügung.

Die Bedeutung Googles steigt besonders im 21. Jahrhundert stetig an, was an Kleinigkeiten wie beispielsweise die Formulierung „Suchen“ durch „Googeln“ im Munde der Internetuser ersetzt wird.

Zukünftig kann man Suchanfrage lediglich nur noch per Spracheingabe stellen, was sogar vereinzelt schon möglich ist. Darüber hinaus wäre eine automatische Sprachantwort der Suchmaschine gewünscht. Bis das umsetzbar ist, wird es wohl noch etwas dauern, da die Sprache an sich schon sehr komplex ist und die Techniker der Suchmaschine vor einigen Hürden stehen.

Weitere Konflikte können durch die steigende Datenmenge sowie durch die verschiedenen Bedeutungen von Suchworten sowie durch die unterschiedlichen grammatikalischen Bedeutungen auftreten. Aufgrund der Tatsache, dass jeden Tag Millionen Webseiten erstellt werden und den gesamten Aktualisierungen der Internetseiten, sind die Veränderungen im Netz extrem groß. Infolgedessen spekulieren einige Experten darauf, dass die Suchmaschine der Zukunft auf spezialisierte Datenbänke zurückgreifen wird. Darüber hinaus wird die Bedeutung der personalisierten und regional gesteuerten Sprache (Personalized Search / Geo-Targeting) deutlich steigen.

2.4 Google

Suchmaschinen – Google

Google hat seinen Ursprung im  Ausdruck „googol“, welches für eine Eins mit hundert Nullen steht. Dieser Name wurde von den Gründern abgeleitet, um die Dimensionen des Internets zu verdeutlichen. 2005 wurde bereit das Verb „googeln“ in den Duden aufgenommen. Doch mittlerweile hat sich der Inhaber von Google aus markenschutzrechtlicher Hinsicht, das Verb „googeln“ wieder aus dem Duden  zu entfernen. Google wurde als Warenzeichen versehen und „mit Google im Internet suchen“ wurde als Ersatz für das entfernte Verb eingesetzt.

Google kann sich mittlerweile als eine der weltweit einflussreichsten Unternehmen nennen, da der aktuelle Marktwert um die 150 Milliarden US-Dollar beträgt. Google beschäftigt ca. 53.000 Mitarbeiter und betreiben weltweit viele Rechenzentren. Damit die Suchgeschwindigkeit so schnell wie möglich gehandhabt wird, werden die Suchanfragen an das nächstgelegene Rechenzentrum gesendet. Das ist die einzige Möglichkeit die Antwort in wenigen Sekunden zu erhalten.

Der Algorithmus ist wie oben genannt, dafür zuständig die Suchergebnisse nach den ausgewählten Kriterien aufzulisten. Als wichtigstes Element wird hierbei der PageRank bewertet, welcher die „Wertigkeit“ einer Internetseite bewertet. Diese wird in Abhängigkeit von der Qualität sowie der Anzahl an eingehenden Links festgelegt und mittels einer Skala von 1-10 demonstriert. Weitere Faktoren sind beispielsweise der Inhalt sowie die Aktualität der Webseite, der Title- und Description-Tag, die gesamte Unterteilung des Contents, ausgehende Links, der Domainname als auch die Eintragung auf wichtigen Webkatalogen wie zum Beispiel DMOZ. Ein wirklich bedeutender Faktor ist auch das Alter der Webseite, welches außerordentlich großen Einfluss auf das Google Ranking hat.

Es wird angenommen, dass mehr als hunderte Elemente den Google-Algorithmus bestimmen. Man kann schon allein von der Einführung dieses Tutorials erkennen, dass die Kriterien welche an eine erfolgreiche Platzierung gestellt werden, sehr schwer zu erfüllen sind.

2.5 Yahoo

Suchmaschinen – Yahoo

Im Jahr 1995 wurde das Unternehmen „Yahoo“ gegründet. Jerry Yang und David Filo erstellten damals im Studentenalter nur eine simple Linkliste, welche sich mittlerweile an über 350 Millionen Nutzern erfreut. Dahinter stehen 7.500 Mitarbeiter, welche einen Umsatz von knapp fünf Milliarden US-Dollar. Yahoo ist eines der größten Internetportale weltweit.

Nicht nur als Suchmaschine fungiert Yahoo, sondern bietet auch eine Menge anderer Dienste wie beispielsweise ein Email-Programm sowie ein Dating-Portal als auch einen Webkatalog. Zunächst lag das Hauptaugenmerk auf dem redaktionell geführten Webkatalog, was sich aber mittlerweile auf die Suchmaschine und Vermarktungen von Anzeigen verlegt hat. 2003 wurden Overture und Inktomi von Yahoo aufgekauft, um mit den Technologien eine Konkurrenz für Google darzustellen. Infolgedessen wurde im Folgejahr die Zusammenarbeit mit Google gekündigt. Somit verwendet Yahoo einen selbsterstellten Algorithmus sowie Indizes.

Allerdings sind die Rankingkriterien nahezu unverändert geblieben, sodass die Auflistung der Suchergebnisse sich nicht verändert. Der individuelle Inhalt sowie die Linkpopularität haben oberster Priorität. Im Jahr 2009 entstand eine Kooperation zwischen Microsoft und Yahoo, wodurch 2010 eine Zusammenarbeit mit Bing stattfand. Mittlerweile bestehen Diskussionen die Kooperation mit Microsoft wieder aufzulösen und mit Google gemeinsame Sache zu machen.

2.6 MSN/Windows Live

Suchmaschinen – MSN, Windows Live

Das Internetportal von Microsoft (MSN) bietet neben unterschiedlichen Diensten auch eine Suchmaschine an, welcher sich „bing“ nennt. Bill Gates sowie Paul Allen gründeten im Jahr 1975 die Firma Microsoft, wo der Name zu Beginn „Microcomputer Software“ lautete.

Die Betriebssoftware „Windows“ bildete die Haupteinnahmequelle des riesigen Unternehmens. Pro Jahr beträgt der Umsatz rund 45 Milliarden US-Dollar, wodurch Bill Gates im Jahr 2006 wieder die erste Stelle der Liste der reichsten Menschen weltweit.

Der momentane Marktanteil von 3-5% ist für die Suchmaschine bing deutschlandweit keine große Zahl, was auch in den Vereinigten Staaten mit einem etwas höheren Anteil, nicht annähernd an die Werte von Google gelangt. Die Rankingfaktoren ergeben sich hierbei, exakt wie bei Google sowie Yahoo, aus externen Einflüssen und dem Content der Webseite. Im Gegensatz zu anderen Suchmaschinen, hat die Link- und Domainpopularität einen nicht so hohen Stellenwert wie das Vorkommen des Suchwortes in der Domain, im Text sowie in den Meta Tags bei bing. Durch die Integration von einigen Yahoo-Seiten, kann sich der Marktanteil von bing demnächst etwas verbessern.