:: intro
Die Suchmaschine google hat nicht nur die Art & Weise verändert, wie Menschen im Web etwas suchen. Sie ist über die Zeit auch intelligenter und besser geworden durch die Menschen, die sie benutzen.
:: geschichtliches
Angefangen hat alles 1997 mit dem pagerank-System. Dieser Algorithmus wertet die Suche nach der Qualität und Anzahl der Links, die auf eine Webseite verweisen. Daran änderte sich erst einmal nichts mehr bis 2001, als diese Ranking-Kriterien erweitert und verfeinert wurden. Im Frühjahr 2003 dann wurde die local connectivity analysis implementiert, die vertrauenswürdigen Seiten mehr Gewicht zuschreibt. Die fritz-Initiative im Sommer des selben Jahres liess konstante Updates des google-Index in kürzeren Abständen zu. Kontrovers wurde es spätestens 2005: Ab diesem Jahr war die personalisierte Suche möglich, die das Suchverhalten des Anwenders analysierte und entsprechende Ergebnisse liefern konnte. Im Mai 2007 wurde die google-Suche universal: man konnte zeitgleich in Bildern, Büchern und/oder Nachrichten suchen. Und seit Dezember 2009 zeigt google die Suchergebnisse in Echtzeit an, also wann diese z.b. in Blogs oder twitter gepostet werden. Soviel zur Vorgeschichte und den Neuerungen, die öffentlich bekannt sind.
:: funktion
Die Websuche von google funktioniert ungefähr so:
Zuerst durchkrabbeln die Spinnen von google das Web und schaufeln die Daten in einen index. Das sieht ähnlich aus wie die Inhaltsseite eines Buches, denn das alles wird nach Wörtern geordnet. Ab diesem Zeitpunkt dreht sich alles um den Kontext: was steht im Titel der Webseite? Was wird untereinander verlinkt? Ist der Inhalt der Seite aktuell oder schon Jahre alt? In welchem Land sitzt derjenige, der sucht? usw. usf. Von diesen „signals“ gibt es über 200, nach denen die Seiten „gerankt“ werden. Das alles macht die Maschine, ab dann kommen die Menschen ins Spiel.
google hat begriffen, dass die hunderte Millionen Menschen selbst Daten generieren, wenn sie etwas suchen. Auf was sie klicken; welche Wörter sie ersetzen, wenn sie Suchbegriffe eingeben; was sie sich durch personalisiertes Suchen vorschlagen lassen. Das alles fliesst ein in den Algorithmus und ermöglicht so ein maschinelles Tiefenwissen, das in der Lage ist, selbst komplexe und kryptische Suchanfragen auszuwerten. Ab hier wird es spannend:
Beispiel Synonyme.
„Take, for instance, the way Google’s engine learns which words are synonyms. “We discovered a nifty thing very early on,” Singhal says. “People change words in their queries. So someone would say, ‘pictures of dogs,’ and then they’d say, ‘pictures of puppies.’ So that told us that maybe ‘dogs’ and ‘puppies’ were interchangeable. We also learned that when you boil water, it’s hot water. We were relearning semantics from humans, and that was a great advance.“
„But there were obstacles. Google’s synonym system understood that a dog was similar to a puppy and that boiling water was hot. But it also concluded that a hot dog was the same as a boiling puppy. The problem was fixed in late 2002 by a breakthrough based on philosopher Ludwig Wittgenstein’s theories about how words are defined by context. As Google crawled and archived billions of documents and Web pages, it analyzed what words were close to each other. “Hot dog” would be found in searches that also contained “bread” and “mustard” and “baseball games” — not poached pooches. That helped the algorithm understand what “hot dog” — and millions of other terms — meant. “Today, if you type ‘Gandhi bio,’ we know that bio means biography,” Singhal says. “And if you type ‘bio warfare,’ it means biological.“
Das Problem mit den „hot dogs“ und den „gekochten Hunden“ wurde erst 2002 gelöst und zwar durch das Konzept des Philosophen Ludwig Wittgenstein, der Wörter ins Verhältnis zum Kontext gesetzt hat, in welchem sie erscheinen. Ein „Stein“ ist also ein „Stein“, egal ob er „Stien“ oder „Stteeiinn“ geschrieben wird. Das kann aber auch ein Nachname sein oder ein Ort. google wird versuchen herauszufinden, dank Herrn Wittgen-stein, ob ein Stein nur ein Stein oder ein Name oder ein Ort ist!
So „pimpt“ google seine Suchmaschine, ohne dass die User grossartig etwas davon mitbekommen oder bei ihrer Suche gestört werden. Alle paar Jahre ändert sich der Motor des Flugzeugs komplett:
„Our job is to basically change the engines on a plane that is flying at 1,000 kilometers an hour, 30,000 feet above Earth.“
Hunderte von Leuten auf der ganzen Welt arbeiten auch von zu Hause aus, um verschiedene Ergebnisse ihrer Suchanfragen auszuwerten und ob die Ergebnisse besser oder schlechter geworden sind. Im prinzip hilft jedoch jeder User, google verfügt über Milliarden passive Tester. Einfach jeder, der die Maschine benutzt.
Das macht die Suchmaschine sehr flexibel. Neue Signale werden hinzugefügt, der Code wird angepasst, die Ergebnisse werden getestet und das Ganze geht von vorne los. Dadurch werden Wettbewerber wie bing oder twitter ausgestochen. Alleine in den letzten sechs Monaten gab es über 200 neue Funktionen, manche einfach übernommen von der Feature-Liste der Konkurrenten. Das, was wir heute bei google sehen, sind zehn Jahre Erfahrung und Fortschritt im Suchmaschinenbereich.
:: die zukunft
In welche Richtung steuert google? Alles in Echtzeit. Die Ergebnisse liefern das bereits seit Dezember. Erweitert wird das bald auf Bilder, die Nutzer mit ihren Handys gemacht haben. Irgendwann soll das auch für Kameras und Sprache gelten. google will allgegenwärtig und immer angeschaltet sein. Über die Infrastruktur verfügt der Konzern bereits. Das selbe gilt für die Ingenieure. Das macht konkurrenten Angst:
„Even if there is a paradigm shift, Google’s algorithms will probably be able to incorporate that, too. That’s why Google is such a fearsome competitor; it has built a machine nimble enough to absorb almost any approach that threatens it — all while returning high-quality results that its competitors can’t match.“
[via]
Die Zukunft ist google everywhere.