SEO- und Internet-News by TechDivision


Will Google mich nur ärgern?

Gepostet in Suchmaschinen, Google durch Markus Stockbauer am 15 April, 2008

Das frage ich mich im Moment gerade ganz ehrlich.

Kurz zur Vorgeschichte

In meinem Blogeintrag PHP Rapid Application Development erwähnte ich die Anzahl der Suchresultate für den Begriff php framework (zu der Zeit 83.200.000), um zu verdeutlichen, wie brisant das Thema ist. Anfänglich erschien mir das eine echt gute Idee. Natürlich war mir bewusst, dass eine Information wie diese nach kurzer Zeit schon nicht mehr exakt stimmen würde.

Doch mit einer Abweichung von über 75 Millionen Ergebnissen hätte ich nicht gerechnet. Denn heute wies mich ein aufmerksamer Kollege darauf hin, dass er bei einer Google-Suche lediglich etwas mehr als 7 Millionen Ergebnisse für php framework erhalten würde. Ungläubig wie immer prüfte ich das persönlich nach, und siehe da: es stimmt wirklich (zumindest jetzt gerade). Da müssen wohl ein paar Seiten aus dem Suchindex gefallen sein.

Mir ist nicht ganz klar wie es dazu gekommen ist, aber das Internet ist wohl nicht mehr so groß wie vor ein paar Tagen noch. Aus Interesse habe ich den Suchbegriff dann in zwei Varianten eingegeben.

Wenn man das Internet von der anderen Seite aus ansieht, wirkt es plötzlich viel großer!

…denkt sich zumindest Google. Denn sucht man nach php framework, gibt es wie schon erwähnt (im Moment!) ca. 7 Millionen Resultate. Eine Suche nach framework php hingegen, liefert ganze 51 Millionen. Da keine Anführungszeichen verwendet wurden, sollten beide Suchbegriffe eigentlich einzeln gewertet werden, höchstens die Reihenfolge könnte einen Einfluss auf die Rangfolge der Suchresultate haben. Aber auf einen Wegfall von 44 Millionen Ergebnissen? Ganz schön dreist, wie ich finde.

Google Suche: php framework

Google Suche: framework php


Was macht nun die beiden Suchen so unterschiedlich? Die Reihenfolge? Sie wird wie es scheint nicht wirklich beachtet, schließlich haben die drei ersten Suchergebnisse für framework php auch eine Überschrift, in der zuerst PHP und dann Framework auftaucht. Also eigentlich besser auf php framework passen müssten.

Tja, hier handelt es sich wohl wieder um eins der auf immer ungeklärten Rätsel der Menschheit…

Abonnieren Sie jetzt unseren RSS-Feed und bleiben Sie so immer auf dem Laufenden!


Diese Artikel dürften Sie auch interessieren


Google kann nun Formulare ausfüllen

Gepostet in Suchmaschinen, Google durch Marion Engel am 14 April, 2008

Es wurde ja immer gewarnt, wichtige Informationen, die man in den Suchergebnissen sehen will, hinter Formularen oder Anmeldemasken zu verbergen, da die Spider der Suchmaschinen keine Formulare ausfüllen können und die Indizierung somit vor dem Formular abbrechen. Diese Warnung scheint bald der Vergangenheit anzugehören, denn Google hat mitgeteilt, dass der Spider zukünftig auch Formulare ausfüllen kann.
Das ist bisher bereits in begrenztem Umfang bei qualitativ hochwertigen Web-Sites geschehen, um auf die Informationen zugreifen zu können.
Und was schreibt so ein Spider in die Formulare? Wenn er auf ein <Form>-Element stößt, schreibt er Begriffe, die auf der Seite vorkommen, in Textfelder. Bei Comboboxen, Radio-Buttons und Checkboxen wählt er einfach einen der in HTML möglichen Werte aus.
Die dann erhaltenen Ergebnisse wurden indiziert – auch wenn Google noch vor Jahresfrist vor Suchergebnissen gewarnt hat, die auf diese Weise zustande gekommen sind. Und nun stellen sie selber solche Ergebnisse zur Verfügung.
Und was ist, wenn Sie nicht möchten, dass Google auf ihrer Web-Site Formulare ausfüllt? Wenn Ihr Formular durch die robots.txt oder Meta-Anweisungen für die Spider ausgeschlossen ist, wird es nicht benutzt, sagt Google. Andere Formulare werden nach folgenden technischen Kriterien ausgeschlossen:
Es werden nur GET-Formulare ausgewertet und keine Formulare, die Benutzerdaten erfordern. Alle Formulare, in denen ein Passwort eingegeben werden muss oder die üblicherweise persönliche Informationen enthalten, wie z.B. Login, User-ID, Kontakt usw. werden ausgelassen.
Dieser Sinneswandel ist gut für die Suchergebnisse, denn nun werden auch Informationen zugänglich, die bisher als “unsichtbares Web” oder “tiefes Web” bezeichnet wurden. Die ersten Versuche in diesem Bereich wurden allerdings nicht von Google unternommen. Diesmal beteiligt sich mit Google allerdings einer der Großen in der Suche an der Zugänglichkeit des tiefen Webs. Google wird also zum Pionier.

Quelle: SearchEngineLand


Diese Artikel dürften Sie auch interessieren


Suchmaschinenergebnisse vergleichen

Gepostet in Suchmaschinen durch Marion Engel am 2 April, 2008

Und wieder gibt es ein paar neue Tools, mit denen man die Ergebnisse mehrerer Suchmaschinen vergleichen kann. Das Interessante ist in diesem Fall, dass die unterschiedlichen Positionen in Google und Yahoo grafisch angezeigt werden.

Eines dieser Tools findet man bei langreiter.com. Die folgende Abbildung zeigt das Ergebnis für meinen Lieblings-Suchbegriff “Online Marketing Rosenheim”:

onl-mark-ro-11.jpg

Wie auf der Perlenkette aufgereiht sind die Treffer in Google und Yahoo. Fährt man mit dem Cursor über diese Punkte, so erscheint die zugehörige URL. Ist ein Treffer in beiden Suchmaschinen enthalten, werden die Punkte blau gefärbt und mit einer Linie verbunden. So sieht man auf einen Blick die doch recht großen Unterschiede in der Position. Die vielen nicht-blauen Punkte verdeutlichen, dass viele Treffer nur in einer der Suchmaschinen gefunden wurden. Dass die Nummer 1 in Google nicht innerhalb der ersten 100 Treffer in Yahoo zu finden sein soll, stimmt mich doch etwas nachdenklich. Und so habe ich mir einmal die URLs der Treffer genauer angesehen. Und da kann was nicht stimmen - zumindest sind die im Tool angezeigten Ergebnisse nicht mit den Ergebnissen vergleichbar, die ich bei meiner Google-Suche erhalte. Sehr wahrscheinlich wird das Tool nicht erkennen, dass ich aus Deutschland suche und an deutschen Ergebnissen interessiert sind, die dem regionalen Aspekt “Rosenheim” entsprechen.

Das zweite grafische Vergleichstool bietet thumbshots.com an. Hier das Ergebnis meines anderen, generischen Suchbegriffs “Doping”.

Suchmaschinenergebnisse vergleichen

Thumbshots bietet den zusätzlichen Service, dass es beim Überfahren des Punkts eine kleine Vorschau der Trefferseite anzeigt. Unter der Grafik wird zusätzlich noch in Zahlen dargestellt, wieviele Treffer von beiden Suchmaschinen angezeigt werden, wieviele Seiten von beiden gemeinsam angezeigt werden und wieviele Einzeltreffer es gibt. Und sonst? Immerhin herrscht an der Spitze der Suchergebnisse eine gewisse Einigkeit. Aber die 6 gemeinsamen Treffer werden vom Tool mit 0% Gemeinsamkeit bezeichnet. Das scheint allerdings ein Rechenfehler zu sein, denn 6 von 100 sind doch eindeutig 6%. Aber auch dieser Wert ist ziemlich klein und wesentlich kleiner, als ich erwartet hätte. Aus der Mini-Vorschau lässt sich zwar nicht ableiten, welche Treffer sinnvoller sind, aber ich hätte doch eine größere Übereinstimmung erwartet.

Da natürlich auch bei diesem Suchbegriff die englischsprachigen Treffer dominieren, kann ich keinen zuverlässigen Vergleich zwischen der Suche im “Original” und im Tool anstellen.

Alles in allem ist der grafische Vergleich zwar eine gute Idee, wenn allerdings zumindest zum Teil Äpfel mit Birnen verglichen werden, ist die Aussagekraft leider etwas eingeschränkt. Aber vielleicht gibt es ja mal Folgeversionen, die auch die regionalen Aspekte des Suchenden berücksichtigen.


Diese Artikel dürften Sie auch interessieren


Neue Suchmaschine

Gepostet in Suchmaschinen durch Marion Engel am 27 March, 2008

Ganz in der Nähe von uns, an der Fachhochschule Rosenheim, wurde eine interessante neue Suchmaschine entwickelt. Wenn die Zeitungen schon darüber berichten, gehört diese neue Suchmaschine auch von mir einmal genauer untersucht und vorgestellt - und das nicht nur aus Lokalpatriotismus.

Google braucht zwar derzeit keine Angst vor der bayerischen IRIS zu haben, denn dieses Informationssystem enthält “nur” Fachinformationen zum Thema Holz. Grundsätzlich spricht aber nichts dagegen, auch andere Themengebiete damit zu strukturieren.

Die Suchergebnisse werden in Bild und Text dargestellt. Das Bild zeigt den Suchbegriff in der Mitte ausgehend verwandte Begriffe mit ihren Beziehungen.

Iris Suchmaschine

Ab der zweiten Suche, deren Button treffenderweise “Finden” heißt, wird auch der vorherige Suchbegriff im Bild angezeigt. Denn möglicherweise gibt es ja Verbindungen zwischen den Begriffen und möglicherweise hangelt sich der Suchende von Ergebnis zu Ergebnis weiter.

Unter dem Bild werden zunächst sprachliche Alternativen angeboten, Tipps also für eine weitere Suche, möglicherweise auch in anderen Suchmaschinen oder Quellen. Schließlich folgt die Liste der tatsächlichen Suchergebnisse, die mit einer Zusammenfassung einen ersten Eindruck über das Dokument gibt. Dazu kommen die Treffergüte und die Quelle. Der Benutzer kann auch nach Geschmack wählen, ob er alle Ergebnisdarstellungen wünscht oder nur eine davon sehen möchte. Wer auf Grafik steht, kann seinen Blickwinkel noch erweitern und sich das Begriffe-Netz anzeigen lassen:

IRIS Begriffe-Netz

Hier erscheint der Suchbegriff (rechts in lila) in einem noch größeren Zusammenhang. Jedes Kästchen lässt sich wieder anklicken und führt zu einem noch größeren Baum. Dieser war bei meinem Suchbegriff allerdings so riesig, dass sich Kästchen und Pfeile teilweise überlappt haben. Aber da ich ja kein Holzspezialist bin, war mein Suchbegriff sicher auch zu unspezifisch. Andererseits kann diese Darstellung durchaus hilfreich sein, wenn man den genauen Suchbegriff nicht kennt und sich langsam vortasten muss oder wenn man sich über ein Gebiet informieren möchte. Die Suche nach “Holzbau” beispielsweise zeigt auf einen Blick, wie vielfältig dieses Gebiet ist, wo Holzbau eingesetzt wird, welche Institutionen es gibt und vieles mehr.

Verwunderlich ist für mich allerdings, dass mir auf den Suchbegriff “Bergwald” das Begriffenetz um “Bitumenkleber” angezeigt wird. Auch der Suchbegriff “schwenden” bringt mir “Abwassergeräusch” im Begriffenetz, mit sprachlichen Alternativen, die aber überhaupt nichts mit dem Entfernen von Bäumen von Almflächen zu tun haben. Neja, IRIS scheint nicht nein sagen zu können, denn sie bringt auch auf völlig absurde Begriffe eine (natürlich nicht passende) Antwort anstatt zuzugeben, dass sie zu dem gesuchten Begriff keine Quellen finden kann…oder dass sie der Benutzer möglicherweise zum Narren halten will - wenn er beim Holzbau nach “Roggenbrot” sucht…
Vielleicht sind das ja Kinderkrankheiten, an denen das Entwicklerteam noch arbeitet. Vielleicht hätte ich als angemeldeter Benutzer auch mehr gesehen als als anonymer Gast.

Alles in allem gefällt mir aber der Ansatz des Informationssystems sehr gut. Und wenn die Inhalte passen, würde ich mir ein solches System auch für meine speziellen Fachgebiete wünschen. Warten wir ab, ob wir demnächst mehr von IRIS oder einer weiterentwickelten Schwester hören werden.


Diese Artikel dürften Sie auch interessieren


Die Reichen suchen mit Google, die Armen mit Yahoo

Gepostet in Suchmaschinen durch Marion Engel am 20 February, 2008

In den USA hat kürzlich eine Studie gezeigt, dass es einen Zusammenhang zwischen Einkommen und bevorzugter Suchmaschine gibt. Die finanziell besser gestellten verwenden eher Google, während die Ärmeren und die Arbeiterklasse Yahoo bevorzugt. Die Studie hat auch gezeigt, dass die Google-Nutzer älter sind und mehr Geld online ausgeben, während Yahoo-Nutzer jünger sind und weniger Geld Online ausgeben.
Google ist Marktführer bei der Online-Suche, während Yahoo die am häufigsten besuchteste Website ist. Der höhere Traffic verhilft Yahoo aber nicht zu mehr Suchanfragen als Google. Vermutlich lassen sich die unterschiedlichen Zielgruppen der beiden Suchmaschinen mit ihren unterschiedlichen Angeboten und Schwerpunkten erklären.
Yahoo hat bei der Unterhaltung klar die Nase vor Google, sei es mit Yahoo Music, Flickr usw. Bei Yahoo gibt es zudem immer sehr viele Suchanfragen nach Promis. Man geht also offensichtlich mehr zum Vergnügen, für leichte Unterhaltung und zum Knüpfen von Kontakten zu Yahoo.
Der Kauf von YouTube hat Google zwar im Unterhaltungsbereich geholfen, aber Google konzentriert sich auf die Suche und die Weitergaben von Informationen, ist damit definitiv akademischer und hat weniger „Kick“ als Yahoo.

Welche Zielgruppe ist wertvoller? Das lässt sich nicht pauschal sagen, d.h. jeder möge sich selber seine Meinung bilden und die Frage diskutieren.

Quelle: Search Engine Journal


Diese Artikel dürften Sie auch interessieren


Zuula: Meta-Suchmaschine für Web, Bilder, Blogs und mehr

Gepostet in Suchmaschinen, Google durch Marion Engel am 23 January, 2008

Hinter dem Namen Zuula verbirgt sich eine weitere Meta-Suchmaschine, die aber nicht nur wie SearchBoth die Ergebnisse mehrerer Suchmaschinen in einem Suchvorgang zur Verfügung stellt. Zuula kann einiges mehr.

Meta-Suchmaschine Zuula

Neben der Suche im Web kann auch separat nach Bildern, Videos, News, Blogs und Jobs gesucht werden. Für jede Kategorie stehen mehrere Anbieter zur Verfügung. Bei den Suchmaschinen sind es beispielsweise

  • Google
  • Yahoo
  • MSN
  • Gigablast
  • Exalead
  • Alexa
  • Accoona
  • Mojeek

Bei der Suche in Blogs kann man zwischen

  • Google
  • Technorati
  • IceRocket
  • Blogpulse
  • Sphere
  • Bloglines
  • Blogdigger
  • BlogDimension
  • Topix

wählen, um nur zwei Beispiele zu nennen. Jeder eingegebene Suchbegriff wird automatisch in allen Bereichen gesucht, so dass man sich nur durch die Navigation klicken muss, um von den Web-Ergebnissen zu den Bildern oder Blogs zu gelangen. Von der Bedienung ist das ziemlich praktisch.
Wie aber steht es mit der Qualität der Suchergebnisse? Dazu habe ich mal ein wenig gesucht, geklickt und geschaut und dies und das festgestellt.

Mit meiner Vermutung, Zuula würde die Original-Suchergebnisse der Suchmaschinen anzeigen, habe ich mich gleich einmal getäuscht. Denn die Zuula-Suchergebnisse von Google haben ziemlich wenig mit den Original-Google-Ergebnissen gemeinsam. Ich habe wieder eine Test-Suche mit den Begriffen “Online Marketing Rosenheim” durchgeführt und bei Zuula folgende Google-Ergebnisse bekommen:

Online Marketing Rosenheim bei Zuula gesucht

In diesem Suchergebnis sind nur die Plätze 1 bis 5 des Google-Suchergebnisses enthalten. Die anderen Ergebnisse, die Zuula anbietet, haben nichts mit meiner Suchanfrage und stehen inhaltlich auch nicht auf der gleichen Ebene mit den 5 anderen Ergebnissen zu tun.

Online Marketing Rosenheim bei Google gesucht

Ein kurzer Blick auf die Ergebnisse der anderen Suchmaschinen, die mir Zuula anbietet, kann mich auch wenig begeistern. Ich erinnere mich an meinen Vergleich von SearchBoth, bei dem ich ja festgestellt hatte, dass die anderen Suchmaschinen neben Google die Suchbegriffe isoliert betrachten und es nicht höher schätzen, wenn die Begriffe nahe beieinander stehen.

Auch bei meinem nächsten Test mit dem Suchbegriff “Magento”, dem kommenden Open-Source Online-Shop, sind die Suchergebnisse von Zuula-Google und Original-Google wieder unterschiedlich. Immerhin steht in beiden Fällen die Seite des Anbieters Varien an erster Stelle. In Google folgen dann relevante deutsche Blog-Beiträge, während es bei Zuula-Google englischsprachige Beiträge sind.

Offensichtlich kann ich als Suchender vor Google meine Herkunft nicht verheimlichen - was allerdings für die Suchergebnisse durchaus von Vorteil ist. Egal ob ich bei Google im gesamten Web suche oder sogar auf google.com gehe: die Suchergebnisse sind deutsch. Und da Zuula aus New Jersey, USA, kommt, sind die Ergebnisse aus seiner Sicht national gefärbt. Und so erklärt sich auch, dass bei der ersten Suche der “Chairman Andrew Rosenheim” wichtiger ist als die Ortsangabe aus unserer Sicht.

Das war zwar nur ein knapper Test, aber meine Meinung habe ich mir gebildet: Ich bleibe beim Google im Original, weil mich die Ergebnisse da noch immer am meisten überzeugen. Momentan und bis auf Widerruf.


Diese Artikel dürften Sie auch interessieren


Ersetzt Social Bookmarking die Suchmaschinen?

Gepostet in Web 2.0, Suchmaschinen durch Marion Engel am 9 January, 2008

Nachdem das Search Engine Journal zum Besten Blog des abgelaufenen Jahres gewählt worden ist, fühle ich mich natürlich in der Auswahl der Quellen für einige meiner Blog-Beiträge bestätigt. Und so habe ich auch für heute wieder einen interessanten Beitrag ausgesucht:

“Die Frage, ob die Diggs und Mr. Wongs unserer Tage die Vorboten der kommenden Generationen an Social Bookmarking-Diensten sind, die die heute bekannten Suchmaschinen ersetzen können, wurde schon öfter diskutiert und wird es auch noch öfter werden. Hier ein paar Gedanken und Erklärungen dazu:

Das Web ist riesig und wächst weiter
Die Crawler sind schnell und ständig im Web unterwegs, um neue Daten für die Indizierung aufzunehmen. Aber Crawler sind eben nur Programme, die die Analyse des Inhalts einer Webseite durch einen Menschen nicht ersetzen können. Reicht es angesichts der steigenden Zahl an Web-Nutzern aus, den Crawlern allein die Indizierung des gesamten Webs zu überlassen? Denn auch die Menschen finden durch die zunehmende Vernetzung neue Web-Inhalte immer schneller.

Soziale Algorithmen
Menschen analysieren Dokumente nach verschiedenen Mustern. Es gibt bestimmte Kriterien, an Hand derer festgelegt wird, ob ein Beitrag „interessant“ ist oder nicht. Dazu zählen die Aktivität und Geschwindigkeit bei den Bewertungen, die Streubreite der Stimmen und die Menge an Bewertungen. Diese Algorithmen wenden somit Metriken auf die Inhalte an, die ursprünglich von Menschen bewertet wurden. Und das ist möglicherweise der beste Weg zur Ermittlung der Relevanz. Sollen doch die Menschen entscheiden.

Es geht nicht darum, wie gut Inhalte sind, sondern wie schlecht
Die Suchmaschinen wollen eher den sozialen Gral der Relevanz erreichen und sind deshalb nicht wirklich darauf ausgerichtet, die schlechte Qualität eines Artikels zu berücksichtigen. Dieser Aufgabe kommen die Bookmarking-Sites am allerbesten nach, da sie die unwichtigen Inhalte einfach ausblenden.
Wie steht es mit der Relevanz – wenn man einmal von Black Hat-Methoden absieht?
Inhalte gibt es in Hülle und Fülle, während Geld für Anzeigen rar ist. Wer im Internet Aufmerksamkeit erlangen will, muss in den Suchmaschinen vorne stehen. Manche Seitenbetreiber greifen da zu umstrittenen Methoden. Für die Nutzer ist es aber nur wichtig, wie relevant die Inhalte in Bezug auf den Suchbegriff sind. Werden also unzulässige Methoden verwendet, kommt eine Seite möglicherweise nie auf den Bildschirm, egal wie relevant ihr Inhalt ist.
Wenn die Welt nur von den Suchmaschinen abhängen würde, würden die Nutzer vielleicht nur die gewünschten Inhalte bekommen. Von Menschen entdeckte Seiten gibt es nur in den Bookmarking-Diensten.

Aber vielleicht kann man ja Suchmaschinen und Social Bookmarking-Dienste so wenig vergleichen wie man Menschen und Computer?”

Zumindest heute lässt sich kein eindeutiger Sieger ermitteln. Die Social Bookmarking-Dienste haben sicher einige Vorzüge verglichen mit den Suchmaschinen, aber sie können auch noch leicht manipuliert werden. Eine überlegte Kombination beider Möglichkeiten ist sicher der beste Weg, die gewünschten Inhalte zu finden. Ob diese Aussage morgen noch Gültigkeit hat, wird sich zeigen.


Diese Artikel dürften Sie auch interessieren


Wikiasearch ist online

Gepostet in Suchmaschinen durch Josef Willkommer am 7 January, 2008

Ab sofort gibt es neue “Konkurrenz” für Google. Wikiasearch - Die Google-Alternative - ist online.

Die Suchmaschinen ist unter http://search.wikia.com/wiki/Search_Wikia erreichbar. Wir werden im Laufe des Tages einen ersten Test machen und Euch unsere Eindrücke mitteilen. Wir sind schon sehr gespannt….

Hier aber nochmals die vier Grundprinzipien von Wikiasearch, die dafür sorgen sollen, dass sich das neue “Baby” von Jimmy Wales ein Stückchen vom Suchmaschinen-Kuchen abschneiden kann:

  • Transparenz - Wikiasearch legt besonderes Augenmerk auf eine offene Architektur, d.h. Open Source Komponenten, Offener Content sowie APIs
  • Mitarbeit - Jeder User kann bei Wikiasearch auf unterschiedliche Art und Weise mitmachen, wobei der Social- und Community-Gedanke im Vordergrund steht
  • Qualität - Wikiasearch möchte durch Einbindung der Community die Suchergebnisse signifikant verbessern und so ein völlig neues Sucherlebnis ermöglichen
  • Datenschutz - Gerade in der Vergangenheit gab es mit bekannten Suchmaschinen hier immer wieder “Probleme”. Eines der obersten Ziele von Wikiasearch ist die Wahrung der Privatsphäre und des Datenschutzes.

Naja, hört sich im ersten Moment ganz vernünftig an. Bleibt nur abzuwarten, ob das reicht um gegen die allmächtige Konkurrenz bestehen zu können.


Diese Artikel dürften Sie auch interessieren


Wikiasearch - Die neue Google-Alternative

Gepostet in Suchmaschinen durch Josef Willkommer am 4 January, 2008

Wikiasearch, die neue Google-Alternative geht am 07. Januar online. Bei Wikiasearch handelt es sich um eine freie Suchmaschine, die vom Open-Source-Gedanken getragen wird. Hinter der Entwicklerfirma Wikia steckt der in Internetkreise bestens bekannte Jimmy Wales. Na, klingelts? Jimmy Wales ist Gründer von Wikipedia und war von 2003 bis 2006 Vorsitzender der Wikimedia Foundation. Seit dem ersten Quartal 2007 arbeitet er an der Google-Alternative Wikiasearch. Der grundlegende Unterschied zu allen bisherigen Suchmaschinen liegt darin begründet, dass bei dieser neuen Suchmaschine auf die aktive Mitwirkung der User gesetzt wird. In der Praxis bedeutet dies, dass Bewertungen von Usern in das Ranking einfließen und so die Suchergebnisse verbessern sollen.

Wikiasearch setzt bei der Suchtechnologie auf Open-Source-Komponenten wie Nutch, Lucene und verschiedene andere Projekte, die es erlauben eine vollkommen neue Art von Suchmaschine zu realisieren, bei der primär menschliche Intelligenz zum tragen kommt. Damit erhoffen sich die Macher hinter Wikiasearch bessere Suchergebnisse, da der Mensch gerade in derartigen Bereich nur schwer durch künstliche Intelligenz zu ersetzen ist bzw. Suchergebnisse, die von Algorithmen berechnet werden leichter manipuliert werden können.

Interessant im Zusammenhang mit dieser Suchtechnologie ist die Tatsache, dass unter anderem Amazon als Geldgeber hinter Wikimedia steht.

Mit dem ersten Indizierungsvorgang möchte Wikiasearch erstmals rund 35 Mio. URLs erfassen. Für diesen Vorgang wurden Webseiten von der Community hinter der Suchmaschine in unterschiedliche Klassen eingeteilt, wobei darauf geachtet wurde, dass mit der ersten Indizierung Webseiten erfasst werden, die als besonders wichtig eingestuft werden. Damit sollte sichergestellt werden, dass die Ergebnisse von Beginn an aus möglichst „vertrauenswürdigen“ Quellen stammen.

Die Liste der URLs wurde in drei Gruppen unterteilt, die man sich als Top-10, Top-50 (d.h. 40 zusätzliche Seiten) und Top-100 (nochmals zusätzliche 50 Seiten) vorstellen kann. Diese Klassifizierung bedeutet nicht, dass die Top-Ergebnisse zwingend aus der Top-10-Liste stammen müssen, vielmehr handelt sich hier lediglich um eine grobe Priorisierung.

Die Suchergebnisse sollten dabei primär von Webseiten mit grundsätzlich nützlichen und einzigartigen Inhalten stammen. Ergänzt werden die Ergebnisse dann noch durch Verzeichnisse, die über vernünftige Links verfügen, sowie diverse andere Quellen.

Zum besseren Verständnis nachfolgend noch das Klassifizierungssystem von Wikiasearch mit einigen Beispielen für den initialen Crawling-Vorgang:

Class I  (Top-10)

•    en.wikipedia.org – sehr gute Datenbasis für den Start mit mehr als 2 Mio. Artikelseiten
•    www.youtube.com
•    www.bbc.co.uk
•    www.cnn.com
•    www.flickr.com
•    www.imdb.com
•    www.forbes.com
•    www.ebay.com
•    www.amazon.com (weil Amazon als Geldgeber mit an Bord ist? :-))

Class II (Top-50)

•    www.mahalo.com
•    www.blogger.com
•    *.microsoft.com
•    *.apple.com
•    www.bl.uk

Class III (Top-100)

•    www.wikia.com
•    www.photo.net
•    www.slashdot.org
•    www.gutenberg.org
•    www.sourceforge.net
•    www.usa.gov
•    www.loc.gov

Verzeichnissen mit guten externen Links

•    dir.yahoo.com
•    www.dmoz.org
•    del.icio.us
•    www.simpy.com
•    www.stpt.com

Seiten mit User-Driven-Content und vielen Links

•    www.myspace.com
•    del.icio.us
•    www.digg.com
•    www.stumbleupon.com
•    www.furl.net

Blogs

•    www.wordpress.com
•    www.blogspot.com
•    www.typepad.com

Andere

•    www.w3.org

Die aktuelle Liste findet man unter http://search.wikia.com/wiki/Whitelist.

 

 

 

 


Diese Artikel dürften Sie auch interessieren


Nutzlose Meta-Tags in Web-Seiten

Gepostet in Suchmaschinen durch Marion Engel am 14 December, 2007

Es ist immer wieder erstaunlich, wie viele nutzlose Tags in den Headern von Web-Seiten zu finden sind. Der größte Nachteil dieser Tags liegt darin, dass sie den eigentlichen Inhalt der Webseiten im Source-Code weiter nach unten schieben. Natürlich lesen die Spider von Google und den anderen Suchmaschinen auch weiter unten, um die tatsächlichen Seiteninhalte zu finden, aber warum soll man es ihnen unnötig schwer machen?Deshalb hier einige der beliebtesten, aber nutzlosen Tags, die im Header einer Webseite vorkommen, aber für die Suchmaschinenoptimierung nichts bringen.

<META NAME=”ROBOTS” CONTENT=”INDEX, FOLLOW”>

Dieser Tag bringt nichts, weil die Suchmaschinen-Spider die Seite sowieso besuchen, und diesen Tag gar nicht beachten. Solange von guten Seiten auf eine Seite verlinkt wird, findet Google die Seite auch. Dieser Meta-Tag ist nur dann sinnvoll, wenn eine Seite nicht indiziert werden soll. Aber auch in diesem Fall ist nicht sicher, dass die Spider die Information beachten. Eine robots.txt-Datei ist immer die bessere Alternative, um Seiten von der Indizierung auszuschließen. Sie wird tatsächlich auch von den meisten Suchmaschinen berücksichtigt.

<META NAME=”REVISIT-AFTER”>

Auch dieser Tag wird in den meisten Fällen von den Suchmaschinen ignoriert. Die Spider haben ihre eigenen Zeitpläne und Häufigkeiten, in denen sie Webseiten besuchen. Man kann einem Spider nicht zwingen, die eigene Site häufiger zu besuchen.

<META NAME=”COPYRIGHT”>

Und noch ein bedeutungsloses Tag für die Webseite. Es ist zwar schon verständlich, dass ein Web-Designer oder ein Suchmaschinenoptimierer seine Kontaktdaten in einem solchen Feld sehen möchte, aber sie sollten der Versuchung dennoch widerstehen. Denn man kann damit weder verhindern, dass andere Ihren Source-Code kopieren (dagegen helfen nur Gesetze) noch Werbung für sein Unternehmen machen. Denn wer schaut schon in den Source-Code, um die Kontaktdaten des Anbieters oder Dienstleisters zu bekommen? Dieser Tag schiebt den eigentlichen Seiteninhalt nur noch weiter nach unten.

Und es gibt noch einige weitere nutzlose Tags, die Webmaster auf ihre Seiten stellen. Schauen Sie einfach mal auf einigen Seiten in den Source-Code oder stellen Sie Ihre Meinung als Kommentar ein.

Quelle: Search Engine Journal


Diese Artikel dürften Sie auch interessieren


Next Page »