Backstage - Suche auf der MSXFAQ

Aktuell gibt es keine Volltextsuche aber es gibt andere Optionen, wie ich auf Suchen auf der MSXFAQ beschreibe.

Eine wichtige Funktion einer Webseite ist natürlich die Durchsuchbarkeit des Inhalts. So Wie sie tagtäglich Suchmaschinen wie Google bemühen, um im Internet entsprechende Informationen zu finden, so kann auch das Auffinden von Informationen auf einer Webseite schon sehr aufwändig werden. Die MSXFAQ besteht Anfang 2005 aus über 100 Megabyte Daten und ca. 800 einzelnen HTML-Dateien. Da kann auch ich als Autor schon mal die Übersicht verlieren.

Daher bin ich immer mal wieder auf der Suche nach einer effektiven Suchfunktion für meine Webseite. Die Webseite selbst ist ja bei mehreren Providern abgelegt (1und1, HostEurope und 1blu) und alle nutzen einen Apache. Einen dedizierten Server möchte ich eigentlich nicht, damit meine Arbeitszeit meinen Kunden und in die Artikel der MSXFAQ fließen kann. Betrieb und Updates der Server machen die Hoster ganz gut. Aber keiner bietet eine "Site Seach"-Funktion an.

Früher: Google Custom Search (mit Werbung)

Tja und dann passierte es im April 2011, dass die Suche nicht mehr funktionierte. Ich habe es erst auf meine IE9-Installation verschoben, dass höhere Security-Einstellungen das Nachladen der Skripte von Live Search unterbinden. Aber Googles Chrome und Firefox liefen auch nicht mehr. Nach einigem Suchen habe ich dann vermutlich die Ursache gefunden:

Ich bin zwar nicht sicher, ob es GENAU diese Funktion ist, die nun auch die Sitesearch auf MSXFAQ stört. Da ich auf dem Server eigentlich nichts installieren will, schaue ich mir gerade die verschiedenen Optionen an, z.B.

Temporär habe ich daher die Google Custom Suche (mit Werbung) aktiviert, bis ich was anderes gefunden habe.

LiveSearch

Seit ca. April 2008 hatte ich Microsoft Live Search in die MSXFAQ integriert. Im Gegensatz zu meiner vorherigen Suchfunktion "Sphider" war sie wenigstens aktuell, elegant und sogar ziemlich schnell. Die Integration war sehr sehr einfach (ca. 10 Minuten) weil man nur den passenden Code in die Webseite einbaue muss. Da war dank einer zentralen DWT-Vorlage schnell erledigt.

Mich störte dabei nur, dass jeder Klick auf eine Fundstelle ein neues Fenster öffnet (verursacht durch ein "target=_blank", was im nachgeladenen Code hinterlegt ist) und die lustig hohe Anzahl an Ergebnissen. Wenn man aber aber weiter blättert, kann ist man irgendwann am Ende und dann stimmt auch wieder die Anzahl oben. Die Ergebnisse selbst waren aber akkurat, so dass es eher ein kosmetisches Problem ist.

Hier ein paar Links, wenn Sie selbst ihre Seite mit einer "Site Search"-Funktion ausstatten wollen.

Es ist wirklich SEHR einfach, die Live Suche zu integrieren. Schauen Sie sich einfach den Quelltext dieser Seite an und suchen Sie nach dem Kommentar "<!-- Live Search -->"

<!-- Live Search -->

Hier dazwischen ist der relevante Code

<!-- Live Search -->

Anscheinend macht aber Firefox in Verbindung mit aktiviertem "Adblock Plus" etwas Probleme, dass er den Live-Code als Werbung erkennt und den Download verhindert oder verzögert.

Geschichte der Site Suche

Die Geschichte der Suche ist sehr wechselhaft. Wie zur damaligen Zeit habe ich auch erst auf eine Suche in der Seite selbst verzichtet. Solange die Anzahl der Seiten überschaubar war, konnte jeder Besucher allein über das Menü und die Struktur die gewünschte Information schnell finden. Oder er wurde von externen Suchmaschinen (Damals war Google noch klein und Yahoo, Altavista.digital.com etc. waren die Platzhirsche) auf die MSXFAQ gelenkt.

Aber bald hat sich gezeigt, dass dies nicht mehr ausreichend war. Da der Webhoster keine Suche angeboten hat und ich mit PHP, MySQL etc. keine eigene Entwicklung starten wollte, habe ich einige Zeit einen externen Anbieter eingebunden.

  • Freefind (ab 2002)
    www.freefind.com
    Nach einer Anmeldung indexiert Freefind die komplette Seite und erlaubt die Einbindung in die eigene Webseite. Auf das Ergebnis "sieht aus", als käme es von der MSXFAQ, da ich eine meiner Seite mit Platzhaltern für das Ergebnis hochgeladen hatte.

Allerdings hatte Freefind den Nachteil, dass Sie die Seite eben nur einmal je Woche gespidert haben. Insofern wurden neue Seiten von mir erst mit Verzögerung sichtbar. Freefind will aber Geld verdienen. Also hatte ich die Wahl, dafür zu bezahlen oder mit der Werbung zu leben, die in die Ergebnisse eingeblendet wurde. Insofern war es keine Lösung auf dauer aber schon mal besser als gar nichts.

Daher habe ich einige Jahre später mich dann an die Integration einer kleinen lokalen Suchmaschine aus Basis von PHP gemacht. Ich habe etwas herum gesucht und mit HostEurope auch eine mySQL-Datenbank und PHP nutzen können. Es hat etwas gedauert, bis ich in der Vielzahl der PHP-Lösungen eine für mich implementierbare Suchmaschine gefunden habe.

Eine Beschreibungen finden Sie auf Suche mit Sphider. Allerdings musste ich nun von Hand über eine Webseite ab und an die Indexierung anschieben, da ich keine CRON-Jobs auf dem Webhosting nutzen kann. Das vergesse ich natürlich sehr leicht. Dann hat mir 2006 jemand ein besonderes Geburtstagsgeschenk gemacht (Hacked). Letztlich waren es aber die doch schlechten Trefferraten, die mich weitersuchen haben lassen

Schon länger beobachtete ich dazu die großen Suchmaschinen (Google, Live Search) und deren Site Suche. Ich habe das Glück, dass die MSXFAQ relativ häufig und aktuell in den Suchergebnissen vertreten ist, so dass eine Suche mit einer Beschränkung auf die MSXFAQ gute Treffer liefert. Ich habe da auch mit der Sitemap (siehe GoogleMap auf MSXFAQ-Skripte) mitgeholfen, dass die Suchmaschinen auch richtig alles lesen und finden.

Gestört hat mich aber bislang, dass eine Suche in einem Formular auf der MSXFAQ die Ergebnisse dann doch wieder auf der Seite der Suchmaschine angezeigt hatten. Erst mit Live Search in der aktuellen Form bekommen Sie die Ergebnisse auf der MSXFAQ und nicht in einem eigenen Browser angezeigt.

Keywords statt Suche ?

Das Problem der Suche ist aber auch, dass Sie die richtigen Begriffe verwenden müssen und die Suchmaschine entsprechend "tolerant" arbeitet. Häufig gibt es zu einem Thema (z.B.: POP3) sehr viele Seiten, die damit verbunden sind. Daher pflege ich am unteren Rand der Seite nach und nach Schlüsselworte ein, die auch durchsuchbar sind. Ich hoffe, dass in absehbarer Zeit auch ein Index darauf generiert werden kann

Weitere Links