Suchmaschine

Wir betreiben die Internet-Suchmaschine „SiteCrawl“ die Webseiten und deren Inhalt indexiert und so die Suche nach Begriffen ermöglicht. Die Suchmaschine ist eine Eigenentwicklung basierend auf PHP und eine Mischung aus Crawler und Metasuche und kombiniert so die Vorteile aus beiden Suchtechnologien, indem es einen eigenen Datenbestand, als auch parallel externe Datenbestände abfragt. Der Grund warum wir eine eigene Suchmaschine betreiben ist ausschliesslich der weil wir so selbst die volle Kontrolle darüber haben welchen Datenbestand wir durchsuchen können und dabei nicht auf externe Anbieter angewiesen sind. Wir können so nicht nur selbst entscheiden welche Quellen genau durchsucht werden, sondern auch wie tief und in welchem Turnus die Quellen abgefragt werden. SiteCrawl ist nicht nur unglaublich schnell, sondern auch extrem flexibel um schnell Ergebnisse zu finden.

Parallel dazu betreiben wir eine spezielle Intranet-Suchmaschine die nur im Intranet verfügbar ist und Quellen im Intranet bequem durchsuchbar macht. Da Quellen meist verteilt auf Netzwerkfreigaben, Netzwerkspeicher (NAS) und sonstigen Datenträgern sind, kann so über eine semantische Suche der gesamte Datenbestand nach Inhalten durchsucht werden, beispielsweise FTP-Server, NAS, PDF-Dokumente, Files, Wissensdatenbank und der Medienbestand, bestehend aus Audios, Fotos und Videos.

Die eigene Suchmaschine

Warum extra eine eigene Suchmaschine betreiben? Nun, die meisten würden sich das fragen und nicht verstehen warum so ein Aufwand betrieben wird. Es gibt doch genügend Suchmaschinen im Internet. Da ist doch jede weitere unnötig. Ja, könnte man meinen, aber solche Aussagen können auch nur von Personen kommen die nie in die Verlegenheit kamen umfassend suchen zu müssen, sowohl im Internet als auch im Intranet. Da kommt nämlich keine Suchmaschine hin. Und auch keiner Suchmaschine im Internet können Sie genau vorgeben welchen Index sie zu pflegen hat und welche Dokumente genau wie indexiert werden sollen. Sie werden so weder ihre auf verschiedenen Speicherlaufwerken, Datenträgern und Online-Konten befindlichen Dokumente, E-Mails, Medien und Archive durchsuchen können, als auch niemals wirklich das finden können was ihnen wirklich wichtig ist. Klar ist das man auch selbst bestimmen kann welche eigenen Datenquellen indexiert werden sollen, gut geschützt über ein persönliches Login. Der öffentliche Teil kann von jedermann durchsucht werden.

Unnötig zu sagen das es auch nicht die eine, perfekte Suchmaschine für alle gibt und geben kann, denn jeder hat andere Präferenzen und keine Suchmaschine kann alle Wünsche erzeugen. Zudem war uns nach Tests diverser auf dem Markt befindlicher Suchmaschinen-Software schnell klar das es weder eine reine Crawler-Suchengine, noch eine Meta-Suchmaschine sein kann, sondern unsere Vorstellung der perfekten Suchmaschine muss in beiden Welten gleichzeitig zu Hause sein, also einen eigenen Crawler besitzen um einen eigenen Datenbestand aufbauen zu können, als auch eine schnelle Meta-Suchmaschine die beliebig viele andere Suchmaschinen mit abfragen kann um daraus ein Suchergebnis zu erzeugen das alles in einer Seite vereint.

Suchmaschinen im Testbetrieb

Derzeit sind die Suchmaschinen YACY und SEARX bei uns im Test. Über die Links können Sie diese ausgiebig testen.

Cookies helfen bei der Bereitstellung von Inhalten. Durch die Nutzung dieser Seiten erklären Sie sich damit einverstanden, dass Cookies auf Ihrem Rechner gespeichert werden. Weitere Information
Navigation