Suchmaschine

Wir betreiben die Internet-Suchmaschine „SiteCrawl“ die Webseiten und deren Inhalt indexiert und so die Suche nach Begriffen ermöglicht. Die SiteCrawl Suchmaschine ist eine Eigenentwicklung basierend auf einem LAMP-Server, der eine seltene Mischung aus Web-Crawler und Metasucher („SuMa-Hybrid“) ist und von uns bevorzugt genutzt wird weil er die Vorteile aus beiden Suchtechnologien kombiniert, indem er den eigenen Datenbestand und den von anderen Suchmaschinen aggregiert. Durch die parallele Abfrage aller Datenbanken ist eine extrem kurze Antwortzeit möglich.

Der Grund warum wir eine eigene Suchmaschine betreiben ist ausschliesslich der weil wir so selbst die volle Kontrolle darüber haben welche Datenbestände wir genau durchsuchen können und dabei nicht auf externe Anbieter angewiesen sind. Wir können so nicht nur selbst entscheiden welche Quellen durchsucht werden, sondern auch wie tief und in welchem Turnus die Quellen abgefragt werden. SiteCrawl ist nicht nur unglaublich schnell, sondern auch extrem flexibel um schnell Ergebnisse zu finden.

Parallel dazu betreiben wir eine spezielle Intranet-Suchmaschine die Quellen im Intranet bequem durchsuchbar macht. Da Quellen meist verteilt auf Netzwerkfreigaben, Netzwerkspeicher (NAS) und sonstigen Datenträgern sind, kann so über eine semantische Suche der gesamte Datenbestand nach Inhalten durchsucht werden, beispielsweise FTP-Server, NAS, PDF-Dokumente, Files, Wissensdatenbank und der Medienbestand, bestehend aus Audios, Fotos und Videos.

Die eigene Suchmaschine

Warum extra eine eigene Suchmaschine betreiben? Nun, die meisten würden sich das fragen und nicht verstehen warum so ein Aufwand betrieben wird. Es gibt doch genügend Suchmaschinen im Internet. Da ist doch jede weitere unnötig. Ja, könnte man meinen, aber solche Aussagen können auch nur von Personen kommen die nie in die Verlegenheit kamen umfassend suchen zu müssen, sowohl im Internet als auch im Intranet. Da kommt nämlich keine Suchmaschine hin. Und auch keiner Suchmaschine im Internet können Sie genau vorgeben welchen Index sie zu pflegen hat und welche Dokumente genau wie indexiert werden sollen. Sie werden so weder ihre auf verschiedenen Speicherlaufwerken, Datenträgern und Online-Konten befindlichen Dokumente, E-Mails, Medien wie Audio und Video und Archive durchsuchen können, als auch niemals wirklich das finden können was ihnen wirklich wichtig ist. Klar ist das man auch selbst bestimmen kann welche eigenen Datenquellen indexiert werden sollen, gut geschützt über ein persönliches Login. Der öffentliche Teil kann von jedermann durchsucht werden.

Unnötig zu sagen das es auch nicht die eine, perfekte Suchmaschine für alle gibt und geben kann, denn jeder hat andere Präferenzen und keine Suchmaschine kann alle Wünsche erfüllen. Zudem war uns nach Tests diverser auf dem Markt befindlicher Suchmaschinen-Software schnell klar das es weder eine reine Crawler-Suchengine, noch eine Meta-Suchmaschine sein kann, sondern unsere Vorstellung der perfekten Suchmaschine muss in beiden Welten gleichzeitig zu Hause sein, also einen eigenen Crawler besitzen um einen eigenen Datenbestand aufbauen zu können, als auch eine schnelle Meta-Suchmaschine die beliebig viele andere Suchmaschinen mit abfragen kann um daraus ein Suchergebnis zu erzeugen das alles in einer Seite vereint.

Cookies helfen bei der Bereitstellung von Inhalten. Durch die Nutzung dieser Seiten erklären Sie sich damit einverstanden, dass Cookies auf Ihrem Rechner gespeichert werden. Weitere Information
Navigation
Drucken/exportieren