Anmerkungen zu IBMs kostenloser Web-Suchmaschine Omnifind Yahoo Edition

15. Dezember 2006 von Wolfgang Sommergut

Die IBM stellte in dieser Woche Omnifind Yahoo Edition vor, eine kostenlose Suchmaschine für Intranets und Firmen-Websites. Nach einem Redaktionsbesuch von zwei Mitarbeitern des Böblinger Entwicklungszentrums, das die Software entwickelt hat, und ein paar eigenen Experimenten, hier ein paar Punkte, die mir interessant erscheinen:

Omnifind Yahoo Edition

  • Obwohl die Software wie die Enterprise Edition und die Discovery Edition auf den Namen Omnifind hört, unterscheidet sie sich technisch entscheidend von den beiden anderen Ausführungen. Sie basiert zwar auch auf dem Open-Source-Framework UIMA, nutzt aber die freie Apache Lucene als Indexer. Da die Yed auch geschlossene Software nutzt wie etwa IBM-eigene Lexika, Spracherkennungsmodule oder Dateifilter, unterliegt das Produkt keiner Open-Source-Lizenz.
  • Im Gegensatz zu den größeren Ausführungen beschränkt sich die Yed auf die Indexierung von zwei Datenquellen, nämlich solche, die via HTTP erreichbar sind und auf Dateisysteme. Es besteht keine offizielle Möglichkeit, Adapter für andere Daten-Pools wie SQL- oder Notes-Datenbanken zu integrieren. Die Suchmaschine kennt außerdem keine Sicherheitsfunktionen, wie sie in der Enterprise-Suche sonst üblich sind. Wenn der Crawler Zugang zu bestimmten Daten hat, dann tauchen sie in der Trefferliste auf, egal ob der Benutzer berechtigt ist, auf diese Quellen zuzugreifen. Da eine Kopie eines jeden indizierten Dokuments im Cache abgelegt wird, könnten sie von allen eingesehen werden, die nicht befugt sind, das Original zu öffnen. Es ist daher Vorsicht geboten, mit welchen Rechten und Passwörtern man den Crawler ausstattet.
  • Verwirrend sind IBMs Auskünfte bezüglich der unterstützten Dateitypen. Während die Pressemitteilung von von mehr als 200 spricht, listet die mitgelieferte Dokumentation nur etwa 25 auf. Selbst in der langen Liste (PDF) fehlen Atom/RSS, die neuen XML-Formate von Office 2007 oder ODF. Leider kann die Yed im Gegensatz zu den kostenpflichtigen Enterprise-Versionen nicht um weitere Dateifilter erweitert werden.
  • Die in Java geschriebene Software lässt sich entgegen den sonstigen IBM-Gepflogenheiten sehr einfach installieren. Das Admin-Interface ist sehr übersichtlich, die Zahl der Konfigurationsoptionen überschaubar. Die Art der Relevanzberechnung lässt sich über drei Parameter steuern. Eine davon ist die im Web übliche Link-Popularität, die in Intranets eine geringere Rolle spielt.
  • Omnifind Yed ist eine eine gute Alternative zu freien Lösungen wie etwa Nutch, das auch auf Lucene basiert. Sie eignet sich aber nicht als Software für eine öffentliche Search Engine, weil sie Suchmaschinen-Spam nicht erkennen und abwehren kann. Außerdem ist sie keine Lösung für kleine Websites auf Basis eines Webhosting-Pakets: Die Software verschlingt mehr als 200 MB RAM und lastet die CPU gehörig aus.
  • Da Seiten in Intranet oft nur schlecht verlinkt sind, dürfte der Crawler dort immer wieder Schwierigkeiten haben, eine Site vollständig zu durchlaufen. Ein alternativer Mechanismus wie Google Sitemaps, der eine Suchmaschine die Liste der zu indexiernden Dateien präsentiert, wird zurzeit nicht unterstützt.
  • Schließlich finde ich IBMs Motivation fragwürdig, das untere Segment des Suchmarkts durch kostenlose Software zu entwerten. Während Google sein Such-Business mit der Mini in Richtung Enterprise-Search erweitert, besitzt die IBM ein solches nicht. Omnifind Yed kommt in dieser Hinsicht dem Kooperationspartner Yahoo zugute. Die IBM hofft, dass sie mit der Gratis-Software die Marke Omnifind bekannter machen kann und auf diese Weise mehr Lizenzen für die Enterprise-Versionen verkauft. Webmaster und Systemverwalter, die Omnifind Yed aus dem Netz laden, sind jedoch i.A. nicht jene, die über ein firmenweites Suchprojekt in fünf- oder sechsstelliger Höhe entscheiden.
  • Die häufig strapazierten Vergleiche mit Google Mini übersehen zumeist, dass Letztere eine Kombination aus Hardware und Software ist: „Kostenlose gegen kostenpflichtige Suchmaschine“ stimmt also nicht, weil man für Omnifind Yahoo Edition erst einen Rechner braucht. Außerdem muss man bei der IBM den Support mit 2000 Euro pro Jahr und Server extra bezahlen, während er bei Google schon inklusive ist.

Update: Das Svizzer Blog sieht in der kostenlosen Omnifind-Version vor allem ein Projekt von Yahoo. Das trifft nicht zu. Die IBM hat die Software praktisch alleine entwickelt und Yahoo bloß als Vertriebspartner gewählt, um Nutzer jenseits ihrer traditionellen Klientel in den großen Unternehmen zu finden.

Siehe auch: Eintrag zu Omnifind Yahoo Edition im Computerwoche-Wiki

Kategorie: Suchmaschinen 2 Kommentare »

2 Antworten zu “Anmerkungen zu IBMs kostenloser Web-Suchmaschine Omnifind Yahoo Edition”

  1. Hallo Herr Sommergut,
    ich habe auf unserem Svizzer-Blog gerade klargestellt, dass die Entwicklung ganz überwiegend auf IBM zurückgeht. Danke für den Hinweis. Für mich war an der Meldung vor allem wichtig, dass nun mit Yahoo ein an sich auf B2C fokussiertes Unternehmen in den Markt für Enterprise Search einsteigt. Noch vor weniger als zwei Jahren hat man bei Yahoo den Einstieg in diesen Markt kategorisch abgelehnt.
    Mein Unternehmen stellt selbst Enterprise Search Software her und daher wundere ich mich auch ein wenig über die Motivation, nun mit kostenloser Software in den Markt einzusteigen. Für Dynamik wird das m.E. durchaus sorgen. Vermutlich sieht IBM ein Potenzial, mit Services und Support Umsätze zu machen. Ferner könnte die Überlegung (oder Hoffnung) bei IBM sein, dass eine Reihe von Interessenten sich möglicherweise die ausgewachsenen Omnifind-Lösungen von IBM zumindest einmal ansehen, wenn sie mit der Yahoo Edition nicht glücklich sind.
    Bei Yahoo bin ich mir nicht sicher, aber vielleicht betrachtet Yahoo dieses Tool als künftigen Werbeträger bzw. Frontend für Sponsored Links. Immerhin wird im Zusammenhang mit Enterprise Search eine interessante Zielgruppe angesprochen. Wir werden es erleben…
    Alles Gute und viele Grüsse, Alexander Rossner

  2. Martin Siemens sagt:

    Hat man eine umfangreiche e-Book Sammlung und will man diese effizient innerhalb des Unternehmens zur Verfügung stellen, gibt es derzeit kein besseres Tool als IBM Omnifind Yahoo Edition.
    Jede Software hat ihre Ausrichtung – und mit dieser hben IBM/Yahoo voll ins Schwarze getroffen…