IBM OmniFind Yahoo! Edition – firemný webový vyhľadávač

Vybudujete firemný intranet a začne Vás hnevať nemotorné vyhľadávanie. Radi by ste mali niečo tak dokonalé ako Google ale aby Vám vo Vašom intranete nikto zvonka nevŕtal.
Doteraz platilo, že kvalitné vyhľadávacie stroje boli pomerne drahé ale existovali. Google dokonca predáva celý predinštalovaný server – to je ideálne riešenie „Potrebujem vyhľadávanie na firemný intranet“ s odpoveďou „Zajtra to môže bežať“.


Novinkou prelomu roka je IBM OmniFing s technológiou Yahoo. Jeho najvýraznejšími rysmi sú:
* zadarmo; napodiv je však extrémne kvalitný a slovo zadarmo neznamená nič utajené naviac,
* java; IBM znamená vždy java ale je to dedikovaná technológia na server a vôbec Vás to nemusí trápiť (nainštalujete a ak to nabehne, netrápite sa či je to žralok alebo káva),
* pomerne rýchly „crawl“; vytvorenie indexu je pomerne rýchle ale nie zasa okamžité (mám to pre test nahodené na mojom slabšom desktope a tam sa doťahuje skoro na 200 naindexovaných stránok za minútu),
* pomerne silne konfigurovateľná stránka s výsledkami (ľahšie vkomponovanie do celkového designu intranetu),
* jednoduché administrátorské rozhranie.
*Inštalácia* je desivo jednoduchá. Jeden inštalačný súbor. Spustím a po chvíli mi nabehne administrátorské rozhraine. Zadal som tam prvý web a začalo to indexovať. Bol menší a preto som o chvíľu mohol nabehnúť na vyhľadávaciu stránku a otestovať si nájdenie pár výrazov.
Skúšam to na workstation a teraz musí prísť moje upozornenie: Nepokúšajte sa to včleniť na nejaký už existujúci server. IBM OmniSearch má vlastný „web server“ v sebe a zrejme bude dosť komplikované rozbehať koexistenciu už skonfigurovaného Apache či IIS.
Na indexovanie je vyžadovaný celý procesorový čas a preto by bolo naozaj dobré mu dopriať doporučovaný hardwarový výkon.
Vo všeobecnosti neprekvapí nikoho, že slušné vyhľadávanie vyžaduje dedikovaný stroj a môžete skúsiť či postačí virtuálny alebo radšej skutočné železo. Ja som odhodlaný ísť do toho a IBM OmniSearch pokúsiť nasadiť.
Používanie sa opäť vymyká nenormálnosti konfigurovateľských orgií a debilného vzhľadu vyhľadávacích formulárov. *Administrátor sa prakticky nenarobí* – doplní zoznam URL, ktoré ma IBM OmniSearch „crawlovať“ a vec je vybavená. Systém vie zaindexovať aj súbory na zadaných diskoch (aj namapovaných). Samozrejme prehľadáva aj vnútro súborov PDF (Word som neskúšal).
Koncoví používatelia použijú *vyhľadávaciu stránku v štýle Google* alebo im zakomponujete formulár do webových stránok svojho intranetu.
Pohrať sa môžete s logami, vzhľadom, farbami. Skúmavejší administrátori zabehnú do zložiek programu a pomenia si možno aj viacej vecí ale samotný základ poskytuje už administračné rozhranie.
Sledoval som systém nainštalovaný na mojej pracovnej stanici (Windows 2000 Workstation) a musím podotknúť, že RAM nie je nikdy dosť. Index sa v pohode vyšplhá na niekoľko gigabajtov. Pri nočnom indexovaní intranetového webu po približne 120 tisícoch dokumentov dorazil posledné bajty na mojom disku. Nedoindexovaný web sa vo výsledkoch neobjavuje. Problémom u mňa je aj rozoznávanie prihlásených používateľov cez prostriedky Windows (crawleru vracia často chybu 401).
Tento systém je najrýchlejšia cesta k dosiahnutiu naozaj dobrého vyhľadávača firemných dokumentov a pre menšie sajty (do pol milióna dokumentov).
* „OmniFind homepage“:http://omnifind.ibm.yahoo.net/

Môže sa Vám ešte páčiť...

5 komentárov

  1. dusoft píše:

    Tiez som to skusal, ale malo to konflikty s Apachom.

  2. dmiba píše:

    Skusal si mnogosearch, indexuje myslim aj priamo z DB. Je opensource.

  3. rony píše:

    [1] ved pisem, ze to treba dat na dedikovany stroj :-)
    [2] neskusal, neinstaluje sa to moc komplikovane „linuxovym“ zvykom je, ze okrme samotneho balicka je treba pomaly nahradit 30 kniznic, upgradovat perl, php, apache :-) u OmniSearch som dvojklikom spustil instalacku :-)

  4. rony píše:

    Tak si zhodnotim mnogosearch:
    * lite verzia up to 3000 dokumentov – tolko som schopny si zapamatat aj sam :-)
    * windows verzia – po nainstalovani a spusteni programu Indexer ma ohromilo rozhranim ako v atomovej elektrarni, co ma odradilo od dalsiech pokusoch :-)
    Pravdepodobne je to funkcny soft ale zrejme potrebuje zanieteneho cloveka, ktory to uz aspon 10x rozbehaval – trochu nerozumiem preco taketo softy nemaju po nainstalovani nieco, cim si nastavim vyberom z profilov vhodne prostredie a v priebehu par minut uz indexujem weby.
    Minusom mnogosearch je rozhranie pre administraciu a preto nepouzitelne pre pripad ako som ja:
    chcem do firmy vyhladavac ale nechcem prejst Vysokou skolou vyhladavacich mechanizmov.

  5. Bystro píše:

    Vdaka za tip, naozaj zaujimava vecicka.