Poznate zaujimave weblogy?
Zostavuje sa slovenska bloggerska elita pre rok 2008
Minuly rok Vas zaujala, co nove bude teraz?
5. január 2007 09.40 WEB
IBM OmniFind Yahoo! Edition - firemný webový vyhľadávač
Vybudujete firemný intranet a začne Vás hnevať nemotorné vyhľadávanie. Radi by ste mali niečo tak dokonalé ako Google ale aby Vám vo Vašom intranete nikto zvonka nevŕtal.
Doteraz platilo, že kvalitné vyhľadávacie stroje boli pomerne drahé ale existovali. Google dokonca predáva celý predinštalovaný server - to je ideálne riešenie "Potrebujem vyhľadávanie na firemný intranet" s odpoveďou "Zajtra to môže bežať".
Novinkou prelomu roka je IBM OmniFing s technológiou Yahoo. Jeho najvýraznejšími rysmi sú:
- zadarmo; napodiv je však extrémne kvalitný a slovo zadarmo neznamená nič utajené naviac,
- java; IBM znamená vždy java ale je to dedikovaná technológia na server a vôbec Vás to nemusí trápiť (nainštalujete a ak to nabehne, netrápite sa či je to žralok alebo káva),
- pomerne rýchly "crawl"; vytvorenie indexu je pomerne rýchle ale nie zasa okamžité (mám to pre test nahodené na mojom slabšom desktope a tam sa doťahuje skoro na 200 naindexovaných stránok za minútu),
- pomerne silne konfigurovateľná stránka s výsledkami (ľahšie vkomponovanie do celkového designu intranetu),
- jednoduché administrátorské rozhranie.
Inštalácia je desivo jednoduchá. Jeden inštalačný súbor. Spustím a po chvíli mi nabehne administrátorské rozhraine. Zadal som tam prvý web a začalo to indexovať. Bol menší a preto som o chvíľu mohol nabehnúť na vyhľadávaciu stránku a otestovať si nájdenie pár výrazov.
Skúšam to na workstation a teraz musí prísť moje upozornenie: Nepokúšajte sa to včleniť na nejaký už existujúci server. IBM OmniSearch má vlastný "web server" v sebe a zrejme bude dosť komplikované rozbehať koexistenciu už skonfigurovaného Apache či IIS.
Na indexovanie je vyžadovaný celý procesorový čas a preto by bolo naozaj dobré mu dopriať doporučovaný hardwarový výkon.
Vo všeobecnosti neprekvapí nikoho, že slušné vyhľadávanie vyžaduje dedikovaný stroj a môžete skúsiť či postačí virtuálny alebo radšej skutočné železo. Ja som odhodlaný ísť do toho a IBM OmniSearch pokúsiť nasadiť.
Používanie sa opäť vymyká nenormálnosti konfigurovateľských orgií a debilného vzhľadu vyhľadávacích formulárov. Administrátor sa prakticky nenarobí - doplní zoznam URL, ktoré ma IBM OmniSearch "crawlovať" a vec je vybavená. Systém vie zaindexovať aj súbory na zadaných diskoch (aj namapovaných). Samozrejme prehľadáva aj vnútro súborov PDF (Word som neskúšal).
Koncoví používatelia použijú vyhľadávaciu stránku v štýle Google alebo im zakomponujete formulár do webových stránok svojho intranetu.
Pohrať sa môžete s logami, vzhľadom, farbami. Skúmavejší administrátori zabehnú do zložiek programu a pomenia si možno aj viacej vecí ale samotný základ poskytuje už administračné rozhranie.
Sledoval som systém nainštalovaný na mojej pracovnej stanici (Windows 2000 Workstation) a musím podotknúť, že RAM nie je nikdy dosť. Index sa v pohode vyšplhá na niekoľko gigabajtov. Pri nočnom indexovaní intranetového webu po približne 120 tisícoch dokumentov dorazil posledné bajty na mojom disku. Nedoindexovaný web sa vo výsledkoch neobjavuje. Problémom u mňa je aj rozoznávanie prihlásených používateľov cez prostriedky Windows (crawleru vracia často chybu 401).
Tento systém je najrýchlejšia cesta k dosiahnutiu naozaj dobrého vyhľadávača firemných dokumentov a pre menšie sajty (do pol milióna dokumentov).
pošli do vybrali.sme.skKomentáre k obsahu príspevku:
Chcete napísať nesúhlasný komentár? Prosím, zvážte nasledovné: je šanca, aby niekto zmenil Váš názor alebo chcete iba trvať na svojom? V prvom prípade sú Vaše slová vítané.
Chcete urážať? Nepíšte sem urážky a invektívy. Každý, kto na týchto stránkach publikuje je automaticky (doplňte vhodný výraz). Takže už to všetci vopred vieme, čo si myslíte a preto sa neopakujte.
Podmienky pre Váš komentár: Tlačidlo na odoslanie stlačte 1x, v texte nenadávajte, nevkladajte linky za účelom SEO, nepropagujte, Váš text musí mať zmysel, neporušujete vlastnícke práva majiteľa tejto stránky, ste pravidelný čitateľ tejto stránky, komentujete príspevok (nie erupcie Slnka) a nemýlite si komentáre s kvákacími fórami a chatom. Používajte formátovanie TEXTILE najmä na odkazy! Rozumiete tomuto poučeniu? áno, nie alebo Týmto sa pošle komentár?
Tiez som to skusal, ale malo to konflikty s Apachom.
Skusal si mnogosearch, indexuje myslim aj priamo z DB. Je opensource.
[1] ved pisem, ze to treba dat na dedikovany stroj :-)
[2] neskusal, neinstaluje sa to moc komplikovane "linuxovym" zvykom je, ze okrme samotneho balicka je treba pomaly nahradit 30 kniznic, upgradovat perl, php, apache :-) u OmniSearch som dvojklikom spustil instalacku :-)
Tak si zhodnotim mnogosearch:
Pravdepodobne je to funkcny soft ale zrejme potrebuje zanieteneho cloveka, ktory to uz aspon 10x rozbehaval - trochu nerozumiem preco taketo softy nemaju po nainstalovani nieco, cim si nastavim vyberom z profilov vhodne prostredie a v priebehu par minut uz indexujem weby.
Minusom mnogosearch je rozhranie pre administraciu a preto nepouzitelne pre pripad ako som ja:
chcem do firmy vyhladavac ale nechcem prejst Vysokou skolou vyhladavacich mechanizmov.
Vdaka za tip, naozaj zaujimava vecicka.