Instantná štatistika z vlastných logov
Iste všetci vieme, prečo existujú instantné štatistiky (Toplist, Navrcholu):
- možnosť porovnávať weby navzájom pretože iná možnosť ako ich popularitu porovnať nie je,
- nedostupnosť logov servera hostingu,
- neschopnosť spracovávať logy servera,
- neprehľadnosť, primitívnosť a invalidita skriptov, ktore spracúvajú logy servera.
Zavedením „kódu“ nejakého počítadla teda iba prenesieme záznam do takého istého logu serveru počítadla aký má aj Váš server.
Z toho mi vyplýva, že by firmy prevádzkujúce počítadla MOHLI byť schopné zákaznícky spracovávať vlastné logy serverov. V čom je výhoda?
Možnosť použiť PRESNEJŠIE záznamy o návštevách (nevypadnú návštevy typu „mám vypnuté obrázky“). Možnosť použiť totožnú metodiku počítania návštev. Komfortnosť prostredia (grafy, analýzy).
Dal som niekomu tip na rozšírenie možností ich počítadlového servera? Pokiaľ to už niekto má hotové, poskytne informácie o sebe? A čo z toho bude mať Spravodaj? ;-)
Nemyslim, ze by firmy prevadzkujuce pocitadla spracovavali priamo logy. Ano, mohli by, ale chcelo by to pravdepodobne dost odlisnu technologiu. Zvycajne bezia na nieco, co v ramci moznosti v realnom case rovno pcha prichadzajuce dotazy do meta databazy z ktorej potom generuju statistiky. Navyse neviem kolko z ludi, co prevadzkuju vlastny server ma v logoch aj zaznamy o rozliseni screenu, podpore JS, Flash, JAVA a inych technologii, takze na druhej strane by si o tieto cisla prisiel.
[1] tie problemy si uvedomujem ;-)
nevidim problem vkladania udajov z txt logu do db. bezny import.
tie ostatne udaje mozes napriklad ozeliet.
pre mensi web su prakticky nepotrebne a klamlive. Napriklad clovek s mensou obrazovkou sa na webe s fix 1600 width nebude citit dobre a uz sa nevrati. Podobne ostatne technologie.
Parsovanim logov zacinal povodne iAudit. Zo zaciatku (nejaky ten rok) sme im vzdy na konci mesiaca natlacilina ich system logy z apache, oni par dni chrumali a vypluli statistiky. Potom presli na dot sposob a z pohladu mna ako prevadzkovatela je to jednoduchsie, lebo tlacit niekde desiatky GiB logov za mesiac uz nie je az taka zabava. Navyse to ani zdaleka nehovorilo nic o stave v aktualnom case, takze dosah a odozva zmien na stranke, ci marketingovych akcii z tejto strany prichadzali zvycajne po funuse. Spracovavanie logov je skor vhodne pre male sites, ako pre velke. Aspon z pohladu „pocitadiel“. Interne si tie logy spracovavat mozem aj nadalej.
ved ti mozu urobit trebars nejakeho klienta, ktory prechrume tie logy a cojaviem v noci ich posle na big spracovanie (grafy, a ptakoviny)
mne to prichadza ako zaujimava alternativa, kde obidem nutnost pchat od kazdej stranky „dot“ kod.
Podla mna nie ako alternativa, ale ako doplnenie. Cely mesiac ziskaavt statistiky bodkou, na konci mesiaca naimportovat logy, urobit prienik logov, pripadne zistit odlisnosti.
To by bola IMHO technika, ktora by pekne ukazala, v com bezna bodka zaostava.
Pytam sa veeeelmi opatrne, neviem totiz, ci som nieco nepochopil – ide vam o to, aby vam logy spracovala nejaka online sluzba, alebo o samotne spracovanie logov do podoby statistik? Lebo softy na spracovanie logov do podoby statistik typu Toplist, Naj a pod. existuju, preco si ich teda nespracovat „doma“? Ale opakujem, mozno som len uplne nepochopil pointu clanku.
[6] skor to prve. Proste spojit obe veci dokopy:
predstav si, ze mne je „zatazko“ instalovat si nejaky soft na parsovanie logov ked aj tak nemaju nejaku metodiku na porovnanie.
Sluzby ako toplist maju silu vo vzajomnom porovnani-audite. Lenze si myslim o logoch, ze su presnejsie a zaroven nemusis mat v kazdej stranke vlozeny nejaky divny kod, ktory je iba barlickou.
Takze pacilo by sa nieco v style:
toto si nakopiruj na server, nastav kde su umiestnene logy a hod to do crontab. Zvysok je nasa starost ;-)
Instantna sluzba ale na zaklade originalnych logov.
Ja som sa uz niekolkokrat pokusil mat nieco ako MRTG – pochybujem ze to niekto len tak zvladne ;-)
Nakoniec som dospel k jednoduchemu perl skriptu ale ten mi zasa nerobi grafy, lebo na nejake gd kniznice som nemal cas a len kvoli statistike ich nechcem ani na servri mat.
Asi som strelil capa a vsetci su spokojni s hlupymi dot obrazkami :-)
Ale pokial mi doporucis soft, ktory je dostatocne vykonny ale nekladie na mna naroky vyssie ako konfiguracia apache ;-) tak sem s nim ;-)
[7] jasne, aj som si myslel, ze ti ide skor o online spracovanie.
asi ti nic konkretne nedoporucim, lebo tiez som spokojny s „naj“ (hlavne ked nemam k dispozicii logy, ze? :-) ), ale predcasom som si testoval par veci z dotazu:
http://www.google.com/search?q=analyze+log+apache&sourceid=opera&num=50&ie=utf-8&oe=utf-8
pustal som to na intranetove logy, nastavenia neboli zlozite, ale detaily si uz nepamatam :-)
clicktracks – plateny a drahy (USD 1000), ale trial verzia je zadarmo.
ad nevypadnú návštevy typu „mám vypnuté obrázky“:
to je paradoxne prave duvod, proc je treba pro servery, ktere maji na svych strankach umistenu reklamu, lepsi pouzit „dot“ mereni. Protoze ten navstevnik, ktery nevidi merici bod, by pravdepodobne nevidel ani tu reklamu :-)
[10] ano, to je dobra poznamka ;-) ale aj tak ma neodraduje od myslienky, ze webove logy mojho servra vlastne lezia nepouzite a pritom su to take „cistejsie“ data ;-)