5. jún 2006 14.47 E-MAIL

Očakávajme krach Bayesianskych filtrov

Nechcem byť zlým prorokom ale je nutné počítať so znižovaním účinnosti Bayesianskych filtrov. V našich jazykových podmienkach je ešte účinnosť veľmi vysoká vzhľadom na jazykové rozdiely.

Bohužiaľ nemožno predpokladať, že vývoj spamovacích nástrojov nepokračuje a okrem tradičnej metódy zvyšovania účinnosti spamu (málo odoziev? pošleme tisicnásobne viac emailov a budú zasa výsledky) sa určite mení obsah mailov so spamom. Pribúdajú "antifilter" prvky v tak vysokej miere, že samotná informácia je len percentuálnym dielikom celého obsahu.

Dnes je v bežnej firme ešte vcelku únosné neriešiť spam vytvorením extra oddelení. Postmaster vcelku zvláda prílev spamu zachyteného vo filtroch vytriediť. A je ešte únosné spam iba označovať a ponechávať v schránkach ľudí.

Veľmi blízko je však doba, keď sa vo filtroch zachytí niekoľko tisícoch mailov denne. V ten moment už úspešnosť 99.9 percenta znamená fatálne dôsledky. Ak mi chodí denne dajme tomu 20 emailov "z internetu" a filter mi z nich zachytil žiadny alebo jeden, po zvýšení "kadencie" spamu mi celkom kľudne môžu filtre zachytávať 10 mailov.

Je doslova evidentné, že čo spam, to originál. Prečo? Proste záťaž generovania preberajú skripty na napadnutých cudzích počítačoch na menej kontrolovaných staniciach debilkov, ktorých jedinou životnou starosťou je mať "ten inet" aby mohli "chodiť na to SME do diskusií".

Písané pod heslom: antispamové filtre mi za víkend označili ako SPAM 4500 emailov. Mimo tie, ktore sa filtrami dostali úspešne dnu, mimo tie, ktore boli iba označkované ako "možný spam".

Riešenie? Pomaličky začínať s agitáciou "e-mail je nespoľahlivý". :-)


Pokiaľ sa ti zdá, že tento článok by sa hodil do výberu zaujímavých stránok, tak ho sme.sk pošli do vybrali.sme.sk

Komentáre k obsahu príspevku:

Chcete napísať nesúhlasný komentár? Prosím, zvážte nasledovné: je šanca, aby niekto zmenil Váš názor alebo chcete iba trvať na svojom? V prvom prípade sú Vaše slová vítané.

Chcete urážať? Nepíšte sem urážky a invektívy. Každý, kto na týchto stránkach publikuje je automaticky (doplňte vhodný výraz). Takže už to všetci vopred vieme, čo si myslíte a preto sa neopakujte.

  1. [1] dusoft, 5. jún 2006 16.54

    podpisy podla domen nie su riesenim? samozrejme, ak by boli aplikovane celoplosne.

  2. [2] rony, 5. jún 2006 17.27

    [1] vsetko je riesenim :-)

    ale podpisy podla domen je dajme tomu to iste ako elektornicky podpis.

    momentalne najspolahlivejsie by bolo, pokial by najrozsirenejsie MTA a MUA obsahovali predinstalovane "bonzacke" riesenie - klepnem na mail, oznacim ako spam, zapise sa do mojho filtra ale zaroven sa s istou vahou "bonzne" niekam.

    sucasne sa musi vyvinut tlak na to, aby sa znizil pocet zombie - pocitacov, ktore si veselo posielaju spam a ich majitel nic netusiac si iba prezera porno alebo bojuje s druhym riadkom textu vo worde ;-)

    obavam sa, ze informatizacia - nielen v Europe ale najma v Afrike prispeje k invazii toho horsieho smerom k nam.

  3. [3] Kozo, 5. jún 2006 17.43

    pri "klepnuti na mail" Ti whatever v MTA je na prd. Nieco dodrotovat do MUA moze pomoct, ale myslim, ze cesta pojde skor k SPF, SenderID a podobnym veciam. V prvej faze asi skor volitelne t.j nieco v style "mozes mi poslat mail odkial chces, ale jeho doveryhodnost bude znizena, ak nebudes pouzivat overenie domeny" a casom to moze prejst plynule na "mozes mi poslat mail odkial chces, ale zaradi sa mi do foldra SPAM ak nepouzivas overenie domeny", az k moznosti "posli co chces, ale ak nemas automaticke overenie domeny, tak Ta rovno zmazem" a zase by na chvilu mohol byt pokoj. Nie som optimista, ze boj na tomto fronte situaciu vyriesi. Treba na to ist inou cestou. A plosne.

  4. [4] rony, 5. jún 2006 18.00

    [3] tiez si myslim, ze by sa mala prekonat nechut zahodit SMTP.

    napriklad aj tou cestou, ze sa niekto rozhodne, ze nad uzavretou kapitolou "servre s SMTP" bude definovany pocet "prestupnych" miest, ktore budu navyse pod silnymi filtrami. A tieto prestupne miesta budu spolufinancovane tymi, ktori budu pouzivat nieco radikalne odlisne. Dokonca si viem prestavit technologie, ktore by nemuseli vobec vymenit alebo doplnit MUA. Iba by sa zmenili MTA.

  5. [5] Kozo, 5. jún 2006 21.00

    Myslim, ze MUA by sa menit mozno nemuseli vobec. E-mail ako terminus technicus je v pohode akceptovany a prijatelny. Ci to bude medzi servermi behat na SMTP, ESMTP, SSMTP, alebo FMTP je koncovemu pouzivatelovi jedno a hlavne by mu to malo byt co najviac skryte a zmeny protokolu co najviac transparentne.

  6. [6] OttY, 5. jún 2006 21.02

    Ja SPAM eliminujem tak, ze admin mi urobil pristup do konfiguracie Spamassassinu. Tam si editujem black/whitelist a vlastne pravidla. Napr. za spam oznaci vsetko, co ma ine casove pasmo ako GMT 0000 az +0200. Mensi skoring dostanu maily s casom GMT 0000 a +0100 a ziadny +0200. Drviva vacsina spamu ma ine casove pasmo, ako je moje. Prejde mi jeden spam za 10 dni, ale musi mat casove pasmo +0200 a nesmu ho zachytit ostatne filtre Spamassassina :) Priznavam, ze pristup na konfiguraciu assassina nema bezny user.

  7. [7] Kozo, 5. jún 2006 21.55

    To je aktualne riesenie Tvojho konkretneho problemu, nie plosne. Pokial mas obchodnych partnerov worldwide, tak toto nefunguje, navyse v mojom pripade (ex-admin freemailu, ktoreho adresa je dost preflaknuta) dostavam aj regulernych mailov dost husto a aj spamu tolko, ze keby som to mal riesit cez WL/BL, tak nerobim cele dni nic ine. Ja mam cez ceba filtrov zavesenych viacero, ale toto vsetko je barlicka. Chyba tomu systemove riesenie.

  8. [8] rony, 5. jún 2006 22.25

    moja posledna veta prispevku je prave preto tak napisana: musi byt dokonale vsetkym jasne, ze email je nespolahlivy. az potom sa zacne uvazovat o niecom dalsom ako je len "hatanie" pretrhnutej hradze.

  9. [9] Yanui, 6. jún 2006 08.18

    Mozno by taku osvetovu kampan o nepolahlivosti emailu mohla zasponzorovat Slovenska posta! ;-)))

  10. A tvoj názor?






Podmienky pre Váš komentár: Tlačidlo na odoslanie stlačte 1x, v texte nenadávajte, nevkladajte linky za účelom SEO, nepropagujte, Váš text musí mať zmysel, neporušujete vlastnícke práva majiteľa tejto stránky, ste pravidelný čitateľ tejto stránky, komentujete príspevok (nie erupcie Slnka) a nemýlite si komentáre s kvákacími fórami a chatom. Používajte formátovanie TEXTILE najmä na odkazy! Rozumiete tomuto poučeniu? áno, nie alebo Týmto sa pošle komentár?



funkcionalita - kto by bol spokojný s obyčajnou funkciou, ked môže mať rovno funkcionalitu? Je to dlhšie, znie to odbornejšie a dajú sa za to naúčtovať väčšie peniaze, keď posielame faktúru za nové webové stránky. Malý bullshitový slovník



Čítal som

Stručne komentované stránky, ktoré ma zaujali:

  • V Bombaji útočili teroristi. Rukojemníci sú v horiacom hoteli 07.59 Pri šiestich útokoch zomrelo najmenej 101 ľudí, z toho najmenej šesť cudzincov, zranených je 200-300 ľudí.
  • The Index.htm thread for Popcorn Hour 09.23 Velmi zaujimava rozsiahla tema diskusii okolo index.htm v PCH - spusta sa okamzite po nabootovani PCH ak je v roote.
  • Movable Type po rokoch | OttY@page 14.23 Z neistej príčiny som sa rozhodol, že si bližšie obzriem ako sa darí Movable Type („MT“), CMS napísanom v Perli, ktorý dnes nie je veľmi „IN“, aspoň v našich končinách (platí pre Perl aj pre Movable Type). Z dôvodu lepšieho ohmatania som si ho nainštaloval na hostingový server a trochu som sa pohral.
  • Dita Von Teese - Playboy, december 2008 12.58 Ditka v sete rozne ladenych fotografii.
  • 2.2 Firmware Now Available in iTunes 12.58 The newest version of firmware is now available in iTunes, version 2.2. We’re installing now on a test phone and will be providing screen shots and a direct link as soon as possible.
  • Kázeň musí být V. 12.58 Evžen vypadal zdrceně. Už zase v dobrém úmyslu, sám v roli poškozeného, porušil zákon. Protože věděl, že zákony se mají respektovat a navíc z toho neviděl cestu ven, zvláště poté, co se sám přiznal do protokolu, opět mužně přijal udělený trest. Je teď bez rádia, bez okénka, bez stěračů, bez poklic a bez antény, navíc ještě bez řidičáku a o pět tisíc lehčí.
  • Je čas na redefinici přístupnosti 11.15 Jestliže si nemohu jedním kliknutím přenést vlakový spoj z IDOSu do svého googlího kalendáře, není pro mne IDOS dostatečně přístupný.
  • Web - metody nahrazování standardních fontů - Chaos sanctuary 20.21 Standardní fonty se nahrazují především v hlavičkách a krátkých textech. Žádná z dále uvedených metod – sIFR, facelift (flir), typeface.js a font-face/CSS - není vhodná pro delší text. Všechny tyto metody jsou relativně nové a stále se vyvíjejí.
  • Nechte je padnout - Bloc 15.49 Ekonomická krize stejně jako každá správná choroba míří do další fáze. Zprávy z trhů už nejsou katastrofické, pouze špatné, pokles burz už není střemhlavý, ale pouze mírný a setrvalý, firmy nehlásí nečekané krachy ze dne na den (viz Lehman Brothers), pouze propouštějí po desetitisících a pouze hlásí snížení výroby či odbytu o pět, deset, dvacet procent.
  • Po ISS se prochází pavouk, dalšího zřejmě zmátl stav beztíže 14.39 Pavouka číslo dvě totiž natolik zmátl stav beztíže, že svou přepravku zaplnil sítěmi, aby přestal volně poletovat. V propletených síťových shlucích se nedá poznat, jestli je tam jeden nebo dva pavouci.
  • Got my girlfriend to model for my car (PICS) 09.39 Chlapik nafotil svoju priatelku pri svojom aute. Reakcii je tam na vyse 60 stran. Stravite na tejto stranke naozaj dlhy cas :-)
  • Tomanová má plán - eTREND 08.00 Ministerka Tomanová v relácii Slovenského rozhlasu "Sobotné dialógy" predstavila svoj plán zmien v systéme sociálneho poistenia a dôchodkového sporenia.


kde to ste?

príspevky

média


Čítaš Spravodaj? Klikni na Surf.sk!

WebHosting: WebServer.sk

Na také to domáce ukladanie veľkých súborov Kotuha.com

Dva šifrované gigabajty zadarmo pre vaše súkromné zálohy na mozy

Späť na obsah