"Крысиный" плагин BayesIt не любит мусора

Пожалуй, сегодня нет ни одного интернетчика, который не сталкивался бы со спамом. Но борьба с рекламным мусором ведется, пусть даже не столь эффективно, как хотелось бы, и ситуация выглядит уже гораздо лучше, чем год-два назад. Почтовые службы устанавливают на своих серверах фильтрующее ПО, проводятся конференции, на которых обсуждаются варианты противодействия и наказания злостных спамеров, в том числе и на законодательном уровне, программисты предлагают свои решения для сортировки писем...

Для почтового клиента The Bat!, не нуждающегося в особом представлении, также сравнительно недавно появился плагин BayesIt, который способен отсеять львиную долю рекламных писем. Его работа основывается на использовании известного статистического метода Байеса, который позволяет с высокой точностью идентифицировать письма как спам или не спам. На одном из этапов установки BayesIt его необходимо обучить: указать папки, в которых находится "хорошая" почта, а в каких - "плохая". Чем больше обработается писем из первой и второй категории, тем выше точность последующей идентификации. Но, так как не многие специально коллекционируют спам (подобные письма всегда безжалостно и быстро удаляются), то для обучения плагина с сайта klirik.narod.ru/usefuls/bayesit.htm стоит скачать базу спама. Кстати, на этой же страничке находится подробная инструкция по установке и работе с BayesIt. Теперь весь найденный плагином спам в полученной с сервера почте попадает в специальную папку "Junk Mail".

В новой версии программы добавлена поддержка "Выборочного скачивания" - возможность удалять "плохие" письма прямо на сервере. Однако, как заметил Алексей Виноградов, автор BayesIt (интервью с ним опубликовано в этом же номере), "выборочное скачивание" малоэффективно при обычном модемном соединении с повременной оплатой, поскольку в этом случае с сервера сначала будут скачиваться заголовки всех входящих писем, а затем будет происходить доставка тех, которые удовлетворяют условиям фильтра. Поэтому суммарный объем скачиваемых заголовков и затраченное на это время может оказаться больше, чем выигрыш от удаления некоторых писем на сервере.

Точность работы BayesIt выше всяких похвал - за все время работы было пропущено всего несколько "плохих" посланий. Плагин, в отличие от других программ, которые необходимо запускать перед приемом почты, работает абсолютно прозрачно и незаметно для пользователя. При этом скорость и точность обработки корреспонденции BayesIt, по сравнению хотя бы с тем же известным SpamPal, несравненно выше.

Плагин обновляется довольно часто, и последнюю его версию (на момент написания статьи - gm) можно скачать по адресу klirik.narod.ru/arc/bayesit04gm.exe. Размер дистрибутива - 185 Kb. Немаловажно, что плагин на данном этапе развития абсолютно бесплатен.

 

Павел БАДЯЛИК

Версия для печатиВерсия для печати

Номер: 

41 за 2003 год

Рубрика: 

Software
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!