SearchInform - это ваша власть над информацией

Неделю назад компания "СофтИнформ" (SoftInform) представила пресс-релиз о выходе новой версии системы поиска информации под названием SearchInform. "КВ" просто не может пропустить такое значимое событие и не рассказать о мощной и быстрой программе полнотекстового поиска с поддержкой атрибутов файлов. Тем более, есть о чем рассказать!

Итак, погнали. С помощью SearchInform v1.5.01 за считанные секунды можно найти любой документ, расположенный на жестком диске компьютера или практически в любой базе данных (Access, MS SQL, Oracle, а также любой СУБД, поддерживающей SQL). Программа отлично работает с наиболее распространенными форматами текстовых файлов (txt, doc, rtf, pdf, htm, html), поддерживая и корректно обрабатывая каждый из них. Среди различных возможностей SearchInform можно отметить то, что программа использует индексный поиск, осуществляет фразовый поиск с учетом морфологии и словаря синонимов, включает технологию поиска похожих документов, поддерживает тэги .mp3 и .avi, форматы электронных писем Microsoft Outlook и The Bat!, а также документы Open Office (sxw и stw).

Теперь обо всем подробнее.

Перед тем, как начать поиск отдельных фраз или целых текстовых фрагментов, необходимо проиндексировать все данные, с которыми программа будет работать. Для этого в SearchInform существует "Менеджер индексов", который позволит выбрать область поиска и типы файлов, подлежащие индексации. Все поддерживаемые форматы перечислить невозможно - их очень много. Если говорить о файлах интернета, то SearchInform работает с htm, html, css, js. Поиск может осуществляться и в архивах rar, zip, jar, tar, gz и tgz (жаль, что 7z пока нет). Скорость индексации данных на современных компьютерах достигает 1,2-1,5 мегабайт в секунду (около 6 гигабайт в час). Одним из преимуществ SearchInform является стабильная скорость индексирования больших объемов информации (1 гигабайт и более), а также то, что в программе индексы создаются быстрее и занимают меньше места. На первый взгляд кажется, что процесс индексации требует больших временных затрат. Но для крупных хранилищ данных выгоднее потратить значительное время один раз, а потом мгновенно получать результат по любому запросу. В SearchInform предусмотрена возможность обновления файла индекса. Это значит, что если в электронную библиотеку поступила новая электронная книга, то она в считанные секунды будет добавлена в общую информационную базу.

Фразовый поиск в документе в SearchInform осуществляется с учетом морфологии и словаря синонимов. Словарь синонимов составляется пользователем самостоятельно при помощи "Менеджера синонимов". А для поиска с учетом словоформ рекомендуется установить морфологическую базу данных для языка, на котором будет осуществляться поиск. Кроме этого, в SearchInform возможен поиск строк и выражений с учетом очепяток.

 

Иногда возникает необходимость поиска не просто строки в содержании файлов, а целого текста, полностью или частично совпадающего с текстом запроса. Ни одна поисковая система в мире, кроме SearchInform, не может справиться с этой задачей быстро и эффективно. При поиске похожих по содержанию текстовых фрагментов с помощью данной программы задействованы не только все слова, встречающиеся в документе, но и их словоформы. В результате поиска SearchInform выводит список найденных документов, максимально похожих на заданный фрагмент, в порядке убывания процента совпадения.

При помощи ограничивающего поиска можно искать документы только с определенными системными атрибутами (по размеру файла, по теме письма, по символам, содержащимся в названии, и т. д.). Кроме этого, в SearchInform присутствует возможность использования так называемых "важных слов" (вспомогательных ключевых слов), на которые программа будет опираться при проведении анализа на релевантность. Как утверждают разработчики, "SearchInform найдет информацию в любом файле или базе данных, в любом формате и на любом носителе".

Теперь заострим внимание на доступных версиях программы.

SearchInform Desktop Free: в бесплатной версии не позволяется создавать более одного файла индекса, не установлена поддержка формата pdf, отсутствуют некоторые необходимые функции.

SearchInform Desktop Edition является триальной версией, предназначенной для поиска информации в больших объемах данных и обладающей полным набором функций для обработки данных и поиска документов.

SearchInform Corporate Edition представляет собой сетевую версию программы полнотекстового поиска SearchInform, ориентированную на предприятия мaлoгo и среднего бизнеса и включающую в себя все инструменты, необходимые для структуризации разрозненной информации, для создания cиcтeмы быстрого поиска и для дальнейшей oбpaбoтки документов.

Скачать или приобрести каждую из версий SearchInform можно на официальном сайте программы www.searchinform.com. Здесь же доступна для загрузки морфологическая база данных для русского языка размером в 16 Mb.

Разговор о замечательной и незаменимой программе для поиска информации в больших массивах данных SearchInform версии 1.5.01 хотелось бы закончить девизом разработчиков - компании SoftInform: "SearchInform - это ваша власть над информацией, это возможность действовать, когда остальные только ищут".

Виталий КРАСИЛЬНИКОВ

При написании статьи были использованы материалы сайта www.searchinform.com

Версия для печатиВерсия для печати

Номер: 

30 за 2005 год

Рубрика: 

Software
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!