В последнее время резко активизировался интерес к различным программам для поиска информации на жестком диске пользователя. Вряд ли это можно объяснить только громкими именами создателей (речь идет о Google Desktop Search, поисковых клиентах MSN и Yahoo). Просто объемы типичных жестких дисков возрастают стремительными темпами, в то же время далеко не все пользователи могут позволить себе постоянное неограниченное интернет-соединение, поэтому интересующие документы предпочитают копировать на свой диск. Как, к примеру, автор статьи, у которого архивы интересных страниц и документации, обнаруженной на просторах Интернета за последние пару лет, уже перевалили за отметку в 20 Гб. Но все эти утилиты хоть и достаточно продвинутые, но их популярность во многом объясняется известностью компании-производителя.
Но вот если спросить профессионала, кто выпускает действительно профессиональные средства для поиска и первичной обработки информации, вам наверняка ответят – Copernic Technologies.
Copernic – компания, которая занимается поиском и ничем больше
Copernic на рынке поиска уже давно, хотя занимается исключительно десктопными приложениями, не выходя на уровень веб-поиска, что, впрочем, совершенно оправдано. Хотя на сайте я не отыскал даты создания фирмы, но первый раз услышал про Copernic еще лет шесть назад, так что ориентировочно компании уже где-то десять лет от роду, а это немалый срок. Четкая фокусировка на поиске и анализе информации позволила создать и отточить за многие годы ряд совершенных алгоритмов, которые находят применение в линейке продуктов Copernic, причем некоторые из программ будут востребованы только сейчас. На странице About Copernic – Technologies очень точно и емко указаны направления деятельности и приоритеты компании:
- индексирование – применяется технология поиска, при которой сначала строится индекс из извлеченной из файлов информации, а потом поиск производится уже в индексе, не затрагивая сами файлы. Параллельно программа отслеживает изменения файлов и обновляет индекс в реальном времени, всегда храня его актуальную версию;
- федеративный поиск (Federated Search) – позволяет быстро проводить поиск по нескольким областям, в том числе на локальном диске и в Интернете одновременно;
- автоматическое реферирование и аннотирование (Summarization) – применяется для составления краткого реферата из текста найденного документа для предварительного ознакомления;
- отслеживание изменений (трекинг, Tracking) – для интеллектуального отслеживания изменений документов, будь то на локальном диске или же в сети Интернет.
Ознакомившись с таким перечнем технологий, думаю, несложно догадаться, что Copernic выпускает продукты, в которые включены все или часть из этих технологий, и, таким образом, они все вместе, дополняя друг друга, создают полную платформу для поиска и обработки информации (пожалуй, только переводчика и системы хранения документов не хватает). Хотя каждая программа по-своему уникальна и заслуживает отдельной статьи, сейчас же мы только вкратце опишем всю линейку продуктов Copernic: Copernic Agent, Copernic Desktop Search, Copernic Tracker, Copernic Summarizer, Copernic Meta.
Copernic Agent
Одна из самых старых и популярных программ в арсенале Copernic – Copernic Agent. Она представляет из себя персонального агента-помощника для поиска в сети Интернет, причем это не просто метапоисковый клиент, а именно помощник, знающий около сотни (!) различных поисковых серверов, разбитых на 10 категорий (тут есть как универсальные поисковики, так и специализированные, например файловые, mp3 или поиска товаров).
Работа программы очень проста, но это не исключает ее профессионального применения – вы можете просто использовать ее для поиска информации сразу через много поисковых серверов, но в руках профессионала это мощнейший инструмент, который может интеллектуально обрабатывать результаты и существенно помогает при анализе «широким фронтом».
Agent – профессиональный метапоиск для всех
Существует три редакции программы, нацеленные на разные категории пользователей: Agent Basic – базовая простая версия (бесплатная), без многих дополнительных возможностей, которые не востребованы при обычном поиске; Agent Personal – уже полупрофессиональная версия, позволяющая гибко управлять результатами поисков, с расширенной поддержкой поисковиков, будет лучшим выбором для расширенного поиска, к примеру при сборе информации для написания книги или статьи; Agent Professional – самый мощный продукт в линейке, поддерживающий больше тысячи (!) поисковых механизмов, сотни категорий, имеет мощные механизмы обработки результатов, в том числе и лингвистические (определения языка, дубликатов с разными адресами, отслеживание изменений). Можно и автоматизировать обработку, например, каждый день получать утром новые материалы, которые обнаруживаются в ответ на ваш запрос – множество функций направлены на так называемый бизнес-поиск (Business-oriented search). Сравнить функциональность бесплатной версии Basic и коммерческих Personal и Professional можно, посмотрев на Feature Comparison Chart.
В Agent, который является флагманским продуктом компании, воплотились все передовые концепции поиска и обработки информации: автоматическое реферирование результатов, анализ страниц для поиска дубликатов и интеллектуальной сортировки, отслеживание изменений и появлений новой информации, федеративный поиск по множеству поисковых механизмов с последующим объединением – все это направлено на то, чтобы пользователь гарантированно нашел нужную информацию. Правда, часть функций реализуется с помощью других приложений, которые только вместе составляют единую универсальную платформу (о них далее).
Copernic Desktop Search
Все же всеобщее увлечение настольным поиском не обошло и Copernic: в арсенале компании появилась Desktop Search – утилита для поиска файлов на жестком диске пользователя и не только (правда, функция веб-поиска реализована странно, на основе поисковика AllTheWeb, а ожидалось увидеть что-то вроде интеграции бесплатной версии Agent Basic с возможностью параллельного поиска). Поиск основан на предварительной индексации, которая осуществляется по расписанию, в фоновом режиме или когда компьютер бездействует. Впоследствии новые файлы автоматически добавляются к индексу. Из особенностей программы хотелось бы выделить корректную работу с основными почтовыми программами (Desktop Search была, если не ошибаюсь, первой, кто предложил поиск в адресной книге и сообщениях Mozille Thunderbild), поиск музыкальных и видеофайлов, картинок (жаль, правда, что поиск по изображениям очень примитивный, вообще, этот рынок кажется пустым).
Desktop Search – один из лучших локальных поисковых механизмов
Desktop Search умеет искать в огромном количестве файлов, включая PDF и офисные документы Word и Excel (можно добавить и свои расширения, указав, к какому типу они относятся и как их следует индексировать), умеет интегрироваться с «Проводником» и панелью задач Windows, так что ваш поиск будет всегда рядом. Радует, что область поиска можно очень точно настроить, например исключить конфиденциальную информацию, указать конкретные почтовые папки, которые необходимо индексировать, а также избирательно перестраивать индексы (например, музыкальных файлов, изображений или весь индекс сразу). Результаты поиска удобно сгруппированы по расположению и типам файлов, найденные слова выделяются в области предпросмотра (которая умеет отображать любые понимаемые программой файлы). Параллельно программа просматривает и другие категории, например если вы ищете файлы, то одновременно с текстовыми документами в отдельном окне вам будет показано, что в e-mail или изображениях найдено несколько документов, соответствующих запросу, – сказывается концепция федеративного поиска. Хотя Copernic Desktop Search (текущая версия 1.5 build 644) и является сейчас самой профессиональной и простой для пользователя, но еще есть куда расти – многие функции, которые бы хотелось видеть, пока не реализованы, а, к примеру, веб-поиск хоть и есть, но реально вряд ли применим.
Copernic Tracker
Tracker – отслеживаем изменения на веб-страницах с точностью до слова
А вот Tracker – достаточно новое и интересное приложение. Суть работы простая – мониторинг изменений на веб-страницах. Для работы вы просто регистрируете нужную страницу, программа скачивает ее и анализирует содержимое. Потом задается правило для определения того, обновилась страница или нет. Думаете, это тривиально? Нет. К примеру, можно настроить программу так, что изменения определенного числа слов или предложений на странице не влияет на распознавание. Если на странице со статьей выводится лента новостей, то логично, что в каждый момент времени содержимое может отличаться, в то же время критично именно обновление самой статьи, а не остальной информации на странице. Tracker умеет интеллектуально анализировать страницы и показывает все изменения с точностью до слова, правда, к сожалению, корректно работает только с английским и другими европейскими языками, кириллические страницы пока обрабатываются некорректно.
Похожая функция отслеживания изменений есть и в поисковом агенте Agent Professional, но там она применяется только к результатам поиска, а Tracker позволяет работать с любой страницей и может служить отличным помощником профессионального интернет-пользователя. Утилита, несмотря на внешнюю простоту выполняемых функций, очень интересная, и мы посвятим отдельную статью описанию приемов работы с ней, тем более что доступна полнофункциональная триал-версия (сама программа стоит 49,95 доллара, но полностью окупает эти деньги).
Copernic Summarizer
Summarizer – реферирование любого текста на лету!
Еще один нетривиальный и интересный продукт, органично дополняющий линейку программ для поиска информации. Summarizer позволяет извлекать текст из документов многих форматов и на его основе создает краткий реферат, который передает в упрощенной форме содержание документа. Работа возможна как с офисными документами MS Word, письмами MS Outlook, веб-страницами или PDF-файлами, так и с любым текстом через буфер обмена. После инсталляции Summarizer совместно с Agent Professional появляется возможность вместе с результатами поиска получать сразу краткие рефераты найденных страниц, что позволит сразу отсеять нерелевантные результаты. Интеграция с Internet Explorer позволяет получить сокращенный текст материала сразу же по окончании его загрузки, позволяя оценить содержание документа. Результат работы можно экспортировать в удобный вид (HTML, XML, text или Word) или распечатать. Применений для Copernic Summarizer может быть множество, но она органично вписывается в концепцию поиска – сначала Agent или Desktop Search ищет в Интернете или на локальном диске нужные документы, потом Summarizer выделяет из наиболее интересных ключевую информацию, а потом, когда интересующие ссылки выделены из массы результатов, их можно сохранить и периодически проверять при помощи Tracker, оставаясь всегда в курсе обновления информации.
Copernic Meta
Meta – метапоиск для нетребовательных
Дополнительно в арсенале Copernic есть и совсем простая утилита (подключаемый модуль к IE) – Copernic Meta, реализующая просто метапоиск, конечно, уступая по функциональности Agent, но дающая возможность легко проводить расширенный поиск одновременно через несколько поисковиков. Но если у вас установлен Agent, то часть его функциональности будет задействована в Copernic Meta, и тогда для поиска необходимо сделать всего несколько кликов, даже нет необходимости запускать полноценный Agent.
Несмотря на иногда слабую поддержку кириллицы (хотя Desktop Search отлично работает с русскоязычными документами), продукты Copernic остаются лучшими инструментами для профессиональной работы с информацией и в полном комплекте (Agent, Tracker, Summarizer) при очень небольшой стоимости (порядка 150 долларов) позволят удовлетворить запросы любого пользователя – ученого, писателя, журналиста, аналитика или маркетолога.
Ссылки по теме
Статья получена: hostinfo.ru