Лидерство в мировом масштабе компании Google в сфере поиска сейчас кажется неоспоримым. Да и положение других грандов – Yahoo! и MSN — кажется весьма устойчивым.
Будет ли будущее поиска определяться конкуренцией между большой тройкой поисковых систем? Или же в это соревнование вмешается кто-то еще и нынешние лидеры окажутся забытыми, как сейчас оказались забытыми пионеры поисковых технологий – AltaVista, WebCrawler и Infoseek.
Уже сейчас новички, бросающие вызов гигантам, могут предложить интересные и необычные решения, которых нет у признанных лидеров поиска.
Что же именно могут предложить пользователям эти новые поисковые системы, с помощью чего они собираются изменить расстановку сил в области интернет-поиска?
Технология – искусственный интеллект
Перспективное направление – использование элементов искусственного интеллектаГлавная цель использования искусственного интеллекта (Artificial Intelligence) – добиться не просто поиска совпадающих слов, а понимания смысла поискового запроса. Это, во-первых, позволит выдавать более качественные результаты (благодаря отсечению заведомо бессмысленного спама и случайно совпадающих по смыслу, но не по значению текстов) и, во-вторых, позволит пользователям задавать вопросы на так называемом «естественном языке» (то есть, например, делать запрос «Каково население Китая» и получать осмысленный ответ, вместо того чтобы пользоваться словами «Китай, население, количество»).
hakia.com |
Одной из самых перспективных в плане применения искусственного интеллекта является запущенная в ноябре 2006 года (и находящаяся пока в бета-версии) поисковая система hakia.com. Как заявляют ее создателя, это первая в Интернете поисковая машина, «основанная на смысле». И некоторые результаты действительно впечатляют – некоторые группы вопросов понимаются совершенно правильно (такие, например, как приведенные выше «Каково население Китая» или «Какова погода в Лондоне», — пока, правда, только на английском языке). Однако правильно понимаются далеко не все вопросы и на некоторые даются совершенно неправильные ответы (даже хуже, чем те, которые можно получить от традиционных поисковых машин). Связанно ли это с недостаточно большим пока поисковым индексом либо не точностью алгоритмов распознавания – непонятно. И хотя понятно, что разработчикам hakia.com предстоит громадная работа, те результаты, которые есть сейчас, весьма интересны.
Технология – поиск силами пользователей (People powered search)
Используется сочетание возможностей машинного и человеческого поискаВ основе действий этих поисковых систем лежит интересный принцип – понимание того, что в любом случае поисковые машины ищут хуже, чем люди. Значит, именно на людей (пользователей поисковой системы) и нужно переложить работу по оценке качества и даже нахождения самих поисковых результатов.
Одним из самых ярких примеров реализации такого принципа является известный сервис закладок del.icio.us – хотя у подавляющего большинства пользователей этот сервис и не ассоциируется с поисковой системой. Но тем не менее огромная база отобранных пользователями ссылок, снабженная тегами и комментариями, может помочь даже тогда, когда пасуют традиционные поисковики. Кстати, интересно, что эту функцию del.icio.us уже хорошо поняли спамеры – эта система в настоящее время подвергается их массовому нашествию.
chacha.com |
Интересной формой реализации того же принципа является поисковик chacha.com, сочетающий в себе как традиционный поиск, так и поиск с использованием людей. chacha.com нанимает людей (примерно за 5 долларов в час) для того, чтобы те помогали пользователям системы в поиске. Эта функция реализована в привычной всем форме чата. В случае если пользователя не устроили результаты традиционного автоматизированного поиска, можно воспользоваться командой «Search with Guide» — и в открывшемся окне чата работник chacha.com поможет подобрать наиболее подходящий результат (важно отметить, что пока подобная возможность реализована только на английском языке). Удачные результаты поиска с помощью человека сохраняются и используются в будущем как основа уже для традиционной поисковой выдачи. К сожалению, chacha.com не раскрывает пока своих финансовых показателей и пока невозможно понять, насколько такая реализация поисковой системы экономически оправданна.
Технология – персонализированный поиск
Главная идея этой технологии заключается в том, что разные люди не должны получать одинаковые результаты при одинаковых запросах. Несмотря на то что поначалу это звучит необычно, идея о том, что при каждом запросе должен учитываться контекст (кто спрашивает? что пользователь спрашивал до этого?), представляется весьма плодотворной.
Способы реализации этой идеи различны.
Так, например поисковая система collarity.com ведет учет всех поисковых запросов пользователя, позволяя подобрать наиболее подходящие результаты, опираясь как на историю запросов, так и на опыт остальных участников системы. Причем удобно реализована возможность управления этой персонализацией – при поиске можно выбрать, на что будут опираться результаты: на собственную историю запросов, на совокупную историю запросов всего сообщества пользователей collarity.com либо результаты будут выдаваться вообще без привязки к чьему-либо опыту.
Представителем другого пути персонализации поиска является система rollyo.com. Эта система позволяет пользователям создавать и публиковать собственные поисковые машины, включая в поисковый индекс только те сайты, которые пользователю интересны. Также система позволяет легко находить и пользоваться персональными поисковыми системами, созданными другими пользователями. Идея персонализированного поиска такого типа кажется весьма перспективной и уже активно реализовывается и применяется (как в России – сервис personal.novoteka.ru, так и в мировом масштабе – сервис google.com/coop).
Технология – использование рекомендаций
В отличие от традиционных поисковых систем, которые позволяют найти ответы на вопросы, которые заранее можно предсказать, системы рекомендаций позволяют найти вещи, о существовании которых пользователь мог даже не догадываться.
И хотя эти системы не выглядят похожими на поисковые системы в традиционном понимании, они по своей сути именно сервисами для поиска и являются.
Некоторые системы рекомендаций используют не только положительные, но и отрицательные оценки (то есть дают не только рекомендации, но и антирекомендации, что также является полезным). Кроме того, активное участие в системе автоматическим образом поощряется – ведь чем больше рекомендаций даст пользователь, тем точнее система будет давать рекомендации для него.
Ярким и классическим примером реализации является система рекомендаций на imdb.com и amazon.com, хотя они и не рассматриваются в качестве самостоятельных сервисов.
В настоящее время в Интернете появилось множество сервисов, занимающихся непосредственно организацией систем рекомендаций. В основном они специализируются на работе с аудио и видео, но можно предположить, что столь удачные схемы в скором времени будут применены и в других сферах.
Самым известным на сегодняшний день является сервис Last.fm, сочетающий в себе систему рекомендаций с социальной сетью и онлайн-радио.
Также интересен сервис pandora.com, использующий как систему рекомендаций, так и специализированные способы анализа музыки на основе генетических алгоритмов.
Система whattorent.com специализируется на видео и использует как учет рекомендаций пользователей, так и собственную систему предсказания поведения зрителей.
Пользовательский интерфейс – лучшее представление результатов
kartoo.com |
Интересным является направление, где главным фактором, призванным улучшить качество поисковой системы, является не качество поиска самого по себе, а более наглядное представление (визуализация) полученных результатов.
В этом направлении добились интересных результатов несколько сервисов.
Так, например, quintura.com (разработанная в России) использует для представления облака тегов — ключевых слов, позволяющих уточнить поисковый запрос.
Поисковая система kartoo.com для тех же целей использует кластеризацию поисковых результатов и строит на этой основе дерево терминов, связанных с поисковым запросом.
Ведутся работы над улучшением поискового интерфейсаДанный подход позволяет добиваться очень интересных и быстрых результатов, но и в то же время некоторыми специалистами высказывается мнение, что в настоящее время эти системы слишком сложны для пользователей, чтобы стать по настоящему массовыми.
В этой связи представляется интересной реализация пользовательского интерфейса поисковиком msdewey.com – остроумное решение организовать поиск в виде общения с хоть и виртуальной, но весьма обаятельной хозяйкой поисковика, несмотря на свой развлекательный характер, может иметь большое будущее.
Вертикальный поиск
Под термином "Вертикальный поиск (Vertical Search)" принято понимать поиск, охватывающий какой-либо один круг вопросов, но зато охватывающий его целиком (то есть поисковые системы, охватывающие только блоги, только сайты о работе, только сайты о туризме и т. д.). Часто эти поисковые системы, кроме своей специализации, также отличаются использованием новых поисковых технологий и новыми реализациями интерфейса. Естественным плюсом сервисов вертикального поиска являются более глубокий охват темы и большая актуальность информации (в связи с тем, что круг сайтов ограничен, обновления поискового индекса происходят намного чаще).
technorati.com |
Хорошим примером может служить известный поисковик по блогам technorati.com – кроме собственно поиска данный сервис предоставляет множество инструментов (теги, рейтинги, счетчики ссылок и т. д.), которых нет в крупных поисковиках.
Вертикальная поисковая система simplyhired.com специализируется на поиске по сайтам с предложениями о работе и резюме, доскам объявлений и сайтам компаний. В настоящий момент данная поисковая система имеет в своей базе информацию о более чем 4,8 миллиона вакансий. Кроме того, имеются функция размещения в базе свои вакансии/резюме и интегрированная система рекомендации наиболее подходящих вакансий.
Из рассмотренных примеров (а удалось охватить далеко не все) видно, что даже такая, казалось бы, устоявшаяся и привычная вещь, как поиск в Интернете, может быть совершенно другим – не похожим на то, к чему мы привыкли сейчас.
Кто наиболее удачно реализует новые технологические решения и удастся ли кому-нибудь из новичков потеснить признанных гигантов интернет-поиска – покажет время.
Ссылки по теме
Статья получена: hostinfo.ru