Возможно, кого-то удивит такой заголовок. Плагиат у большинства вызывает исключительно негативные эмоции и трудно увидеть в этом явлении какую-то “полезность”. Однако попытаемся…
Как известно, задачу поиска, в общепринятом смысле, можно подразделить на 2 подзадачи:
1. информационный (тематические материалы, справочная информация и т.д.)
2. неинформационный (компании, сервисы, товары, услуги и т.д.)
Да простят меня гуру за подобные вольные трактовки.
Я прекрасно понимаю, что в общем случае вся задача поиска это именно информационный поиск. И неинформационного поиска нет. Но в рамках данной статьи буду использовать для наглядности именно такое разделение.
Мне трудно судить о том, насколько сами поисковики разделяют эти два вида поиска и какие подходы используют для этого, но, судя по общей “топорности” применяемых методов, оригинальностью эти подходы не сильно отличаются.
А раз так, то попытаемся самостоятельно разобраться в этом вопросе. Здесь и далее мы будем рассматривать именно задачу информационного поиска (в вышеозвученном контексте).
Для более полного понимания сути вопроса коснемся такого немаловажного понятия как релевантность, а точнее одного из ключевых факторов - ссылочого ранжирования. Не секрет, что ссылочное ранжирование является не просто ключевым фактором оценки релевантности, но скорее определяющим. Современный поиск просто немыслим без его учета.
Но! Именно в этом и кроется, по моему мнению, главная ошибка, когда мы подходим к задаче поиска исключительно информационных материалов. Почему?
Возьмем самого обычного веб-мастера. Пусть это будет пресловутый Василий П.. Наш Вася создал свой сайт и наполняет его информацией. Заметьте! Не ссылками, а информацией. Глупо полагать, что Вася будет сидеть днями и ночами, пытаясь придумать что-то свое, новое и оригинальное. Скорее всего, большая часть материалов будет заимствоваться по принципу “мне понравилось”. С одной стороны Вася занимается откровенным плагиатом и наносит невосполнимый моральный ущерб правообладателям, которые в свою очередь будут заваливать его гневными письмами с требованием удалить украденное или хотя бы поставить ссылку на первоисточник. Но с другой стороны, Вася выражает этим свою оценку скопированному материалу. Проще говоря, он голосует за него, поднимает его рейтинг, доносит до большего числа людей. И при этом, не обязательно ставит ссылку на первоисточник. Если не полениться и взять любой интересный материал, то в интернете можно найти немало копий или частичных заимствований. Об “интересности” конкретного информационного материала можно судить по соотношению числа копий ко времени, прошедшему с начала его создания. Таким образом, делаем логичный вывод, что плагиат может использоваться для определения авторитетности, т.е. быть фактором ранжирования. Причем фактором незаменимым, когда речь идет об информационном поиске.
Неинформационный поискВ случае, когда речь идет о неинформационном поиске (например, поиск сервисов), то веб-мастер естественно не может “скопировать” на свой сайт поисковик, бесплатную почту или брэнд. В этом случае он может только поставить ссылку. И тогда вполне эффективным будет классическое ссылочное ранжирование. Но, повторюсь, в случае информационного поиска, ссылочное ранжирование может быть совершенно необъективно и в каких-то случаях даже вредно.
Правда, использование плагиата как фактора ранжирования ставит задачу определения первоисточника. Причем, замечу, задача эта в большей степени морально-этического плана, дабы не нарушались авторские права. Но с точки зрения пользователя разницы никакой нет - он в любом случае получает один и тот же материал.Но нельзя сказать, что эта задача принципиально сложна. Прежде всего, поисковики определяют дату появления каждого документа в индексе. Уже это с большой степенью вероятности позволит определить первоисточник. Если же в индексе за короткий промежуток времени появилось несколько копий, то можно задействовать еще один фактор. Для каждого сайта вводится оценка оригинальности контента. Т.е. соотношение незаимствованных (оригинальных) документов к их общему числу. Т.е. доверие к сайту с высокой оценкой оригинальности будет выше (вот вам еще один фактор ранжирования). И эта же оценка будет определять вес “голоса” данного сайта за данный материал, а значит, и за сайт-первоисточник. В заключение…
Ну и в заключение хочу сказать, что я не вижу принципиальных проблем на пути реализации данного подхода к оценке информационного наполнения сайтов. Вся необходимая информация для этого у поисковых систем есть. И, возможно, даже какие-то разработки в этом направлении ведутся. Но даже если и так, то они скорее экспериментальные, нежели практические.
Также замечу, что распространена практика перепечатки материалов с разрешения авторов. Формально это не является плагиатом, но методология оценки интересности/авторитетности материала и сайта-первоисточника от этого не меняется.
Статья получена: www.SeoNews.ru