Статья на тему Интернет » Продвижение и оптимизация » Дублирование контента: как с этим бороться?

Дублирование контента: как с этим бороться?

Дублирование контента – это одна из тех проблем, которую создатели поисковых систем пытаются решить уже достаточно давно. Борьба с этим злом в области поисковых технологий происходит с переменным успехом, а, в конечном счете, страдают авторы материалов и простые пользователи.

Сами разработчики поисковых систем не раз поднимали эту проблему на множестве конференций, но воз, как и раньше ...

А что делать простому пользователю, который по определенному запросу на первых страницах находит один и тот же материал? Хорошо, если материал качественный, а если нет?

загрузка...

Вот и остается пользователю либо довольствоваться тем, что дали, либо продолжить поиск, тратя на него свое время.

Проблема заключается еще и в том, что в большинстве случаев дублирование контента происходит незлонамеренно. Основными причинами дубляжа контента могут стать:

перечисление небольших фрагментов идентичного текста на всех страницах сайта либо на страницах других сайтов (это могут небольшие информационные блоки о каких-либо событиях, компаниях, людях и т.д.);
это могут быть сайты, на которых располагаются новостные агрегаторы (rss), которые просто перепечатывают новости с других сайтов;
могут возникнуть копии страниц, расположенных на одном «доме». Здесь, в большинстве случаев, проблема в технических неполадках или неграмотно составленном файле robots.txt. Так, к примеру, веб-мастера частенько забывают закрывать от индексации версии страниц, предназначенные для печати. Нередко на сайте присутствуют идентификаторы сессий, которые приводят к тому, что одна и та же страница индексируется поисковой системой по несколько раз и т.д.
нередко пользователи цитируют каких-либо людей, причем объемы цитат могут быть существенными, в этом случае поисковым системам не к чему придраться.

При этом не следует забывать, что переводные статьи (чем, собственно, занимается ваш слуга) не считаются дублированными статьями. Во всяком случае, об этом говориться на официальном блоге Google. Данная поисковая система даже старается помочь пользователям разных государств лучше понимать друг друга, осуществляя множественный перевод с одних языков мира на другие.

На блоге говорится, что фрагмент, который оформлен как цитата, дублированным контентом не считается. Хотя верится в это с трудом.

Несомненно, больше хлопот доставляют те, кто, не ставя ссылки на источник, сознательно ворует контент без соблюдения авторских прав.

Обнаружить «вредителей» можно с помощью следующих сервисов:

www.copyscape.com. (сервис позволяет найти, на каких сайтах сеть контент, похожий на тот, что представлен на введенной странице);
www.webconfs.com (http://www.webconfs.com/similar-page-checker.php) (сервис, показывающий процентное соотношении похожего контента на сравниваемых страницах).

Кроме этих сервисов, для выявления дубляжей используется параметр &rd=0 (только для поисковой системы Яндекс). В строку поиска вводится фрагмент текста, который, может быть, сворован, Яндекс выдает точные повторения, чтобы обнаружить нечеткие дубли в конец url на странице поиска ставится &rd=0, поиск проводится повторно. Но, повторюсь, данный параметр применим только для Яндекса.

Выявить сайты, которые воруют у вас контент, не ставя ссылку, - это полдела. Обратитесь к ним сначала с просьбой поставить ссылку. Безрезультатно? С предупреждением о том, что могут быть приняты адекватные меры. В том случае, если ваши требования не выполнены, можете смело жаловаться хостеру. Они обычно не церемонятся, в результате «сайт-вор» может прекратить свою деятельность на долгий срок.

Поисковые системы стараются бороться с дублирование текста так, как могут - придумывают различные фильтры. Конечно, какая-то часть повторяющегося материала отсеивается, но другая часть остается. И, к сожалению, очень много материала повторяется из-за ошибок веб-мастеров. Есть несколько шагов, которые помогут значительно сократить количество дублированного материала:

закрывайте в robots.txt версии для печати, страницы с ненужной повторяющейся информацией;
если вы перенесли свой сайт на другой домен, то не забудьте реализовать 301 редирект на новую версию сайта с помощью htaccess или просто закройте старую версию от индексации;
постарайтесь не допускать наличия таких страниц на сайте, как /index.html;
не допускайте на сайте наличия идентификаторов сессий;
следите, чтобы сайт индексировался только с www., пропишите директиву host в robots.txt;
если вы собираете на сайте подборку авторов с других сайтов, то не забывайте ставить ответную ссылку

Поисковая система Google просит пользователей сообщать о нарушении авторских прав, которое ведет к захламлению поиска спамом, и обещает принимать против нарушителей меры.

Иными словами, проблема, как сохранить релевантную выдачу, должна волновать не только разработчиков поисковых систем, но и всех, кто заинтересован в качественном поиске.

Перевод под ред. Сергея Стружкова ,
По материалам блога Центра поддержки веб-мастеров Google и сайта webconfs.com
Статья получена: www.SeoNews.ru

загрузка...

Постоянная ссылка на статью "Дублирование контента: как с этим бороться?":

Рассказать другу

Оценка: 4.0 (голосов: 16)

Поиск по базе статей:

Темы статей

Новые статьи

Противовирусные препараты: за и против

Добро пожаловать в Армению. Знакомство с Арменией

Крыша из сэндвич панелей для индивидуального строительства

Возможно ли отменить договор купли-продажи квартиры, если он был уже подписан

Как выбрать блеск для губ

Чего боятся мужчины

Как побороть страх перед неизвестностью

Газон на участке своими руками

Как правильно стирать шторы

Как просто бросить курить

Вместе с этой статьей обычно читают:

Аллергический коньюктивит - как с ним бороться?

Аллергический конъюнктивит — это аллергическое воспаление слизистой оболочки глаз. Аллергические конъюнктивиты поражают примерно 15% всего населения. Аллергический конъюнктивит может возникать как проявление сенной лихорадки, как лекарственная аллергия, как аллергия на животных, как реакция на контактные линзы и др.

» Заболевания - 33298 -

Что такое целлюлит и как с ним бороться

Объективная наука статистика утверждает, что целлюлит в более или менее выраженной форме присутствует у 80% женщин. Изменения происходят незаметно. Вы еще молоды, здоровы и стройны, но кожа бедер и живота вдруг стала неровной и бугристой, как корочка апельсина.

» Заболевания - 4631 -

Депрессия: как с этим бороться и побеждать

Чувство депрессии знакомо каждому. Почему бы и нет? Жизнь полна сложностей, а судьба нередко бросает нам вызов.

» Заболевания - 1909 -

Синдром хронической усталости: как с ним бороться

Фикус всегда был зеленым, он просто не имеет права стать оранжевым или малиновым в клеточку. Сосед уже десять лет с милой улыбкой приветствует тебя, когда вы сталкиваетесь у лифта. Друзья денег не просят, а просто пытаются вытянуть тебя на шашлыки.

» Заболевания - 4779 -

Что такое шеф-психолог и как с этим бороться?

Он смотрит на тебя мудрым взглядом, но при этом у тебя ощущение, что он ничего не слышит, каждый твой недочет приводит к длительному анализу твоей карьеры в компании и твоих личных проблем, он постоянно цитирует великих психологов и популярную психологическую литературу? Поздравляю, твой шеф, скорее всего, приобрел психологические знания, и тебе теперь придется с этим жить! Как?

» Работа и карьера - 1729 -

Статья на тему Интернет » Продвижение и оптимизация » Дублирование контента: как с этим бороться?

Все статьи | Разделы | Поиск | Добавить статью | Контакты

Дублирование контента: как с этим бороться?

Ваш комментарий

Темы статей

Новые статьи

Вместе с этой статьей обычно читают: