Поисковая оптимизация - это технология продвижения информационных ресурсов. На оценку поисковой системы влияют десятки различных факторов, начиная с имени домена и заканчивая качеством каналов связи. В статье перечисляются факторы, поддающиеся оценке и управлению, которые влияют на релевантность HTML-документов.
Введение в поисковую оптимизацию
Поисковая оптимизация - это технология продвижения информационных ресурсов. Это не спам, не проталкивание сайтов любой ценной к началу рейтинга поисковых систем.
Увеличение конкурентоспособности проекта достигается в результате выделения и усиления главной темы и повышения ее релевантности запросам пользователей поисковых систем.
Поисковая оптимизация это не просто средство увеличения трафика, влияя на релевантность страниц сайта (основываясь на анализе запросов пользователей поисковых машин) можно добиться многого, но еще большего можно добиться, если цель поставлена конкретно:
- Раскрутка сайта (увеличение известности в заданном сегменте рынка).
- Привлечение целевых посетителей (читателей, покупателей, контрагентов, партнеров).
- Удержание используемого сегмента рынка.
- Формирование более специализированных сегментов рынка.
Поисковая оптимизация не волшебная палочка, она не сможет сделать никем не востребованный, ничего не содержащий ресурс популярным, особенно при наличии жесткой конкуренции.
Прежде чем что-то продвигать, необходимо сделать это "что-то" хоть кому-нибудь нужным!
Поисковая оптимизация предназначена для того, чтобы приблизить востребованность проекта к максимально возможному значению. Но если нужно поднять планку самого "максимально возможного значения", тогда необходимо прибегнуть к наступательным рекламным технологиям.
Релевантность
Каждая поисковая система определяет релевантность HTML-документа, к запросу пользователя, в соответствии с заложенной в нее концепцией поиска. И хотя концепции у всех разные, ищут поисковые машины примерно одинаково, так как алгоритмы поиска построены на общих принципах. Основные отличия поисковых машин заключаются не в алгоритмах определения релевантности, в их реализации.
В каталогах релевантность оценивают живые люди (модераторы), в их задачу так же входит сортировка ресурсов по разделам и отсечение спама. При запросе пользователя поисковая машина каталога рассчитывает релевантность, так же как и машина поисковой системы, но уже с учетом оценок модераторов.
На оценку поисковой системы влияют десятки различных факторов, начиная с имени домена и заканчивая качеством каналов связи. Далее перечисляются поддающиеся оценке и управлению факторы, влияющие на релевантность HTML-документов:
- - Имя домена.
- - Тег Title.
- - МЕТА теги, Keywords;, Description;.
- - МЕТА тег Robots;, файл robots.txt (или его отсутствие).
- - МЕТА тег Refresh;, при значении близком к нулю.
- - МЕТА тег Expires;, если указана прошедшая дата.
- - МЕТА тег Document-state;, определяет режим индексации.
- - Размер HTML-кода, стоящего перед текстом.
- - Ошибки в коде.
- - Ошибки в тексте.
- - Объем текста.
- - Качество текста (стиль, содержание, востребованность).
- - Количество ключевых слов в HTML-документе.
- - Удаление ключевых слов от начала текста.
- - Кучност ключевых слов.
- - Точное соответствие ключевой фразе.
- - Выделение ключевых слов. Теги B, H1 - H6 , STRONG
- - Теги AREA, IMG.
- - Тег A
- - Тег FRAME
- - Тег SCRIPT
- - Тег комментариев
- - Теги STYLE, BODY, FONT, TABLE.
- - Размер изображений размещенных на документе.
- - Количество документов на сервере.
- - Количество "качественных" документов на сервере.
- - Количество "мусора" на сервере.
- - Организация ссылок внутри сервера (глубина, охват, количество).
- - Внешние ссылки на страницы сервера (качество, количество).
- - Рейтинг и соответствие теме серверов, с которых идут внешние ссылки.
- - Популярность сервера (количество обращений).
- - Время жизни сервера (страницы), чем больше, тем лучше.
- - Организация ссылок внутри сервера.
- - Качество виртуального сервера, на котором размещен ресурс (ограничения трафика, надежность).
Очень важные, но не управляемые факторы:
- - Уровень конкуренции по выбранной тематике.
- - Качество ресурсов по выбранной тематике.
- - Востребованность выбранной тематики.
- - Количество спамеров, атакующих поисковую систему по выбранной тематике.
Организация сервера
Если веб-страница будет переименована или перенесена в другой каталог, она потеряет свою рейтинговую историю. Поэтому структура расположения каталогов и страниц, на сервере должна быть организована так, что бы в процессе развития, не было необходимости, в их переименовании или переносе.
При правильной организации структуры сервера, для сопровождения достаточно две операции: добавить и удалить.
Отступление от этого правила целесообразно только при ведении архивов. Когда по истечении небольшого времени показа, страница переносится на "вечное" хранение в каталог архива.
Некоторые поисковые машины индексируют не все HTML-документы на сервере, а только те которые лежат не глубже определенного уровня - гипертекстовых переходов. Поэтому желательно придерживаться правила четырех кликов, то есть страницы должны быть связаны ссылками так чтоб с главной (регистрируемой) страницы можно было попасть на любую другу (подлежащею индексации) за четыре перехода.
Тег LINK, также может использоваться, для указания на следующий индексируемый документ.
Не все поисковые машины могут проводить индексацию по ссылкам из тега FRAMESET. Чтобы избежать проблем, необходимо обеспечить альтернативную ссылку (теги LINK или A) или упростить дизайн.
Такая же проблема может возникнуть и при использовании тега IMAGEMAP, если ссылки не будут продублированы тегам LINK или A.
Роботы большинства поисковых машин не индексируют страницы, URL которых содержит символ '?' или символы не входящие в набор ASCII.
Подготовка документов
Если текста мало, его релевантность может быть недооценена поисковой машиной. Когда текста много поисковая машина обработает только часть его (Rambler, AltaVista, . . .), остальное проигнорирует.
Чтоб не испытывать судьбу, странички ресурса должны быть приведены к оптимальному для индексации состоянию.
Все страницы нужно разбить на три группы:
- Страницы, содержащие рабочий объем текста, 30 - 300 строк (60 - 80 символов в строке), пустые строки не считать. Далее будем их называть опорными документами. Если страница содержит больше текста ее необходимо разбить или сократить.
- Страницы, содержащие мало текста (менее 30 строк), но имеющие ключевую для проекта информацию, будем называть документами второго эшелона.
- Третья группа - страницы, без ярко выраженной релевантности, и не имеющие большого значения для проекта.
Опорные документы могут быть разной тематической направленности, но желательно не очень далекой, друг от друга. Весь текст в одном документе должен относиться к одной тематике.
Желательно, чтобы текст документа был разбит на несколько частей (2 - 7), и каждая часть имела заголовок, выделенный тегом Hx;.
Опорный документ не должен содержать большого объема кода разметки (скриптов, таблиц стилей, тегов комментария). Если таблицы стилей и скрипты необходимы для корректной работы документа, они должны подгружаться из отдельных файлов тегами SCRIPT; и STYLE;. Теги комментариев, в версии документа, предназначенной для сервера, необходимо удалять, подавляющее большинство поисковых машин их игнорирует.
Документ обязательно должен содержать тег TITLE; и META-теги DESCRIPTION; и KEYWORDS;. Конечно, теги должны не просто присутствовать, а содержать информацию по выбранной тематике, в соответствие с назначением тега.
Размер опорного документа не должен превышать 200 kb, желательно уложиться в 50 kb.
Попадание страниц третьей группы в фавориты у поисковых машин мало вероятно. Но влиять на индексацию (замедляя ее) они могут, и общую релевантность проекта они тоже снижают. Что бы этого избежать, необходимо запретить, поисковым роботам индексировать страницы третьей группы.
Замедление индексации может происходить вследствие того, что некоторые поисковые машины индексируют не все страницы сервера за раз. И место того, что бы проиндексировать опорные документы, робот проиндексирует страницы третьей группы. А часть опорных документов останется не проиндексированными. Со временем они тоже будут проиндексированы, но стоит ли терять это время.
Перед тем, как документы будут выложены на сервер, они должны быть проверенны, на наличие ошибок в тексте и коде.
Текст можно проверить в любом редакторе, проверяющем правописание. Для проверки кода нужна специальная программа, броузеры выдают сообщения об ошибках только в критических ситуациях. Если броузер сможет проигнорировать ошибку, он это сделает.
Страничка с грамматическими ошибками едва ли будет серьезно восприниматься посетителями. А ошибка в ключевом слове снизит релевантность документа.
Ошибки в коде могут сделать документ плохо или вообще не читаемым броузером посетителя. Либо понизить релевантность, повлияв на обработку тегов идущих после ошибки.
Поисковые машины оценивают ресурсы сети по содержанию их текстов. Значит, и продвигать, с помощью поисковых машин, эффективней документы, содержащие текст. Положение веб-страницы в рейтинге поисковой системы находится в прямой зависимости от времени ее жизни и популярности, чем больше - тем лучше. Релевантность не является чем-то, что живет в HTML-документе само по себе. Релевантность это коэффициент соответствия HTML-документа запросу. Релевантность, рассчитываемая поисковыми машинами вещь очень субъективная, вследствие несовершенства алгоритмов и ограничений самих поисковых машин. Для того чтобы поисковые машины могли адекватно проиндексировать сайт, он должен иметь, как минимум, несколько относительно стабильных HTML-документов, содержащих некоторый объем текста. Но если важен трафик, а не сам факт регистрации на поисковой машине то без поисковой оптимизации не обойтись.