Каталог статей
Поиск по базе статей  
Статья на тему Интернет » Интересное в сети » Контент-анализ

 

Контент-анализ

 

 

Создание сайта не заканчивается на том, что после размещения на каком-либо сервере он становится доступен для посетителей. Придумать идею, воплотить ее в html-страницы, наполнить содержанием и графикой, разместить в Интернете — только первые шаги. Теперь, если автор проекта хочет, чтобы посетители легко находили его творение, нужно добиться, чтобы поисковые машины по определенным, важным для автора словам выдавали ссылку на него на первых страницах результатов поиска. Для этого используются различные методы, и один из них заключается в оптимизации ключевых слов.

Если сайт состоит из нескольких страничек, проанализировать их содержание, выбрать наиболее подходящие и нужные ключевые слова и разместить их в метатегах, правильно составить фразы, по которым эти страницы должны находиться наилучшим образом, — не очень сложная и длительная по времени задача.

загрузка...

 

 

Немного терпения, и все можно сделать. Другое дело, когда таких страниц много, текст на них разный и ставили-то его на страницы не только вы, автор, но и ваши помощники. Проанализировать каждую страницу, подсчитать наиболее часто встречающиеся слова, определить их весовое значение — вот это уже задача посложнее. Делать «врукопашную» — долго и сложно. Нужна помощь. И приходит она в виде программы Site Content Analyzer.

Эта программа выполняет анализ содержимого веб-страниц, автоматически выделяет ключевые слова, подсчитывает количество вхождений каждого слова, анализирует как отдельную страницу, так и сайт полностью, как расположенный локально, так и находящийся в онлайне. На основе наиболее употребимых слов, имеющих для конкретной страницы наибольший рейтинг, программа будет конструировать фразы. Как фразы, так и ключевые слова очень легко экспортируются в текстовый файл.

Анализировать можно как локальные страницы, так и сайты, расположенные в Сети

Основным понятием в программе является понятие «проект». Собираетесь ли вы анализировать отдельную страницу или целый сайт, первое, что требуется сделать, — это создать новый проект. Затем для проекта определяется страница, раздел, в котором находится офлайновый проект, или сетевой адрес проекта, который требуется проанализировать. Каждому проекту в программе соответствует отдельное окно. Одновременно можно открывать неограниченное количество окон (проектов) и запускать в каждом из них свои задачи или выполнять анализ обработанных данных — у каждого окна есть своя собственная инструментальная панель.

Работа с проектом начинается с его проработки (в программе используется слово «парсинг»). В зависимости от количества страниц, их насыщенности текстом, расположения и доступности процесс может проходить как очень быстро, в считаные секунды, так и занимать порядочное количество времени. Впрочем, на длительность процесса влияют также и настройки программы. Что к ним относится? В настройках три раздела. Первый предназначен для общих настроек размещения проектов, сохраняемых страниц, при обработке удаленного сайта, настройке доступа через прокси, а также выбор того, в качестве какого объекта анализатор будет восприниматься на стороне веб-сайта: как собственно анализатор или как один из видов браузеров — MS IE или Opera.

Что будет анализироваться — определяется настройками программы

Следующий раздел настроек определяет принципы анализа ("парсинга"). Здесь можно определить, следует ли анализировать комментарии, описания изображений, ссылок, что считать разделителями слов. Весовая значимость слов, которая будет учитываться в дальнейшем разборе страниц, зависит от того, в какой части страницы слово было обнаружено. (Настройки весовых характеристик можно изменять, подгоняя таким образом значимость нахождения слов под то, как эту значимость определяет тот или иной поисковик.) По умолчанию наивысшую значимость имеют слова, размещенные в заголовке страницы, а самую малую те, что записываются в метатегах (это раньше считалось, что записав в список ключевых слов самые подходящие слова, вы сможете «вытащить» свой сайт в первые ряды, теперь на метатеги внимание обращается в последнюю очередь). В серединке находятся слова, размещенные в заголовках или выделенные специальным образом в тексте (наклонный, жирный шрифт, текст в ссылках и некоторых иных тегах HTML).

Некоторые поисковики учитывают не только то, какими html-тегами выделено слово, но и расположением его относительно начала страницы — чем дальше оно находится, тем меньше его весовая значимость. Поэтому программа предоставляет возможность настройки величины уменьшения базового веса на определенную величину при удалении слова от начала страницы также на определенное количество слов.

Можно убрать из анализа слова, не несущие смысловой нагрузки

Существуют слова, которые могут появляться в любых текстах (междометия, наречия, слова-вставки, предлоги, просто часто употребляемые слова). Учет их не только замедляет процесс обработки, но и уменьшает ценность выполненного анализа. Поэтому в программе предусмотрена возможность использования списка слов, которые должны быть проигнорированы в процессе обработки сайта (или страницы). При этом возможно наличие двух списков — слова, игнорируемые при обработке любого проекта, и слова, которые должны быть проигнорированы при обработке конкретного проекта. При работе возможно использование обоих списков. Кроме определенного списка можно исключить из обработки слова, чья длина составляет менее определенного количества символов или превышает некоторое заранее определенное количество символов. Один недостаток у программы — в поставке отсутствуют предустановленные русские слова-исключения, их придется составлять самим.

В противовес списку игнорируемых слов имеется список «одобренных» слов. Для чего это нужно? Например, если вы определили, что не должны учитываться слова, чья длина составляет менее четырех символов, а ваше ключевое слово состоит всего из трех букв, то вы можете занести это слово в список привилегированных слов и оно будет учитываться при обработке любого проекта. Ключевые фразы. Настройки этой закладки определяют, из каких слов будут составляться фразы, наиболее подходящие по своим весовым категориям для конкретной страницы. Можно определить максимальное количество слов, из которых может состоять фраза, какое количество наиболее употребляемых на странице слов можно использовать для составления фраз, слова с какой весовой значимостью не следует включать в составляемые фразы. Последнее может сказаться на том, что для страницы не будет составлено ни одной ключевой фразы, несмотря на то что слов на ней может быть предостаточно. Еще одна секция настройки позволяет определить внешний вид формируемых экранов после обработки проектов — цвета, настройки значков, настройки отчетов.

После того как был выполнен анализ страницы или сайта, информация обрабатывается программой и выводится в окно проекта в отсортированном виде. В левой части окна — дерево страниц, обработанных на сайте, либо список наиболее употребимых слов или фраз (для этого имеются переключатели в нижней части раздела). Справа — детальная информация по выделенной в дереве странице. Эта информация довольно разнообразна и состоит из нескольких закладок. Основная закладка — список всех использованных на странице слов (с учетом установленных ограничений), их плотность размещения в тексте, а также расположение в различных разделах страницы (количественное значение).

Отдельная закладка отдана сведениям о весовых значениях использованных на странице слов, а также их относительной значимости в пределах страницы. Эта закладка позволяет быстро оценить, какие страницы используют максимальное количество слов и могут быть наиболее полезными при обработке их поисковыми роботами. Для каждой страницы можно сохранить в виде файла список наиболее употребляемых на ней слов (это можно сделать с помощью контекстного меню). А вот на странице со словами можно из контекстного меню занести слово (или все слова) в список игнорируемых или, наоборот, используемых слов.

Еще одна закладка содержит подготовленные для каждой страницы ключевые фразы с оценкой их значимости, вычисленной на основе значимости входящих во фразу слов. Последняя закладка содержит сводную информацию о странице. На ней, кроме обработанных данных о количестве слов, их средневзвешенном весовом значении, ключевых словах, дается список предлагаемых программой ключевых слов, выполненных в виде готового мета-тега, который можно скопировать и вставить на страницу.

При выборе в левой стороне окна панели с перечнем слов в правой стороне окна для каждого выделенного слева слова будут показаны все файлы, в которых это слово используется, и графическими разноцветными символами показано, в каких частях страницы это слово было использовано (чем левее графический символ, тем ближе к началу страницы было использовано слово).

Сохраняйте отчеты, по ним можно будет просматривать историю изменений

По завершении анализа страницы или сайта можно сформировать отчет. Его можно как просмотреть предварительно, так и сохранить в виде pdf-файла. В отчет включаются все сведения по каждой из проанализированных страниц проекта. Чем он интересен? Тем, что, дорабатывая проект, можно сравнивать результаты отчетов и определять, правильно ли ведется доработка сайта с точки зрения его оптимизации.

Для чего еще может быть использована программа? В связи с тем, что она позволяет анализировать не только локально размещенные страницы, но и страницы и проекты, размещенные в Сети, можно выполнять анализ сайтов-конкурентов, чтобы проанализировать слова, их размещение на страницах и использовать наиболее удачные решения для продвижения своего сайта.

Ссылки по теме




Статья получена: hostinfo.ru
загрузка...

 

 

Наверх


Постоянная ссылка на статью "Контент-анализ":


Рассказать другу

Оценка: 4.0 (голосов: 16)

Ваша оценка:

Ваш комментарий

Имя:
Сообщение:
Защитный код: включите графику
 
 



Поиск по базе статей:





Темы статей






Новые статьи

Противовирусные препараты: за и против Добро пожаловать в Армению. Знакомство с Арменией Крыша из сэндвич панелей для индивидуального строительства Возможно ли отменить договор купли-продажи квартиры, если он был уже подписан Как выбрать блеск для губ Чего боятся мужчины Как побороть страх перед неизвестностью Газон на участке своими руками Как правильно стирать шторы Как просто бросить курить

Все статьи | Разделы | Поиск | Добавить статью | Контакты

© Art.Thelib.Ru, 2006-2024, при копировании материалов, прямая индексируемая ссылка на сайт обязательна.

Энциклопедия Art.Thelib.Ru