Кластеризация для чего нужна
Кластеризация запросов: что это, зачем нужно и как сделать
Время прочтения: 7 мин.
Кластеризация — это разделение списка ключевых фраз на группы. Каждая группа запросов должна соответствовать одной странице сайта, на которой будут продвигаться эти запросы. Рассказываем, для чего нужна кластеризация, как разбить запросы на группы, какие сервисы стоит использовать.
Для чего нужна кластеризация запросов?
Вы собрали ключевые фразы для продвижения сайта. Что делать дальше? Нужно распределить эти фразы по страницам сайта (если сайт уже существует), либо запланировать создание страниц под собранные запросы.
Создавать по отдельной странице под каждый запрос не имеет смысла. Обычно в сематическом ядре много фраз, близких по смыслу, поэтому ключевые фразы нужно сгруппировать. Это и есть кластеризация.
Виды кластеризации
1. Кластеризация по смыслу
Это самый простой вариант кластеризации. В этом случае ключевые фразы разбиваются на группы вручную. Цель — собрать в одну группу фразы со схожим смыслом.
Плюсы такого способа:
2. Кластеризация по близости поисковых выдач
Этот способ позволяет работать с большим объёмом ключевых слов и учитывает работу алгоритмов поисковых систем. Рассмотрим этот метод кластеризации на примере. Допустим, у нас в семантическом ядре есть три ключевые фразы:
Нужно ли их поместить в одну группу ключевых фраз и на одну страницу сайта или лучше отнести их к разным группам? По смыслу ключевые запросы кажутся схожими и при использовании метода кластеризации по смыслу, их вполне можно разместить на одной странице. Но будет ли это правильно с точки зрения поисковой системы?
Яндекс различает коммерческие и информационные запросы. В большинстве случаев продвижение коммерческих и информационных запросов на одной странице оказывается затруднительным, так как по мнению Яндекса страница должна быть заточена под один вид запросов.
В нашем примере запрос «Кипр» — информационный. Пользователь, который вводит этот запрос, скорее всего, хочет просто получить информацию о стране и не собирается ничего покупать.
«Туры на Кипр» и «купить тур на Кипр» — это коммерческие запросы. Если пользователь вводит такие запросы, высока вероятность того, что он планирует свой отдых и планирует покупку тура.
Исходя из этих предположений, ключевую фразу «Кипр» лучше разместить на одной странице, а запросы «туры на Кипр» и «купить тур на Кипр» — на другой. Но хорошо бы подтвердить эту гипотезу данными от поисковых систем. Как это сделать?
Предположим, что поисковые системы считают некоторые запросы схожими по смыслу и допускают их продвижение на одной странице, а некоторые — нет. Действительно, вряд ли на нормальном сайте на одной странице будут продвигаться запросы «туры на Кипр» и «купить лопату». Это больше похоже на дорвей, рассчитанный на обман поисковой системы.
Если предположение верно, то по схожим (по мнению поисковой системы) запросам в поисковой выдаче должны присутствовать одни и те же страницы сайтов. А по запросам, которые не могут продвигаться на одной странице, поисковая выдача не должна содержать одинаковых страниц сайтов.
Давайте сделаем выгрузку сайтов из топ-10 по трём запросам из нашего примера и сравним (выгрузка сделана при помощи инструмента: arsenkin.ru/tools/check-top:
Одинаковым цветом выделены одни и те же страницы сайтов. Из выгрузки видно, что у запросов «Туры на Кипр» и «Купить тур на Кипр» топ-10 поисковой выдачи совпадают на 100%, только немного отличаются позиции страниц. А по запросу «Кипр» совпадает только одна страница.
Такая картина подтверждает выдвинутую нами теорию: запрос «Кипр» нужно поместить на одну страницу, а «туры на Кипр» и «купить туры на Кипр» — на другую.
По этому принципу и работает кластеризация по схожести поисковой выдачи.
Как работают автоматические кластеризаторы?
Кластеризаторы (это могут быть, как онлайн-сервисы, так и программы) собирают топ-10 страниц по запросам, которые кластеризуются. Если поисковая выдача по ключевым фразам частично совпадает — эти фразы помещаются в одну группу.
Обычно в сервисах и программах можно задавать параметры кластеризации:
В большинстве случаев достаточно использовать алгоритм Soft. Но если вы работаете в высококонкурентной тематике, то стоит использовать алгоритм Hard.
Что делать после кластеризации?
К сожалению, использование автоматических кластеризаторов полностью не избавляет от необходимости ручной работы. Кластеризаторы на выходе выдают готовые группы ключевых фраз. Тем не менее, часть фраз попадают в группу «несгруппированные».
Несгруппированные ключевые фразы нужно перебрать вручную. Их придётся самостоятельно отнести к одной из уже созданных групп, удалить или создать для них новые группы.
Также стоит пересмотреть все созданные кластеризатором группы. Иногда имеет смысл объединить несколько групп с низкой суммарной частотностью ключевых фраз в одну. Или добавить ключевые фразы из низкочастотной группы, под которую делать отдельную страницу нет смысла, к ключам более частотной группы.
После ручной доработки групп можно переходить к распределению групп по существующим страницам сайта, созданию новых страниц и составлению технических заданий на написание статей под созданные группы ключевых фраз.
Инструменты для кластеризации ключевых фраз
Рассмотрим популярные сервисы и программы для кластеризации.
Key Collector
Эта программа есть практически у каждого специалиста по SEO. Она платная, сейчас стоит 1 800 рублей за одну лицензию.
Помимо множества функций, полезных при работе над продвижением сайта, в этой программе есть встроенный кластеризатор запросов.
Чтобы воспользоваться им, нужно собрать или загрузить в программу ключевые фразы для кластеризации. Затем выбрать пункт «SERP — Получить все данные для Яндекс» или «Получить все данные для Google», если в приоритете поисковая система Google.
Далее — ждём окончания сбора данных и переходим в меню «Данные — Анализ групп».
Выбираем настройки группировки:
Затем нужно выбрать поисковую систему, по которой будет выполняться кластеризация и сколько сайтов из выдачи нужно сравнивать по каждому запросу: топ-10 — топ-50. обычно достаточно топ-10.
Нажимаем кнопку «Вычислить группировку» и ожидаем окончания процедуры:
В итоге, получаем сформированные группы ключевых слов, которые можем редактировать и экспортировать в формате Excel.
Результаты кластеризации в Key Collector
Онлайн-сервис кластеризации Topvisor
Изначально topvisor.com был предназначен для отслеживания позиций сайта в поисковых системах, но потом оброс функциями, в том числе и кластеризатором.
Для использования этого сервиса нужно зарегистрироваться и пополнить баланс. Кластеризация платная. Стоимость — от 0,3 рубля за один поисковой запрос. Стоимость будет снижена, если выбрать один из тарифов с ежемесячной оплатой.
Для кластеризации запросов нужно создать новый проект и перейти в раздел «Ядро/Запросы», импортировать запросы в новую группу.
Затем нажимаем кнопку «Кластеризация ядра» и выбираем «Кластеризация по топ-10», делаем нужные настройки и жмём кнопку «Начать».
Настройки кластеризации Topvisor
В результате получаем группы запросов, которые можем дальше использовать в системе Topvisor, либо экспортировать.
Результаты кластеризации в сервисе Topvisor
KeyAssort — программа для кластеризации больших семантических ядер
Эта программа удобна для работы с любыми семантическими ядрами, но лучше всего она показывает себя при работе с ядрами большого объёма. Она отлично кластеризует ядра с миллионом и более запросов.
В KeyAssort удобно работать с запросами и их группами: сортировать, удалять, объединять. Программа платная, стоимость лицензии — 1 900 рублей.
Для работы программы нужны XML-лимиты. XML-лимиты — это механизм, созданный Яндексом, чтобы владельцы сайтов могли получать информацию о позициях сайтов, а также другую информацию о поисковой выдаче, не перегружая поисковую систему запросами. Один XML-лимит позволяет сдалать один запрос к поисковой системе.
Их можно получить двумя способами:
У KeyAssort есть демо-версия, в которой работают все функции, кроме экспорта результатов. Перед принятием решения о покупке программы можно протестировать её работу.
Результаты работы программы KeyAssort
Magento Кластеризатор — бесплатный кластеризатор поисковых запросов
Magento Кластеризатор похожа на очень упрощённую версию KeyAssort. Но зато пользоваться ей можно бесплатно. Для работы программы нужны XML-лимиты.
В окне программы нужно вставить ссылку на XML-лимиты в соответствующее поле, затем вставить список ключевых фраз для кластеризации в поле «Queries for clustering», выбрать метод кластеризации и задать степень группировки. После выполнения этих настроек нажимаем кнопку «Cluster» и ждём завершения операции. Результаты можно экспортировать в формате csv.
Кластеризация
Кластеризация (англ. cluster analysis) — задача группировки множества объектов на подмножества (кластеры) таким образом, чтобы объекты из одного кластера были более похожи друг на друга, чем на объекты из других кластеров по какому-либо критерию.
Задача кластеризации относится к классу задач обучения без учителя.
Содержание
Постановка задачи кластеризации [ править ]
Множество [math]Y[/math] в некоторых случаях известно заранее, однако чаще ставится задача определить оптимальное число кластеров, с точки зрения того или иного критерия качества кластеризации.
Решение задачи кластеризации объективно неоднозначно по ряду причин:
Теорема невозможности Клейнберга [ править ]
Для формализации алгоритмов кластеризации была использована аксиоматическая теория. Клейнберг постулировал три простых свойства в качестве аксиом кластеризации и доказал теорему, связывающую эти свойства.
Определение: |
Алгоритм кластеризации [math]a[/math] является масштабно инвариантным (англ. scale-invariant), если для любой функции расстояния [math]\rho[/math] и любой константы [math]\alpha \gt 0[/math] результаты кластеризации с использованием расстояний [math]\rho[/math] и [math]\alpha\cdot\rho[/math] совпадают. |
Первая аксиома интуитивно понятна. Она требует, чтобы функция кластеризации не зависела от системы счисления функции расстояния и была нечувствительна к линейному растяжению и сжатию метрического пространства обучающей выборки.
Определение: |
Алгоритм кластеризации является согласованным (англ. consistent), если результат кластеризации не изменяется после допустимого преобразования функции расстояния. |
Третья аксиома требует сохранения кластеров при уменьшении внутрикластерного расстояния и увеличении межкластерного расстояния.
Примеры преобразований с сохранением кластеров | ||
Исходное расположение объектов и их кластеризация | Пример масштабной инвариантности. Уменьшен масштаб по оси ординат в два раза. | Пример допустимого преобразования. Каждый объект в два раза приближен к центроиду своего класса. Внутриклассовое расстояние уменьшилось, межклассовое увеличилось. |
Исходя из этих аксиом Клейнберг сформулировал и доказал теорему:
Теорема (Клейнберга, о невозможности): |