Кластеризация запросов в excel
Сбор семантики сайта представляет собой сложную и многоступенчатую задачу. Ее успешное решение предусматривает использование различных вспомогательных инструментов, включая специализированные программы и онлайн-сервисы. Но значительную часть выполняемых SEO-оптимизатором операций можно эффективно выполнять в обычных электронных таблицах Excel.
Речь идет не только о сортировке отобранных ключей, но и оформлении списка запросов, его последующем редактировании и чистке, а также подготовке базы данных для работы с другими сервисами или составления технического задания для копирайтера. А потому имеет смысл изучить порядок и особенности сбора семантического ядра в Excel более подробно, включая рассмотрение возможности, где можно скачать пример семантики, составленной в электронных Google Таблицах.
Виды Excel для сбора СЯ
Для решения задач СЕО-оптимизации применяются две версии электронных таблиц. Первая поставляется в рамках стандартного пакета MS Office и представляет собой самостоятельную программу. Вторая – составной элемент Google Docs. Именно последний вариант пользуется сегодня все большим спросом, так как обладает рядом достоинств, в числе которых:
- доступность для любого обладателя аккаунта в Google;
- интеграция с программами из MS Office, включая обычные Эксель и Ворд;
- доступ к облачному хранилищу Google Диск, 15 ГБ которого предоставляется бесплатно и позволяет работать с Google Таблицами с любого устройства – от ПК до смартфона – сразу после авторизации.
На приведенном ниже скриншоте показан пример, как выглядят Google Таблицы. Приводить внешний вид традиционного Excel не имеет смысла, так как он прекрасно известен любому более-менее опытному пользователю ПК.
excel
В остальном работа с обеими версиями программы – Excel и Google Docs – осуществляется по стандартным правилам, хорошо известным большинству пользователей. С учетом нескольких особенностей, характерных для SEO-продвижения сайтов по поисковым запросам.
Этапы сбора семантического ядра с помощью Google Таблиц
Некоторые специализированные сервисы, к примеру, Key Collector или Словоеб, обладают встроенными инструментами для форматирования структуры сайта и перечня ключевых слов и запросов. Поэтому не предполагают применение Excel. Но для значительной части других сервисов, включая один из самых популярных Яндекс Wordstat, использование Google Docs или Excel выступает одним из необходимых этапов работы. Более того, при грамотном применении возможностей электронных Google Таблиц удается упростить и оптимизировать сразу несколько важных операций по чистке семантического ядра. Рассмотрим последовательность предпринимаемых для этого действий с разбивкой на отдельные этапы.
Шаг №1. Перенос данных из Яндекс Wordstat в Google Excel
Функционал Excel предоставляет возможность составить список поисковых запросов вручную – посредством анализа продвигаемого сайта и деятельности компании. Но намного проще собрать исходное семантическое ядро с помощью Яндекс Wordstat. Чтобы сделать это, необходимо произвести следующие операции:
- Скачивание и установка расширения Яндекс Wordstat Assistant (подробнее о сервисе и расширениях к нему – на другой страницу нашего сайта). Сделать ссылку. В результате в левой части окна сервиса появится дополнительная панель инструментов.
- Выделение и сохранение интересующих пользователя запросов нажатием кнопки «+».
- Копирование сформированного списка поисковых запросов в Google Таблицы или обычный Эксель. Производится по одному из двух вариантов – с показателем частотности ключа или без него. Выбирается нужный пользователю способ копирования. Пример выполнения операции показан на скриншоте.
Шаг №2. Чистка семантического ядра
Основной задачей оптимизации СЯ запросов выступает повышение эффективности размещенных на сайте ключевых слов и фраз. Первым этапом становится избавление от ключей с низкой или даже нулевой релевантностью. Операция выполняется вручную, так как требует непосредственного участия SEO-специалиста. Ответ на вопрос, как почистить семантическое ядро, предусматривает удаление нескольких видов запросов, включая:
- самые низкочастотные (полное их удаление нецелесообразно, так как важно найти оптимальный баланс запросов с разной частотностью);
- ведущие на сайты конкурентов;
- лишние с предсказуемо низкой релевантностью из-за несоответствия задачам сайта;
- дубли (представляют собой поисковые запросы или фразы, которые различаются порядком слов).
Как было отмечено, удаление ненужных запросов происходит вручную. Для большего удобства и упрощения работы допускается как редактирование текущего листа электронных таблиц Google, так и перенос оптимизированного списка запросов на вновь созданный.
Шаг №3. Кластеризация/группировка семантического ядра запросов
Завершающий этап работы по СЕО-продвижению сайта с помощью Excel предполагает проведение кластеризации или группировки поисковых запросов. Она предусматривает разбивку общего списка ключевых слов или фраз для размещения на отдельные страницы в соответствии с предварительно разработанная структурой интернет-ресурса. Оптимальное количество запросов на каждую равняется 5-6, для очень объемных оно может быть несколько увеличено.
Операция также выполняется вручную с применением традиционного функционала Google Таблиц или Excel. Автоматизировать данные действия специалиста можно только с использованием специализированного инструментария, хотя даже самые современные и многофункциональные сервисы не способны выполнять такую работу на требуемом уровне.
Дальнейшие операции с собранным семантическим ядром производятся в зависимости от задач, стоящих перед СЕО-специалисту. Это может быть или составление технического задания копирайтеру, или дальнейшая оптимизация СЯ с использованием других программ или сервисов. Примеры готовой семантики, составленной в Эксель, можно с легкостью найти в сети, например, по следующей ссылке.
Полезные функции Google Docs и Эксель
Подробно описывать набор функциональных возможностей самой популярной программы электронных таблиц не имеет особого смысла. Опытным пользователям они прекрасно известны, а новичкам намного проще и правильнее разобраться самостоятельно, так как это наверняка пригодится в дальнейшей работе. Главное – знать о существовании таких возможностей, как:
- копирование и удаление ссылок из семантического ядра;
- замена отдельных слов или элементов списка запросов;
- удаление ненужных или лишних пробелов, включенных в СЯ;
- сортировка запросов по значениям любого из столбцов по двум параметрам – алфавиту или числу;
- поиск повторяющихся значений или минус-слов для последующего удаления вручную;
- удаление дубликатов из состава семантического ядра;
- сортировка запросов по цвету ячейки и многое другое.
Вспомогательные инструменты
Google Таблицы и традиционный Эксель обладают обширным функционалом. Но далеко не все опции эффективны применительно к СЕО-продвижению сайтов по поисковым запросам. Именно поэтому активно разрабатываются дополнительные надстройки к традиционным электронным таблицам. Два из них – самые известные и популярные – имеет смысл привести отдельно, хотя количество подобных инструментов постоянно растет.
SeoTools for Excel
Одно из первых расширений для электронных таблиц, которое разработано специально для SEO-продвижения. Обладает обширным функционалом, постоянно обновляется, совместимо с различными онлайн-сервисами и программами. Из недостатков – отсутствие версии для русскоязычных пользователей. Чтобы скачать программу, достаточно перейти на сайт разработчика и зарегистрироваться на нем.
seoTools
SEO-Excel
Русскоязычный аналог описанной выше надстройки. Содержит более двух десятков инструментов для СЕО-продвижения. Чтобы скачать программу, достаточно зарегистрироваться на сайте, хотя возможно платное использование онлайн-версии продукта. SEO-Excel адаптирован для работы с Яндекс Wordstat и Rush-Analytics, что объясняет популярность среди отечественных специалистов. Дополнительный аргумент скачать и установить надстройку – очень полезная опция генерации различных тегов – H1, Title и Description, заметно упрощающая работу SEO и экономящая его время, в том числе – при составлении технического задания копирайтеру.
Seo-Excel
Рекомендации по использованию Google Docs для сбора СЯ
Главным достоинством Excel и Google Таблиц справедливо считается доступность. Оборотной стороной становится необходимость выполнять значительную часть операций СЕО-оптимизации вручную. Чтобы упростить собственную работу, имеет смысл воспользоваться несколькими простыми рекомендациями:
- внимательно изучайте руководство пользователя, так как некоторые функции электронных таблиц выступают секретом даже для очень опытных специалистов;
- автоматизируйте самые рутинные и трудоемкие процессы за счет грамотного использования встроенных опций и сервисов;
- скачивайте и устанавливайте дополнительные надстройки, предназначенные для SEO-продвижения (важное дополнение – загрузка должна выполняться только с проверенных сайтов компаний-разработчиков).
Вместо вывода
Важно понимать, что полная автоматизация процесса SEO-продвижения сайта по поисковым запросам попросту невозможна. Никакие сервисы и программы не способны заменить опыт и квалификацию грамотного специалиста, хотя существенно помогают в его работе при грамотном использовании. Именно поэтому имеет смысл сотрудничать с профессионалами, а вложенные средства с лихвой окупаются повышением эффективности интернет-ресурса.
Наша компания оказывает полный комплекс услуг в области SEO-оптимизации на выгодных и привлекательных для клиентов условиях. Для получения персонального коммерческого предложения достаточно связаться с нами любым удобным способом.
У нас был классный инструмент — кластеризатор ключевых слов в Excel, который сильно экономил время. Но у него был серьезный минус: каждый раз приходилось заново создавать таблицы, вставлять и протягивать формулы. На это уходило 30–40 минут и можно было легко ошибиться.
С помощью Power Query мы автоматизировали все механические действия: вычисление долей весов, разбивку запросов по словам, формирование справочников слов и лемм, составление названий для групп объявлений и непосредственно саму группировку.
Всё, что остаётся сделать: подобрать запросы с частотностью → взять шаблон кластеризатора → почистить и отсортировать леммы → получить готовый результат.
Мы написали подробную инструкцию, как пользоваться кластеризатором на Power Query.
Если вы не знаете или не помните, как работает кластеризатор на Excel, прочитайте статью про него. Иначе вы можете запутаться в этой статье.
Подготовка к кластеризации
На каждом листе кластеризатора будет синяя или зеленая таблица с рыбными ключевыми словами и вшитыми формулами. Синие таблицы — это умные таблицы Excel. В них можно удалять всё, кроме первой строки, потому что в ней зашиты формулы для кластеризатора. Зелёные таблицы — результаты работы Power Query. В них ничего нельзя менять или удалять, их можно только обновлять.
Менять или удалять данные можно только в синих таблицах. Если вы измените таблице, эти изменения исчезнут после обновления таблицы
Вставьте ваш список ключевых слов с частотностью на лист кластеризатора «Исходник».
В списке на листе «Исходник» находятся ключевые слова для будущей рекламной кампании
Обновите таблицу на листе PQ 1: кликните правой кнопкой по любой ячейке со значением и выберите «Обновить» (Refresh).
После обновления вы получите справочник слов с долями весов и суммами долей весов.
В последнем столбце — суммы долей весов. Они зависят от значимости слова и общего количества слов
Скопируйте полученную на листе PQ 1 таблицу и вставьте как значения (Paste values) на лист Step 2 - Import Lemmas в столбец Word.
Никогда ничего не исправляйте вручную в зелёных таблицах — эти исправления удалятся после обновления таблицы. Хотите — сначала скопируйте данные в синюю таблицу
Лемматизируйте запросы из столбца Word и вставьте результаты в столбец Lemma.
После лемматизации в некоторых леммах останутся запросы со знаками «?» и «|». Лемматизатор добавляет в лемму знак «?», если не распознает слово: например, аббревиатуру «РБК». Знак «|» появляется, если кластеризатор сомневается в форме слова: например, «банк» или «банка». Пропишите правильную лемму вручную или выберите одну из предложенных.
Лемматизатор принял название банка «юнистрим» за глагол и предложил несколько вариантов лемм — просто удалите лишние леммы
Обновите таблицу на листе PQ 3.
На этом листе формируется справочник лемм, где для каждой леммы проставлен статус и подсчитаны количество упоминаний, длина и вес. Статус леммы — условный порядковый номер, который используется для сортировки. Лемме с самым большим весом присваивается самый меньший статус, чтобы она попала в начало списка.
Все леммы упорядочены по весу — это произведение суммы весов всех словоформ на их количество
Кластеризация
Скопируйте полученную на листе PQ 3 таблицу и вставьте как значения (Paste Values) на лист Step 3 - Status в столбец Lemmas.
Прежде чем начинать работу с леммами, обязательно скопируйте их из зелёной таблицы в синюю, чтобы все изменения сохранились
Мы получили исходник справочника лемм. Если мы оставим справочник как есть, кластеризация пройдёт по принципу «одна группа объявлений — одно слово». В порядке исключения в одну группу могут попасть две одинаковые фразы с разным порядком слов.
Чтобы настроить точность кластеризации и объединить фразы в группы, поработайте со статусами лемм:
- удалите статусы у лемм, для которых не хотите выделять отдельную группу и писать объявление;
- передвиньте более «важные» леммы в начало списка, чтобы они стояли в начале названия группы объявлений. Для этого разделите их статус на 10, 100 или 1000;
- установите статус «123» : все фразы, которые содержат лемму со статусом «123» не попадут в итоговый список.
Обновите таблицы на листах PQ 3.1, PQ 3.2 Adgroup и «Структура».
На листах PQ 3.1 и PQ 3.2 формируются промежуточные служебные справочники. Кластеризатор использует их для формирования итоговых результатов. Ничего не трогайте и не меняйте на этих листах, иначе кластеризатор может выдать неправильные результаты.
На листе AdGroup появятся результаты кластеризации. У каждой фразы прописано название группы объявлений, в которую она попадает; фразы отсортированы по алфавиту и образуют единые массивы ключевых слов.
Фразы «exocur ru курсы валют» и «exocur курсы валют» попали в одну группу набора слов в самих фразах. Мы удалили статус у леммы частицы «ru», поэтому она не повлияла на кластеризацию
Если вы недовольны результатами кластеризации, укрупните группы объявлений по инструкции в пункте 6. Затем обновите таблицы на листах PQ 3.1, PQ 3.2 и AdGroup. Укрупняйте группы снова и снова, пока не получите желаемый результат.
Лист «Структура» — сводная таблица из результатов кластеризации. Там находятся группы объявлений, сумма весов и количество фраз в группе.
Лист «Структура» помогает понять, надо ли уточнять кластеризацию или, наоборот, укрупнять группы
Кластеризатор на Power Query — не полностью автоматическое решение. Вам придётся самостоятельно чистить леммы и контролировать точность группировки слов. Инструмент ускоряет процесс, но не дает готового решения. Благодаря этому, вы всегда контролируете финальный результат.
Вручную группировать запросы не всегда эффективно: перебрать запросов можно за час, уйдет неделя. Автоматическим сервисам группировку я не доверю, так как она определяет структуру и управляемость кампании.
Поэтому придумал свой метод, который ускоряет кластеризацию и даёт осознанный результат. Облегчает жизнь при работе ключевых слов. Пробовал работать с 45 000 — Excel начинал умирать. Список запросов быстрее перебрать руками.
Далее расскажу про свой метод кластеризации в теории, а затем — как реализую его в Excel. Дам ссылку на готовый . Но чтобы им пользоваться, нужно хорошо понимать метод.
Метод
Кластеризация — распределение запросов по кластерам. Кластер — это группа запросов, схожих по смыслу и набору слов. Чтобы выделить такие запросы и объединить их в кластер, нужен признак.
Используем для этого нормализованную форму запроса — уберём окончания и выстроим слова в порядке важности:
Удаление окончаний позволит охватить все возможные словоформы для конкретного слова, а сортировка «по важности» — игнорировать порядок слов.
Убираем окончания
Слово без окончания — это признак, который объединяет разные словоформы:
Чтобы убирать окончания я использую mystem. Это лемматизатор от Яндекса. Он обрабатывает список слов и возвращает нормализованные значения — леммы.
Если система не уверена, какая лемма правильная, то покажет . Например, для слова «банку» mystem вернёт две леммы: «банк» и «банка». При проверке результатов мы выберем нужную.
Определяем важность
Сортировка «по важности» позволит игнорировать порядок слов. При сортировке нормализованных значений фраз по алфавиту мы получим готовые кластеры — группы запросов, схожих по смыслу и набору слов.
Важность слова — вычисляемый параметр для конкретного списка ключевых слов. Он не определяет важность слова в общей картине мира.
Важность слова рассчитывается из частотности и количества упоминаний слов в списке. Рассмотрим на примере.
Берём список запросов с частотностью
- Купить бумеранг — 1000
- Бумеранги цена — 700
- Бумеранги в москве — 750
- Купить классический бумеранг — 450
- Цены на бумеранги в москве — 350
- Купить классический бумеранг в москве — 100
В списке запросов встречаются слова: купить, бумеранг, классический, москва, цена, в, на. Вес слова равен сумме долей частотностей помноженных на количество упоминаний слова.
Считаем доли частотностей
- Купить бумеранг — 1000 = 1000/2 = 500
- Бумеранги цена — 700 = 700/2 = 350
- Бумеранги в москве — 750 = 750/3 = 250
- Купить классический бумеранг — 450 = 450/3 = 150
- Цены на бумеранги в москве — 350 = 350/5 = 70
- Купить классический бумеранг в москве — 100 = 100/5 = 20
Считаем вес слов
Сортируем по важности
- 8040 — бумеранг
- 2010 — купить
- 840 — цена
- 640 — москва
- 340 — классический
- 70 - на
- 20 - в
Располагаем запросы по важности
- Купить бумеранг — бумеранг | купить
- Бумеранги цена — бумеранг | цена
- Бумеранги в москве — бумеранг | москва
- Купить классический бумеранг — бумеранг | купить | классический
- Цены на бумеранги в москве — бумеранг | цена | москва | на | в
- Купить классический бумеранг в москве — бумеранг | купить | москва | классический | в
Упорядочиваем и чистим
- Бумеранг | купить: купить бумеранг — 1000
- Бумеранг | купить | классический: купить классический бумеранг — 450
- Бумеранг | купить | москва | классический: купить классический бумеранг в москве — 100
- Бумеранг | москва: бумеранги в москве — 750
- Бумеранг | цена: бумеранги цена — 700
- Бумеранг | цена | москва: цены на бумеранги в москве — 350
В итоге получили первые группы объявлений, с которыми можно работать дальше: укрупнять, объединять, . Для этого используем Excel.
Реализация в Excel
Выполняем последовательность действий в таблице (XLS, 537 КБ) с формулами. Кластеризация 1000 запросов займет 30 минут.
Алгоритм одной строкой
Собираем СЯ → собираем частотность → разбиваем запросы по словам и вычисляем доли весов → формируем с весами слов → выделяем леммы для слов → вычисляем «вес» леммы → формируем с леммами → делаем первичную кластеризацию → укрупняем полученные группы.
Шаг 1. Вычисляем доли весов и разбиваем запросы по словам
Лист «Кластеризация», таблица «Main»
Чтобы избежать правки формул называйте все листы и таблицы аналогично
- Вычисляем доли весов:
- Доли весов = Частотность / .
- =LEN ([@Ключ])-LEN (SUBSTITUTE ([@Ключ]," ",""))+1.
Шаг 2. Формируем с весами слов
Лист «Слова — Леммы», таблица «Word»
- Копируем столбцы W1—W7 на новый лист.
- Преобразуем таблицу из формата
[W1] [W2] [W3] [W4] [W5] [W6] [W7] [Доли весов] в формат:
[W1] → [Доли весов]
[W2] → [Доли весов]
[W3] → [Доли весов]
[W4] → [Доли весов]
[W5] → [Доли весов]
[W6] → [Доли весов]
[W7] → [Доли весов]:
Шаг 3. Выделяем леммы и дорабатываем справочник со словами
Лист «Слова — Леммы», таблица «Word»
- Копируем полученный на прошлом шаге список слов «как есть».
- Обрабатываем через mystem → получаем леммы для каждого слова.
- Считаем каждой леммы.
Шаг 4. Формируем с леммами
Лист «Леммы», таблица «Lemmas»
- Копируем полученный список лемм на новый лист и удаляем дубли.
- Из справочника со словами подтягиваем -во упоминаний каждой леммы.
- Считаем в лемме.
- Вычисляем «вес» леммы:
Вес Леммы= [Сумма долей весов слов, входящих в Лемму] * [ Леммы].
Формула:
=(SUMIF (Words[Lemma],[@Лемма], Words[Доли весов]))*[@[]]. - Сортируем леммы по столбцу «вес» — от большего к меньшему.
- Проставляем «Статус» для лемм — минимальный для старшей леммы (лучше начать с 1 000), дальше +1 к следующему статусу:
Шаг 5. Делаем первичную кластеризацию
Лист «Кластеризация», таблица «Main»
Для каждого слова в столбцах W1—W7 подтягиваем «Статус» → записываем их столбцы :
Итак, что мы сделали. Разбили запросы по словам. Для каждого слова выделили лемму — можем объединить запросы по общим словам. Для каждой леммы посчитали вес. Остаётся выстроить слова в запросе в порядке важности. Тогда при сортировке по алфавиту запросы сами объединятся в группы объявлений.
Выстраиваем слова в порядке важности функцией SMALL. В диапазоне статусов L1 – L7 ищем самый маленький статус — это самое важное слово во фразе. Затем, ищем второй самый маленький статус — это второе по важности слово во фразе. И так еще пять раз — проверяем оставшиеся столбцы L3 – L7.
Получаем последовательность статусов. Например, 37 → 100 → 200 → 700. Для каждого статуса подтягиваем Лемму из справочника Лемм. Соединяем Леммы нормализованное значение фразы. Я использую его как название группы объявлений.
Сортируем по алфавиту:
Полная рабочая формула .
Шаг 6. Укрупняем полученные группы
Игнорируя окончания и порядок слов, мы объединили запросы с одинаковым набором слов. Количество групп стремится к количеству слов — это 100 % точность инструмента. Можно использовать, если вы предпочитаете работать с запросами в точном соответствии.
Чтобы укрупнить группы, нужно уменьшить точность — снизить количество лемм, которые составляют «нормализованную форму».
Что можно удалить:
- одинокие буквы, цифры, предлоги, доменные зоны. Леммы длиной ;
- редкие леммы — меньше среднего по списку;
- леммы с малым весом — недостаточно «важные»;
- в редких случаях — топонимы.
Важно: лемму не удаляем, только её «Статус» — этого достаточно, чтобы лемма не попала в «нормализованную форму»:
До какой степени укрупнять: я стремлюсь к среднему показателю в одной группе объявлений и слежу за максимальным количеством фраз (помним про ограничения систем контекстной рекламы).
Резюме
Полученный список групп удобно и двигать между кампаниями. Название группы поможет писать объявления — вы сами определяете важные слова в названии группы.
Ещё раз алгоритм: собираем СЯ → собираем частотность → разбиваем запросы по словам и вычисляем доли весов → формируем с весами слов → выделяем леммы для слов → вычисляем «вес» леммы → формируем с леммами → делаем первичную кластеризацию → укрупняем полученные группы.
Отзывы джедаев о кластеризаторе
«Я помогал Роме с созданием инструмента на ранних этапах. Всем рекомендую попробовать кластеризатор для ядра от 2000 ключевых слов → сэкономит время.
Инструмент можно улучшить и превратить в автоматический сервис. Также можно дорабатывать формулы определения веса лемм. Но и в текущем виде он поможет специалистам по контексту, которые работают с большой семантикой.»
«С помощью кластеризатора сильно удобнее и быстрее сгруппировать фразы и потом писать объявления для них. Из недостатков — первый раз кажется, что это сложновато. Но когда попробуешь, то всё довольно понятно. Но эту штуку лучше автоматизировать.»
«Методику пробовал, но не использую в работе, потому что нечасто собираю контекст в больших объемах.
Хорошо подойдет для работы с большой семантикой, особенно в свете последних нововведений яндекса по низкочастотным запросам. Группировки помогут сэкономить много времени при подготовке ключевых фраз.
Методика на первый взгляд кажется сложной и громоздкой, но если разобраться, то процесс становится понятным и удобным.»
«Кластеризация от Ромы просто находка! Методом пользуюсь каждый раз когда работаю с семантикой — собираю или корректирую кампании.
Больше всего мне нравятся три вещи:
- я регулирую какие фразы попадут в группу. Если вес фразы небольшой, то объединяю с похожими. Не придерживаюсь принципа «один ключ — одна группа», иначе управлять кампанией сложно;
- понимаю механику и вижу какие фразы должны быть в заголовке. Конечно, важно делать полное вхождение ключевого слова. Часто оно не вмещается полностью и я строю заголовок из фраз с бо́льшим весом;
- это Excel, который всем знаком. Не нужно устанавливать дополнительные программы и платить за сервис. Если разобраться в формулах, то уже немного прокачаешься.
Из минусов: все формулы я копирую из готового шаблона и переключаться между окнами одной программы неудобно. Я бы хотела иметь формулы под рукой, а может сделать в будущем шаблон, чтобы сократить количество копирований. Ещё хотелось бы сократить время группировки, но пока не нашла способ.
В целом, способ мне нравится тем, что механика простая и понятная, её легко внедрить и потом управлять кампаниями.»
Что дальше
Если у вас ключевых слов, используйте этот алгоритм. Прогоните алгоритм , чтобы «впитать».
Если у вас список запросов, переберите руками — так быстрее.
Если хотите готовое решение — попросите программистов написать скрипт.
Я постоянно дорабатываю кластеризатор. В следующих итерациях хочу проработать групп, добавить справочники и максимально автоматизировать кластеризатор на Power Query. Следите за обновлениями!
262
Для успешного продвижения проекта важно не только отобрать максимально возможное количество целевых запросов, но и правильно распределить их по страницам сайта. На практике похожие запросы могут обладать разными характеристиками, из-за которых их нельзя будет продвинуть на одной странице. Поэтому мы рекомендуем делать группировку на основе анализа выдачи ПС.
В результате кластеризации по ТОПу станет ясно, какие запросы можно продвигать на одной странице, а какие – нельзя. Например:
- Берём два запроса «телевизор» и «купить телевизор».
- Анализируем выдачу по каждому запросу и проверяем наличие общих страниц в обеих выдачах:
- — наличие одинаковых URL по запросам в ТОПе говорит о возможности их продвижения на одной странице. Чем больше страниц пересекается, тем вероятнее, что запросы будут хорошо ранжироваться на одной странице;
- — если нет общих URL в ТОПе, высока вероятность, что запросы невозможно продвинуть в ТОП-10 ПС на одной странице.
Преимущества кластеризации семантического ядра по методу ТОПов
- Кластеризация позволяет избежать ошибок при распределении запросов (например, группировки запросов с разным интентом в один кластер).
- В результате кластеризации будут учтены и корректно привяжутся, не потерявшись, переформулировки и синонимы.
Недостатки кластеризации по методу ТОПов
- Качество кластеризации зависит от качества выдачи по интересующим запросам.
- Выдача меняется и то, что сегодня является коммерческим запросом, через несколько месяцев может стать информационным.
- Есть вероятность попадания запросов не в те группы (например, конкуренты посчитали правильным продвигать запросы с одинаковым интентом на разных страницах).
Поэтому важно!
Автоматически созданные группировки нужно проверять вручную. Это значительно снизит риск ошибок.
Почему нужно использовать автоматическую кластеризацию?
С помощью сервисов для кластеризации ключевых запросов можно быстро группировать большие по объёму семантические ядра. Если на ручную группировку может уйти неделя или даже месяц, с помощью кластеризатора можно выполнить работу за несколько часов.
Какие есть виды кластеризации?
Soft – запросы сравниваются с главным ключевым словом (с большей частотностью), но не сравниваются между собой.
Hard – запросы сравниваются и с главным ключевым словом, и между собой.Для конкурентных тематик рекомендуем делать Hard-кластеризацию. Если тематика не очень конкурентная – достаточно Soft-кластеризации.
Инструменты автоматической кластеризации
Рассмотрим несколько сервисов, с помощью которых можно провести автоматическую кластеризацию семантического ядра.
Особенности сервиса:
- Платный онлайн-сервис.
- Высокая скорость кластеризации запросов.
- Простой и понятный интерфейс.
- Автоматическое определение релевантных страниц.
- Определение коммерческих и информационных запросов.
Особенности сервиса:
- Платный онлайн-сервис.
- Быстрый сбор данных и группировка запросов.
- Сложный для новичков интерфейс.
- Возможность одновременно группировать запросы по нескольким порогам.
- Кластеризация по выдаче заданных регионов в Яндексе.
- Группировка по тематическим группам.
Особенности сервиса:
- Платный онлайн-сервис.
- Понятный и простой в использовании интерфейс.
- Инструмент разбирает интент запроса при формировании кластера.
- Бесплатная перегруппировка ключевых фраз.
- Высокая скорость сбора данных.
Особенности сервиса:
- Десктопная версия.
- Понятный интерфейс.
- Сравнительно низкая стоимость.
- Возможность настраивать группировку.
- Нельзя редактировать полученные группы в программе — только в Excel.
- Нужна ручная коррекция кластеров.
- Можно подбирать настройки группировки.
Заключение
Кластеризация запросов по ТОПу – хороший способ ускорения работы по созданию структуры и группировке семантического ядра.
Зная ошибки при кластеризации, легко избежать их в работе. Для этого, даже автоматизируя процесс группировки, всегда проверяйте результаты вручную.
Сайт не приносит продаж или занимает низкие позиции? Наши эксперты найдут и устранят причину
108
Наиболее длительный этап работы с семантическим ядром – его группировка. На основании групп создаётся структура сайта, и запросы распределяются по посадочным страницам.
При группировке ключей много ручной и мыслительной работы: нужно понять, какой интент пользователи вкладывают в конкретный запрос, похож ли он на интенты остальных. Также важно проанализировать выдачу, чтобы понять, можно ли посадить запросы на одну страницу или нужно создавать разные.
Если у вас маленький узкотематический сайт, страницы которого включают до 100 запросов, сделать такую работу — не проблема. Однако ручная проработка нескольких десятков или сотен тысяч запросов может растянуться на месяцы. В таком случае важно максимально автоматизировать этот этап, что позволит сэкономить время. Поэтому при работе с большими семантическими ядрами мы используем кластеризаторы.
Основное преимущество использования кластеризаторов – экономия времени. Также кластеризация (автоматическая группировка поисковых запросов) позволяет:
- понять, какие запросы можно продвигать на одной странице, а какие – по отдельности;
- распределить большое количество запросов;
- снизить процент ошибок при группировке, так как минимизируется человеческий фактор;
- кластерно убрать запросы, которые не относятся к тематике вашего сайта;
- разделить коммерческие и информационные запросы без явных маркеров.
Рассмотрим программы, которые можно использовать для группировки запросов по подобию ТОПов, их возможности. Кластеризаторы перечислены в произвольном порядке, а в заключении есть сравнительная таблица.
1. Coolakov
Стоимость кластеризации: бесплатно – до 1000 запросов, больше – 20 коп. за запрос.
Можно выбрать регион, указать порог кластеризации от 1 до 10 (автор сервиса говорит, что оптимальный порог – 2). Кластеризация проводится по ТОП-10 Яндекса, есть экспорт.Так выглядит интерфейс сервиса:
А так — результат кластеризации:
2. Кластеризатор от RushAnalytics
Стоимость кластеризации: от 55 (1 запрос) до 35 копеек (10К).
Онлайн-кластеризатор с несколькими типами группировки:
- по Wordstat – нужен список запросов и их частота, кластеризатор сам группирует;
- по ручным маркерам – среди пула запросов нужно выбрать маркеры (главные запросы), которые соответствуют страницам сайта. Остальные запросы программа группирует по указанным маркерам;
- Wordstat + ручные маркеры – нужно выбрать маркерные запросы, после чего к ним будут привязаны остальные. Оставшиеся запросы, которые не привязались к маркерам, будут сгруппированы через Wordstat.
Кластеризация происходит на основании ТОП-10 Яндекса или Google. Есть два вида кластеризации – Soft и Hard. Точность группировки – от 3 до 8.
В сервисе также можно указать URL своего сайта, и он найдёт страницы, релевантные кластеру.
Результат кластеризации выглядит так:
Есть отчёт с лидерами тематики.
3. Кластеризатор от Serpstat
Стоимость кластеризации: лимиты на кластеризацию входят в тарифный план, 1 лимит=одному запросу. От 1 500 при минимальном тарифе 69$/мес до 30 000 при тарифном плане 499$/мес.
Онлайн-кластеризатор, находится в бете. Позволяет кластеризовать до 2000 ключевых фраз в одном проекте. Можно группировать по Яндексу или Google. Есть выбор страны, региона и города (при кластеризации по Google) или страны и города (при группировке по Яндексу).
Можно выбрать силу связи между фразами:
Можно также выбрать один из двух типов кластеризации – Soft или Hard.
Результат кластеризации выглядит так:
Полученные кластеры можно перемещать, добавлять или убирать фразы, удалять.
4. KeyAssort
Стоимость кластеризации: 1900 рублей за покупку десктопной программы с возможностью экспорта, бесплатная демо-версия без экспорта.
В настройках KeyAssort можно:
- выбрать поисковую систему – Яндекс или Google;
- указать силу группировки (от 1 до 100) и вид кластеризации (софт, мидл или хард);
- исключить сервисы и отдельные URL, которые не нужно учитывать при кластеризации;
- выбрать глубину ТОПа – от ТОП-5 до ТОП-50.
Настройки сбора данных:
Собирает также URL, которые находятся в ТОПе для каждой из групп.
Интересные функциональные дополнения, которые можно использовать:
- миграция запросов;
- расширение семантики;
- использование маркерных фраз.
Также в программе можно создавать группы вручную при ручной добивке и экспортировать уже готовое семантическое ядро.
Результат кластеризации выглядит так:
5. Just-Magic
Стоимость кластеризации: от 1,5 рубля до 10 коп. за фразу (в зависимости от тарифа).
При кластеризации по Яндексу можно выбрать определение коммерции и геозависимости. Есть тематический классификатор. Определяет тематику запроса на основании анализа выдачи, позволяет отсеять нерелевантные запросы.
Можно указать домен для поиска релевантных страниц, настроить оповещение на почту после того, как кластеризация будет завершена.
Результат кластеризации можно посмотреть на сайте или экспортировать в xlsx, csv, в виде сжатых gzip-данных.
6. Key Collector
Стоимость кластеризации: лицензия на программу обойдётся в 1900 рублей при безналичном расчёте и в 1800 рублей – при электронном.
Кластеризация – одна из функций инструмента. Сделать это можно при помощи функции «Анализ групп». Перед группировкой нужно использовать функцию SERP.
Есть несколько режимов группировки:
- по отдельным словам;
- по составу фраз;
- по поисковой выдаче;
- по составу фраз и SERP.
7. Топвизор
Стоимость кластеризации: от 0,8$ до 0,48$ за 100 запросов, зависит от тарифного плана. При регистрации начисляется бонус в 1$. Это позволяет опробовать инструмент до покупки тарифного плана.
Топвизор группирует запросы по ТОП-10 Google или Яндекса. Можно выбрать уровень и тип кластеризации.
Есть следующие варианты группировки:
Результат кластеризации выглядит так:
Можно фильтровать или сортировать ключевые слова, перенести в другой проект или экспортировать.
8. Semparser
Стоимость кластеризации: от 60 коп. до 18 коп. (при покупке от 100К запросов) за запрос. Есть тестовый режим после регистрации: можно бесплатно кластеризовать 50 запросов.
Онлайн-инструмент для кластеризации запросов по Яндексу и Google. В настройках можно выбрать регион и силу группировки.
- указать, учитывать или не учитывать спектр;
- спарсить подсветку из сниппетов Яндекса;
- определить геозависимость запросов;
- определять степень коммерческости запроса;
- определить релевантные страницы.
В результате кластеризации получается отчёт с двумя вкладками – «Группировка» и «ТОП тематики».
Также появляется окно редактирования.
Для групп есть дополнительные инструменты:
- получение подсветки;
- получение ТОП-10 документов;
- параметры эталонных текстов и ТЗ копирайтеру.
Результаты кластеризации можно скачать в Excel.
9. Seoquick
Стоимость кластеризации: зависит от тарифа. Бесплатно можно кластеризовать до 6 тыс. слов, не более 2 тыс. за одну проверку. За 239 руб. – до 2.000.000 в день и до 20 тыс. за одну проверку.
Онлайн-сервис для кластеризации запросов. Ключевые слова можно загрузить файлом формата txt, xls, xlsx, csv. Есть возможность дополнительно указать слова, которые можно считать как одну фразу, минус-слова в широком и точном соответствии, список обязательных и игнорируемых слов, синонимы. А также можно выбрать частотность, от которой и будет зависеть тип кластеризации.
Есть дополнительный функционал:
- учёт геозависимости;
- расширенные кластеры для семантики – позволяют распределять некластеризованные слова в наиболее подходящие группы.
Лимит на одну группировку – 20 тысяч.
В результате группировки получаем данные по частоте запросов, CPC и тип ключа.
10. Кластеризатор от Majento
Стоимость кластеризации: бесплатно
Результат онлайн-группировки включает кластеры и релевантную страницу, если при запуске был указан домен.
Можно скачать в csv.
В программе для ПК можно выбрать регион и выставить порог кластеризации от 1 до 10.
Данные для кластеризации собираются из выдачи Яндекса. Для работы программы нужны XML-лимиты.
11. Группировка запросов от Пиксель Тулс
Стоимость кластеризации: доступен только для пользователей с тарифным планом «Профессионал», «Эксперт», «Гуру», минимально – 1 990 рублей в месяц или 464 рубля в неделю (выбор тарифа доступен сразу после регистрации).
Инструмент для группировки запросов по Яндексу и Google. В настройках можно выбрать регион и степень группировки. Есть 4 метода обработки:
Дополнительно есть возможность собрать позиции сайта, частоту запросов, количество главных страниц.
За один раз позволяет кластеризовать до 5000 фраз. Результат группировки можно скачать в CSV.
12. Megaindex
Стоимость кластеризации: до 1000 запросов бесплатно, дальнейшее количество запросов в отчёте зависит от тарифа.
Автоматический кластеризатор, который позволяет группировать до 10000 запросов за один раз. Есть возможность бесплатной группировки до 1000 запросов.
Есть два варианта добавления запросов:
- Сбор запросов конкурентов и дальнейшая кластеризация
В настройках можно указать количество совпадений в ТОП-10, расширить кластеры связанными запросами.
Результат кластеризации выглядит так.
Можно вручную расширить кластер. Есть экспорт в CSV.
Заключение
В заключение приводим сводную табличку по основным характеристикам кластеризаторов:
Читайте также: