Парсер запросов яндекс. Парсинг Яндекс Вордстат: что это и для чего? Автоматическое распознавание капчи

Узнать частотности Wordstat можно вручную, но это долго и неудобно. Для ускорения работы есть парсеры: десктопные программы, расширения для браузеров, облачные сервисы и скрипты. Все они похожи - есть лишь отличия в нюансах работы. Собственный появился и в системе PromoPult. Разбираемся, как он работает и чем он лучше аналогов.

Основные возможности Парсера Wordstat в PromoPult:

  • массовая проверка частотностей из левой колонки Wordstat для указанных фраз;
  • загрузка фраз списком или с помощью файла XLSX;
  • возможность парсить частотность в любом регионе Яндекса;
  • учет типа соответствия при парсинге (операторы «фраза «, «!фраза » и [фраза ]);
  • сохранение всех отчетов «в облаке».

Особенности сервиса:

  • неограниченное количество поисковых запросов при проверке за один раз;
  • сбор частотностей онлайн - не нужно устанавливать софт;
  • не нужно создавать фейковые аккаунты в Яндексе специально для парсинга или рисковать собственными аккаунтами;
  • не нужно использовать прокси-серверы и вводить капчу;
  • суммирование в отчете частотностей по указанным регионам или разбивка по каждому региону;
  • высокая скорость парсинга;
  • удобный для последующей обработки отчет в формате XLSX.

Немного теории: зачем знать частотности ключевиков?

Основная причина, по которой собирают частотности, - прогнозирование трафика . Зная, сколько раз пользователи интересовались определенной фразой, можно примерно рассчитать, сколько сайт получит переходов, если займет N-ую позицию в поиске.

Как это работает на практике:

  • вы сформировали список ключевых фраз, по которым планируете продвигаться;
  • для фразы, по которой планируете оценить трафик, определяете частотность (например, «купить тахту в Москве » - 2852);
  • узнаете значения CTR в зависимости от позиции в поиске (приблизительные данные о распределении CTR можно найти в открытых источниках, но если у вас сайт работает хотя бы несколько месяцев, то более точные данные доступны в отчете «Поисковые запросы» / «История запросов» / показатель: «CTR на позициях, %»);
  • составляете прогноз трафика для ТОП-10 (для этого умножаете частотность на CTR и делите на 100 %; допустим, если CTR 2-3 позиции составляет 25 %, то прогнозный трафик при достижении этой позиции равен: 2852*25/100 = 713).

Вторая причина собирать частотности - отсеивание «мусорных» фраз . Это фразы, частотность которых стремится к нулю, и их нет смысла включать на существующие страницы (и тем более создавать под них новые страницы).

Какие именно фразы считать «мусорными» ? Здесь все зависит от тематики. Например, если тематика узкая, трафика мало (например, по ключам «покупка аппарата МРТ » или «ремонт Vertu »), и каждый пользователь на вес золота, то можно оставлять и фразы с частотностью 1. Для магазинов масс-маркета отсеивают запросы с частотностью ниже 5. А для информационных сайтов частотность 10-20 вполне может быть нижним пределом. Главное, не переусердствуйте с удалением лишних фраз, иначе есть риск потерять трафик по низкочастотным запросам, который порой составляет до 70-80 % от общего трафика.

Еще одна причина уточнить частотности - выстраивание иерархии запросов на странице . Более частотные запросы добавляют в Title и H1, а под менее частотные - формируют разделы и подразделы.

Продвигать сайт на автомате? С модулем SEO от PromoPult это реально! Внутренняя оптимизация, линкбилдинг, наполнение контентом - все это автоматизируется в пару кликов. Вам лишь остается контролировать результат. Готовы? !

Один из наиболее популярных модулей в Rush Analytics – парсер Яндекс Вордстат, и это не случайно. При сборе семантического ядра необходимо точно знать частотность собранных запросов, чтобы правильно расставить приоритеты по продвижению и избавится от «мусорных» и нулевых запросов. Часто стоит задача пробить несколько десятков тысяч запросов на частотность в Яндексе, но это не совсем простая задача для самописных парсеров Вордстата и десктопных программ, и вот почему:

  1. Yandex Wordstat имеет хорошую защиту от парсинга, например бан IP-адресов с которых осуществляется парсинг и выбрасывание капчи в ответ на запросы от ботов. Чтобы эффективно собирать данные с Wordstat, нужен эффективный алгоритм подключения IP-адресов и другие хитрости
  2. Для парсинга большого количества данных с помощью десктопных программ понадобится много IP-адресов (прокси), которые Яндекс с легкостью банит при неоптимальном алгоритме подключения, а прокси – удовольствие недешевое
  3. Так же для парсинга понадобится автоматическое введение большого количества капчи (например подключение Antigate для этой задачи). Данный фактор, при неоптимальном алгоритме парсинга, может сделать сам парсинг нерентабельным, так как стоимость капчи будет чрезмерно высока
  4. Большинство десктопных программ не имеют защиты от потери данных при сборе. Так, например, собрав половину данных и потратив на это деньги, при сбое в парсере, вы рискуете не только не получить оставшиеся данные, но и потерять уже собранные

Парсинг Яндекс Вордстат в Rush Analytics

Учитывая все трудности которые могут возникнуть при парсинге Вордстата, мы сделали свой парсер Wordstat максимально быстрым, удобным и устойчивым к максимальному количеству проблем, связанных с парсингом:

  • Никаких прокси и капчи! Вам больше не нужно думать о бане ваших прокси или огромном количестве капчи, которую выдает Яндекс. Просто создайте проект, загрузите ключевые слова и ждите готовый файл с результатом
  • Высокая скорость парсинга. Наши алгоритмы используют оптимальную схему подключения IP-адресов и другие хитрости, чтобы сделать скорость парсинга феноменально высокой – вы и не заметите, как ваш проект будет выполнен!
  • Сохранность данных. Создавая проект в нашем парсере, вы можете быть уверены, что он будет успешно завершен и доступен для скачивания в любое время и из любой точки мира – все данные хранятся в облаке!
  • Поддержка всех регионов Яндекса. У многих пользователей есть потребность определять частотность запросов в Яндексе не только по региону «Москва» или «Россия», но и по другим, включая «Украину» и «Беларусь». В Rush Analytics вы сможете определить частотность запросов по любому региону, который поддерживает Яндекс на данный момент.
  • Сбор всех частотностей. С помощью нашего парсера вы сможете собрать все частотности: поисковый запрос, «поисковый запрос», «!поисковый!запрос».

  • Сбор левой колонки Wordstat. Помимо проверки частотности запросов, доступен сбор ключевых слов из левой колонки Wordstat с настройкой глубины парсинга от одной страницы до сбора всех имеющих в левой колонке страниц.
  • Сбор правой колонки Wordstat. Доступен сбор ключевых слов из правой колонки Wordstat.

Если вам нужен скоростной сбор частотностей Яндекс Wordstat – Rush Analytics лучшее решение, особенно если вам нужно собирать большие объемы данных. Для пользователей с потребностью сбора боле 100 000 запросов в месяц предусмотрены индивидуальные условия, просто напишите в нашу поддержку на

Парсер ключевых слов — это настройка Datacol, которая автоматически собирает запросы из статистики сервиса Wordstat по заданным пользователем ключевым словам. Таким образом, вам необходимо всего лишь задать базовые ключевые слова, после чего Datacol самостоятельно соберет информацию по производным запросам. Наряду с запросами сохраняется частота показов каждого запроса в месяц. При парсинге Datacol проходит по всем страницам выдачи Wordstat.

  • С помощью парсера Wordstat Вы сможете собрать запросы и частоту показа из статистики;
  • Вам нужно указать только список ключевых слов, данные по которым Вам необходимо собрать;
  • Сохраняйте собранную информацию в любом удобном формате (Excel, TXT, WordPress, MySQL и т. д.).

Парсинг Wordstat подразумевает обработку Javascript, а также необходимость авторизации для сбора данных. Такую возможность мы получаем благодаря плагину . При запуске кампании Datacol откроет один или более экземпляров браузера Chrome для загрузки через них вебстраниц. Количество работающих экземпляров Chrome равно количеству потоков кампании. Обратите внимание, что инициализация экземпляров браузеров может занять некоторое время.

Кем и для чего используется парсер ключевых слов яндекса

Парсер ключевых слов чаще всего используется специалистами по поисковому продвижению сайтов. В частности, это касается реализации задачи составления семантического ядра сайта. Оговоримся, что ниже речь пойдет о продвижении сайтов в рунете. В данном контексте более актуален парсер ключевых слов яндекс директа.

Парсер поисковых запросов директа

Для начала опишем стандартную схему работы парсера директа.

1. Пользователь задает поисковые запросы, производные которых необходимо собрать.
2. Парсер авторизуется на яндексе и начинает парсить яндекс вордстат поочередно для каждого запроса.
3. Для каждого запроса получаются производные ключевые слова не только с первой страницы выдачи директа, но и со всех последующих.

В результате на выходе мы имеем достаточно большое количество вариантов ключевых слов, которые в дальнейшем используются для формирования семантического ядра сайта.

Парсер ключевиков и количества показов — “скользкий момент”

Отметим, что помимо ключевых слов мы получаем так называемое “прогнозируемое количество показов” — показатель к которому стоит относиться очень осторожно. Для начала разберемся, что об этом значении пишет сам Яндекс:

В результатах выводится статистика запросов поисковой системы Яндекс, содержащих заданное слово или словосочетание, и других запросов, которые осуществляли искавшие его люди (справа).
Цифры рядом с каждым запросом в результатах выдачи вордстат дают предварительный прогноз числа показов в месяц, которое вы будете иметь, выбрав данный запрос в качестве ключевого слова.

Ошибкой многих оптимизаторов является то, что они читают только первую часть описания, и при этом — читают не совсем внимательно. Идем дальше:

Цифра рядом со словом «телевизор» обозначает число показов по абсолютно всем запросам, включающим слово «телевизор»: «купить телевизор» , «плазменный телевизор», «купить плазменный телевизор», «купить новый плазменный телевизор» и т.п.

Вы уже наверное догадались, на что мы намекаем? Итак, вы должны понять главное — при парсинге производных запросов по Wordstat не стоит обращать внимание на показатель их частотности, поскольку данное значение суммируется из частотностей всех производных запросов.

Но как в таком случае определить какие ключевики более “жирные” а какие менее? Сразу развенчаем ошибочное мнение, что производные ключевики всегда имеют меньше реальных показов, что основные. Это откровенная чушь! Найти реальные количества показов ключевиков (с вычетом количества показов производных) нам позволит операторы кавычки. Таким образом, для поиска запросов и определения самых “жирных” необходимо применять следующую схему:

1. Запустить парсер ключей для поиска производных.
2. Взять все производные запросы и отпарсить количество показов каждого, задавая запрос в кавычках.

Мы согласны, что это несколько более длинный и сложный путь. Однако представьте ситуацию. У вас есть около 500 запросов, по которым вы хотите продвинуть основной сайт. 30 из них являются (по вашему первоначальному мнению, то есть по изначально спарсенной статистике Wordstat) наиболее высокочастотными. Далее вы тратите 3 месяца времени и несколько тысяч убитых енотов (да ребята — качественное продвижение это дорогостоящее и длительное мероприятие) и в итоге оказывается, что поискового трафика в несколько раз меньше чем ожидалось. Вы сильно расстраиваетесь, ищите профессионального специалиста по продвижению и он вам открывает глаза на то, что вы продвигали совсем не те запросы, которые приводят трафик (в частности, он показывает вам реальную статистику по запросам в кавычках).

Тестирование парсера запросов

На нашем сайте вы можете бесплатно скачать парсер ключевых слов яндекса и протестировать его. Мы также можем обсудить настройку парсера кеев, которая будет проверять значения собранных запросов в кавычках.

Тестирование парсера Wordstat

Чтобы протестировать работу парсера Wordstat :

Шаг 1. Установите . Демо-версия программы имеет все возможности платной, но сохраняет только первые 25 результатов парсинга.

Шаг 2. В дереве кампаний присутствует кампания seo-parsers/wordstat-keywords-parser.par . Выберите ее и нажмите кнопку Запуск (Play) . Перед запуском можно отредактировать Входные данные , чтобы изменить набор базовых запросов , по которым будет собираться статистика.

кликните на изображении для увеличения

После запуска кампании открывается окно браузера, в которое необходимо ввести авторизационные данные для доступа к статистике Wordstat.

Яндекс Вордстат - это один из базовых сервисов для SEO-оптимизаторов, работающих в Рунете. Штатный инструмент системы позволяет искать ключевые фразы из поисковой выдачи - высоко-, средне- и низкочастотные - используя для этого операторы для повышения эффективности поиска и настройку геолокации. В среде оптимизаторов процесс сбора ключевых запросов, релевантных тематике сайта, называется парсингом.

Специалисты проводят парсинг Яндекс, чтобы сформировать семантическое ядро - лингвистический «костяк» для будущего контента, который наиболее точно отражает нишу или услугу, которую предлагает сайт. Для этого есть собственный инструмент для поиска в Яндексе - Yandex Wordstat Assistant, который можно бесплатно привязать к аккаунту. С его помощью удобно собирать и выгружать собранные ключевые слова в таблицу Excel.

Вы можете пользоваться этим инструментом, но только в том случае, если у вас относительно небольшой сайт, где семантическое ядро составляет не более тысячи запросов. Если объем работы по сбору семантического ядра гораздо больше (например, для интернет-магазина с множеством товаров), то парсить выдачу Яндекса вручную с помощью Wordstat Assistant будет неоправданно долго. Целесообразнее делать это с помощью специальных программ и онлайн-сервисов - бесплатных, условно бесплатных и платных (например, Key Collector).

Рассмотрим основные принципы работы с Вордстат, а также популярные средства для автоматического сбора поисковых запросов.

Как правильно парсить в Вордстат: обзор программ для анализа поисковой выдачи

Парсинг выдачи Яндекса - это процесс сбора поисковых запросов по заданной тематике (с помощью базовых маркеров). С Yandex Wordstat Assistant можно легко получить основную информацию для формирования семантического ядра - поисковые запросы, количество показов в месяц по каждой фразе, а также схожие по тематике слова, помогающие расширить охват целевой аудитории. Парсер Wordstat позволяет получить информацию по словам и по регионам, при этом система ориентируется именно на сайты.

Если хотите выполнить расширенный поиск, включающий не только Яндекс, но и социальные сети и другие поисковые системы, необходимо воспользоваться универсальными инструментами, например, A-Parser. Этот программный продукт отличается удобством в работе, но для эффективной работы с ним нужно купить прокси для парсинга.

В какой среде бы Вы ни работали, используйте универсальную схему сбора семантического ядра:

  • формирование базового списка маркеров (запросов, однозначно релевантных сайту);
  • сбор ключевых слов;
  • удаление «мусора» - ненужных и случайно попавших в список запросов;
  • кластеризация ключевиков по разделам сайта или тематикам.

Рассматриваем основной алгоритм работы с Вордстат и парсим Яндекс для сбора семантики на примере сайта агентства недвижимости. Допустим, нам нужно составить перечень релевантных ключевых запросов, соответствующих базовому маркеру «аренда квартир».


Совет! Обращайте внимание на подсказки типа «вместе с этим ищут» в соседнем поле выдачи результатов парсинга - это поможет вам охватить больше аудитории при составлении SEO-контента.

Чтобы облегчить себе задачу по ручному парсингу, используйте операторы Яндекс. Например, поставив в конце поисковой фразы знак «!», вы зафиксируете окончание поискового запроса, и система будет искать слова именно в этой словоформе. Оператор «-» (минус) позволит убрать лишние слова, а квадратные скобки «» - зафиксировать порядок слов в запросе.

Специалисты советуют сочетать ручной и автоматический выбор запросов для составления семантического ядра, особенно для новичков. Пользуясь штатным инструментом Яндекс Вордстат Ассистент, вы нарабатываете навыки интуитивного подбора поисковых фраз, которые приводят на сайт целевых клиентов с помощью средне- и низкочастотных ключей. Высокочастотные фразы не всегда работают, особенно в конкурентной нише.

Если у вас нет времени на ручной парсинг в Яндекс Вордстат, используйте специальные инструменты. В интернете можно найти различное программное обеспечение, но большинство русскоязычных специалистов по SEO-оптимизации делают парсинг выдачи Яндекса с помощью Key Collector.

Это десктопный продукт, позволяющий создавать и хранить в локальной памяти компьютера проекты для каждого сайта, загружать и сохранять файлы и делать парсинг ключевых слов в соответствии с региональными настройками. Программа требует привязки к аккаунту. Для работы с ключевыми поисковыми запросами в Кей Коллекторе имеются пиктограммы основных поисковых систем в Рунете (в нашем случае это Yandex-парсер, хотя можно выбрать Google, Bing и другие).

Среди других полезных сервисов для SEO такие:

  • Serpstat - многофункциональная платформа для профессионалов, имеющая триальную версию с ограниченным функционалом, а также платную подписку от 19 до 299$ в месяц;
  • Ahrefs - веб-сервис с множеством полезных опций, включая мониторинг ниши, анализ конкурентов и улучшение индексации сайта. Для сбора семантического ядра предусмотрен инструмент Keywords Explorer. Протестировать его можно от 7$ в неделю;
  • Semrush - аналог Ahrefs по части функционала, более дорогой по тарифам (от 99$ и выше).

Специалисты утверждают, что Кей Коллектор - это самая удобная и функциональная программа, позволяющая значительно облегчить жизнь оптимизатора. У нее есть множество полезных опций для точной настройки параметров парсера Yandex (например, глубины поиска, избирательного поиска запросов по базовой частотности и т.п.).

Но у программы есть нюанс - она платная. Стоимость лицензии составляет 1800-1900 рублей по электронному и безналичному расчету соответственно.

Совет! Если по какой-то причине вы не хотите пользоваться этим продуктом, можете попробовать его бесплатный аналог «Словоёб». Подойдет и более простой вариант - Букварикс - бесплатный сервис для сбора ключевых слов и формирования семантического ядра.

Парсинг Яндекс Вордстат можно делать самостоятельно и с помощью специальных программ. Ручной сбор посредством инструмента Wordstat Assistant оправдывает себя в том случае, если ваша ниша имеет узкую направленность и мало конкурентов, а перечень поисковых запросов относительно невелик. При больших объемах работ рекомендуется пользоваться специальными программами для парсинга и аналитики.