Парсер ЯКа. Собираем базу доноров в автоматическом режиме.
Приветствую! Не секрет, что довольно важным фактором при продвижении в коммерческом секторе (и не только), как правило, является регион. Региональная принадлежность сайта - один из факторов ранжирования поисковой системы Яндекс; пользователю, находящемуся в определенном регионе, будут выдаваться те сайты в выдаче, которые отнесены к данному региону (при прочих равных условиях). Ведь глупо человеку, задавшему запрос "купить суши" и находящемуся, к примеру, в Перми, выдавать сайты из Владивостока Для того, чтобы задать продвигаемому сайту определенный регион, необходимо:
1. Перейти в
2. Выбрать необходимый сайт;
3. Перейти в "География сайта" - "регион сайта";
4. Задать нужный регион, при необходимости указав страницу на сайте, подтверждающую принадлежность сайта именно к этому региону.
После этого модераторы Яндекса проверят информацию, и если не возникнет вопросов/сомнений - подтвердят региональную принадлежность сайта.
Таким образом можно назначить только один регион. Чтобы была возможность добавить сайту сразу несколько регионов, необходимо добавить его в Яндекс Каталог. Сделать это можно на
Для регионального продвижения лучше всего искать доноров из этого же региона, что и продвигаемый сайт. На 100% точно определить региональную принадлежность сайта можно благодаря ЯКу. То есть, напарсив базу из Яндекс Каталога по определенному необходимому нам региону, можно создать свой "список доноров" по этой региональной принадлежности, а уже дальше добавлять их в white list в gogetlinks, miralinks, getgoodlinks, rotapost и т.д. Кстати, для более оптимальной работы рекомендую ознакомиться со статьей про нюансы работы в биржах gogetlinks и getgoodlibks в качестве оптимизатора. А, заодно, и про грамотный и эффективный выбор сайтов-доноров.
В сети можно найти онлайн парсеры ЯКа, или скрипты для парсинга (я встречал на php). Но, зачастую они либо слишком тормознутые, или имеют какие-либо ограничения (например, на количество напарсенных сайтов). Каким же образом можно собрать нужную базу потенциальных сайтов-доноров из Яндекс Каталога необходимого региона? Я предлагаю десктопный вариант парсера, написанный специально для читателей блога Net-Bloga.ru

Просто запускаете парсер ЯК, предварительно загрузив в файл proxy.txt рабочие прокси-сервера, вводите нужный урл, выбираете необходимый регион и ждете

Например, нам нужна база сайтов из категории Яндекс каталога "Развлечения - Юмор" по региону Москва. Там 15 сайтов. вводим в окно программы
Entertainment/Humor/
Выбираем "Москва" и жмакаем "парсить". Работает довольно быстро, 1000 сайтов при хороших и быстрых проксях напарсит за считанные минуты. Напарсенная база сохраняется в файл sites.txt и выглядит как
адрес сайта; его тИЦ
Для "выдирания" самих урлов, можно, например, воспользоваться Microsoft Exel (я использую версию 2003). Примерно так:
- Создаем новый Exel документ
- Файл - открыть. Выбираем текстовый документ с напарсенной базой, не забыв указать в окне "открытие документа" внизу "все файлы"
-
Выбираем "с разделителем", нажимаем "Далее". Затем выбираем "точка с запятой", "Далее" и "Готово". Вуаля
Копируем получившийся первый столбец с урлами в ткстовый файл. Теперь у нас на руках готовая база напарсенных сайтов из ЯКа, готовая к импорту в любую биржу!
Рассмотрим более детально плюсы подобных доноров:
- в подавляющем большинстве случаев - трастовые ресурсы
-
находятся в ЯК (логично, правда
)
- имеют нужную нам региональную принадлежность
И, заодно, чтобы быть объективным, основной минус:
- высокая цена размещения ссылок на таких донорах
Таким образом, такие доноры, собранные при помощи парсера Яндекс Каталога, в прямом и переносном смыслах являются "золотыми": по эффективности продвижения при помощи них и по цене.
Кстати, парсер ЯК также может пригодится многим для того, чтобы собирать базу сайтов по нужной категории без указания региона. Например, для наращивания тИЦ

Еще разок ссылочка для тех, кто желает скачать парсер Яндекс Каталога - вот.
PS: Убедительная просьба при распространении программы указывать ссылку на эту статью. Уважайте, пожалуйста, чужой труд, тем более что Вы получаете этот софт, так необходимый каждому SEO-шнику абсолютно бесплатно. Спасибо за понимание!
Вопросы и предложения, а также критику готов выслушать в комментах. Кстати, был бы актуален подобный парсер, только каталога DMOZ?
Работаем с текстом при помощи Textus Pro. Статистика текста, слов и фраз. | eTXT антиплагиат: настройка и использование. Нет копипасту! |
---|
- Вконтакте
- Фейсбук
- Комментарии