15,854 просмотра

В сети существует достаточно много разработанных серверных скриптов и десктопных приложений для извлечения информации (парсинга) каталога яндекса (ЯК). В данной статье не является целью привести примеры онлайн сервисов для парсинга ЯК, их можно найти в поисковой системе по ключу парсер яндекс каталога. Пролистав страницу, ниже вы найдете ссылку для скачивания серверной версии граббера, которую можно установить на денвере.

Что такое Яндекс.Каталог?

Яндекс Каталог, или просто ЯК, это сборник самых хороших, качественных (по мнению редакторов самого каталога) ресурсов русского интернета, сгруппированных по тематическим категориям. В каталоге ЯК ресурсы отсортированы в порядке убывания их тематического индекса цитирования (тИЦ), который среди SEOшников считается одним из показателей качественного сайта. Более подробно о яндекс-каталоге вы можете почитать здесь.

Что такое парсер?

Парсер — это синтаксический анализатор. В нашем случае парсер, или граббер, это анализатор кода. Обычно это программа, или часть программы, которая извлекает из заданной структуры необходимые данные. Парсер яндекс каталога это программа, которая извлекает из страниц ЯКа урлы сайтов в заданной тематике (категории).

Зачем нужен парсер каталога яндекса?

Есть несколько целей использования информации о сайтах, полученных в результате парсинга каталога. Ниже приводится две наиболее распространенных из них.

  • Покупка ссылок в сапе с сайтов именно вашей тематики или смежной для эффективного увеличения тИЦ своего ресурса.
  • Поиск контактной информации с сайтов (часто с помощью специальных программ) и связь с администраторами или вебмастерами для рекламы, сотрудничества или тематического обмена ссылками или пользователями.

Наверняка, комментарии излишни. Если вам нужен парсер каталога ЯК, вы попали именно туда, куда следует.

Скачать парсер ЯК с инструкциями

Yaca лого Для скачивания парсера кликните ссылку ниже:
YacaParser.zip [11.39KB]

ТРЕБОВАНИЯ

  • PHP 4+
  • Библиотека cURL
  • Поддержка функций работы с файлами (fopen, fwrite)

УСТАНОВКА

Перепишите папку YacaParser на свой сервер в любое место, доступное из web. Папка files должна быть доступна для записи. Если вы записали на сайт site.ru, тогда запустите парсер, введя в строку браузера путь http://site.ru/YacaParser/

ИСПОЛЬЗОВАНИЕ

При использовании скрипта необходимо задать категорию, которую требуется спарсить. Поддерживается два формата категории:

1. Категория/Подкатегория
Например, для парсинга категории “Недвижимость”, необходимо ввести путь
Business/Realty

2. Полный путь
Например,
http://yaca.yandex.ru/yca/cat/Business/Realty/

При переходе по страницам Яндекс Каталога используется задержка в 1 секунду (строка 48 файла class.Grabber.php). Этот параметр можно менять, задавая целое число секунд. Регулярные выражения для работы со структурой кода страниц каталога можно изменять в файле config.php.

ВНИМАНИЕ

При большом количестве запросов к яндекс каталогу ваш IP адрес может быть забанен на сутки. Обычно, не более 1000 запросов (страниц) в час это нормально.

Все замечания по поводу скрипта вы можете оставлять в комментариях к данному посту. Скрипт распространяется свободно, но если вы захотите отблагодарить автора, он всегда рад. Реквизиты можно найти на странице контактов. Успехов в продвижении!

Если вам понравилась статья, вы можете подписаться на RSS или E-mail рассылку. Для получения обновлений по электронной почте, введите ваш e-mail адрес в эту форму (Доставка от FeedBurner):