6,551 просмотр

Всем привет. Меня зовут Захаров Максим, я из команды Миратекст. Сегодня речь пойдет об исследовании модуля Яндекс.Вебмастера «Оригинальные тексты» продолжительностью в 26 месяцев.

Как Яндекс объясняет работу сервиса?

Если вы публикуете на своем сайте оригинальные тексты, а их перепечатывают другие интернет-ресурсы, предупредите Яндекс о скором выходе текста. Мы будем знать, что оригинальный текст впервые появился именно на вашем сайте, и попробуем использовать это в настройке поисковых алгоритмов. Обратите внимание, что мы не гарантируем учет вашей заявки в работе поисковых алгоритмов.

Начнем с истории

Альфа-тестирование сервиса Яндекс начал в 2011 году, 15 августа. С ограничением для сайтов с тИЦ > 0.

Тестирование закончилось в 2013 году, 23 октября. Оригинальные тексты стали доступны всем. Без ограничений. Появилось API.

Небольшое отступление

Многие веб-мастера не верили в работу «Оригинальных текстов». Есть много тем на форумах, где по сей день люди обсуждают эту тему. Даже было несколько экспериментов в блогах с целью проверки работы этого черного ящика. Один из самых запоминающихся сделал Игорь Бакалов.

Я смотрел на эти эксперименты со стороны и понимал, что данных слишком мало, чтобы делать какие-то выводы, поэтому не воспринимал результаты всерьез. Да и поводов не верить Яндексу у меня не было, хоть и проверить его было нельзя.

Именно поэтому в начале 2014 года мы на Миратекст реализовали возможность автоматически отправлять готовые тексты в Яндекс.Вебмастер. Бесплатно, ведь Яндекс тоже ничего за это не просит. Заказчику надо было только связать аккаунт на Миратекст с аккаунтом в Яндексе.

А работают ли?

Процесс налажен, тексты писались, отправлялись в Яндекс. Другими словами, все было хорошо. Недавно я вспомнил об этом и подумал: а почему-бы не проанализировать все добавленные тексты и не узнать, а работают ли эти «Оригинальные тексты»?

Немногие отправляют свои тексты в Яндекс, но за 2 года и 2 месяца накопилось:
— 2014: 7014 статей
— 2015: 6924 статей
— 2016: 778 статей

Практически 15 тысяч статей которые были отправлены в Яндекс. Я бы поверил такому эксперименту, если бы прочел о нем в Рунете. Решено, делаем.

Первый этап — проверка уникальности

Первым делом надо проверить все тексты на уникальность. Понятное дело, что изначально они были уникальными, но спустя время их могли украсть, что нам и нужно.

В этом мне помог Михаил Романов из content-watch.ru. После проверки вернулось:
— 2014: 408 статей
— 2015: 480 статей
— 2016: 46 статей

Проверяя уникальность статей, игнорировали основной домен, на котором должна быть размещена статья, чтобы найти реальные копии статей.

В итоге 934 статьи (6%) из 15 тысяч статей оказались неуникальными. Я ожидал большего количества, но и этот результат неплохой.

Второй этап — проверка позиций

В теории: Если «Оригинальные тексты» работают, то позиции ОС должны быть выше чем у СК. В идеале все позиции ОС должны быть первыми.

Мы изначально знали, на каком сайте был размещен текст, так как отправка готовых статей в Яндекс.Вебмастер идет по API к привязанному сайту. Итак, основной сайт (в дальнейшем ОС) нам уже известен, а вот сайт-копипастер (в дальнейшем СК) мы узнали после проверки уникальности.

Нам надо проверить, кто в выдаче выше – ОС или СК. Чтобы это проверить, разбиваем неуникальные статьи (934 штуки) на запросы по 8 слов и по всем этим запросам проверяем позиции первого и второго сайта.

Почему именно по 8 слов? Потому что такого запроса должно быть достаточно, чтобы в выдаче оказался нужный сайт. А также, чем меньше слов в запросе, тем больше запросов на одну статью, а это более точные данные.

Для наглядности объясню

Есть сайты:
— site.ru – наш основной сайт
— site2.ru – сайт-копипастер

После разбивки текста на запросы получится примерно 38 запросов для текста объемом 2000 символов (примерно 300 слов). А значит, надо узнать 76 позиций: 38 для ОС и 38 для СК. И так по каждой статье.

Итак, разбиваем все статьи на запросы. Получаем:
— 2014: 12555 запросов
— 2015: 11984 запроса
— 2016: 1026 запросов

В сумме: 25565 запросов. Так как мы будем проверять позиции двух сайтов, то общее количество запросов будет равно 51130. Круто, 50 тысяч!

Перед тем, как приступить к проверке понимаю, что спустя годы некоторые сайты могут вообще не работать. Проверяем и в итоге отсеиваем часть запросов. Остаются:
— 2014: 9289 запросов
— 2015: 10974 запроса
— 2016: 1026 запроса

В сумме: 21289 запросов. Для двух сайтов: 42578 запросов. А для двух поисковых систем: 85156 запросов.

С позициями помогла команда PR-CY.ru из line.pr-cy.ru. Загнали все данные, запустили, ждем, потираем руки…

Третий этап — анализ

Вот тут и началось самое интересное. Изначально я думал, что картина сразу будет ясна. Но все оказалось сложнее.

К сожалению, многие заказчики неправильно использовали инструмент. Они отправляли готовые статьи в Яндекс, но статьи размещали не на своем сайте, а на других (яркий пример – статьи для Миралинкс). Именно поэтому зачастую позиции у ОС отсутствовали, потому что статьи, которую мы искали, там нет.

Если вы делаете также – остановитесь! По алгоритму Яндекса, текст, отправленный в “Оригинальные тексты” должен быть размещен именно на том сайте, куда и был отправлен текст. Иначе какой смысл отправлять тексты в Яндекс?

Пришлось дополнительно фильтровать результаты. Оставлять только те статьи, которые действительно есть на сайте.

В результате осталось только 7029 позиций (33%). Если считать в среднем, то это около 150 статей. Вообще мизер, но что делать.

Сначала интересные наблюдения

Количество позиций в топ 100
— Яндекс ОС: 5920
— Яндекс СК: 3507
— Google ОС: 7029
— Google СК: 2126

Количство позиций в ТОП100

Видно, что Google лучше находит источник и гораздо реже показывает в выдаче копипастера. Хотя у Google нет инструмента “Оригинальные тексты”. А также обращу внимание на то, что Google чаще выбрасывает сайт СК за топ 100 (что на мой взгляд верно), а Яндекс все равно находит ему место в выдаче.

Средняя позиция
— Яндекс ОС: 3,91
— Яндекс СК: 6,67
— Google ОС: 1,53
— Google СК: 3,21

Средние позиции в поисковых системах

Видно, что в среднем оба поисковика отдают предпочтение тому сайту, кто является владельцем контента, но по позициям Google вновь опережает Яндекс.

Если смотреть на позиции, то особо ничего не понятно, но для чистоты эксперимента я их опубликую. Позиций много, поэтому они выглядят не очень удобно.

Позиции в Яндексе
Позиции в Google

Интересно узнать самое главное: кто же выше по позициям, основной сайт или сайт-копипастер? Рисуем диаграммы на основе данных 7029 запросов:

Кто выше?

Выводы

Прежде, чем перейти к выводу, хочу отдельно поблагодарить Михаила Романова из content-watch.ru и команду PR-CY.ru из line.pr-cy.ru. Без вашей помощи я не смог бы получить эти данные. Спасибо!

Целью эксперимента было проверить кто будет в выдаче выше, сайт, который добавлен в “Оригинальные тексты” или тот сайт, который украл чужой контент. Сравнение с Google происходит лишь потому, что было интересно, каковы результаты у главного конкурента Яндекса.

Вывод простой и короткий – “Оригинальные тексты” в Яндексе работают.
Сайт, за которым закреплено авторство контента, находится в выдаче выше, чем сайт, который украл этот контент.

Мои рассуждения такие.
Яндекс создал этот инструмент потому, что есть проблема со скоростью индексирования новых страниц. И этот инструмент работает. Помогает Яндексу узнать, кто первоисточник. А Google сам по себе очень быстрый, поэтому и без дополнительных инструментов может определить, кто первоисточник. Остается вопрос, как будет развиваться ситуация, если: контент с сайта был украден при условии, что ОС не отправлял этот текст в “Оригинальные тексты”, а также страница с новым текстом быстрее проиндексировалась именно у СК?

В теории СК должен быть выше. Возможно ли потом доказать поисковому алгоритму, что именно вы являетесь автором контента? И как это сделать?

Максим Захаров, руководитель биржи копирайтеров Миратекст Я с этим не сталкивался. Интересен ваш опыт.

Кстати, у нас есть база текстов, которые точно размещены на сайтах, и не отправлялись в “Оригинальные тексты”. Можно сделать другое исследование, как поисковые системы ведут себя в этом случаев. Если вам это интересно.

Автор: Захаров Максим, в прошлом SEO-оптимизатор, сейчас руководитель биржи копирайтеров miratext.ru.

  • 0 Нет
  • 33 Да
  • Мне понравилось!

Если вам понравилась статья, вы можете подписаться на RSS или E-mail рассылку. Для получения обновлений по электронной почте, введите ваш e-mail адрес в эту форму (Доставка от FeedBurner):