Часто при формировании UGC-контента возникает проблема, когда отправлять его на индексацию нет смысла из-за малой информативности образовавшегося документа. Наличие малоинформативных страниц на сайте может снижать скорость индексации, а также влиять на авторитет домена. В связи с этим, необходимо уметь управлять качеством генерированных страниц. В некоторых случаях частичные дубли можно склеивать между собой, в других лучше вовсе не допускать их индексацию.

В данной статье предложено решение проблемы UGC-контента, а именно метод работы с малоинформативными страницами сайта с помощью введения внутреннего показателя качества документа.

Задача 1. У вас есть раздел объявлений, где каждый пользователь может создать страничку с описанием. Некоторые пользователи стараются и описывают свое объявление как можно подробней, особенно, если в подсказках или элементами интерфейса/функционала мы будем просить их об этом. Но, зачастую, люди не любят создавать уникальный контент, особенно если это касается объявлений. Они пишут короткие тексты или копируют свои объявления на множество досок, в том числе и на вашу. Такие малоинформативные документы никогда не будут хорошо ранжироваться и приносить трафик, а при большом количестве могут снижать авторитет раздела. Как поступить?

Решение: Вводим показатель качества (Q), который зависит от необходимых нам параметров, например, от объема контента (volume)Q = F(volume), а также вводим порог (T), при котором мы считаем страницу некачественной. В случае Q < T добавляем документу мета-тег noindex.

<meta name="robots" content="noindex, follow" />

При генерации sitemap.xml также не выводим в него адреса, для которых Q < T.

Читать дальше про метод решения проблемы UGC-контента...