Среди вебмастеров и оптимизаторов бытуют различные мнения по поводу влияния валидности HTML кода, качества верстки страниц, соответствия кода страницы W3C стандартам на их рейтинг и позиции в поисковых системах. В данной статье приведен обозор мнений о том, как относятся поисковые системы к качественным HTML страницам и страницам, содержащим ошибки в HTML коде (верстке), а также показаны результаты проведенных экспериментов по этому вопросу несколькими вебмастерами.
Все страницы в вебе, как известно, написаны на HTML. Как и каждый язык, HTML имеет свою грамматику и синтакс и каждый документ, использующий этот код, должен следовать правилам языка. HTML постоянно меняется и на данный момент стал относительно сложным, вебмастерам не составляет труда сделать ошибки в коде. Если ваш HTML код не соответствует официальным правилам (w3c стандартам), тогда он называется невалидным или плохим (invalid html code).
Поисковые системы должны спарсить (разобрать) HTML код на ваших страницах чтобы найти релевантный контент. Если ваш HTML код содержит ошибки, поисковые роботы могут не найти контента. Программы поисковых систем подчиняются стандартам HTML. Пропущенный закрытый тег и сломанная верстка может иметь большое значение для ботов. Общаясь на общем языке с поисковыми роботами, вы должны четко объяснить, как что должно выглядеть и какой элемент чем является.
Битые ссылки на странице сильно замедлят индексацию вашего сайта, особенно при большом количестве страниц. Валидный HTML позволит роботам легко индексировать сайт и быстро добавлять его в свой индекс.
В руководстве для веб-мастеров Google советуют некоторые правила оформления для упрощения работы бота со страницами вашего сайта, которые являются правилами валидного HTML:
Ряд веб-мастеров придерживаются мнения о том, что качество верстки или валидность HTML страниц никоим образом не влияет на ранжирование сайта в результатах поиска. При этом они ссылаются на тот факт, что по большинству ключевых запросов в серпе (поисковых результатах) на первых местах содержатся далеко не те сайты, которые соответствуют w3c стандартам. Однако, не стоит забывать, что на ранжирование в поисковых системах влияет множество факторов, работающих в совокупности. Некоторые из вебмастеров решились провести эксперименты для решения этого вопроса.
Результаты одного из таких экспериментов приведены в статье Марка Даоста [Заботится ли Google о валидности HTML]. Вкратце, автор делает два сайта, один из которых содержит ошибки в коде, а второй является валидным. Оба оптимизированы под два ключевых слова. После индексации и проверки позиций он меняет код в сайтах, исправляя в первом ошибки и добавляя их во второй. Вывод эксперимента Марка в том, что Google меняет позиции сайтов в независимости от корректности HTML кода. В двух случаях не удалось подтвердить или опровергнуть гипотезу о положительном влиянии корректного кода на позиции в выдаче.
На выводы, приведенных в первом эксперименте, могли повлиять малое количество экспериментальных данных и неверный подход к проведению. К тому же, доверять Марку Даосту сложно, так как в конце статьи он даёт битую ссылку на обсуждение данного вопроса на форуме, а также неизвестна дата публикации данного материала. Поэтому перейдем к другим проведенным экспериментам.
12 мая 2007 г. Шаун Андерсон опубликовал статью о тестировании Google на предпочтение валидного HTML и получил положительный результат, причем автор приводит примеры и доказательства чистоты эксперимента. Помимо влияния корректного HTML автро также исследует влияние валидного CSS. Выводы автора в том, что валидные HTML и CSS положительно влияют на позиции страницы в поисковых результатах. На его же сайте можно почитать комментарии других пользователей к посту.
Другой эксперимент проводился раннее. 30 января 2006 г. Майк Девидсон опубликовал уроки из хитрого сео-теста. В указанной статье приведен подробный отчет об эксперименте, в том числе учитывающий и валидность HTML кода. Майк отвечает на вопрос: можно ли получить пенальти за использование невалидного HTML кода? Ответ – да. По его словам, Google каким-то образом классифицирует страницы, основываясь на том, как хорошо они отдаются и как написаны. Незакрытый атрибут может привести к тому, что часть контента может быть воспринята как значение атрибута. И в выводе автор заключает: не совсем понятно, влияет ли валидный код на поизиции в поиске, однако совершенно понятно, что некоторые ошибки в коде могут привести к вылету страницы или сайта в целом из индекса.
Для проверки валидации вашего HTML кода существует множество бесплатных сервисов. Многие профессионалы используют известный HTML Validator для проверки соответствия кода w3c стандартам.
Не смотря на то, что не все HTML ошибки приведут к проблемам поискового ранжирования, некоторые из них могут затруднить поисковым системам успешно индексировать страницы и могут испортить все ваши SEO усилия.
Найдите нужного исполнителя через каталог seo-компаний Рунета.
28 Ответов
октября 7, 2008 at 10:51
1конечно я давно уже подозревал что нужно досконально изучить html и благодоря данной статье все таки решился еще раз перечитать литературу. а то проверив свой сайт на валидность сервис показал аж 38 ошибок. я хоть и начинающий в сео,но думаю у меня все впереди-на ошибках учаться как говориться. спасибо автору.
октября 8, 2008 at 05:37
2Если ошибки не критичные и сайт нормально отображается, то все нормально.. маниакально следовать стандартам и при этом мучаться что бы все работало для пользователей считаю злом.
октября 8, 2008 at 10:19
338 ошибок это, конечно, перебор. но практика (хоть и не слишком большая) показывает, что совершенно без ошибок обойтись не получается. вот хоть убейте, а 4-8 бывает всегда. :)
хотя согласна, что ранжировании так или иначе неграмотный код отражается.
февраля 2, 2009 at 03:18
4А на моём сайте валидатор показал 325 ошибок и 15 предупрежеднний, я думаю что пора бы начать с этим бороться
марта 5, 2009 at 07:10
5Согласен с Mr.Snow.
Дело в том, что сайт ваш проверяет машина. не надо забывать, что это как проверка орфографии и в проверки слова нЁбо машина увидит нЕбо и выдаст ошибку. Проще говоря, если в коде не силен, то лучше не обращать внимание на ошибки. за это должен отвечать программист. имхо.
марта 20, 2009 at 03:47
6Когда анализатор выдает вам 100-200 ошибок, стоит задуматься.
НО! большинство из них – это отсутсвие кавычек для параметров тэгов. А это ерунда.
марта 23, 2009 at 10:57
7блин 35 ошибок нашел, а на много влияет это?
марта 23, 2009 at 11:25
8Смотря какие ошибки.
Большинство из них не критичны
марта 23, 2009 at 11:37
9у меня 18 и почти все связаны с “>”. проверил- везде стоят, но почему-то прога не засчитывает. да и стоят в основном перед имедж или нттп- то есть на валидацию вряд ли влияют. так что если все эти 35 тоже “>” стоит ли переживать? но если ругается на absmiddle то думаю стоит подумать чтоб под стандарт подвести. короче, мое мнение-с тегами бороться время терять (ну если только не совсем все косячно), важней на атрибуты смотреть по ошибкам. хотя может профессионалы и наоборот скажут.
апреля 21, 2009 at 10:37
10Спасибо за инфу, мне как раз дали задание написать по html доклад – буду отсюда немного цитировать
апреля 26, 2009 at 01:52
11turboswed, у вас не соотв. doctype вашему “стилю” кодирования :)
сделайте absmiddle через css, а теги img или meta закрывайте со слешем “/>”
июня 5, 2009 at 09:50
12достаточно одной маленькой кавычки, чтобы все поехало и машина перестала считать вашу страницу валидно
вот пример
a href=“ссылк>
этого достаточно чтобы парсер перестал работать.
на счет того что совсем без ошибок нельзя – это бред – ошибки бывают либо изза не до читания документации (сорри за не русский) или из-за всяких счетчиков.
Некоторых авторов этих счетчиков я бы поубивал.
июня 19, 2009 at 08:00
13Фигня это у вас!У меня 310 ошибок и 106 предупреждений.
Некоторые ошибки, которые показывает, вовсе не ошибки.
июля 5, 2009 at 03:48
14Сергей, а как Вы относитесь к субдоменам на сайте, особенно, если их очень-очень много? Снижается ли рейтинг сайта в целом и как гугл относится к продвижению на них? будет ли такой сайт некачественным с т.зр. СЕО и доверия поисковиков? в одной статье гугла было сказано, что не нужно делать субдомены…
июля 8, 2009 at 02:34
15Эх… сео. А что делать куда деваться???
июля 8, 2009 at 11:48
16А как быть с тегом noindex?
Встречал в сети конструкцию <![CDATA[<noindex>]]>, но вроде как пишут, что она не скрывает ссылки от Яши, хотя код получается валидный.
Интересно что ты по этому поводу думаешь) спасибо)
июля 9, 2009 at 12:18
17Tod, лучше не париться и если необходимо вставить noindex, то вставлять его обычным способом, нарушая валидность. На позиции и доверие псов это не повлияет. На счет скрывает или не скрывает ссылки от Яши приведенная тобой конструкция я пока что не в курсе.
июля 9, 2009 at 12:36
18На серче вроде делали эксперимент, что оно не скрывает, хотя так конкретного ничего и не нашел. Вот прочила с интересом твой пост про javascript – получается замена ноуиндекс – Яша ссылку не видит, а для гугла пойдет. Хотя какой смысл в этом – если уж скрывается, то от обоих:)
сентября 15, 2009 at 07:22
19Если судить по моим первым опытам сайтостроения и продвижения, то валидность никоим образом не сказывалась на проектах… Есть много других факторов, влияющих на выдачу, о которых пока умолчу …
октября 11, 2009 at 01:51
20От себя, как от версталы, могу добавить что за счет валидного и логически структуририванно построеного html получаешь большой + (судя из своих проектов, где использовалась только внутрення оптимизация кода).
октября 27, 2009 at 02:35
21Не знаю, когда валидатор показывает 0 ошибок – на сердце как-то легче становится. Лишние положительные эмоции никогда не помешают :)
декабря 19, 2009 at 07:11
22проверьте igoogle на валидность – 214 Errors, 88 warning(s)
http://validator.w3.org/check?uri=http://www.google.com/ig&charset=(detect+automatically)&doctype=Inline&group=0
:-)
декабря 30, 2009 at 02:00
23а зачем это нужно?
января 31, 2010 at 06:18
24ну я думаю что гуглу не обязательно соблюдать валидность в коде.. наврятле ему требудется лучший поиск в поисковиках :) а я исправил все ошибки у себя в коде на сайте :) самооценка аш зашкаливает, что я теперь могу похвастаться валидным кодом.. :)
февраля 4, 2010 at 12:44
25Кто нибуть может рассказать о наблюдениях по влиянию валидного html после 20.01.10 на выдачу Яндекса?
февраля 5, 2010 at 11:27
26простите а кто знает ,что произошло с индексацией яндекс… точнеее с выдачей результатов поиска…. все сайты рухнули….
февраля 21, 2010 at 03:48
27А я изначально старалась делать код валидным, правда не знаю помогло ли это..
февраля 24, 2010 at 04:56
28Посмотрите на эту же страницу в валидаторе, 57 errors, не надо парится, ни как это не влияет, ну совсем.
http://validator.w3.org/check?uri=http%3A%2F%2Fdevaka.ru%2Farticles%2Fvalid-html-in-seo&charset=%28detect+automatically%29&doctype=Inline&group=0
Ответить