Ошибки в карте сайта sitemap.xml

Небольшой пост по поводу ошибок в xml-карте сайта:

  • Почему возникают?
  • Насколько критично?
  • Всегда ли надо устранять?

Файл sitemap — это файл с информацией о страницах сайта, подлежащих индексированию. Разместив этот файл на сайте, вы можете:

  • сообщить Яндексу, какие страницы вашего сайта нужно индексировать;
  • как часто обновляется информация на страницах;
  • индексирование каких страниц наиболее важно.

Как правило, xml-карта доступна по адресу site.ru/sitemap.xml

О проблемах с сайтом можно узнать при помощи сервиса Яндекс.Вебмастер, для этого необходимо добавить сайт в Вебмастер.

Яндекс.Вебмастер сигнализирует о возможной проблеме
Яндекс.Вебмастер сигнализирует о возможной проблеме

Сразу замечу, что в обязательном порядке необходимо реагировать на фатальные ошибки. К "самым фатальным ошибкам" относятся заражение сайта вирусами и полный запрет на индексирование сайта в файле robots.txt (Disallow: /).

В конкретном случае сервис сообщает, что возможно есть какие-то проблемы с файлами Sitemap.

В одном или нескольких файлах Sitemap обнаружены ошибки, которые могут повлиять на обработку файлов индексирующим роботом.
В одном или нескольких файлах Sitemap обнаружены ошибки, которые могут повлиять на обработку файлов индексирующим роботом
Много ошибок в файле Sitemap
После щелчка по ссылке "Проверить" возникла ужасающая картина - почти 11 тыс. ошибок в файле Sitemap с постами сайта

У особо впечатлительных веб-мастеров может подняться давление, но сперва следует разобраться в причине статуса.

Ошибки в sitemap тег image
Как оказалось, проблема в теге image:image, который не смог распознать робот Яндекса

Этот тег появился в картах Sitemap по той причине, что в качестве SEO-плагина на сайте установлен Yoast SEO, который создает Sitemap согласно пожеланиям Google.

Тег <image:image> содержит всю информацию об одном изображении. Он нужен для того, чтобы картинки были представлены в результатах поиска Google.

Следуя рекомендациям для веб-мастеров и советам по публикации изображений, вы повысите вероятность того, что ваши картинки будут представлены в результатах поиска. Кроме того, можно предоставить Google дополнительную информацию о графических материалах, размещенных на вашем сайте, с помощью специальных функций файла Sitemap. Это поможет Google найти контент, который иначе нельзя было бы обнаружить (например, если он загружается с помощью JavaScript), а также позволит вам указать изображения, которые необходимо сканировать и индексировать.

Получается, что хорошо для Google, то плохо для Яндекса. На некоторых блогах появились рекомендация убирать все лишнее из файлов Sitemap чтобы у Яндекса не было замечаний. Но надо ли на самом деле убирать то, что рекомендует Google? Насколько критичны данные ошибки для сайта? Чтобы ответить на этот вопрос, обратимся к справке Яндекса.

Файл Sitemap может содержать различную информацию о страницах сайта, которая передаётся роботам с помощью тегов в файле. Робот Яндекса поддерживает следующие теги:

  • loc (адрес страницы);
  • lastmod (дату последнего обновления страницы);
  • changefreq (частоту изменения страницы);
  • priority (относительную значимость страницы).

Если файл содержит другие теги, например, с указанием на мобильную или мультиязычную версию, а также с адресами картинок, в Яндекс.Вебмастере появится ошибка «Неизвестный тег». Неподдерживаемые теги игнорируются роботом при обработке Sitemap, при этом данные из поддерживаемых тегов учитываются, поэтому менять файл Sitemap необязательно. Если содержимое файла будет изменено, потребуется до двух недель на обновление информации в Яндекс.Вебмастере.

Итак, согласно справки Яндекса, если ошибки связаны с тегом <image:image>, то нет необходимости его удалять. Однако всегда терзают смутные сомнения. А может ошибки все же негативно влияют на продвижение сайта? Чтобы дать адекватный ответ на этот вопрос, я нашел несколько топовых сайтов строительной тематики на движке WordPress с установленным плагином Yoast SEO и посмотрел их параметры:

  • Возраст;
  • Посещаемость;
  • Количество статей.

Согласно выработанным мною метрикам, у изученных сайтов все замечательно. Для большей наглядности привожу статистику одного из них.

Возраст сайта - 1,5 года, количество статей - 450, посещаемость более 15 тыс. человек в сутки. Плагин Yoast SEO был установлен с первых дней создания сайта

Все вышесказанное относилось к тегу <image:image>. Естественно, возникают и  другие ошибки, которые действительно могут негативно сказаться на индексировании сайта. Во всех случаях необходимо руководствоваться тем, что при помощи sitemap.xml поисковые роботы должны узнать обо всех документах которые вы хотите видеть в выдаче. Любой робот поймет следующую разметку:

<url>
<loc>https://mukhutdinov.com/gde-kupit-domen-deshevo.html</loc>
<lastmod>2012-08-22T18:08:20+00:00</lastmod>
<changefreq>monthly</changefreq>
<priority>1</priority>
</url>

Должна быть ссылка на каждый "нужный" документ. На практике могут возникать случаи, когда Вебмастера Яндекса и Google говорят "good", а на самом деле проблема существует. Например, ссылки на новые документы могут не появляться в карте сайта. Это может произойти из-за некорректной работы скриптов отрисовывающих Sitemap. Выявить данную неисправность довольно просто - опубликовав тестовую страницу, убедитесь, что ссылка на неё появились в карте сайта.

Оставьте первый комментарий

Оставить комментарий

Ваш электронный адрес не будет опубликован.


*