Чеклист проверки sitemap.xml

Проверьте sitemap.xml перед отправкой в Яндекс Вебмастер: коды ответа, canonical, закрытые от индексации страницы, редиректы, lastmod и размер файла. Чеклист поможет убрать технический мусор из карты сайта и снизить риск ошибок при обходе.

Чеклист проверки sitemap.xml

Sitemap.xml часто воспринимают как простой список страниц, который достаточно один раз создать и отправить в Яндекс Вебмастер. На практике карта сайта быстро устаревает: меняются URL, появляются редиректы, закрываются разделы, обновляются canonical и правила robots.txt.

Короткий ответЧто нужно проверить в sitemap.xml перед отправкой?

В sitemap.xml должны оставаться только важные индексируемые URL со статусом 200, корректным canonical, без noindex, лишних редиректов и технического мусора. Отдельно стоит проверить lastmod, размер файла и связь с robots.txt.

Этот чеклист подходит для ручной проверки небольшой карты сайта и для первичного контроля после выгрузки из системы управления сайтом, генератора или краулера. Его цель не в том, чтобы обещать индексацию, а в том, чтобы убрать явные технические противоречия до отправки файла.

Что считается хорошей картой сайта

Хороший sitemap.xml не обязан содержать все страницы сайта. Он должен содержать те URL, которые вы действительно хотите показать поисковым системам как актуальные и доступные для обхода.

Базовая проверка sitemap.xml
  • В файле есть только канонические и важные страницы.
  • Основные URL открываются со статусом 200.
  • В карту сайта не попали страницы корзины, личного кабинета, поиска и служебных разделов.
  • URL не закрыты через noindex, robots.txt или другие ограничения индексации.
  • Файл доступен по стабильному адресу и не требует авторизации.
  • Карта сайта указана в robots.txt или легко находится по стандартному адресу.

Какие URL должны попасть в sitemap.xml

В sitemap.xml стоит включать страницы, которые должны участвовать в поиске: главную, категории, карточки товаров, услуги, статьи, посадочные страницы и важные информационные разделы. Если страница не нужна в поиске, её наличие в карте сайта обычно только мешает диагностике.

Что оставлять и что убирать
Делать
  • Оставляйте страницы, которые открываются пользователям и имеют самостоятельную ценность.
  • Используйте чистые URL без случайных параметров сортировки и фильтрации.
  • Разделяйте большие карты сайта по типам страниц, если проект крупный.
  • Проверяйте, что важные новые страницы действительно появились в sitemap.xml.
Не делать
  • Не добавляйте внутренний поиск, корзину, авторизацию и личный кабинет.
  • Не оставляйте дубль страницы с параметрами, если основная версия уже есть в карте.
  • Не включайте тестовые, временные и закрытые от индексации URL.
  • Не смешивайте в одной карте сайта актуальные страницы и технический мусор.

Почему в карте сайта должны быть URL со статусом 200

Если URL из sitemap.xml отдаёт 404, 500, 301 или 302, поисковому роботу приходится тратить обход на лишнюю проверку. Для пользователя это не всегда заметно, но для карты сайта это сигнал, что файл устарел или собран без контроля.

Высокий рискВысокий риск: ошибки и редиректы в sitemap.xml

URL со статусами 404, 500 и длинными цепочками редиректов лучше не отправлять в карте сайта. Их нужно заменить на актуальные адреса или удалить из файла.

Что найденоЧто это значитЧто сделать
200Страница доступнаОставить, если она индексируемая и каноническая
301 или 302URL перенаправляетЗаменить на конечный адрес со статусом 200
404Страница не найденаУдалить из sitemap.xml или восстановить страницу
500Ошибка сервераИсправить проблему и перепроверить URL

Как проверить canonical, noindex и robots.txt

Sitemap.xml не должен спорить с другими сигналами индексации. Если страница есть в карте сайта, но закрыта от индексации или указывает canonical на другой URL, поисковая система видит противоречие: файл предлагает страницу к обходу, а сама страница просит учитывать другой адрес или не индексировать её.

Проверка сигналов индексации
  • Canonical на странице указывает на тот же URL или на корректную основную версию.
  • Страница не закрыта через meta robots noindex.
  • Для URL нет запрета в robots.txt, если страницу нужно показывать в поиске.
  • В карту сайта не попали страницы пагинации, фильтров и сортировок без отдельной SEO-задачи.
  • HTTP и HTTPS версии не смешаны в одном файле.
  • www и non-www версии не дублируются.
Миф и правда о sitemap.xml
Миф

Если URL добавлен в sitemap.xml, поисковая система обязана его проиндексировать.

Правда

Sitemap.xml помогает обнаружить страницы, но не отменяет качество контента, доступность URL, canonical, noindex и другие сигналы.

Как оценить lastmod и размер файла

Поле lastmod полезно, когда оно показывает реальное существенное обновление страницы. Если каждый URL получает сегодняшнюю дату при любой генерации файла, этот сигнал становится менее информативным для диагностики.

Технические ограничения и аккуратность
  • Проверьте, что файл не превышает лимиты по количеству URL и размеру.
  • Для крупного сайта используйте несколько sitemap.xml и индекс sitemap.
  • Не обновляйте lastmod без реального изменения страницы.
  • Сохраняйте единый формат URL: протокол, домен, слэш в конце, регистр.
  • Проверяйте XML-синтаксис после ручного редактирования.
  • Не добавляйте в файл URL, которые требуют входа в аккаунт.

Пошаговая проверка перед отправкой

Как пройти чеклист без лишней ручной работы
  1. Откройте карту сайта в браузере и убедитесь, что файл доступен без авторизации.
  2. Проверьте структуру sitemap.xml и найдите лишние разделы, параметры и дубли.
  3. Выберите несколько важных URL и проверьте HTTP-статус, canonical и ограничения индексации.
  4. Удалите из файла редиректы, ошибки, закрытые страницы и технический мусор.
  5. Проверьте lastmod и убедитесь, что даты не проставлены формально для всех страниц.
  6. После исправлений повторно откройте файл и только потом отправляйте его в панель вебмастера.
Инструмент Webmaster ToolsПроверьте структуру через визуализатор sitemap.xml

Вставьте URL карты сайта или содержимое файла, чтобы увидеть структуру, заметить лишние URL и подготовить sitemap.xml к отправке.

Проверить sitemap.xml

Частые ошибки в sitemap.xml

Ошибки, которые стоит исправить до отправки
В карте сайта есть страницы с 404.

Удалите несуществующие URL или восстановите страницы, если они важны.

Sitemap.xml содержит редиректы вместо конечных адресов.

Замените такие URL на актуальные страницы со статусом 200.

В файл попали страницы, закрытые через noindex.

Исключите закрытые URL, если вы не планируете возвращать их в индекс.

Canonical указывает на другой адрес.

Оставьте в sitemap.xml каноническую версию или исправьте canonical на странице.

Все страницы получают одинаковый сегодняшний lastmod.

Используйте реальные даты существенного обновления или не указывайте lastmod там, где он недостоверен.

Какие инструменты использовать вместе с проверкой sitemap.xml

После первичной проверки карты сайта полезно пройти соседние технические проверки. Они помогают понять, почему конкретные URL не стоит оставлять в sitemap.xml или почему файл нужно пересобрать.

Главное

Перед отправкой sitemap.xml проверьте не только XML-синтаксис, но и смысл файла: в нём должны быть актуальные индексируемые URL со статусом 200, без редиректов, 404, noindex и конфликтов с canonical или robots.txt. Такая проверка не гарантирует индексацию, но помогает убрать технические противоречия заранее.

FAQ

Частые вопросы

Быстрые ответы по теме статьи. Найдите нужный вопрос, раскройте весь блок или сохраните ссылку на конкретный ответ.

6 ответов
01 Нужно ли отправлять sitemap.xml, если на сайте мало страниц?

Да, это полезно даже для небольшого сайта. Карта сайта не гарантирует индексацию, но помогает поисковой системе быстрее увидеть важные URL и понять структуру проекта.

Скопировать ссылку на ответ
02 Можно ли оставлять в sitemap.xml страницы с noindex?

Лучше не оставлять. Если страница закрыта от индексации, но находится в sitemap.xml, поисковая система получает противоречивый сигнал.

Скопировать ссылку на ответ
03 Что делать, если URL из sitemap.xml отдаёт редирект?

В карту сайта лучше добавить конечный актуальный URL со статусом 200. Редиректы в sitemap.xml создают лишний шаг обхода и могут усложнять диагностику.

Скопировать ссылку на ответ
04 Обязательно ли заполнять lastmod для каждой страницы?

Нет, но если lastmod используется, дата должна отражать реальное существенное обновление страницы. Массовая сегодняшняя дата для всех URL снижает доверие к этому сигналу.

Скопировать ссылку на ответ
05 Нужно ли указывать sitemap.xml в robots.txt?

Да, это хорошая практика. Строка Sitemap помогает поисковым роботам быстрее найти карту сайта, особенно если файл лежит не по стандартному адресу.

Скопировать ссылку на ответ
06 Как часто нужно проверять sitemap.xml?

Проверяйте карту сайта после массовых изменений URL, переезда, обновления структуры, закрытия страниц от индексации и перед отправкой файла в панели вебмастеров.

Скопировать ссылку на ответ
Проверка карты сайта

Проверьте sitemap.xml перед отправкой

Откройте визуализатор sitemap.xml, чтобы посмотреть структуру карты сайта, найти лишние URL и быстрее заметить технические проблемы.

Проверить sitemap.xml
Все материалы базы знаний