Как создать sitemap xml
Карта сайта (Sitemap) — файл, который помогает Googlebot и другим поисковым системам обнаруживать и индексировать контент, особенно динамический и при индексировании новых страниц. Отправка и мониторинг через Search Console.
- XML (sitemap.xml)
- RSS / Atom / mRSS
- Текстовый файл (sitemap.txt)
- HTML‑карта сайта (для пользователей)
Сравнение форматов Sitemap (таблица и краткий обзор)
Краткий обзор форматов sitemap: XML, RSS/Atom, текстовый файл и HTML — их возможности и случаи применения.
| Формат | Теги/поля | Пределы | Когда использовать |
|---|---|---|---|
| XML | loc, lastmod, changefreq, priority, image/video | 50 000 URL / 50 МБ | основной формат для поисковиков |
| RSS / Atom | item/link/pubDate (mRSS для медиа) | динамический поток | новости, динамический контент |
| Текстовый файл | один абсолютный URL на строку | без специальных полей | простые/малые сайты |
| HTML | список ссылок | нет ограничений Sitemap‑протокола | для пользователей, улучшение UX |
XML — формат детально
XML‑Sitemap (sitemap.xml) — структурированный XML‑файл с корневым элементом urlset, содержащим повторы url. Обязательные и рекомендованные теги: loc, lastmod, changefreq, priority. Для мультимедиа используются image:image и video:content_loc. Указывайте namespace sitemaps.org. Файл должен быть в кодировке UTF-8, формат‑дата — ISO 8601 (YYYY-MM-DD).
https://example.com/page/
2025-08-04
weekly
0.8
- loc — адрес (обязателен)
- lastmod — дата изменения (формат‑дата ISO 8601)
- changefreq — частота обновления
- priority — приоритет
- image:image / video:content_loc — мультимедиа

RSS / mRSS / Atom — когда и как использовать
RSS и Atom — фид для динамического контента и news sitemap. mRSS расширяет фид мультимедиа‑метаданными.
- Новости
- Обновления контента
Текстовый Sitemap (sitemap.txt)
sitemap.txt — текстовый файл: один абсолютный URL на строку.
https://example.com/ https://example.com/about/ https://example.com/product/123
HTML‑карта сайта (пользовательская навигация)
HTML‑карта — удобная страница навигации, повышающая юзабилити и поддерживающая внутреннюю перелинковку. Дополняет хлебные крошки (Breadcrumbs) и помогает пользователям быстро находить разделы.
- Главная
- Разделы / Категории
- Подкатегории / Теги
- Страницы товаров / Материалы
- Контакты / Политика и справка

Описание тегов и элементов XML‑карты
Краткий разбор основных тегов XML‑карты: loc — абсолютный URL; lastmod — дата изменения (ISO 8601); changefreq — частота обновлений; priority — приоритет. Для мультимедиа: image:loc, video:thumbnail_loc. Обязательно корректное экранирование тегов и валидные URL.
- Обязательные:
loc— адрес страницы. - Рекомендуемые:
lastmod,changefreq,priority. - Мультимедиа (опционально):
image:loc,video:thumbnail_loc,video:content_loc. - Технические: namespace, кодировка UTF-8, экранирование символов (&, <, >).
Ограничения и технические требования
Sitemap ограничен: до 50 000 URL и 50 МБ на файл. Используйте абсолютные URL и кодировку UTF-8. При превышении лимитов создавайте sitemap_index и указывайте карты в robots.txt; sitemap.xml обычно в корне сайта.
- 50 000 URL / 50 МБ — лимит файла
- Абсолютные URL (https://...)
- Кодировка UTF-8
- Использовать sitemap_index при большом количестве карт
- Добавить запись в robots.txt и разместить sitemap.xml в корне
Ограничения и технические требования
Sitemap поддерживает жёсткие лимиты: 50 000 URL и 50 МБ на файл. При превышении используйте sitemap_index. Файлы должны содержать абсолютные URL и быть в кодировке UTF-8; sitemap.xml размещают в корне или указывают в robots.txt.
- Не более 50 000 URL в одном файле
- Максимальный размер файла: 50 МБ (не сжатый)
- При большем объёме — применить sitemap_index
- Использовать абсолютные URL (https://...)
- Кодировка UTF-8 для корректного чтения
- Разместить sitemap.xml в корне сайта или указать через robots.txt
Ручное создание Sitemap (примеры кода)
Ручное создание: кодовые примеры (XML) и проверка через валидаторы XML.
https://example.com/
2025-08-04
Онлайн‑генераторы и автоматические сервисы
Онлайн‑генератор упрощает создание sitemap: XML‑Sitemaps.com и xmlsitemapgenerator.org позволяют быстро сгенерировать файл, выполнить экспорт в XML, загрузить по FTP и сжать в gzip.
- XML‑Sitemaps.com — быстрая генерация, платные опции для больших сайтов
- xmlsitemapgenerator.org — простой интерфейс, подходит для небольших проектов
- Freesitemapgenerator / online‑генераторы — бесплатно, но с ограничениями
- Сервисы с экспортом/FTP/gzip — удобны для загрузки на сервер и интеграции
Десктопные программы для генерации Sitemap
Десктопные программы эффективны для больших сайтов: сканируют структуру, собирают список URL и экспортируют sitemap-файлы.
| Инструмент | Когда использовать | Ограничения |
|---|---|---|
| Screaming Frog | Глубокое сканирование, аудит | Платная версия для больших сайтов |
| Xenu | Быстрая проверка ссылок | Устаревший интерфейс, простые отчёты |
| Comparser | Массовый парсинг URL | Нужны настройки под проект |
| G-Mapper | Карта сайта и экспорт | Ограниченная поддержка форматов |
| Sitebulb | Аналитика и отчёты для SEO | Ресурсоёмкий на больших сайтах |
Как сделать Sitemap доступным для поисковых систем
Добавьте ссылку на sitemap в robots.txt через директиву Sitemap:, затем отправьте файл в Search Console и Яндекс.Вебмастер, проверяйте отчёты и используйте Search Console API для автоматизации отслеживания статуса и ошибок.
- Проверьте sitemap (валидность, абсолютные URL, UTF-8).
- Добавьте строку в
robots.txt:Sitemap: https://example.com/sitemap.xml. - В Google Search Console: выберите сайт → «Sitemaps» → вставьте путь и отправьте.
- В Яндекс.Вебмастер: добавьте сайт → «Индексирование» → «Файлы Sitemap» → отправьте URL.
- Отслеживайте статус, исправляйте ошибки и обновляйте карту при изменениях.
Sitemap для мультдоменов, поддоменов и локализаций
Для мультидоменов и поддоменов используйте отдельные sitemap или единый sitemap_index; для локализованных версий применяйте rel=alternate (hreflang).
- Один sitemap_index на главный домен — ссылки на карты поддоменов
- Отдельные sitemap для каждого поддомена/сайта
- Sitemap с rel=alternate/hreflang для локализованных версий
Проверка и устранение неполадок
Проверяйте ошибки URL через отчёты Search Console, сканируйте сайт Screaming Frog и валидируйте sitemap с помощью валидаторов XML; контролируйте коды ответов (HTTP 200, 401 Unauthorized).
- Сканирование: Screaming Frog / Xenu — собрать список проблем
- Отчёты: Search Console — ошибки URL и исключённые URL
- Валидация: проверить sitemap через валидаторы XML
- Проверка ответов сервера: HTTP 200, 301, 401 Unauthorized и пр.
- Кодировка и символы: убедиться в UTF-8 и корректном экранировании
Часто встречаемые ошибки и как их избежать
Типичные проблемы: robots.txt блокировка, некорректные URL и дублирование контента, превышение лимитов и ошибки кодировки — краткие способы устранения ниже.
- robots.txt блокировка — проверьте директивы и доступ для Googlebot.
- Неправильные абсолютные URL — используйте корректный https:// формат.
- Дублирование контента — внедрите rel=canonical и нормализуйте URL.
- rel=canonical absence — добавьте canonical-тег на все версии страниц.
- Превышение лимитов — разбивайте файлы через sitemap_index.
- Кодировка — применяйте UTF-8 и валидируйте файлы перед отправкой.
Кейсы и примеры (интернет‑магазин, блог, крупный сайт)
Короткие чеклисты по типам sitemap и настройкам мультимедиа.
- Интернет-магазин: XML (product), image/video sitemaps, частые обновления.
- Блог: XML + RSS/Atom для фидов, быстрый индекс новых статей.
- Крупный сайт: sitemap_index, разбивка по файлам, отдельные мультимедиа‑карты.
Комментарии
Оставить комментарий