Отчет о файлах Sitemap. XML Sitemap: полное руководство по использованию Неверное значение атрибута

Как понятно из названия, Sitemap (карта сайта) отображает ваш веб-сайт. Это веб-страница, в которой описывается структура вашего сайта, включая разделы и ссылки. Это значительно упрощает навигацию по вашему сайту. И очень важно иметь обновленный Sitemap для поисковых запросов и результатов пользовательского опыта.

Почему вашему сайту необходим файл Sitemap?

Проще говоря - вашему веб-сайту нужен Sitemap, чтобы его можно было найти на странице результатов поиска. XML Sitemap помогает поисковым системам, таким как Google и Bing, при сканировании легко понять структуру вашего сайта. И в случае, если ваш сайт имеет сложную структуру, или он недавно был создан или имеет динамические страницы, Sitemap значительно улучшит его рейтинг. Кроме того, у вас будет список всех URL-адресов вашего сайта, и вы получите приоритет сканирования поисковыми системами. Хотя вам и не обязательно иметь XML Sitemap, это важная часть любого SEO-продвижения.

Как ошибки файла Sitemap влияют на ваш рейтинг?

Ошибки файла sitemap включают ошибку сжатия, пустой файл sitemap, ошибку HTTP или некорректное пространство имен. Эти ошибки могут «загрязнить» файл sitemap, что затруднит сканирование вашего сайта. Если некоторые страницы не могут сканироваться должным образом, они не могут быть проиндексированы. Если ваши страницы не проиндексированы, вы не сможете получить высокий рейтинг Google и потеряете много органического трафика.

Карта сайта (sitemap) — это html страница сайта или специальный xml файл , в котором отражены ссылки на все важные страницы сайта. Чтобы понять, что такое карта сайта, достаточно представить книжное оглавление и сразу же станет ясно, зачем нужна карта сайта . Карта сайта помогает посетителю, будь это человек или поисковый робот, быстро найти любую страницу сайта, совершая минимальное число переходов. На простых, небольших сайтах все страницы могут быть доступны через 1-2 клика от главной страницы, но что делать, если сайт большой и структура его непроста? Подобный сайт будет неудобен не только посетителям, но и неочевиден для поисковых систем.

Какие бывают карты сайта

Поисковые системы индексируют сайт постепенно, уровень за уровнем, начиная с главной страницы. Если на сайте много уровней вложенности страниц, то пока все страницы сайта проиндексируются пройдут многие месяцы. Значит, необходимо создать карту сайта , на которой будут все ссылки на все страницы сайта сразу, чтобы робот не тратил время на переходы по уровням вложенности, верно? И да и нет. Ответ зависит от того зачем делается карта и какой она будет. Давайте рассмотри, какие бывают карты сайта .

Карта сайта HTML Sitemap

Карты сайта делятся на 2 основных вида или формата: карта сайта html и карта сайта файл xml. HTML карта сайта — это страница сайта , на которой перечислены ссылки. Обычно это ссылки на самые важные разделы и страницы сайта. HTML карта сайта больше рассчитана на людей , нежели на роботов и помогает быстрее ориентироваться в основных разделах сайта. Для карты сайта в виде html-страницы существуют серьезные ограния по количеству ссылок на одной странице. Если на странице будет слишком много ссылок, далеко не все ссылки могут быть проиндексированы или вовсе страница карты сайта может быть исключена из поиска за чрезмерное количество ссылок, пусть даже .

Для того, чтобы карта сайта html правильно индексировалась и адекватно воспринималась посетителями не стоит размещать на странице более 100 ссылок. Этого более чем достаточно, чтобы разместить на странице все разделы и подразделы, которые не влезли в основное меню.

Обычно, карта сайта в формате HTML имеет древовидную структуру, где указаны развернутые разделы и подразделы. Излишне громоздкие HTML карты сайта, зачастую оформляются графическими элементами, CSS-стилями и дополняются Java-script. Однако, карта сайта html не имеет большого значения для поисковых систем.

HTML карта сайта — это не есть полноценный sitemap. Как же быть, если на сайте сотни, тысячи, десятки тысяч страниц? Для этого необходимо разместить ссылки на все страницы в карте сайта в формате xml.

Карта сайта XML Sitemap

XML карта сайта — это файл формата xml, вида sitemap.xml , который обычно находится в корне сайта. У карты сайта в формате xml есть множество преимуществ перед html картой сайта. Sitemap xml — это специальный формат карты сайта , который определяется всеми популярными поисковыми системами, например Google и Яндекс. В xml sitemap можно указать до 50.000 ссылок . Более того, в sitemap xml можно указать относительный приоритет и частоту обновления страниц.

Стоит сказать, что содержимое карты сайта является лишь рекомендацией для поискового робота. Например, если установить для страницы сайта ежегодную частоту обновления, поисковые роботы все равно будут ходить чаще. А если установить частоту обновления страницы ежечасно, это не значит, что роботы будет индексировать страницу каждый час.

Карта сайта xml имеет определенный синтаксис, давайте рассмотрим структуру xml карты сайта подрбнее.

Пример файла карты сайта sitemap.xml

Правильный sitemap.xml должен иметь кодировку UTF8 . Содержимое файла карты сайта sitemap.xml выглядит следующим образом:

http://mysite.ru/ 2014-09-18T18:54:13+04:00 always 1.0 http://mysite.ru/category/ 2014-09-18T18:57:09+04:00 hourly 0.8 http://mysite.ru/page/ 2014-09-18T18:59:37+04:00 daily 0.6

Где используются следующие обязательные теги:

  • — родительский тег, в него заключаются все url-адреса;
  • — тег, в котором указываются сведения о конкретном url-адресе;
  • — в данном теге указывается непосредственно url.
  • — этот тег заключает в себе дату последнего изменения страницы;
  • — тег используется, чтобы указать насколько часто изменяется страница: always, hourly, daily, weekly, monthly, yearly, never;
  • — указывает приоритет определенной страницы, относительно других страниц сайта от 0,1 – низкий приоритет, до 1 – высокий приоритет.

Так же, в файле карты сайта в формате xml должно содержаться указание на пространство имен языка XML:

Xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"

Если файл карты сайта включает более 50 тысяч ссылок или размер sitemap.xml превышает 10 мб, рекомендуется разделить карту сайта на несколько файлов. В таком случае, в карте сайта необходимо указать несколько ссылок на разные файлы карт.

http://mysite.ru/sitemaps/sitemap01.xml 2014-09-18T18:54:13+04:00 http://mysite.ru/sitemaps/sitemap02.xml 2014-09-18T18:54:13+04:00

Здесь используются уже знакомые нам теги и , а так же обязательные теги:

  • — родительский тег, в который заключаются адреса всех карт сайта;
  • — тег, в котором заключается параметры для каждой карты сайта.

Пример файла карты сайта sitemap.txt

Еще одним способом оформления карты сайт в виде файла может быть карта сайта в формате txt:

1. http://mysite.ru/ 2. http://mysite.ru/page/ 3. http://mysite.ru/page1/

Все просто. В файле sitemap.txt построчно перечисляются все необходимые ссылки. Карта сайта в формате txt — это «вариант для ленивых». Здесь работает аналогичное sitemap xml ограничение в 50.000 ссылок. Однако, TXT карта сайта лишена возможностей указания даты последнего изменения и приоритета страницы.

Как создать карту сайта

Создание карты сайта важный процесс, в котором необходимо четко указать, какие страницы сайта нужно индексировать и как лучше их индексировать. В зависимости от того о каком типе карты сайта идет речь, используются различные способы создания карты сайта . Как создать html карту сайта обсуждать отдельно смысла нет. Рассмотрим как сделать карту карта в формате xml файла. Существует несколько основных способов создания карты сайта, но все их объединяет то, где находится карта сайта и как файл sitemap определяется поисковыми системами.

Как уже было написано выше — файл карты сайта размещается в корне сайта . Поисковые системы способны самостоятельно обнаружить файл карты сайта. Но существует несколько способов указания прямой ссылки на файл(ы) карты сайта(ов) для более скорого обнаружения поисковыми системами. Самый простой способ указать место расположения файла карты сайта — это непосредственное указание ссылки или нескольких ссылок на файлы карт сайта в инструментах для вебмастеров от Yandex и Google. Там же можно проверить карту сайта , провести анализ карты сайта на корректность , соответствие того, какие страницы из карты сайта найдены поисковой системой и сколько из них находится в индексации.

Второй способ указать поисковым системам на расположение файла карты сайта — это .

Sitemap: http://mysite.ru/sitemap.xml

В robots.txt можно указать несколько файлов sitemap, после чего, он автоматически будут добавлены в инструменты для вебмастеров. Как найти карту сайта мы рассмотрели, теперь перейдем к тому, как создать карту сайта.

Основные способы создания карты сайта

  1. Генерация карты сайта силами системы управления сайта, если CMS имеет подобную встроенную возможность.
  2. Скачать карту сайта со стороннего онлайн сервиса. Существует множество online генераторов карт сайта с различным возможностями и ограничениями. Напрмер xml-sitemaps.com обладает возможностью настройки параметров карты сайта, но имеет ограничение по количеству ссылок в файле sitemap.xml в 500 штук.
  3. Скачать программу-генератор карты сайта . Подобные программы генераторы обычно платные, но при их помощи можно можно регулярно генерить sitemap xml для одного или нескольких сайтов. Вот пара примеров подобных программ-генераторов: SiteMap XML Dynamic SiteMap Generator, WonderWebWare SiteMap Generatior.
  4. Автоматическое создание sitemap карты сайта в Joomla (Джумла), WordPress (Вордпресс), Bitrix (Битрикс).
  5. Создание карты сайта вручную .

Карта сайта — один из важнейших инструментов . Не важно, как будет создана карта сайта. Важно — какие ссылки будут перечислены в карте сайта и как часто она будет обновляться. Иногда, в карту сайта выгружается все подряд и даже те ссылки, которые запрещены в robots.txt или . А обновление карты сайта происходит раз в месяц или реже. Подобное отношение к карте сайта может не просто сделать ее бесполезной, но того хуже — запутать поискового робота, что негативно отразится на индексации и позициях сайта в поиске.

Создайте карту сайта для своего ресурса. Но будте внимательны и хорошо подумайте, что выгружать в sitemap, а что нет.

Sitemap или Карта сайта – специально созданный файл с перечнем страниц ресурса, которые необходимо проиндексировать.

Зачем нужен файл Sitemap

Существует два вида Карты сайта, которые различаются форматами и назначением:

HTML-карта

Её составляют для пользователей, чтобы упростить им навигацию по страницам сайта. Это необязательный элемент, такую карту можно составить на большом сайте со сложной иерархией для удобства пользователей.

XML-карта

Нужна для поисковых ботов, она важна для SEO, так как помогает ботам индексировать страницы ресурса.Наличие этого файла подсказывает поисковым роботам, как именно организована структура сайта. Соответственно, Яндекс, Google, Bing и другие поисковики получают возможность более качественно индексировать проект.

В этом материале разберем создание XML-карты .

Для чего нужна Карта сайта:

  1. Ускорить процесс полной индексации .
    Поисковые роботы Google могут пропустить недавно созданные или измененные страницы, а Карта поможет в них ориентироваться.
  2. Дать дополнительную информацию.
    В Карте указывают дополнительные рекомендации для робота: делают пометки о важности страницы, частоте и дате обновления.
  3. Отобразить количество проиндексированных URL
    Сигналы из Sitemap нужны в том числе для отображения проиндексированных ссылок в Search Console.
  4. Ускорить процесс пакетной деиндексации.
    Для этого создают временный файл Sitemap, в который включают страницы для удаления. Об этом , он рекомендует обязательно указать дату последнего изменения страниц, когда им был присвоен код ошибки 404 или атрибут noindex. Так Google будет знать, что необходимо заново просканировать содержимое сайта. Через несколько месяцев эту временную карту сайта можно будет убрать.

При этом даже если Google найдет ссылку в Sitemap, но ее не будет в навигации, он не придаст ей веса и не проиндексирует. Ссылки в Карте сайта - это рекомендации, важнее всего составить грамотную , в которой поисковый робот найдет все нужные страницы.

В большинстве случаев грамотной внешней и внутренней перелинковки страниц достаточно, чтобы поисковые роботы узнали о всем содержимом сайта. Лендингам, небольшим корпоративным сайтам из пары страниц, одностраничным визиткам Карта сайта и не нужна - бот разберется в страницах без труда. Карты нужны для сайтов, которые сложно краулить, поэтому для остальных проектов ее рекомендуют создать.

Карта обязательно нужна сайтам с такими признаками:

  • Проект создан недавно, у него мало внешних ссылок. В этом случае поисковому боту сложнее найти сайт.
  • В структуре сайта много архивов веб-документов, не связанных между собой.
  • У проекта большое количество страниц, разделов и подразделов;
  • В структуре преобладают динамические страницы.
  • На сайте есть мультимедийный контент. Бот сможет получить дополнительную информацию из Sitemap для показа в результатах поиска.

Поисковые системы могут не проиндексировать все нужные страницы таких сайтов, если не предложить краулерам файл Sitemap. Разберем, как его создать.


Базовые критерии создания файла Sitemap

У поисковиков есть свои требования к составлению Карты сайта, о которых нужно помнить веб-мастеру.

Общие требования к Sitemap:

  1. Количество URL-адресов в файле Sitemap не должно превышать 50 тысяч. Если их больше, необходимо создать несколько отдельных Карт сайта, которые прописывают в файле индекса Sitemap. По , для этого достаточно создать несколько отдельных файлов Sitemap, не больше 50 тысяч ссылок каждая, а в сумме ссылок может быть больше лимита. После этого для нескольких Карт создают общий материнский файл Sitemap.
  2. Максимальный размер файла – 50 Мб. Файл можно уменьшить при помощи сжатия , но в несжатом виде он все равно должен быть меньше 50 Мб.
  3. Файл Sitemap должен находиться на том же домене, что и веб-сайт, для которого он создан.
  4. Можно использовать кодировку UTF-8, а также латинские буквы и цифры.
  5. на обращение к файлу Sitemap должен быть HTTP-статус с кодом 200 OK.
  6. URL идентификаторы сессий не должны быть в Карте сайта.
  7. Ссылки должны иметь одинаковый синтаксис.
  8. В Карте указаны только канонические URL.
  9. Карта не конфликтует с информацией в robots.txt - если в robots.txt какие-то страницы закрыты от индексации, то их не должно быть в Карте.

Некоторые веб-мастеры беспокоятся о порядке ссылок в файле, но представитель Google , что очередность не имеет значения вообще, главное - поместить в Sitemap самые важные канонические ссылки.


Допустимые форматы Карты сайта

Особое требование предъявляется к формату файла Sitemap. Карту сайта можно создать в виде XML-файла, текстового файла или посредством RSS, mRSS и Atom 1.0. Яндекс указывает, что поиск не поддерживает передачу RSS и Atom-фидов с помощью Sitemap. Если ориентируетесь на разные поисковые системы, используйте формат XML. Правила создания файла описаны в стандарте .

Служебные теги Sitemap

Обязательные теги Карты сайта:

  • - контейнер с указанием стандарта протокола;
  • - родительский тег для каждой записи URL-адреса;
  • - указание URL, начинается с префикса, к примеру, http или https.

Дополнительные теги:

  • - частота обновления веб-документа с атрибутами never, always, yearly, monthly и так далее;
  • - дата последнего обновления на странице;
  • Указание разной важности страниц ресурса от 0,1 до 1, определяет очередность обработки URL на этом сайте. Google его не поддерживает. Приоритет можно дать самым важным страницам и нет смысла указывать высокий приоритет всем ссылкам, тогда тег вообще ни на что не повлияет.

Другие языковые версии сайта указывают с помощью атрибута hreflang .

Пример Карты сайта в формате XML

Sitemap для сайт, если бы он состоял из одной страницы и содержал упомянутые теги, мог бы выглядеть так:

http://www.сайт/ 2016-03-21 daily 0.8

Как создать и где разместить файл Sitemap?

При желании составить Карту сайта можно вручную, но это слишком трудозатратно и бессмысленно - Карта сайта должна быть динамической, если вы регулярно обновляете сайт - публикуете новые записи в блоге, развиваете интернет-магазин. Лучше создавать файл Sitemap автоматически, обратившись к услугам бесплатных онлайн-сервисов и плагинов для CMS.

Сервисы для создания Sitemap


С помощью отчета о файлах Sitemap вы можете отправить в Google карту своего сайта, посмотреть историю ее отправки, а также сведения об ошибках, с которыми столкнулась наша система при анализе файла Sitemap.

Что такое файл Sitemap? Нужен ли мне этот тип отчета?

Файл Sitemap размещается на вашем сайте и содержит информацию обо всех его новых и измененных веб-страницах. Если ваш ресурс небольшой (менее 100 страниц), возможно, вам будет проще запросить индексацию главной страницы , при условии, что на ней (или на одной из тех, на которую она ссылается непосредственно либо через другие страницы) есть ссылки на все остальные страницы.

Управление файлами Sitemap

Как отправить файл Sitemap

Выполните следующие действия:

  1. Разместите файл Sitemap на своем сайте. Требования:
    • Файл Sitemap должен быть в .
    • Файл Sitemap должен быть доступен роботу Googlebot.
  2. У вас должно быть разрешение владельца . Если его нет, вы можете вместо отправки файла добавить ссылку на него в файл robots.txt .
  3. Укажите относительный URL файла на странице с отчетом о файлах Sitemap и нажмите Отправить .
  4. Сразу же начнется обработка файла Sitemap. Учтите, что для сканирования перечисленных в нем URL может потребоваться некоторое время. Иногда отсканировать удается не все URL (это зависит от размера сайта, трафика и других факторов).

Внимание!

Если вы уже отправляли нам файл Sitemap, не нужно отправлять его повторно, даже если вы внесли в него изменения (мы заметим их при следующем сканировании сайта).

Как удалить файл Sitemap

Если вы удалите файл Sitemap, он будет удален из соответствующего отчета, но останется в Google, как и все URL, которые были в нем указаны. Если вам нужно, чтобы роботы Google перестали посещать ваши веб-страницы, добавьте правило в файл robots.txt .

Чтобы удалить файл Sitemap, выполните следующие действия:

Как интерпретировать отчет

  • В отчете показываются только файлы Sitemap, отправленные с его помощью, а не обнаруженные по ссылкам в файле robots.txt или другими способами. Тем не менее, если мы уже получили ваш файл Sitemap из другого источника, вы все равно можете отправить его нам через этот отчет, чтобы мы могли убедиться в правильности данных и определить коэффициент ошибки.
  • В отчете показаны только файлы Sitemap, относящиеся к текущему ресурсу.
  • В файле Sitemap можно указывать URL изображений , видео и новостных статей . Но в настоящее время в отчете не отображаются сведения об этих типах адресов.

Для каждого файла Sitemap указывается следующая информация:

URL файла Sitemap Адрес, по которому размещен файл, относительно корневого каталога ресурса. Тип Тип файла Sitemap. Возможные значения:
  • Sitemap – обычный XML-файл или текстовый файл Sitemap .
  • Файл индекса Sitemap – файл Sitemap с информацией о других файлах Sitemap .
  • RSS – файл Sitemap в формате RSS-фида .
  • Atom – файл Sitemap в формате фида Atom .
  • Неизвестно – файл имеет неизвестный формат или ещё не обработан.
Отправлен Дата, когда файл Sitemap был последний раз отправлен в Google. Дата последней обработки Дата, когда файл Sitemap был последний раз обработан инструментами Google. Статус Статус отправки или сканирования. Возможные значения: Количество выявленных URL Количество URL, перечисленных в файле Sitemap. Если это файл типа "индекс Sitemap", то здесь указывается общее количество URL во всех включенных в него файлах. Повторяющиеся URL засчитываются только один раз. При нажатии на этот значок открываются сведения о покрытии всех URL в отчете. В случае с индексом Sitemap указываются все URL, перечисленные в его дочерних файлах Sitemap.

Моего файла Sitemap нет в списке

Вот несколько причин, по которым файл Sitemap может отсутствовать в отчете:

  • Он относится к другому ресурсу. Файлы Sitemap, связанные с одним ресурсом, недоступны для других. Например, файлы в домене http://example.com не будут представлены в отчете по доменам http://m.example.com или https://example.com . Чтобы решить эту проблему, убедитесь, что вы добавили все версии URL своего ресурса.
  • Вы не посылали в Google файл Sitemap с помощью отчета. Если вы отправляли файлы Sitemap другим способом, они не будут показаны в списке, даже если Google может найти и использовать их.

Ошибки в файлах Sitemap

В отчете по файлам Sitemap может появляться информация об ошибках, перечисленных ниже.

Переход по URL не выполнен

Google не удалось просканировать все URL, указанные в файле Sitemap. Возможные причины:

  • По URL выполняется слишком много переадресаций. Рекомендуем заменить такие URL на адреса, которые могут быть просканированы непосредственно.
    • Если вы постоянно перенаправляете с одной страницы на другую, используйте окончательную переадресацию.
    • Рекомендуем отказаться от переадресации с помощью JavaScript или метатега refresh.
  • Роботам Google не удается просканировать относительные URL в вашем файле Sitemap. По возможности используйте абсолютные ссылки вместо относительных. Например, ссылаясь на другую страницу своего сайта, используйте URL https://www.example.com/moya-stranitsa.html , а не просто moya-stranitsa.html .

Недействительные URL

Некоторые URL-адреса находятся на более высоком уровне по отношению к файлу Sitemap или в другом домене.

Более высокий уровень. Если файл находится на странице http://www.example.com/mysite/sitemap.xml , то для него недействительны следующие URL:

  • http://www.example.com/ – находится на более высоком уровне, чем файл Sitemap;
  • http://www.example.com/yoursite/ – находится в дочернем каталоге файла Sitemap (необходимо перейти на более высокий уровень, а затем на более низкий).

Другой домен. Убедитесь, что все адреса начинаются с домена, в котором хранится ваш файл Sitemap. Например, если файл находится на странице http://www.example.com/sitemap.xml , то для него недействительны следующие URL:

  • http://example.com/ – отсутствует www в начале.
  • www.example.com/ – нет префикса протокола (http).
  • https://www.example.com/ – указан протокол https вместо http.

Ошибка сжатия

Ошибка при попытке распаковать заархивированный файл Sitemap. Выполните сжатие ещё раз (например, с помощью gzip), а затем загрузите его на сайт и повторно отправьте в Google.

Пустой файл Sitemap

В файле Sitemap отсутствуют URL. Убедитесь, что он не пустой.

Превышен максимально допустимый размер файла Sitemap

Размер файла Sitemap в несжатом виде превышает 50 МБ. Разбейте его на несколько файлов и укажите их в индексе , а затем отправьте нам каждый из них отдельно.

Неверное значение атрибута

Атрибут, связанный с одним из тегов XML в файле Sitemap, имеет недопустимое значение. Проверьте файлы Sitemap и убедитесь, что все атрибуты используются согласно техническим требованиям к таким файлам. Проверьте, нет ли опечаток в значениях атрибутов.

Недопустимая дата

Одна или несколько дат в файле Sitemap имеет неверный формат или значение. Даты должны быть в формате кодировки даты и времени W3C . Время можно не указывать. Убедитесь, что все даты записаны в одном из допустимых форматов кодировки согласно W3C .

2005-02-21 2005-02-21T18:00:15+00:00

Время задавать не требуется (по умолчанию устанавливается значение 00:00:00Z), однако если вы все же делаете это, не забудьте указать часовой пояс.

Недопустимое значение тега

В файле Sitemap содержится один или несколько тегов с недопустимым значением. Проверьте спецификации для соответствующего типа файла Sitemap (индекс, стандартный, видео и т. п.).

Недопустимый URL

В файле Sitemap указан недействительный URL. Возможно, он содержит недопустимые символы (пробелы, кавычки и т. д.) или другие ошибки форматирования, например имеет префикс htp:// вместо http:// .

Отсутствует URL значка видео

В одной или нескольких записях о роликах отсутствует ссылка на значок видео. Убедитесь, что в тегах указаны URL всех таких значков.

Отсутствует название видео

В некоторых записях о роликах отсутствует название. Убедитесь, что в тегах указаны названия всех видео.

Неверный формат индекса Sitemap: вложенные файлы индекса Sitemap

В одной или нескольких записях файла индекса Sitemap указан его собственный URL или URL другого файла индекса Sitemap. Файл индекса Sitemap может содержать ссылки только на обычные файлы Sitemap, а не на индексы.

Удалите записи, указывающие на индексы Sitemap, и повторно отправьте файл.

Ошибка синтаксического анализа

Google не удалось выполнить синтаксический анализ XML-контента вашего файла Sitemap.

Часто это происходит из-за неэкранированных символов в одном из URL. Как и в файлах XML, любые значения данных (включая адреса URL) должны использовать экранирующие коды для некоторых символов, таких как & " " < >. Проверьте, правильно ли настроено экранирование URL .

Временная ошибка

Файл Sitemap не удалось обработать из-за временной ошибки системы. Как правило, при этой ошибке отправлять файл заново нет необходимости. Робот Google попробует получить его позже. Если это сообщение об ошибке будет отображаться и по прошествии нескольких часов, отправьте Sitemap ещё раз.

Слишком много файлов Sitemap в файле индекса

В файле индекса более 50 000 файлов Sitemap. Разделите его на несколько и убедитесь, что в каждом указано не более 50 000 файлов Sitemap.

Слишком много URL в файле Sitemap

В файле Sitemap более 50 000 URL. Разделите его на несколько, каждый из которых содержит до 50 000 адресов. Для удобства можно создать файл индекса Sitemap .

Неподдерживаемый формат файла

Вы создали некорректный файл.

Чтобы избежать самых частых ошибок XML, проверьте следующее:

  • В файлах Sitemap должны быть правильные заголовки. Например, если содержание файла представляет информацию о видео, заголовок должен быть следующим:
  • Пространство имен в заголовке должно иметь вид http://www.sitemaps.org/schemas/sitemap/0.9 (не .9 ).
  • Все атрибуты XML нужно заключать в одинарные (") или двойные (") кавычки, которые должны быть только прямыми. Внимание! Текстовые редакторы, например Microsoft Word, могут автоматически менять их на фигурные.

Несоответствующий путь: отсутствует префикс www

Путь к файлу Sitemap не содержит префикс www (например, http://example.com/sitemap.xml), однако этот префикс есть во всех перечисленных в файле URL (например, http://www.example.com/myfile.html).

Измените файл Sitemap, удалив префикс www из всех URL.

Несоответствующий путь: имеется префикс www

Путь к файлу Sitemap содержит префикс www (например, http://www.example.com/sitemap.xml), однако этого префикса нет во всех перечисленных в файле URL (например, http://example.com/myfile.xml).

Измените файл Sitemap, добавив префикс www во все URL.

Неправильно указано пространство имен

В корневом элементе файла Sitemap неверно задано или отсутствует пространство имен, содержится орфографическая ошибка или неправильный URL.

Убедитесь, что пространство имен задано правильно с учетом типа файла. Пример:

  • Файл Sitemap: xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
  • Файл Sitemap для видео: xmlns:video="http://www.google.com/schemas/sitemap-video/1.1"
  • Файл индекса Sitemap:

Файл Sitemap начинается с пробела

Ваш файл Sitemap начинается с пробела, а не с пространства имен. Файлы XML должны начинаться с декларации XML , в которой указана используемая версия XML.

Эта ошибка не помешает Google обработать ваш файл Sitemap, однако лучше удалить пробел, чтобы файл соответствовал стандартам XML и сообщение об этой ошибке больше не появлялось.

Ошибка HTTP (конкретный код )

При попытке скачать файл Sitemap произошла ошибка HTTP . В сообщении о ней будет указан код статуса (например, 404). Убедитесь, что URL файла Sitemap записан верно и файл находится в указанном месте. Затем повторно отправьте его в Google.

Значок видео слишком велик

Значок видео, указанный в файле Sitemap, слишком велик. Измените его размер до 160 x 120 пикселей. При необходимости обновите файл Sitemap и повторно отправьте его в Google.

Значок видео слишком мал

Значок видео, указанный в файле Sitemap, слишком мал. Измените его размер до 160 x 120 пикселей. При необходимости обновите файл Sitemap.

Местоположения видео и страницы воспроизведения совпадают

Указанные в файле Sitemap URL видео и страницы воспроизведения не должны совпадать. Если используются оба тега ( и ), URL должны различаться.

URL местоположения видео указывает на страницу воспроизведения

Файл Sitemap содержит URL, доступ к которым заблокирован в файле robots.txt

Роботу Google не удалось обработать файл Sitemap, поскольку доступ к нему или его содержанию запрещен в файле robots.txt . С помощью инструмента проверки URL выясните, какой именно файл вызывает проблему, и внесите в robots.txt необходимые изменения.

Эта информация оказалась полезной?

Как можно улучшить эту статью?

Google не удалось просмотреть адреса из файла Sitemap.

  1. Убедитесь, что файл находится именно там, где указано.
  2. С помощью инструмента проверки файла robots.txt выясните, как именно заблокирован доступ.
  3. Используйте Сканер Google для сайтов, чтобы определить, настроена ли блокировка страницы в файле robots.txt .
  4. Если сканировался URL из вашего файла Sitemap, проверьте, нет ли ошибок в адресе.

Переход по URL не выполнен

Обычно указывает на то, что при обработке файла Sitemap роботу Google не удалось открыть некоторые URL, потому что по ним выполняется слишком много перенаправлений. Измените URL переадресации в файле Sitemap и замените их на URL назначения (цель перенаправления).

Ниже описано, почему могла иметь место такая ошибка и как ее исправить.

  • Проверьте сайт с помощью текстового браузера (например, Lynx), поскольку большинство поисковых систем видят сайт точно так же, как Lynx. Если вам не удается просмотреть весь сайт с помощью текстового браузера из-за таких элементов как JavaScript, cookie, идентификаторы сеансов, фреймы, DHTML или Flash, то и сканерам поисковых систем, скорее всего, тоже будет трудно его обработать.

  • Если вы все время применяете переадресацию с одной страницы на другую, используйте постоянные перенаправления. Рекомендуем отказаться от переадреcации с помощью JavaScript или метатега refresh.
  • По возможности используйте абсолютные ссылки вместо относительных. Например, ссылаясь на другую страницу своего сайта, используйте URL https://www.example.com/moya-stranitsa.html , а не просто moya-stranitsa.html .

Недействительные URL

Некоторые URL-адреса находятся на более высоком уровне по отношению к файлу Sitemap или в другом домене.

Более высокий уровень : если файл находится на странице http://www.example.com/moy_sait/sitemap.xml , то для него недействительны следующие URL-адреса:

  • http://www.example.com/ – находится на более высоком уровне, чем файл Sitemap;
  • http://www.example.com/yoursite/ – расположен в каталоге, параллельном текущему местонахождению файла Sitemap.

Другой домен : убедитесь, что все адреса начинаются с домена, в котором хранится ваш файл Sitemap. Например, если файл находится на странице http://www.example.com/sitemap.xml , то для него недействительны следующие URL:

  • http://example.com/ – отсутствует www в начале.
  • www.example.com/ – нет префикса протокола (http).
  • https://www.example.com/ – указан протокол https вместо http.

Ошибка сжатия

Ошибка при попытке распаковать заархивированный файл Sitemap. Выполните сжатие ещё раз (например, с помощью gzip), а затем загрузите его на сайт и повторно отправьте в Google.

Пустой Sitemap

В файле Sitemap отсутствуют URL. Убедитесь, что он не пустой. Если файл использует протокол Sitemap, проверьте правильность тегов в URL.

Ошибка размера файла Sitemap: превышен максимально допустимый размер файла Sitemap

Размер файла Sitemap в несжатом виде превышает 50 МБ. Разбейте его на несколько файлов и укажите их в индексе, а затем отправьте нам каждый из них отдельно.

Неверное значение атрибута

Атрибут, связанный с одним из тегов XML в файле Sitemap, имеет недопустимое значение. Проверьте файлы Sitemap и убедитесь, что все атрибуты используются согласно техническим требованиям к таким файлам. Проверьте, нет ли опечаток в значениях атрибутов.

Недопустимая дата

Одна или несколько дат в файле Sitemap имеет неверный формат или значение. Даты должны быть в формате кодировки даты и времени W3C. Время можно не указывать. Убедитесь, что все даты записаны в одном из допустимых форматов кодировки согласно W3C.


2005-02-21 2005-02-21T18:00:15+00:00

Время задавать не требуется (по умолчанию устанавливается значение 00:00:00Z), однако если вы все же делаете это, не забудьте указать часовой пояс.

Недопустимое значение тега

В файле Sitemap содержится один или несколько тегов с недопустимым значением. В сообщении об ошибке они все должны быть указаны. Проверьте спецификации для соответствующего типа файла Sitemap (индекс, стандартный, видео и т. д.).

Недопустимый URL

В файле Sitemap указан недействительный URL. Возможно, он содержит недопустимые символы (пробелы, кавычки и т. д.) или другие ошибки форматирования, например имеет префикс htp:// вместо http:// . Проверьте экранирование и кодировку URL, указанных в файле Sitemap. Проверьте, нет ли недопустимых символов, таких как пробелы и кавычки. Кроме того, можно вставить URL в браузер и посмотреть, сможет ли программа распознать его и загрузить страницу.

Недействительный URL в файле индекса Sitemap: неполный URL

Для некоторых файлов Sitemap, перечисленных в файле индекса Sitemap, не указаны полные URL-адреса. Google выполняет поиск файлов Sitemap в том же каталоге, в котором находится файл индекса. Например, если индекс находится по адресу http://www.example.com/folder1/sitemap_index.xml и адрес файла Sitemap в нем указан как sitemap.xml, наш робот попытается загрузить его по адресу http://www.example.com/folder1/sitemap.xml. Если робот Google не обнаружит файл Sitemap по этому адресу, попытка закончится ошибкой.


Обновите файл индекса Sitemap, добавив в него полные URL-адреса всех перечисленных файлов Sitemap, а затем ещё раз отправьте файлы.

Недопустимый XML: слишком много тегов

В файле Sitemap имеются повторяющиеся теги. Например, следующая запись станет причиной ошибки, поскольку тег повторяется в ней дважды:

http://www.example.com/ http://www.example.com/stranitsa1.html 2005-01-01 monthly 0.8

В сообщении об ошибке указываются тег и номер строки, в которой он находится. Удалите повторяющийся тег и ещё раз отправьте файл Sitemap.

Отсутствует атрибут XML

В одном из тегов в файле Sitemap отсутствует обязательный атрибут. Просмотрите файлы Sitemap и убедитесь, что все обязательные атрибуты на месте. Исправьте найденные ошибки в значениях атрибутов и ещё раз отправьте файл Sitemap.

Отсутствует тег XML

В одной или нескольких записях в файле Sitemap отсутствует обязательный тег. В сообщении об ошибке указывается номер строки. Сведения о обязательных тегах можно найти в статье о файлах Sitemap.

Отсутствует URL значка видео

В одной или нескольких записях о роликах отсутствует ссылка на значок видео. Убедитесь, что в тегах указаны URL всех таких значков.

Отсутствует название видео

В некоторых записях о роликах отсутствует название. Убедитесь, что в тегах указаны названия всех видео.

Неверный формат индекса Sitemap: вложенные файлы индекса Sitemap

В одной или нескольких записях файла индекса Sitemap указан его собственный URL или URL другого файла индекса Sitemap.

Удалите записи, указывающие на файлы индекса Sitemap и повторно отправьте файл Sitemap в Google.

Ошибка синтаксического анализа

Google не удалось выполнить синтаксический анализ XML-контента вашего файла Sitemap.

Часто это происходит из-за неэкранированных символов в одном из URL. Как и в файлах XML, любые значения данных (включая адреса URL) должны использовать экранирующие коды для некоторых символов, таких как & ‘ » < >. Проверьте, правильно ли настроено экранирование URL.

Временная ошибка

Файл Sitemap не удалось обработать из-за временной ошибки системы. Как правило, при этой ошибке отправлять файл заново нет необходимости. Робот Google попробует получить его позже. Если это сообщение об ошибке будет отображаться и по прошествии нескольких часов, отправьте Sitemap ещё раз.

Слишком много файлов Sitemap в файле индекса

В файле индекса более 50 000 файлов Sitemap. Разделите его на несколько и убедитесь, что в каждом указано не более 50 000 файлов Sitemap.

Слишком много URL в файле Sitemap

В файле Sitemap более 50 000 URL. Разделите его на несколько, каждый из которых содержит до 50 000 адресов. Для управления ими можно создать файл индекса Sitemap.

Неподдерживаемый формат файла

Вы создали некорректный файл. Он должен быть в формате XML и содержать правильный заголовок.

Распространенные ошибки XML:

  • Во файлах Sitemap должны быть правильные заголовки. Например, если содержание файла представляет информацию о видео, заголовок должен быть следующим:
  • Пространство имен в заголовке должно иметь вид http://www.sitemaps.org/schemas/sitemap/0.9 (не .9 ).
  • Все атрибуты XML нужно заключать в одинарные (‘) или двойные («) кавычки, которые должны быть только прямыми. Внимание! Текстовые редакторы, например Microsoft Word, могут автоматически менять их на фигурные.

Несоответствующий путь: отсутствует префикс www

Путь к файлу Sitemap не содержит префикс www (например, http://example.com/sitemap.xml), а все перечисленные в нем URL содержат (например, http://www.example.com/myfile.html
).

Если вы хотите удалить префикс www из файла Sitemap, но сохранить его в URL, указанных в файле, выберите вариант с префиксом в качестве основного домена.

В противном случае измените файл Sitemap, удалив префикс www из всех URL.

Несоответствующий путь: имеется префикс www

Путь к файлу Sitemap содержит префикс www (например, http://www.example.com/sitemap.xml), а перечисленные в нем URL не содержат (например, http://example.com/myfile.xml).

В противном случае измените файл Sitemap, добавив префикс www во все URL.

Неправильно указано пространство имен

В корневом элементе файла Sitemap неверно задано или отсутствует пространство имен, содержится орфографическая ошибка или неправильный URL.

Убедитесь, что пространство имен задано правильно с учетом типа файла. Пример:

  • Файл Sitemap: xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
  • Файл Sitemap для видео: xmlns:video="http://www.google.com/schemas/sitemap-video/1.1"
  • Файл индекса Sitemap:
  • Другие типы файла Sitemap…

Файл Sitemap начинается с пробела

Ваш файл Sitemap начинается с пробела, а не с пространства имен. Файлы XML должны начинаться с декларации XML, в которой указана используемая версия XML.


Эта ошибка не помешает Google обработать ваш файл Sitemap, однако лучше удалить пробел, чтобы файл соответствовал стандартам XML и сообщение об этой ошибке больше не появлялось.

Ошибка HTTP (конкретный код )

При попытке скачать файл Sitemap произошла ошибка HTTP. В сообщении о ней будет указан код статуса (например, 404). Убедитесь, что URL файла Sitemap записан верно и файл находится в указанном месте. Затем повторно отправьте его в Google.

Значок видео слишком велик

Значок видео, указанный в файле Sitemap, слишком велик. Измените его размер до 160 x 120 пикселей. При необходимости обновите файл Sitemap и повторно отправьте в Google. Подробнее о том, как добавить информацию о видео в файл Sitemap…

Значок видео слишком мал

Значок видео, указанный в файле Sitemap, слишком мал. Измените его размер до 160 x 120 пикселей. При необходимости обновите файл Sitemap.

Местоположения видео и страницы воспроизведения совпадают

URL видео и страницы воспроизведения не должны совпадать. Если используются оба тега ( и ), URL должны различаться.

URL местоположения видео указывает на страницу воспроизведения

URL
в файле Sitemap для видео указывает на страницу, на которой размещен проигрыватель.

Файл Sitemap содержит URL, доступ к которым заблокирован в файле robots.txt

Роботу Google не удалось обработать файл Sitemap, поскольку доступ к нему или его содержанию заблокирован в файле robots.txt . С помощью инструмента проверки файла robots.txt выясните, как именно заблокирован доступ, и внесите изменения, чтобы обеспечить сканирование.

support.google.com

Установка карты сайта плагином Google XML Sitemaps от 4.0 версии

В ранней статье «Строим карту xml плагином Google Sitemaps» я уже рассказал, каким образом создается подобный вид карты и возможно те, кто привык все делать по старинке найдут там полезную информацию, но большинство пользователей все-таки решило перейти на новую версию плагина, а для этого придется произвести кое-какие манипуляции.

Тем, кто еще не пользовался этим плагином, придется скачать его с официального сайта wordpress по этой ссылке, на день написания статьи уже доступна версия 4.0.7.

Для тех, у кого стоит старая версия, ниже 4.0, придется ее обновить из административной панели wordpress.


Теперь очень важный момент, так как для работы прежней версии карты требовалось размещение в корневой папке сайта файлов sitemap.xml и sitemap.xml.gz , то после обновления они уже не понадобятся, поэтому их надо удалить.

Если перейти в настройки плагина, то он предлагает автоматически избавиться от ненужных элементов.

Если кому-то удобнее все делать в ручную, тогда переходите в коневую папку площадки, я для этого использую FTP клиент, и удаляете там выше перечисленные файлы.

Теперь если вы посмотрите на свою sitemap xml карту сайта, то будите немного удивлены, потому что разработчики модуля решили перейти на новый формат хранения информации о страницах сайта.

Настройка плагина Google XML Sitemaps

Теперь давайте пробежимся по всем настройкам обновленного плагина. В новой версии почему-то не до конца имеется перевод элементов настроек на русский язык, хотя и так все понятно, но лучше использовать встроенный в браузер онлайн переводчик.

Здесь я оставил первые галочки, чтобы происходило уведомление поисковиков Google и Bing об изменениях на сайте.

В виду того, что у меня уже в файле robots.txt прописан URL адрес к xml карте сайта, то третью галочку снимаем.

Предпоследняя строчка отвечает за отображение карты по ссылке http://ваш-сайт/sitemap.xml , однако если ее убрать, то никаких изменений у меня не произошло.

У меня на тестируемой площадке все статьи имеют одинаковый приоритет, поэтому данную опцию я отключил.

Отмечаем страницы, которые будут загружаться в карту сайта, а также отмечаем самый последний пункт «Include the last modification time» , чтобы помогать поисковикам определять, время изменения контента сайта.

Плагин предлагает указать время, как часто поисковики должны индексировать страницы. Лично я считаю это элемент бесполезным, так как роботы ПС все равно не следуют данным предписаниям.

Расставляем приоритеты значимости для страниц блога.

Подробно про установку и настройку карты сайта в формате XML с помощью плагина Google XML Sitemaps я рассказал в видео. Приятного просмотра.

[yt=yeKChkP72qw]

Проверка индексации XML карты в Яндексе и Google

Далее нужно повторно отправить файл sitemap.xml на проверку в панели Вебмастер от Гугла, с Яндекс все куда проще, так как русский поисковик сам подхватит все изменения через несколько апдейтов при условии, что вы проверяли это файл там ранее.

Проверка для Яндекса

Затем указываем полный HTML адрес sitemap.xml карты и нажимаем проверить.

Вас должно перебросить на страницу валидатора, который проверит файл sitemap на наличие ошибок.

Проверка для Google

Для Гугла все немного сложнее, так как понадобится повторно отправить файл обновленной карты на перепроверку. Для этого в панели вебмастера от Google переходим по вкладке «Сканирование» — «Файлы Sitemap»

Появится сообщение, что файл отправлен и можно обновить страницу. После чего появится таблица со временем и датой обработки новой карты, а ниже вы увидите статус индексирования отдельных элементов xml файла.

Через несколько минут, а может и часов, зависит от размера файла, Google полностью просканирует его содержимое, главное смотрите, чтобы были прочерки в столбце «Проблемы».

Создание xml карты сайта плагином All in One Seo pack

Выше мы рассмотрели вариант построения структурированной карты сайта формата xml по средствам специального плагина, но не все, в том числе и я разделяют такой способ:

— Кого-то пугает ее странный вид, так как вместо обычных ссылок на статьи вы увидите что-то похожее на sitemap-pt-page-2013-03.xml , то есть привычный список ссылок будет разделен на несколько отдельных суб-карт.

— Другие нашли способ избавиться от лишнего модуля, построив карту с помощью плагина All in One Seo pack.

Итак, начнем…

Первое. Сначала избавляемся от плагина Google XML Sitemaps, для этого деактивируем его в административной панели и радуемся небольшому ускорению сайта.

Второе. Переходим в корневую папку и удаляем старые файлы sitemap.xml и sitemap.xml.gz , но все же рекомендую где-нибудь на компьютере сохранить их резервную копию.

Третье. Переходите во вкладку плагина All in One Seo pack «SEO инструменты» — «Другие модули» и активируете модуль «Карта сайта».

В основных настройках указываем стандартный префикс файла, отмечаем какие поисковики следует уведомлять, если вы внесете изменения в ее содержание.

Далее указываем, из каких элементов будет состоять sitemap карта площадки, я оставил только записи и страницы, а также отметил самый последний пункт, чтобы плагин автоматически генерировал новую карту, по мере добавления новых ссылок.

Здесь можно исключать из xml ненужные категории, страницы и записи.

Задаем приоритеты для страниц сайта.

Указываем, с какой частотой надо поисковикам индексировать страницы. Последние два параметра не имеют значимой роли.

Ну и конечно же не забываем проверить работоспособность новой карты по адресу http://seoslim.ru/sitemap.xml.

Вроде все. На этом я заканчиваю пост, хотел разделить его на две отдельных статьи, но в последний момент передумал.

seoslim.ru

Влияет ли файл sitemap.xml на продвижение сайта

Если у вас отсутствует sitemap, это не означает, что поисковики не станут индексировать ресурс. Поисковые роботы зачастую и без этого неплохо сканируют сайты и включают их в поиск. Но иногда могут возникать сбои, из-за которых порой удается отыскать не все веб-документы. Основными причинами являются:

  1. Разделы сайта, в которые можно попасть, только совершив длинную цепочку переходов;
  2. Динамические URL-адреса.

Создание sitemap.xml помогает решить эту проблему.

Sitemap.xml влияет на SEO косвенно: облегчая и ускоряя индексацию страниц.

Карта сайта sitemap в формате HTML

Карты сайта делятся на 2 основных вида или формата: карта сайта html и карта сайта файл xml. HTML карта сайта - это страница сайта , на которой перечислены ссылки. Обычно это ссылки на самые важные разделы и страницы сайта. HTML карта сайта больше рассчитана на людей , нежели на роботов и помогает быстрее ориентироваться в основных разделах сайта. Для карты сайта в виде html-страницы существуют серьезные ограничения по количеству ссылок на одной странице. Если на странице будет слишком много ссылок, далеко не все ссылки могут быть проиндексированы или вовсе страница карты сайта может быть исключена из поиска за чрезмерное количество ссылок, пусть даже внутренних ссылок.

Для того, чтобы карта сайта html правильно индексировалась и адекватно воспринималась посетителями не стоит размещать на странице более 100 ссылок. Этого более чем достаточно, чтобы разместить на странице все разделы и подразделы, которые не влезли в основное меню.

Обычно, файл sitemap в формате HTML имеет древовидную структуру, где указаны развернутые разделы и подразделы. Излишне громоздкие HTML карты сайта, зачастую оформляются графическими элементами, CSS-стилями и дополняются Java-script. Однако, карта сайта html не имеет большого значения для поисковых систем.

HTML карта сайта - это не есть полноценный sitemap. Как же быть, если на сайте сотни, тысячи, десятки тысяч страниц? Для этого необходимо разместить ссылки на все страницы в карте сайта в формате xml.

Карта сайта sitemap.txt

Еще одним способом оформления карты сайт в виде файла может быть карта сайта в формате txt:

1. http://site.ru/ 2. http://site.ru/page/ 3. http://site.ru/page1/

Все просто. В файле sitemap.txt построчно перечисляются все необходимые ссылки. Карта сайта в формате txt - это «вариант для ленивых». Здесь работает аналогичное sitemap xml ограничение в 50.000 ссылок. Однако, TXT карта сайта лишена возможностей указания даты последнего изменения и приоритета страницы.

Карта сайта XML Sitemap

XML карта сайта - это файл формата xml, вида sitemap.xml , который обычно находится в корне сайта. У карты сайта в формате xml есть множество преимуществ перед html картой сайта:

  • Sitemap xml - это специальный формат карты сайта , который определяется всеми популярными поисковыми системами, например Google и Яндекс.
  • В xml sitemap можно указать до 50.000 ссылок .
  • В sitemap xml можно указать относительный приоритет и частоту обновления страниц.

Содержимое карты сайта — лишь рекомендация для поискового робота. Например, если установить для страницы сайта ежегодную частоту обновления, поисковые роботы все равно будут ходить чаще. А если установить частоту обновления страницы ежечасно, это не значит, что роботы будет индексировать страницу каждый час.

Как создать правильный sitemap.xml

Рассмотрим, как сделать правильную xml-карту. Здесь должны быть соблюдены следующие требования:

  1. Размер файла должен быть не больше 10 мб;
  2. Карта должна содержать не больше 50000 ссылок. В тех случаях, когда ссылок больше, можно создать несколько карт и включить их в главную xml-карту;
  3. Адрес сайтмапа следует прописать в robots.txt;
  4. Также загрузите sitemap в яндекс и гугл (как добавить файл – описано ниже);
  5. Поисковые системы должны иметь доступ к карте. Необходимо использовать специальные теги, которые дают поисковикам понять, что это именно карта, а не что-то другое;
  6. У sitemap должна быть кодировка UTF-8.

Содержимое файла карты сайта sitemap.xml выглядит:

http://site.ru/ 2015-10-18T18:54:13+04:00 always 1.0 http://site.ru/category/ 2015-10-18T18:57:09+04:00 hourly 0.8 http://site.ru/page/ 2015-10-18T18:59:37+04:00 daily 0.6

Где используются следующие обязательные теги:

  • - родительский тег, в него заключаются все url-адреса;
  • - тег, в котором указываются сведения о конкретном url-адресе;
  • - в данном теге указывается непосредственно url.
  • - этот тег заключает в себе дату последнего изменения страницы;
  • - тег используется, чтобы указать насколько часто изменяется страница: always, hourly, daily, weekly, monthly, yearly, never;
  • Указывает приоритет определенной страницы, относительно других страниц сайта от 0,1 – низкий приоритет, до 1 – высокий приоритет.

Changefreq указывает на частоту изменений страницы:

  1. Hourly – обновление ежечасно;
  2. Always – всегда обновляется;
  3. Weekly – обновляется раз в неделю;
  4. Daily – обновления происходят ежедневно;
  5. Monthly – обновления происходят раз в месяц;
  6. Yearly – один раз в год;
  7. Never – не обновляется (такое значение лучше не использовать).

Priority сообщает поисковикам о степени важности страницы, по сравнению с другими. Приоритет можно выставлять от 0,1 (низкий) до 1 (высокий).

Файл sitemap.xml должен содержать указание на пространство имен языка XML:

Xmlns=

Если файл карты сайта включает более 50 тысяч ссылок или размер sitemap.xml превышает 10 мб, рекомендуется разделить карту сайта на несколько файлов. В таком случае, в карте сайта необходимо указать несколько ссылок на разные файлы карт.

http://site.ru/sitemaps/sitemap01.xml 2015-10-18T18:54:13+04:00 http://site.ru/sitemaps/sitemap02.xml 2015-10-18T18:54:13+04:00

Здесь используются уже знакомые нам теги и , а также обязательные теги:

  • - родительский тег, в который заключаются адреса всех карт сайта;
  • - тег, в котором заключается параметры для каждой карты сайта.

Как создать Sitemap.xml

Создание карты сайта важный процесс, в котором необходимо четко указать, какие страницы сайта нужно индексировать и как лучше их индексировать. В зависимости от того о каком типе карты сайта идет речь, используются различные способы создания карты сайта . Как создать html карту сайта обсуждать отдельно смысла нет. Рассмотрим как сделать карту карта в формате xml файла. Существует несколько основных способов создания карты сайта, но все их объединяет то, где находится карта сайта и как файл sitemap определяется поисковыми системами.

Как уже было написано выше - файл карты сайта размещается в корне сайта . Поисковые системы способны самостоятельно обнаружить файл карты сайта. Но существует несколько способов указания прямой ссылки на файл(ы) карты сайта(ов) для более скорого обнаружения поисковыми системами. Самый простой способ указать место расположения файла карты сайта - это непосредственное указание ссылки или нескольких ссылок на файлы карт сайта в инструментах для вебмастеров от Yandex и Google. Там же можно проверить карту сайта , провести анализ карты сайта на корректность , соответствие того, какие страницы из карты сайта найдены поисковой системой и сколько из них находится в индексации.

Второй способ указать поисковым системам на расположение файла карты сайта - это директива Sitemap файла robots.txt.

Sitemap: http://site.ru/sitemap.xml

В robots.txt можно указать несколько файлов sitemap, после чего, он автоматически будут добавлены в инструменты для вебмастеров. Как найти карту сайта мы рассмотрели, теперь перейдем к тому, как создать карту сайта.

Основные способы создания карты сайта

  1. Генерация карты сайта силами системы управления сайта, если CMS имеет подобную встроенную возможность.
  2. Скачать карту сайта со стороннего онлайн сервиса. Существует множество online генераторов карт сайта с различным возможностями и ограничениями. Наверное, один из самых известных онлайн генераторов карты сайта - это Sitemap Generator. Он обладает достаточно большим функционалом и позволит вам бесплатно генерировать сайтмап на 1500 страниц, что достаточно много. Еще есть xml-sitemaps.com обладает возможностью настройки параметров карты сайта, но имеет ограничение по количеству ссылок в файле sitemap.xml в 500 штук.
  3. Скачать генератор карты сайта . Подобные программы генераторы обычно платные, но при их помощи можно можно регулярно генерить sitemap xml для одного или нескольких сайтов. Вот пара примеров подобных программ-генераторов: SiteMap XML Dynamic SiteMap Generator, WonderWebWare SiteMap Generatior.
  4. Автоматическое создание sitemap карты сайта в Joomla (Джумла), WordPress (Вордпресс), Bitrix (Битрикс), ModX.
  5. Создание карты сайта вручную .

Sitemap WordPress

Создать карту сайта для WordPress можно будет с помощью плагина Google XML Sitemaps. Для нее вы сможете произвести множество настроек, которые позволят исключить часть материалов вашего сайта, а также можете задать предполагаемую частоту обновления. Кроме создания карты, плагин Google XML Sitemaps при публикации новых материалов на вашем блоге уведомляет об этом многие поисковые системы, приглашая их побыстрее провести индексацию.

Путь до файла сайтмап можете задать сами в настройках плагина и даже можете дать ему название отличное от классического sitemap.xml.

[yt=5ZmRSR1bbEI]

Sitemap Joomla

Создать карту сайта для Joomla можно с помощью компонента Xmap.

Проверить Sitemap на битые ссылки

Чтобы не обманывать поискового робота sitemap.xml должна быть настроена без ошибок. Поэтому после каждого обновления файла нужно проверить sitemap на битые ссылки.

Зайдите в Яндекс Вебмастер — раздел «Инструменты» — «Анализ файлов Sitemap».

Выберите один из способов загрузки файла:

  • скопировать текст sitmepa.xml;
  • отправить URL карты сайта;
  • загрузить xml файл в сервис.

Проверка sitemap.xml в Яндекс Вебмастер

Зайдите в Google Search Console — раздел «Сканирование» — «Файлы Sitemap».

Анализ Sitemap.xml от PixelPlus

Инструмент от pixelplus.ru — Анализ XML-карты сайта. Он простой, крутой и понятный.

  1. Указываем карту сайта (URL) или загружаем XML-файл.

    Выбираем, требуется ли проверка кода ответа сервера для каждого URL в ней.

Инструмент позволит проверить корректность карты сайта (файла формата *.xml), а также найти:

    Ошибки валидности файла.

    Те URL, которые отдают код ответа не 200 OK.

    Прочие ошибки (указание на URL с другого домена, избыточный размер файла или числа URL в нём и так далее).

Напомним, что число допустимых URL в одном файле - 50 000 штук, а размер файла не должен превышать 10 МБайт.

Если будут найдены ошибки (такое случается часто), то сервис подскажет, какие URL отдают некорректный ответ (удалены, лишние и так далее).

Sitemap.xml — важный инструмент

Карта сайта - один из важный инструмент SEO-продвижения сайта. Не важно, как будет создана карта сайта. Важно - какие ссылки будут перечислены в карте сайта и как часто она будет обновляться. Иногда, в карту сайта выгружается все подряд и даже те ссылки, которые запрещены в robots.txt или неканонические ссылки. А обновление карты сайта происходит раз в месяц или реже. Подобное отношение к карте сайта может не просто сделать ее бесполезной, но того хуже - запутать поискового робота, что негативно отразится на индексации и позициях сайта в поиске.

Создайте карту сайта для своего ресурса. Но будьте внимательны и хорошо подумайте, что выгружать в sitemap, а что нет.

webmaster-seo.ru

Как часто после создания нового сайта для него создается карта сайта? Судя по нашей статистике вновь прибывших проектов, как минимум 50-60% сайтов создаются без генерации карты в формате sitemap.xml. Да, можно аргументировать тем, что дело разработчика – это создать сайт. Как он будет индексироваться и нас колько быстро попадет в индекс поисковых систем - это дело владельца сайта. В принципе, тоже верно, но создать Sitemap.XML и тем самым сделать как минимум приятный бонус для клиента – это вопрос нескольких минут.

Итак, что есть Sitemap.XML и чем может бать полезен? Расскажу об этом далее.

Sitemaps-XML-файл с информацией о страницах сайта для поисковых систем. Данный файл оказывает помощь поисковым системам в сканировании и индексировании страниц сайта. Стоит отметить, что данный файл не является директивой, а всего лишь своеобразным предложением к сканированию и индексации необходимых страниц сайта. Создавая такой файл для своего нового сайта, тем самым вы облегчаете (читайте, ускоряете) работу поисковых систем по сканированию и индексации сайта.

Пример Sitemap .xml

Привожу пример того как может выглядеть Sitemap в формате xml. (в нем описана только одна страница сайта)

http://www.site.com.ua/

2010-16-07

daily

1.0/priority>

Как создать Sitemap.xml

Для автоматизированного создания карты сайта есть достаточно много онлайн сервисов. Например: раз, два.

Как использовать Sitemap.xml

Как правило, файл располагают в корневой директории сайта, чтобы он был доступен по адресу http://www.site.com.ua/sitemap.xml.

В файле должно быть не более 50 000 URL и размер его не должен превышать 10 МБ. Если требуется указать более 50 000 URL, создаем несколько файлов Sitemap.

Проверка корректности созданного файла Sitemap

Для определения элементов и атрибутов, которые могут появляться в файлах Sitemap, используются следующие XML-схемы:

  • Для файлов Sitemap
  • Для файлов индекса Sitemap

Оповещение поисковых систем о файле карты сайта

После создания файла карты сайта и его размещения, требуется оповестить создан и размещен на веб-сервере, необходимо оповестить поисковые системы о его местонахождени.

Данную операцию можно сделать несколькими методами:

  • с помощью панели вебмастера поисковой системы
  • указав местоположение файла в файле robots.txt
  • с помошью специального запроса к поисковой системе (как создать запрос описано ниже)

В таблице приведены запросы к некоторым поисковым системам

Эпилог

Стоит отметить, что создание таких файлов как sitemap.xml и robots.txt являются одними из первых «джентльменских» действий после создания нового сайта.

blog.aweb.ua

С помощью «проверки XML-карты сайта» можно диагностировать и проблемы индексации. Для удобства выводится не только число найденных URL, но число документов в индексе Яндекса и Google для домена и их можно сравнить.

Потенциальные проблемы с индексацией, которые можно выявить:

    Число документов в индексе какой-то из поисковых систем — сильно меньше найденного в файле. Проблемы индексации, которые требуется решить для роста поискового трафика.

    В индексе сильно больше документов, чем в карте сайта. Дубли? Или в файл попали не все нужные URL.

Доступна и история проведенных проверок.

Удачи в работе!

tools.pixelplus.ru

Зачем нужен файл Sitemap?

В большинстве случаев грамотной внешней и внутренней перелинковки страниц достаточно, чтобы поисковые роботы узнали о всем содержимом сайта. Вместе с тем использование Карты сайта может заметно ускорить процесс полной индексации, особенно если:

  • Интернет-ресурс создан относительно недавно и пока не может похвастаться богатым профилем внешних ссылок;
  • в структуре сайта присутствуют многочисленные архивы веб-документов, не связанных между собой;
  • проект располагает большим количеством страниц, разделов, подразделов;
  • в структуре ресурса преобладают динамические страницы.

Во всех этих случаях всеобъемлющая индексация сайта поисковыми системами может оказаться под вопросом, если своевременно не позаботиться о файле Sitemap.

Базовые критерии создания файла Sitemap

К созданию Карты сайта выдвигается несколько основных требований, о которых веб-мастер должен всегда помнить.

Во-первых , количество URL-адресов в файле Sitemap не должно превышать 50 тысяч единиц. Если их больше, то необходимо создать несколько отдельных Карт сайта, которые прописываются в файле индекса Sitemap.

Во-вторых , максимальный размер файла – 10 Мб. Если несжатый файл превышает этот размер, его можно уменьшить при помощи архиватора gzip .

В-третьих , файл Sitemap должен находиться на том же домене, что и веб-сайт, для которого он создан.

В-четвертых , составление Карты сайта предполагает использование кодировки UTF-8, а также латинских букв и цифр.

В-пятых , ответом сервера на обращение к файлу Sitemap должен быть HTTP-статус с кодом 200 OK.

Допустимые форматы Карты сайта

Особое требование предъявляется к формату файла Sitemap. Так, Карта сайта может быть создана в виде XML-файла, текстового файла или посредством RSS, mRSS и Atom 1.0. При этом наиболее распространенным форматом, который распознают все поисковые системы, считается XML-файл. С его помощью поисковикам можно сообщить не только о правильном местоположение страницы в иерархии сайта, но и:

  • о частоте обновления веб-документа в принципе (атрибут – changefreq );
  • о дате последнего обновления на странице (атрибут – lastmod );
  • о разной важности тех или иных страниц ресурса (атрибут – priority ).

Пример Карты сайта в формате XML для PR-CY.ru, если бы он состоял из одной страницы и содержал упомянутые теги, мог бы выглядеть так:

http://www.pr-cy.ru/ 2016-03-21 daily 0.8

Как создать и где разместить файл Sitemap?

При желании составить Карту сайта можно самому (вручную), что, впрочем, выглядит весьма трудозатратной затеей. Поэтому лучше создавать файл Sitemap автоматически, обратившись к услугам бесплатных онлайн-сервисов таких, как этот или этот.

После того, как Карта сайта готова, файл необходимо определить в корневую директорию. В этом случае ссылка, указывающая поисковым системам путь к файлу Sitemap, может быть следующей: http://www.pr-cy.ru/sitemap.xml

pr-cy.ru

Для следующего заголовка я получаю те же две ошибки на всех моих файлах Sitemap. Это сбивает с толку, потому что, если Google не сможет прочитать мою карту сайта, то как они могут сказать, что каждый URL имеет тот же приоритет? Заголовок загорается как строка 2 после объявления XML. Google утверждает, что индексировал около 2% URL-адресов с карт. Пожалуйста помоги.

ОБНОВЛЕНИЕ: Я думаю, что проблема в том, что я не знаю, как проверять схему. Как это сделать?

"http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:xsi = xsi:schemaLocation = > ==Parsing error We were unable to read your Sitemap. It may contain an entry we are unable to recognize. Please validate your Sitemap before resubmitting. ==Notice All the URLs in your Sitemap have the same priority...

ОБНОВЛЕНИЕ. Пожалуйста, будьте терпеливы, впервые проверяя XML. Я не понимаю ошибок.

Errors in the XML document: 4: 80 SchemaLocation: schemaLocation value = "http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" must have even number of URI"s. 4: 80 cvc-elt.1: Cannot find the declaration of element "urlset". XML document: 1 2 "http://www.sitemaps.org/schemas/sitemap/0.9" 3 xmlns:xsi = "http://www.w3.org/2001/XMLSchema-instance" 4 xsi:schemaLocation = "http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" > 5 6 http://nutrograph.com/1-butter-salted 7 monthly 8 0.8 9 10 11 http://nutrograph.com/2-butter-whipped-with-salt 12 monthly 13 0.8 14 15

code-examples.net

Структура Sitemap.xml

Файл размечается XML-тегами, основные из которых указывают на:

  • Важность страницы в диапазоне от 0,1 до 1,0 (где 0,1 – самый низкий, а 1,0 – самый высокий приоритет).
  • Частоту обновления (раз в час, раз в день, раз в неделю, раз в месяц, раз в год, никогда или всегда).
  • Описание страницы и ее начало (это обязательный элемент карты сайта).
  • Адрес страницы сайта (это тоже обязательный элемент карты сайта).
  • Дату последнего изменения страницы (это опциональный элемент).

Размещение Sitemap.xml

Существуют правила расположения файла Sitemap.xml, соблюдение которых позволит достичь наилучших результатов в продвижении ресурса.

  • Документ Sitemap.xml рекомендуется размещать в корневой директории сайта.
  • Все имеющиеся на сайте ссылки нужно размещать на одном домене с файлом Sitemap.xml.
  • Ссылки, имеющиеся в документе Sitemap.xml, должны использовать тот же протокол, что и ссылки, размещенные на сайте (http или https, с www. или без www.).
  • В файле Robots.txt необходимо указать путь к карте сайта.

Файлы Sitemap

Разрешается размещать не только основной документ Sitemap.xml, но и дополнительные файлы, подобные основному. Каждый их этих файлов может содержать не больше 50 тыс. ссылок, а общий размер документов не должен быть более 10 МБ. В случае необходимости Sitemap.xml можно сжимать стандартным архиватором. Дополнительные файлы используются в том случае, если превышен объем основного файла. Каждый дополнительный файл перечисляется в индексе, а его формат идентичен исходному.

Польза Sitemap.xml

Документ Sitemap.xml используется в поисковом продвижении и особенно важен в том случае, если:

  • Сайт относительно молодой и ссылок, которые ведут на него с других ресурсов, для эффективного продвижения слишком мало.
  • На сайте содержится большое количество страниц, которые не связаны друг с другом навигационными ссылками.
  • На сайте размещаются мультимедиа данные, не индексируемые ботом.
  • Содержание страниц сайта постоянно обновляется.

Sitemap для Google.News

При продвижении новостного сайта в новостном агрегаторе Google News необходимо создавать отдельный файл Карты сайта для улучшенной индексации.

Генерация карты сайты (Sitemap)

В большинстве популярных CMS предусмотрена автоматическая генерация карт сайта. Если у вашего сайта отсутствует такая возможность, то можно воспользоваться сервисом: https://www.xml-sitemaps.com.

Статья в тему: Как создать и настроить карту сайта в XML и HTML.

Проверка карты сайта (Sitemap) на валидность

Самый простой способ проверить файл сайтмапа на валидность — добавить в вебмастеры поисковых систем и, если есть проблемы и ошибки, то вы их увидите в панели.