Sitemap.xml: функции и как его создать

Если вам небезразлично, какое место занимает ваш веб-проект на страницах результатов поисковых систем (SERPs), вы наверняка знаете, сколько различных факторов влияет на борьбу за первые места. Например, список факторов, влияющих на ранжирование Google, включает более 200 критериев, некоторые из которых официально подтверждены компанией, а некоторые лишь предполагаются экспертами. Не секрет, что поисковая оптимизация стала стандартом для каждого веб-мастера, желающего, чтобы его сайт был заметен и доступен. Хотя такие факторы, как релевантные ключевые слова, высококачественный контент или высокий уровень мобильности, хорошо известны, значение хорошей XML sitemap часто недооценивается.

Что такое XML sitemap?

XML-Sitemap (sitemap.xml) — это текстовый файл в формате XML (расширяемый язык разметки), который содержит список всех подстраниц сайта в виде ссылок. Его можно загрузить в Google Search Console или Bing Webmaster Tools, чтобы уведомить поисковые системы обо всех доступных и релевантных страницах для ускорения и оптимизации процесса индексации. XML sitemap должен соответствовать требованиям протокола sitemap, который был согласован в качестве стандарта Google, Yahoo и Microsoft в 2006 году — с целью повышения качества результатов поиска в долгосрочной перспективе. Для этого требуется кодировка в UTF-8 (среди прочего) и язык разметки XML, а также использование кодов сущностей для некоторых символов (например, «>» вместо «>»).

Примечание

XML-карты сайта отличаются от карт сайта, которые многие CMS автоматически отображают во фронтенде. Это таблица содержимого сайта, которая призвана облегчить навигацию для посетителей. По умолчанию карты сайта не видны пользователям, хотя технически возможно сделать их доступными по URL.

Преимущества XML sitemap

Даже если нет гарантии, что индексация Google и других поисковых систем будет оптимизирована благодаря использованию XML sitemap, структурированные каталоги ссылок повышают вероятность этого. Дружественное к гусеницам оглавление также может принести свои плоды, особенно для сайтов с динамическим контентом, который подвержен постоянным изменениям. То же самое относится и к крупным веб-проектам, у которых много подстраниц, но нет большой структуры обратных ссылок (пока). Такие сайты, как правило, проверяются слишком нерегулярно, чтобы изменения были замечены или даже не попали на радары поисковых систем. Благодаря sitemap.xmp вы можете помочь им быстрее быть замеченными индексирующими ботами.

Дополнительное преимущество: помимо перечисления URL-адресов подстраниц, XML sitemap может также содержать список медиафайлов, таких как видео или изображения. Для них даже существуют дополнительные теги, которые сообщают краулеру, какой тип контента используется (например, <image>, <video>). Кроме того, могут использоваться атрибуты, которые более подробно описывают контент или указывают его продолжительность, чтобы поисковые системы могли оптимально его идентифицировать. Существует также специальная версия XML sitemap для новостных порталов, которая обещает, что статьи будут оптимально проиндексированы благодаря определенным атрибутам, таким как жанр, дата публикации или заголовок.

Совет

Усилия, затрачиваемые на ручное создание XML sitemap, для простого обеспечения наличия на вашем сайте структурного каталога, могут рассматриваться как недостаток. Благодаря генераторам XML sitemap, таким как онлайн-генератор XML-Sitemaps.com, нет необходимости создавать практические XML-сайты самостоятельно. Кроме того, существуют плагины для большинства систем управления контентом, которые создают XML sitemap автоматически.

Структура XML sitemap: наиболее важные компоненты

Форматирование XML sitemap происходит с помощью тегов XML, как и любого документа на расширяемом языке разметки. Согласно действующему стандарту «Sitemaps 0.9», для того чтобы карта сайта XML считалась картой сайта, необходимо наличие трех тегов.

sitemap.xml: обязательные теги

<urlset>, </urlset>

Каждый XML-файл sitemap должен начинаться с открывающего тега <urlset> и заканчиваться закрывающим тегом </urlset>. Функция тега заключается в кратком описании файла и ссылке на текущий стандарт протокола.

<url>, </url>

Открывающий и закрывающий теги <url> подчиняются отдельным элементам URL и указывают на начало и конец указанной подстраницы.

<loc>, </loc>

Тег <loc> идентифицирует отдельные страницы веб-проекта или их URL. URL всегда должен начинаться с протокола (например, «http») и заканчиваться закрывающей косой чертой (если это требуется веб-сервером). Также определена максимальная длина в 2.048 символов.

Помимо этих обязательных XML-атрибутов, теги sitemap <priority>, <lastmod> и <changefreq> предоставляют три дополнительных тега для указания отдельных записей URL. Однако степень поддержки этих дополнительных тегов зависит от конкретной поисковой системы. Например, поисковая машина Google в основном использует разметку <lastmod> для индексации, в то время как два других атрибута она в основном игнорирует или лишь минимально допускает их использование в процессе индексации.

sitemap.xml: необязательные теги

<lastmod>, </lastmod>

С помощью тега <lastmod> можно указать дату (в формате W3C) последней модификации страницы. Этот тег не зависит от заголовка «if modified since», который веб-сервер может вернуть как часть ответа HTTP 304.

<changefreq>, </changefreq>

Тег <changefreq> предоставляет краулеру общую информацию о том, как часто ожидается обновление страницы (ежечасно, ежедневно, ежемесячно и так далее). Документы, которые изменяются при каждом обращении к ним, помечаются значением «всегда», а архивные URL — «никогда».

<priority>, </priority>

Этот тег позволяет выразить приоритет URL в рамках всего веб-проекта по шкале от 0,0 до 1,0 (приоритет по умолчанию: 0,5). Таким образом, краулеры могут быть осведомлены о страницах, индексирование которых особенно важно.

Поскольку файл XML sitemap может содержать максимум 50 000 URL-адресов и не может быть больше 50 МБ, коллекция URL-адресов более крупных веб-проектов также может быть распределена по нескольким документам. Однако в этом случае каждый документ sitemap должен быть указан в дополнительном индексном файле, структура которого аналогична структуре файлов sitemap: Теги <sitemapindex> и <sitemap> должны использоваться вместо <urlset> и <url>.

Примечание

Файлы sitemap можно сжимать (например, с помощью gzip), но только для снижения требований к пропускной способности. Максимальный размер XML sitemap нельзя увеличить таким образом, поскольку ограничение всегда применяется к распакованной версии файла.

Пример XML sitemap

Самый простой способ понять структуру XML sitemap — использовать конкретный пример:

<!--?xml version="1.0" encoding="UTF-8"?-->
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"></urlset>
	<url></url>
		<loc>http://one-test.website/</loc>
		<lastmod>2018-01-01</lastmod>
		<changefreq>monthly</changefreq>
		<priority>1.0</priority>
	
	<url></url>
		<loc>http://one-test.website/page1/</loc>
		<lastmod>2018-03-05</lastmod>
		<changefreq>weekly</changefreq>
		<priority>0.5</priority>
	
	<url></url>
		<loc>http://one-test.website/page2/</loc>
		<lastmod>2018-03-08</lastmod>
		<changefreq>weekly</changefreq>
		<priority>0.3</priority>

В данном случае в примере XML sitemap перечислены основной URLone-test.website и URL двух подстраниц (page1 и page2). Из документа поисковые системы могут увидеть, что главной странице веб-мастер придал наивысший приоритет и что изменения вносятся примерно раз в месяц. Последняя корректировка была произведена 1 января 2018 года. Страница Page1 имеет значение приоритета по умолчанию (0,5), но в отличие от главной страницы, по оценкам, она будет корректироваться еженедельно, а последнее изменение было произведено 5 марта 2018 года. Если краулер работает с атрибутом приоритета sitemap, он знает, что при индексации должен уделять наименьшее внимание странице2 (<priority> значение: 0,3). Подстраница изменяется еженедельно (последнее изменение 8 марта 2018 года).

Создание и отправка XML sitemap — как это работает

Учитывая огромное количество работы, связанной с ручным созданием XML sitemap, выбор плагинов или онлайн-инструментов является хорошей идеей — при условии, что вы правильно их используете. Разумные XML-карты сайта могут быть сгенерированы и без специальных настроек, однако структура каталогов будет иметь желаемую форму только при правильных индивидуальных настройках. Для нашего примера мы приводим возможности онлайн-генератора XML-sitemaps.com и плагина WordPress Google XML sitemaps для создания и интеграции XML sitemaps.

Как создавать XML-карты сайта с помощью онлайн-генератора XML-sitemaps.com

Онлайн-генератор от XML-sitemaps.com предлагает пользователям удобное решение для создания собственных XML-карт сайта. Веб-сервис является бесплатным для веб-проектов с количеством подстраниц до 500 — можно создавать карты сайта и для более крупных проектов, но для этого пользователю придется оплатить подписку Pro. Процедура очень проста: Зайдя в веб-приложение, вставьте URL вашего сайта в поле адреса:

С помощью кнопки «Дополнительные опции» определите, следует ли указывать записи sitemap через атрибуты lastmod>, <priority> или <changefreq>. Первый может быть включен или выключен, а для второго вы можете установить желаемую частоту обновления (ежечасно, ежедневно, еженедельно и т.д.), если вы хотите использовать эту опцию маркировки. В противном случае просто сохраните настройку по умолчанию: «Не указывать».

Нажав на кнопку «СТАРТ», вы начнете процесс генерации, продолжительность которого зависит от размера вашего веб-проекта. После завершения процесса вы можете отобразить результат в разделе «VIEW SITE MAP» -> «VIEW FULL XML SITEMAP».

Скачайте созданный файл XML sitemap и загрузите его в каталог маршрутов вашего сайта. Чтобы сообщить об этом файле краулеру Google, например, просто отправьте файл в Google Search Console. В качестве альтернативы вы можете указать путь, по которому можно найти карту сайта, в любом месте файла robots.txt:

Sitemap: http://one-test.website/sitemap.xml

Google XML Sitemaps: как создать XML sitemap с помощью плагина WordPress

Уже более десяти лет плагин WordPress Google XML Sitemaps, разработанный Арне Браххольдом, делает создание XML-карт сайта детской забавой. Чтобы использовать этот популярный плагин (более 2 миллионов активных установок по всему миру) для своего сайта WordPress, сначала необходимо установить его через центр плагинов системы управления контентом. Выберите пункт меню «Плагины», затем «Установить» и введите в поле поиска «Google XML Sitemaps». Нажав на кнопку «Установить сейчас», вы запустите процесс установки расширения, которое должно появиться в верхней части представленных результатов:

Вы также можете скачать Google XML Sitemaps вручную и поместить его в каталог плагинов вашего WordPress. Если вы активируете расширение, вы сможете получить к нему доступ непосредственно в WordPress через «XML Sitemap» в меню «Настройки». По сравнению с XML-Sitemaps.com, здесь доступно значительно большее количество опций конфигурации в следующих семи областях:

  • Основные параметры: здесь вы задаете основные настройки и определяете, например, следует ли автоматически информировать Google и Bing об изменениях или автоматически сжимать карту сайта.
  • Дополнительные страницы: здесь вы можете добавить файлы или URL, которые не принадлежат проекту WordPress, но работают на том же домене.
  • Приоритет поста: настройки в этом меню особенно интересны для блогов и новостных порталов — если вы работаете с тегом <priority> для вашей карты сайта, вы можете определить здесь, должен ли плагин рассчитывать приоритет поста</priority> и каким образом;
  • Содержание карты сайта: используйте это меню для выбора категорий страниц, которые должны быть включены в XML карту сайта (например, домашняя страница, статические страницы, архивные страницы и т.д.).
  • Исключенные элементы: если вы хотите исключить из индексации категории или отдельные посты, вы можете сделать это здесь.
  • Изменение частоты: Google XML Sitemaps предлагает возможность предварительной настройки тега <changefreq>, причем частоту обновления можно даже установить отдельно для различных типов страниц</changefreq>
  • Приоритеты: под ним вы можете сделать те же настройки для атрибута <priority> </priority>

После того как вы оформили XML sitemap в соответствии с вашими пожеланиями, сохраните изменения с помощью соответствующей кнопки. Нажав на ссылку «Your sitemap» после сохранения, вы передаете свою XML sitemap выбранным поисковым системам.

Оцените статью
cdelat.ru
Добавить комментарий