Amoureuze sitemap html. XML-sitemap: complete handleiding voor gebruik. Technische details van de sitemap

Sitemap (sitemap) is een html-pagina van een site of een speciaal xml-bestand, die links naar alle belangrijke pagina's van de site bevat. Om te begrijpen wat een sitemap is, volstaat het om een ​​inhoudsopgave van het boek te presenteren en het wordt meteen duidelijk waarom heb je een sitemap nodig. Een sitemap helpt een bezoeker, of het nu een mens of een zoekrobot is, om elke pagina op de site snel te vinden, met een minimum aan klikken. Op eenvoudige, kleine sites zijn alle pagina's met 1-2 klikken toegankelijk vanaf de hoofdpagina, maar wat als de site groot is en de structuur niet eenvoudig? Zo'n site is niet alleen onhandig voor bezoekers, maar ook niet voor de hand liggend voor zoekmachines.

Wat zijn sitemaps

Zoekmachines indexeren de site geleidelijk, niveau voor niveau, vanaf de hoofdpagina. Als de site veel niveaus van nesting van pagina's heeft, zullen er vele maanden verstrijken voordat alle pagina's van de site zijn geïndexeerd. Dus het is nodig maak een sitemap, die alle links naar alle pagina's van de site tegelijk bevat, zodat de robot geen tijd verspilt aan het navigeren door nestingniveaus, toch? Ja en nee. Het antwoord hangt af van waarom de kaart is gemaakt en wat het zal zijn. Laat ons nadenken wat zijn sitemaps.

Sitemap HTML-sitemap

Sitemaps zijn onderverdeeld in 2 hoofdtypen of formaten: sitemap html en sitemap xml-bestand. De HTML-sitemap is de pagina van de site., waarin de links worden vermeld. Meestal zijn dit links naar de belangrijkste onderdelen en pagina's van de site. HTML-sitemap is meer voor mensen in plaats van robots en helpt om snel door de belangrijkste secties van de site te navigeren. Voor een sitemap in de vorm van een html-pagina zijn er serieuze beperkingen op het aantal links op één pagina. Als er te veel links op de pagina staan, worden mogelijk niet alle links geïndexeerd of kan de sitemappagina worden uitgesloten van het zoeken naar een te groot aantal links, zelfs als .

Om ervoor te zorgen dat de html-sitemap correct wordt geïndexeerd en goed wordt waargenomen door bezoekers, mag u niet meer dan 100 links op de pagina plaatsen. Dit is meer dan genoeg om op de pagina alle secties en subsecties te plaatsen die niet in het hoofdmenu pasten.

Gebruikelijk, sitemap in HTML-indeling heeft een boomstructuur, waarin de uitgebreide secties en subsecties zijn aangegeven. Onnodig omslachtige HTML-sitemaps zijn vaak versierd met grafische elementen, CSS-stijlen en aangevuld met Java-script. De html-sitemap is echter van weinig waarde voor zoekmachines.

Een HTML-sitemap is geen volledige sitemap. Wat als de site honderden, duizenden, tienduizenden pagina's heeft? Om dit te doen, moet je links naar alle pagina's in de sitemap in xml-formaat plaatsen.

Sitemap XML-sitemap

Een XML-sitemap is een xml-bestand van het type sitemap.xml, die zich meestal in de hoofdmap van de site bevindt. Een xml-sitemap heeft veel voordelen ten opzichte van een html-sitemap. Sitemap xml is een speciaal formaat voor sitemaps, die wordt bepaald door alle populaire zoekmachines, zoals Google en Yandex. U kunt maximaal 50.000 links specificeren in xml-sitemap. Bovendien kunt u in de sitemap xml de relatieve prioriteit en frequentie van pagina-updates specificeren.

Het is de moeite waard om te zeggen dat de inhoud van de sitemap slechts een aanbeveling is voor de zoekrobot. Als u de sitepagina bijvoorbeeld instelt op een jaarlijkse updatefrequentie, zullen zoekrobots nog steeds vaker gaan. En als u de vernieuwingsfrequentie van de pagina instelt op elk uur, betekent dit niet dat robots de pagina elk uur indexeren.

Sitemap xml heeft een specifieke syntaxis, laten we de sitemap xml-structuur in meer detail bekijken.

Voorbeeld sitemapbestand sitemap.xml

Correcte sitemap.xml moet UTF8-gecodeerd zijn. De inhoud van het sitemap.xml-bestand ziet er als volgt uit:

http://mysite.ru/ 2014-09-18T18:54:13+04:00 always 1.0 http://mysite.ru/category/ 2014-09-18T18:57:09+04:00 hourly 0.8 http://mysite.ru/page/ 2014-09-18T18:59:37+04:00 daily 0.6

Waar de volgende vereiste tags worden gebruikt:

  • - parent tag, deze bevat alle url-adressen;
  • — тег, в котором указываются сведения о конкретном url-адресе;
  • https://qzoreteam.ru/nl/ — в данном теге указывается непосредственно url.
  • — этот тег заключает в себе дату последнего изменения страницы;
  • — тег используется, чтобы указать насколько часто изменяется страница: always, hourly, daily, weekly, monthly, yearly, never;
  • — указывает приоритет определенной страницы, относительно других страниц сайта от 0,1 – низкий приоритет, до 1 – высокий приоритет.

Так же, в файле карты сайта в формате xml должно содержаться указание на пространство имен языка XML:

Xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"

Если файл карты сайта включает более 50 тысяч ссылок или размер sitemap.xml превышает 10 мб, рекомендуется разделить карту сайта на несколько файлов. В таком случае, в карте сайта необходимо указать несколько ссылок на разные файлы карт.

http://mysite.ru/sitemaps/sitemap01.xml 2014-09-18T18:54:13+04:00 http://mysite.ru/sitemaps/sitemap02.xml 2014-09-18T18:54:13+04:00

Здесь используются уже знакомые нам теги https://qzoreteam.ru/nl/ и , а так же обязательные теги:

  • — родительский тег, в который заключаются адреса всех карт сайта;
  • — тег, в котором заключается параметры для каждой карты сайта.

Пример файла карты сайта sitemap.txt

Еще одним способом оформления карты сайт в виде файла может быть карта сайта в формате txt:

1. http://mysite.ru/ 2. http://mysite.ru/page/ 3. http://mysite.ru/page1/

Все просто. В файле sitemap.txt построчно перечисляются все необходимые ссылки. Карта сайта в формате txt — это «вариант для ленивых». Здесь работает аналогичное sitemap xml ограничение в 50.000 ссылок. Однако, TXT карта сайта лишена возможностей указания даты последнего изменения и приоритета страницы.

Как создать карту сайта

Создание карты сайта важный процесс, в котором необходимо четко указать, какие страницы сайта нужно индексировать и как лучше их индексировать. В зависимости от того о каком типе карты сайта идет речь, используются различные способы создания карты сайта . Как создать html карту сайта обсуждать отдельно смысла нет. Рассмотрим как сделать карту карта в формате xml файла. Существует несколько основных способов создания карты сайта, но все их объединяет то, где находится карта сайта и как файл sitemap определяется поисковыми системами.

Как уже было написано выше — файл карты сайта размещается в корне сайта . Поисковые системы способны самостоятельно обнаружить файл карты сайта. Но существует несколько способов указания прямой ссылки на файл(ы) карты сайта(ов) для более скорого обнаружения поисковыми системами. Самый простой способ указать место расположения файла карты сайта — это непосредственное указание ссылки или нескольких ссылок на файлы карт сайта в инструментах для вебмастеров от Yandex и Google. Там же можно проверить карту сайта , провести анализ карты сайта на корректность , соответствие того, какие страницы из карты сайта найдены поисковой системой и сколько из них находится в индексации.

Второй способ указать поисковым системам на расположение файла карты сайта — это .

Sitemap: http://mysite.ru/sitemap.xml

В robots.txt можно указать несколько файлов sitemap, после чего, он автоматически будут добавлены в инструменты для вебмастеров. Как найти карту сайта мы рассмотрели, теперь перейдем к тому, как создать карту сайта.

Основные способы создания карты сайта

  1. Генерация карты сайта силами системы управления сайта, если CMS имеет подобную встроенную возможность.
  2. Скачать карту сайта со стороннего онлайн сервиса. Существует множество online генераторов карт сайта с различным возможностями и ограничениями. Напрмер xml-sitemaps.com обладает возможностью настройки параметров карты сайта, но имеет ограничение по количеству ссылок в файле sitemap.xml в 500 штук.
  3. Скачать программу-генератор карты сайта . Подобные программы генераторы обычно платные, но при их помощи можно можно регулярно генерить sitemap xml для одного или нескольких сайтов. Вот пара примеров подобных программ-генераторов: SiteMap XML Dynamic SiteMap Generator, WonderWebWare SiteMap Generatior.
  4. Автоматическое создание sitemap карты сайта в Joomla (Джумла), WordPress (Вордпресс), Bitrix (Битрикс).
  5. Создание карты сайта вручную .

Карта сайта — один из важнейших инструментов . Не важно, как будет создана карта сайта. Важно — какие ссылки будут перечислены в карте сайта и как часто она будет обновляться. Иногда, в карту сайта выгружается все подряд и даже те ссылки, которые запрещены в robots.txt или . А обновление карты сайта происходит раз в месяц или реже. Подобное отношение к карте сайта может не просто сделать ее бесполезной, но того хуже — запутать поискового робота, что негативно отразится на индексации и позициях сайта в поиске.

Создайте карту сайта для своего ресурса. Но будте внимательны и хорошо подумайте, что выгружать в sitemap, а что нет.

Привет, друзья! Как вы поняли из названия статьи, сегодня я расскажу об одной грубейшей ошибке c индексацией новых статей, которая возможно есть и у вас, если вы используете плагин All In One Seo Pack для генерации .

Если вы читали мою прошлую статью, то знаете, что я принял участие в SEO конкурсе, по условиям которого нужно вывести статью как можно выше в ТОП. Если не читали, то вот .

С чего я вообще заговорил об ошибке. Дело в том, что я давно заметил, как в индексе поисковых систем появляется много дублей страниц такого вида:

То есть, если на странице 5 изображений значит, в индексе появляется 5 дублей страниц, которые не содержат контента за исключением одного изображения и его описания. Вот скриншот такого дубля:

Я сначала подумал, что дело в файле robots.txt так как я в нем прописывал принудительную индексацию изображений. Но дело оказалось совсем в другом. Кстати, если не знаете как настроить robots.txt, рекомендую ознакомиться с .

Возможно я бы еще долго не придавал этому значения, если бы не конкурс, о котором я упоминал выше.

Прошло два дня, и в поиске гугла появилась страница по запросу «как я пришел в блогосферу». Появится то появилась, да только не основная страница, а ее дубликат, причем аж на 47 позиции. А где же еще быть пустой странице 🙂 И это в то время, как самые сильнейшие «конкуренты» уже были в ТОПе.

Я уже собирался просить совета на форумах, как вдруг подумал, дай ка я проверю карту сайта. И что вы думаете? В карте десятки ссылок на подобные страницы. Получается я сам направляю поисковых роботов на дубликаты, ведь роботы поисковых систем в первую очередь ориентируются по карте сайта XML. А самое интересное, что в этой карте на дубликате стоял приоритет перед основной страницей.

А вся эта канитель получилась из-за банальной невнимательности при настройке карты сайта в плагине All In One Seo Pack. Может это произошло при очередном обновлении, не знаю.

Как проверить есть ли у вас такая ошибка с индексацией страниц? Элементарно. Откройте настройки карты сайта XML.

Теперь давайте проверим все настройки. Сразу скажу, что у меня стоит версия 2.2.6 если у вас другая, то настройки могут несколько отличаться.

Итак, поехали.

2. Уведомлять Google и Bing. Здесь обязательно должны стоять галочки. Благодаря этой настройке, при появлении новой статьи, будет отправляться уведомление поисковым системам, что соответственно ускорит индексацию.

3. Включить Sitemap Indexes. Если поставить здесь галочку, то карта сайта будет разбита на несколько файлов. Поэтому ни в коем случае не делайте этого, если у вас менее 50 000 страниц.

4. Типы записей. А вот та самая грубейшая ошибка, о которой я говорил с самого начала. В данном разделе мы указываем ссылки на какие страницы должны присутствовать в карте сайта XML. По логике вещей для блога это записи и страницы. А я когда-то поставил галочку на все типы записей, вследствие чего начали индексироваться медиа, что соответственно неправильно. Теперь придется из индекса Google удалять около пятисот проиндексированных страниц, или ждать пока он сам их выкинет.

Обязательно проверьте у себя, чтобы в разделе «Медиа/Вложения» у вас отсутствовала галочка ! Исключением являются сайты-галереи.

5. Таксономии. Поставив здесь галочки, вы отправляете в sitemap.xml ссылки на рубрики и метки.

6. Включать архивы за день и страницы авторов не стоит. Во избежание опять же дублей страниц.

7. Создать сжатую версию карты. Кто пользовался когда-то плагином Google XML Sitemap, помнит что нужно было архивировать карту и закидывать его в корень сайта, а в файле robots.txt прописывать к нему путь. В итоге в файле robots.txt были две ссылки, одна из которых вела на архивированную сжатую версию карты, вторая на основную. В плагине All In One Seo Pack все гораздо умнее. При запросе поисковым роботом XML карты сайта, плагин автоматически генерирует сжатую карту и предоставляет роботу.

9. Динамическая карта сайта. Тоже нужно поставить галочку. Вы ведь регулярно обновляете блог новыми записями, следовательно и карта у вас должна быть динамическая.

10. Noindex Sitemap file. Этой опцией можно запретить индексировать карту. Не могу понять зачем вообще разработчики внедрили эту функцию. Если вы ставили здесь галочку, срочно убирайте!

В дальнейших настройках можно указать исключенные страницы, это те, которые вы хотите запретить индексировать. Но это больше рекомендация для робота, а не обязательное условие.

P.S. Я не просто так рассказал об этой ошибке, чтобы повыпендриваться. Буквально через день после исправления, статья оказалась в ТОП 1 Яндекса.

Файл sitemap.xml, так же, как и обычная карта сайта представляет из себя набор страниц, оформленных в XML-теги. С помощью данного файла, поисковые системы понимают, какие страницы вашего сайта следует индексировать в первую очередь.

Обычная HTML карта сайта:

Карта сайта в формате XML:

У каждого варианта есть свои плюсы и минусы. Ключевое преимущество карты сайта в формате XML — исключение возможности размытия статического веса страниц внутри сайта.

В этой статье я расскажу вам как составить корректный файл Sitemap.xml.

Если вы уже знаете все про составление Sitemap, сразу переходите к последней главе, которая называется «Фишки».

1. Директивы файла sitemap.xml

Существуют 3 обязательных директивы, которые должны быть заполнены в любом случае, это теги:

  • < urlset>
  • < url>
  • < loc>

А также 3 необязательных тега:

  • < lastmod>
  • < changefreq>
  • < priority>

Вот памятка по расшифровке каждого тега из официального сайта http://www.sitemaps.org/ru/protocol.html :

Атрибут

Статус

Описание

обязательный

Инкапсулирует этот файл и указывает стандарт текущего протокола.

обязательный

Родительский тег для каждого URL-адреса. Остальные теги подчинены этому тегу.

обязательный

Сам URL-адрес страницы. Всегда начинается с префикса (например, HTTP) и заканчиваться косой чертой (если сервер вашего сайта требует этого).

Внимание: длина URL-адреса не должна превышать 2048 символов.

необязательный

Дата последнего изменения файла. Указывается строго в формате W3C Datetime. Он позволяет при необходимости не учитывать сегмент времени и использовать формат ГГГГ-ММ-ДД.

необязательный

Позволяет указать как часто меняется информация на странице.

Это значение устанавливается приблизительно.

Допустимые значения:

  • always
  • hourly
  • daily
  • weekly
  • monthly
  • yearly
  • never

Если страница изменяется каждый раз, когда ее открывают — используем значение «always» (всегда). Если это архивная страница — ставьте never (никогда).

Учтите, что этот атрибут служит для поискового робота подсказкой, а не правилом. Поэтому зависимости между ним и реальной частотой посещения страницы поисковым роботом нелинейная.

необязательный

Позволяет указать приоритет одних страниц вашего сайта перед другими.

Диапазон значений — от 0,0 до 1,0.

По умолчанию каждой странице отдается приоритет 0,5.

Значение атрибута работает для сравнения приоритета страниц только внутри вашего сайта. То есть оно не влияет на сравнение вашего сайта с сайтами конкурентами в поисковой сети. Более того, выставлять всем страницам максимальный приоритет тоже бессмысленно. Потому что тогда значения будут одинаковыми для робота и атрибут просто не сработает. Так что не ищите лазеек, а указывайте объективные приоритеты для страниц.

Сохраните эту памятку. Она обязательно пригодится вам в первое время. Стоит отметить еще один плюс XML-карты сайта - это гибкость. Гибкость заключается в сочетании разных необязательных директив.

Теперь, когда у вас есть ясность, что такое XML-карта сайта и вы узнали основные директивы этого файла, можно перейти к его составлению.

2. Составление файла sitemap.xml

Составлять карту сайта можно 3 способами:

  • Вручную;
  • Автоматически, с помощью специальных сервисов;
  • Автоматически, с помощью готовых решений в виде плагинов к CMS и т.п.

Процесс приготовления карты сайта следующий:

  • Составляем карту сайта одним из способов, перечисленных выше;
  • Проверяем на валидность с помощью сервисов поисковых систем (https://webmaster.yandex.ru/sitemaptest.xml);
  • Размещаем файл на сайте;
  • Указываем путь к карте сайта для поисковых роботов в файле robots.txt (Кстати, есть отдельная статья о том, );
  • Указываем Sitemap в панели вебмастеров Яндекс и Google.

Итак, как составлять файл карты сайта?

Разберем пример составления файла вручную. Если вы хотите добавить в карту сайта 5 страниц вашего сайта:

Вот так должна выглядеть карта сайта в формате XML:

http://site.ru/url-o_kompanii/

http://site.ru/url-uslugi/

http://site.ru/url-produkty/

http://site.ru/url-dostavka/

http://site.ru/url-kontakty/

При необходимости добавляем необязательные теги из памятки, которую я привел выше. Дополнительные теги прописываются в контейнере , после указания URL-адреса страницы в теге https://qzoreteam.ru/nl/. Например:

http://site.ru/

2005-01-01

monthly

0.8

Приведенный выше код, указывает поисковой системе, что страница http://site.ru/

в последний раз изменилась 1 января 2005 года. Обновляется с частотой раз в месяц. И приоритет у данной страницы 0.8 (максимально возможный 1).

Особенно удобен функционал подсветки парных тегов.

Сервисы для генерации Sitemap

В случае, если на вашем сайте много полезных страниц и вы не хотите тратить время на составление файла вручную, то вам помогут следующие сервисы:

Таких сервисов много. Я использую https://www.xml-sitemaps.com/ .

Поясню вкратце все настройки:

Плагины для CMS

Существует огромное количество плагинов и готовых решений для систем управления сайтов. Например:

Плагин

Валидность

После составления карты сайта нужно проверить ее на наличие ошибок. Для проверки используйте сервис https://webmaster.yandex.ru/sitemaptest.xml

После успешной проверки заливаем наш файл на сайт.

Расположение файла

В отличие от файла robots.txt, файл sitemap.xml может располагаться в любом месте вашего сайта. Например, в корневой папке сайта файл будет доступен по следующему адресу:

Если вы разместили файл в папке /files/, то он будет доступен по такому адресу:

После успешной загрузки файла, обязательно укажите поисковым роботам как найти этот файл. Делается это очень просто. В файле robots.txt () в директиве Sitemap пропишите полный адрес к файлу. Например, файл robots.txt может выглядеть следующим образом:

Важно! В отличии от robots.txt файлов Sitemap может быть несколько. В таком случае необходимо указывать в robots и вебмастерах полный адрес ко всем файлам Sitemap.

Search Console и панель Яндекс.Вебмастера

Остался последний этап. Указать путь к карте сайта в панелях вебмастеров поисковых систем.

  • Настройка индексирования
  • Файлы Sitemap
  • «Проверить» и «Добавить»

Следует отметить ограничения в XML-карте сайта:

  • В одном файле можно указать не более 50000 URL-адресов
  • Вес файла не более 10 мегабайт (поисковые системы не индексируют документы, превышающие размер в 10 мегабайт). При необходимости файл можно сжать с помощью архиватора.gzip.
  • Кодировка файла только в UTF-8

На этом основные этапы завершены. Следуйте всем описанным простым правилам и ошибок у вас не будет. Вторая часть статьи посвящена более детальной настройке, тонкостям и особенностям sitemap.xml эти знания потребуются вам для составления профессиональной карты сайта для интернет-магазинов.

3. Группировка файлов Sitemap

В случае превышения лимита в 50000 URL-адресов, нужно использовать вложенную структуру и создать группу из нескольких Sitemap. То есть создавать карты сайта в карте сайта!

Для обычного сайта (не крупного портала или интернет-магазина) такой объем страниц редкость, поэтому группировку Sitemap большинство SEO-специалистов используют для удобства, например, для группировки страниц товаров или разделов.

Синтаксис выглядит следующим образом:

http://site.ru/sitemap1.xml.gz

2004-10-01T18:23:17+00:00

http://site.ru/sitemap2.xml.gz

2005-01-01

Определение XML-тегов:

Атрибут


Описание

обязательный

Инкапсулирует информацию о всех файлах Sitemap в этом файле.

обязательный

Инкапсулирует информацию об отдельном файле Sitemap.

обязательный

Указывает местоположение файла Sitemap.

необязательно

Указывает время изменения соответствующего файла Sitemap. Робот использует эту информацию, чтобы понять в каких файлах Sitemap произошли изменения. Косвенно, этот тег позволяет роботу быстрее обнаружить новые страницы сайта.

Таким образом составляется сгруппированная карта сайта. Все остальные процедуры те же, что описаны выше. Не забываем указывать в файле robots.txt, в директиве Sitemap, корректную ссылку на ваш файл.

4. Исследование

В конце 2014 года я провел небольшое исследование по анализу эффективности наличия на сайте файла sitemap.xml.

Наблюдалась проблема индексации товарной группы на сайте интернет-магазина (товаров порядка 10000). При этом, ничего не препятствовало их индексации. Был составлен файл карты сайта, состоящий только из ссылок на товары сайта. Карта сайта обновлялась автоматически. За 2 месяца в индексную базу поисковой системы Яндекс попало более 70% URL-адресов. Большая доля страниц, попавших в индекс, это страницы из карты сайта. Отмечу, что в данный период не проводились другие мероприятия по ускорению индексации сайта (например, простановка ссылок).

Вот сами результаты:

Вывод: карта сайта до сих пор влияет на индексацию вашего сайта. Необходимо регулярно обновлять и актуализировать данный файл.

5. Фишки

Чтобы статья не получилась скучной для опытных SEO-специалистов, предлагаю вам ознакомиться со следующими «фишками».

Картиночный сайтмап

Для привлечения дополнительного трафика из поисковых систем (возможно не совсем конверсионного) вы можете составить дополнительный Sitemap для картинок.

Синтаксис для картиночной карты сайта выглядит так:

xmlns:image="http://www.google.com/schemas/sitemap-image/1.1">

http://example.com/primer.html

http://example.com/kartinka.jpg

http://example.com/photo.jpg

Памятка по XML-тегам:

Обязательно?

Описание

Содержит всю информацию об одном изображении. Каждый URL (тег https://qzoreteam.ru/nl/) может включать до 1000 тегов .

URL изображения.

В отдельных случаях домен URL изображения может отличаться от домена, используемого основным сайтом. Если оба домена подтверждены в Search Console, проблем при этом не возникнет. Но если картинки размещены с помощью системы управления контентом, например, сервиса Google Сайты, вам необходимо подтвердить сайт хостинга в Search Console. Кроме того, файл robots.txt не должен запрещать сканирование содержания, которое необходимо индексировать.

Подпись к изображению.

Место съемки. Например, Поронайск, о. Сахалин .

Название изображения.

URL лицензии изображения.

Лайфхак для тех, кто дочитал

Многие SEO-специалисты генерируют файлы Sitemap один раз на старте проекта. Дальше про карту сайта забывают. Проиндексировались страницы — хорошо. Нет — а что поделать?! Новые страницы вообще забывают вносить в sitemap.

В ходе своего исследования я выяснил, что наиболее удобным способом решения этой проблемы является отдельный файл sitemap.xml, в котором будут только те страницы сайта, которые еще не попали в индекс.

И именно это позволило вогнать в индекс Яндекса более 70% новых URL-адресов.

Карта сайта (Sitemap.xml) – это специальный файл в формате.xml, хранящийся в корневой директории сервера. Это файл с информацией о страницах сайта, которые нужно индексировать. Обычно sitemap создают для Яндекса и Гугла, чтобы оповестить поисковых роботов о страницах, которые нужно внести в индекс. Ещё при помощи сайтмапа осуществляется проверка того, как часто происходят обновления, и индексация каких веб-документов является наиболее важной.

Видео из Вебмастерской Яндекса:

Sitemap.xml составляется с учетом специального синтаксиса, понятного поисковым машинам, где будут перечислены все страницы, подлежащие индексации с указанием степени их важности, даты последнего обновления и примерной частоты обновления.

Есть два основных файла, которые должны иметься у любого web-проекта - robots.txt и sitemap.xml . Если у вашего проекта их нет или они заполнены не правильно, то с большой долей вероятности вы сильно вредите своему ресурсу и не позволяете ему раскрыться на все сто процентов.

Влияет ли файл sitemap.xml на продвижение сайта

Если у вас отсутствует sitemap, это не означает, что поисковики не станут индексировать ресурс. Поисковые роботы зачастую и без этого неплохо сканируют сайты и включают их в поиск. Но иногда могут возникать сбои, из-за которых порой удается отыскать не все веб-документы. Основными причинами являются:

  1. Разделы сайта, в которые можно попасть, только совершив длинную цепочку переходов;
  2. Динамические URL-адреса.

Создание sitemap.xml помогает решить эту проблему.

Sitemap.xml влияет на SEO косвенно: облегчая и ускоряя индексацию страниц.

Карта сайта sitemap в формате HTML

Карты сайта делятся на 2 основных вида или формата: карта сайта html и карта сайта файл xml. HTML карта сайта - это страница сайта , на которой перечислены ссылки. Обычно это ссылки на самые важные разделы и страницы сайта. HTML карта сайта больше рассчитана на людей , нежели на роботов и помогает быстрее ориентироваться в основных разделах сайта. Для карты сайта в виде html-страницы существуют серьезные ограничения по количеству ссылок на одной странице. Если на странице будет слишком много ссылок, далеко не все ссылки могут быть проиндексированы или вовсе страница карты сайта может быть исключена из поиска за чрезмерное количество ссылок, пусть даже внутренних ссылок.

Для того, чтобы карта сайта html правильно индексировалась и адекватно воспринималась посетителями не стоит размещать на странице более 100 ссылок. Этого более чем достаточно, чтобы разместить на странице все разделы и подразделы, которые не влезли в основное меню.

Обычно, файл sitemap в формате HTML имеет древовидную структуру, где указаны развернутые разделы и подразделы. Излишне громоздкие HTML карты сайта, зачастую оформляются графическими элементами, CSS-стилями и дополняются Java-script. Однако, карта сайта html не имеет большого значения для поисковых систем.

HTML карта сайта - это не есть полноценный sitemap. Как же быть, если на сайте сотни, тысячи, десятки тысяч страниц? Для этого необходимо разместить ссылки на все страницы в карте сайта в формате xml.

Карта сайта sitemap.txt

Еще одним способом оформления карты сайт в виде файла может быть карта сайта в формате txt:

1. http://site.ru/ 2. http://site.ru/page/ 3. http://site.ru/page1/

Все просто. В файле sitemap.txt построчно перечисляются все необходимые ссылки. Карта сайта в формате txt - это «вариант для ленивых». Здесь работает аналогичное sitemap xml ограничение в 50.000 ссылок. Однако, TXT карта сайта лишена возможностей указания даты последнего изменения и приоритета страницы.

Карта сайта XML Sitemap

XML карта сайта - это файл формата xml, вида sitemap.xml , который обычно находится в корне сайта. У карты сайта в формате xml есть множество преимуществ перед html картой сайта:

  • Sitemap xml - это специальный формат карты сайта , который определяется всеми популярными поисковыми системами, например Google и Яндекс.
  • В xml sitemap можно указать до 50.000 ссылок .
  • В sitemap xml можно указать относительный приоритет и частоту обновления страниц.

Содержимое карты сайта — лишь рекомендация для поискового робота. Например, если установить для страницы сайта ежегодную частоту обновления, поисковые роботы все равно будут ходить чаще. А если установить частоту обновления страницы ежечасно, это не значит, что роботы будет индексировать страницу каждый час.

Как создать правильный sitemap.xml

Рассмотрим, как сделать правильную xml-карту. Здесь должны быть соблюдены следующие требования:

  1. Размер файла должен быть не больше 10 мб;
  2. Карта должна содержать не больше 50000 ссылок. В тех случаях, когда ссылок больше, можно создать несколько карт и включить их в главную xml-карту;
  3. Адрес сайтмапа следует прописать в robots.txt;
  4. Также загрузите sitemap в яндекс и гугл (как добавить файл – описано ниже);
  5. Поисковые системы должны иметь доступ к карте. Необходимо использовать специальные теги, которые дают поисковикам понять, что это именно карта, а не что-то другое;
  6. У sitemap должна быть кодировка UTF-8.

Содержимое файла карты сайта sitemap.xml выглядит:

http://site.ru/ 2015-10-18T18:54:13+04:00 always 1.0 http://site.ru/category/ 2015-10-18T18:57:09+04:00 hourly 0.8 http://site.ru/page/ 2015-10-18T18:59:37+04:00 daily 0.6

Waar de volgende vereiste tags worden gebruikt:

  • - parent tag, deze bevat alle url-adressen;
  • - een tag die informatie bevat over een specifiek url-adres;
  • https://qzoreteam.ru/nl/- in deze tag wordt de url direct aangegeven.
  • - deze tag bevat de datum van de laatste wijziging van de pagina;
  • - de tag wordt gebruikt om aan te geven hoe vaak de pagina verandert: altijd, elk uur, dagelijks, wekelijks, maandelijks, jaarlijks, nooit;
  • Geeft de prioriteit van een bepaalde pagina aan ten opzichte van andere pagina's op de site, van 0,1 - lage prioriteit tot 1 - hoge prioriteit.

Changefreq geeft aan hoe vaak de pagina verandert:

  1. Elk uur - update elk uur;
  2. Altijd - altijd bijgewerkt;
  3. Wekelijks - eenmaal per week bijgewerkt;
  4. Dagelijks - updates vinden dagelijks plaats;
  5. Maandelijks - updates vinden eenmaal per maand plaats;
  6. Jaarlijks - eenmaal per jaar;
  7. Nooit - wordt niet bijgewerkt (het is beter om zo'n waarde niet te gebruiken).

Prioriteit vertelt zoekmachines hoe belangrijk een pagina is in vergelijking met andere. De prioriteit kan worden ingesteld van 0,1 (laag) tot 1 (hoog).

Het bestand sitemap.xml moet een aanduiding van de XML-taalnaamruimte bevatten:

Xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"

Als het sitemapbestand meer dan 50.000 links bevat of als de sitemap.xml groter is dan 10 mb, is het raadzaam de sitemap in meerdere bestanden te splitsen. In dit geval moet u in de sitemap verschillende links naar verschillende kaartbestanden specificeren.

http://site.ru/sitemaps/sitemap01.xml 2015-10-18T18:54:13+04:00 http://site.ru/sitemaps/sitemap02.xml 2015-10-18T18:54:13+04:00

De voor ons al bekende tags worden hier gebruikt. En , evenals de vereiste tags:

  • - bovenliggende tag, die de adressen van alle sitemaps bevat;
  • - een tag die de parameters voor elke sitemap bevat.

Sitemap.xml maken

Maak een sitemap een belangrijk proces waarbij het nodig is om duidelijk aan te geven welke pagina's van de site geïndexeerd moeten worden en hoe deze het beste geïndexeerd kunnen worden. Afhankelijk van het type sitemap waar we het over hebben, verschillen hoe maak je een sitemap. Het heeft geen zin om apart te bespreken hoe je een html-sitemap maakt. Overweeg hoe u een kaartkaart in xml-bestandsindeling kunt maken. Er zijn verschillende basismanieren om een ​​sitemap te maken, maar ze hebben allemaal gemeen waar de sitemap zich bevindt en hoe de sitemap wordt bepaald door zoekmachines.

Zoals hierboven al geschreven - sitemap-bestand wordt in de hoofdmap van de site geplaatst. Zoekmachines kunnen het sitemapbestand zelf vinden. Maar er zijn verschillende manieren om direct te linken naar het/de sitemapbestand(en) voor snellere ontdekking door zoekmachines. De eenvoudigste manier om de locatie van het sitemapbestand op te geven, is door direct een link of meerdere links naar sitemapbestanden op te geven in de webmasterhulpprogramma's Yandex en Google. Daar kan je check sitemap, uitgeven analyse van de sitemap op juistheid, overeenkomen met welke pagina's uit de sitemap door de zoekmachine worden gevonden en hoeveel ervan zijn geïndexeerd.

De tweede manier om zoekmachines te vertellen waar het sitemapbestand zich bevindt, is met de sitemapinstructie in het robots.txt-bestand.

Sitemap: http://site.ru/sitemap.xml

U kunt in robots.txt meerdere sitemapbestanden opgeven, waarna deze automatisch worden toegevoegd aan webmasterhulpprogramma's. We hebben gekeken hoe u een sitemap kunt vinden, laten we nu verder gaan met het maken van een sitemap.

Basismanieren om een ​​sitemap te maken

  1. Sitemap genereren sitebeheersysteem, als de CMS een vergelijkbare ingebouwde mogelijkheid heeft.
  2. Sitemap downloaden van een online service van een derde partij. Er zijn veel online sitemapgeneratoren met verschillende mogelijkheden en beperkingen. Waarschijnlijk een van de meest bekende online sitemapgeneratoren is de Sitemap Generator. Het heeft een vrij grote functionaliteit en stelt je in staat om gratis een sitemap voor 1500 pagina's te genereren, wat best veel is. Er is ook xml-sitemaps.com, dat de mogelijkheid heeft om sitemapparameters te configureren, maar een limiet heeft van 500 links in het sitemap.xml-bestand.
  3. Sitemapgenerator downloaden. Dergelijke generatorprogramma's worden meestal betaald, maar met hun hulp kunt u regelmatig een xml-sitemap genereren voor een of meer sites. Hier zijn een paar voorbeelden van dergelijke generatorprogramma's: SiteMap XML Dynamic SiteMap Generator, WonderWebWare SiteMap Generator.
  4. Automatisch genereren van sitemap in Joomla (Jumla), WordPress (Wordpress), Bitrix (Bitrix), ModX.
  5. Handmatig een sitemap maken.

WordPress-sitemap

U kunt een sitemap voor WordPress maken met behulp van de plug-in Google XML Sitemaps. Hiervoor kun je veel instellingen maken waarmee je een deel van het materiaal op je site kunt uitsluiten, en je kunt ook de verwachte vernieuwingsfrequentie instellen. Naast het maken van een kaart, stelt de plug-in Google XML Sitemaps, wanneer nieuwe inhoud op uw blog wordt gepubliceerd, veel zoekmachines hiervan op de hoogte en nodigt ze uit om snel te indexeren.

Je kunt het pad naar het sitemapbestand zelf instellen in de plugin-instellingen en je kunt het zelfs een andere naam geven dan de klassieke sitemap.xml.

Joomla-sitemap

U kunt een sitemap voor Joomla maken met behulp van de Xmap-component.

Controleer de sitemap op verbroken links

Om de zoekrobot niet te misleiden, moet de sitemap.xml foutloos worden geconfigureerd. Daarom moet u na elke bestandsupdate de sitemap controleren op verbroken links.

Ga naar Yandex Webmaster - sectie "Tools" - "Analyse van sitemapbestanden".

Kies een van de bestandsuploadmethoden:

  • kopieer tekst sitmepa.xml;
  • dien de sitemap-URL in;
  • upload xml-bestand naar service.

Sitemap.xml controleren in Yandex Webmaster

Ga naar Google Search Console - sectie "Crawlen" - "Sitemaps".

Sitemap.xml-analyse door PixelPlus

Tool van pixelplus.ru - XML-sitemapanalyse. Het is eenvoudig, cool en begrijpelijk.

  1. Geef een sitemap (URL) op of upload een XML-bestand.

    Kies of u de serverresponscode voor elke URL erin wilt controleren.

Met de tool kunt u de juistheid van de sitemap (bestand *.xml-indeling) controleren en het volgende vinden:

    Fouten in de geldigheid van bestanden.

    Die URL's die een antwoordcode retourneren, zijn niet 200 OK.

    Andere fouten (verwijzen naar een URL van een ander domein, te grote bestandsgrootte of het aantal URL's erin, enzovoort).

Bedenk dat het aantal geldige URL's in één bestand 50.000 is en dat de bestandsgrootte niet groter mag zijn dan 10 MB.

Als er fouten worden gevonden (dit gebeurt vaak), zal de service u vertellen welke URL's een onjuist antwoord geven (verwijderd, onnodig, enzovoort).

Sitemap.xml is een belangrijk hulpmiddel

Een sitemap is een van de belangrijkste SEO-tools voor websitepromotie. Het maakt niet uit hoe de sitemap wordt gemaakt. Het gaat erom welke links in de sitemap worden vermeld en hoe vaak deze wordt bijgewerkt. Soms wordt alles geüpload naar de sitemap, en zelfs die links die verboden zijn in robots.txt of niet-canonieke links. Een sitemap wordt één keer per maand of minder bijgewerkt. Een dergelijke houding ten opzichte van de sitemap kan deze niet alleen nutteloos maken, maar nog erger - de zoekrobot in verwarring brengen, wat de indexering en siteposities in de zoekopdracht negatief zal beïnvloeden.

Maak een sitemap voor uw bron. Maar wees voorzichtig en denk goed na over wat u naar de sitemap moet uploaden en wat niet.

Overweegt u een sitemap te maken? Laten we proberen erachter te komen hoe we het goed kunnen doen.

Wat is een sitemap?

kaart van de site- dit is een aparte pagina met alle secties, subsecties, artikelen. Dit is zoiets als een directory waarin alle artikelen van de site zijn opgenomen met links naar dezelfde artikelen.

Waar dient een sitemap voor? XML of HTML: welke kaart is beter?

Een sitemap in html-formaat is nodig voor bezoekers om het voor hen gemakkelijker te maken om de informatie te vinden die ze nodig hebben. Zo'n kaart moet aanwezig zijn op grote sites met meer dan 30 pagina's.

Een sitemap in xml-formaat is gewoon nodig voor zoekmachines - zodat de zoekrobot alle links op de site kan zien en de site zelf beter kan indexeren.

In totaal is het beter om 2 aparte sitemaps te maken: sitemap.XML voor robots en .HTML voor bezoekers.

Met behulp van het sitemapbestand kunt u Yandex vertellen welke pagina's van uw site moeten worden geïndexeerd, hoe vaak informatie op de site wordt bijgewerkt en welke pagina's het belangrijkst zijn om te indexeren. Het is handig om kaarten te bekijken van grote sites of goede sites van jouw onderwerp die in de TOP staan.

We zullen het xml-formaat later analyseren, eerst zullen we proberen om te gaan met het html-formaat, d.w.z. met de ons bekende kaart, die we op bijna elk portaal zien.

HTML-sitemap - 7 ijzeren regels

    Plaats het op een aparte pagina, die toegankelijk is vanuit het hoofdmenu. Dat wil zeggen dat de link naar de sitemap zichtbaar moet zijn vanaf elke pagina van de site.

    De structuur van de kaart moet de hiërarchie van de pagina's van de site weerspiegelen; de structuur moet duidelijk worden getraceerd - waar zijn de hoofdsecties en waar zijn de subsecties.

    Het is goed als aan het begin van de sitemap een korte beschrijving van de site zelf wordt geplaatst, zodat de bezoeker snel kan zien op welke site hij zich bevindt.

    Overlaad de sitemap niet met onnodige afbeeldingen, het is beter om ze helemaal te missen.

    Probeer de regel in sectiebeschrijvingen te volgen: beknoptheid is het zusje van talent. Sectiekoppen moeten beknopt, duidelijk en begrijpelijk zijn. U kunt een korte beschrijving van de sectie toevoegen, bijvoorbeeld:

    «- Over bedrijf
    Deze sectie beschrijft in het kort de belangrijkste principes van ons bedrijf, de geschiedenis van zijn ontstaan ​​en ontwikkeling, evenals onze ambities en ambities op lange termijn.»

    Houd de sitemap up-to-date. Als sommige pagina's uit de structuur worden verwijderd of juist nieuwe worden toegevoegd, vergeet dan niet om dit op de kaart weer te geven.

Volg deze 7 regels en de sitemap wordt een geweldige navigator voor uw bezoekers.

Sitemap.xml sitemap: waarom je het nodig hebt en hoe je het zelf kunt maken

Sitemap-XML- dit is een bestand in de hoofdmap van de site, met informatie voor zoekmachines (zoals Yandex, Google, Rambler, Bing en anderen) over de pagina's van uw site. Dit bestand is nodig om het voor zoekmachines gemakkelijker te maken om uw site te indexeren.

Hoe werkt sitemap.xml?

Bij het bezoeken van een site leest de crawler allereerst de instructies in het robots.txt-bestand over hoe de site te indexeren. En als u daarin opgeeft dat er een sitemap.xml-sitemap is, gaat de robot naar het opgegeven adres, dat de URL's vermeldt van de belangrijkste pagina's van de site die onderworpen zijn aan verplichte indexering.

Vergeet daarom niet dat het sitemap.xml-bestand niet alleen op uw site moet worden geplaatst, maar dat u het pad ernaartoe moet opgeven in robots.txt in de sitemap-richtlijn.

Gebruikersagent: Yandex
toestaan: /
Sitemap: http://mysite.ru/site_structure/my_sitemaps.xml

Dit is hoe de sitemap.XML-sitemap het voor de zoekmachine gemakkelijker maakt om te werken en om hoogwaardige indexering voor uw site te bieden.

Sitemap sitemap.xml voor Yandex

Yandex ondersteunt het Sitemap-protocol. Gebruik de volgende elementen om informatie door te geven:

  • loc - pagina-adres;
  • Hoe maak je zelf en gratis een sitemap.XML sitemap?

    Dat is niet moeilijk. Er zijn verschillende gratis programma's en sites op het net die automatisch zo'n kaart voor je genereren. Hier zijn er enkele: sitemapgenerator.ru, xml-sitemaps.com, cy-pr.com/tools/sitemap/