Реклама. ООО Топвизор, ИНН 4726000897, erid: 2SDnjehLc7f
Чтобы пользователь увидел страницу сайта в выдаче, она должна быть сначала проиндексирована поисковыми роботами. Как проверить индексацию, как ее ускорить и что делать, если сайт не индексируется – разобрались эксперты из Топвизор-Журнала.
Что такое индексация страниц сайта
Индексация страниц сайта – это процесс добавления страниц сайта в базу данных поисковых систем – Google, Яндекса и других.
Когда пользователь вводит поисковый запрос, поисковик анализирует эту базу данных и выдает наиболее релевантные запросу страницы. То есть чтобы страница сайта попала в результаты поиска, она должна быть проиндексирована.
Процесс индексации начинается с того, что поисковые роботы сканируют все страницы вашего сайта. Они анализируют содержание каждой страницы, включая текст, изображения, видео и другие элементы. Затем информация о странице сохраняется в базе данных поисковой системы, а сама страница индексируется.
Индексация бывает первичной и повторной. Первичная индексация – это когда новая страница впервые добавляется в базу поисковика. Повторная индексация означает обновление данных о странице в базе.
Как проверить индексацию сайта
Есть несколько способов проверить индексацию сайта. Во-первых, ввести URL конкретной страницы в поисковый запрос Google- или Яндекс-поиска – так мы сможем увидеть, добавлена ли в индекс конкретная страница.
Проверка индексации страницы по URL
Еще есть возможность проверить индексацию, введя часть текста страницы в поисковый запрос:
Проверка индексации страницы по части текста
Также функция проверки индексации есть и в каждой поисковой системе. Об этом поговорим подробнее.
Чтобы проверить, проиндексирован ли сайт в Google, нужно воспользоваться оператором site:
site:мойсайт.рф
В результатах поиска будут показаны все страницы сайта, которые есть в базе Google.
Проверка индексации в Google
Можно воспользоваться сервисом Google Search Console. В нем отображается более подробная информация об индексации. Откройте сервис, затем «Индексирование» – «Страницы». Будет показано, сколько страниц проиндексировано, а сколько нет.
Проверка индексации в Google Search Console
Ниже будет информация о том, почему страницы не индексируются – подробнее о причинах читайте ниже в разделе «Почему страница не индексируется».
Причины, почему страницы не индексируются
Яндекс
В Яндексе проверить индексацию можно такой же командой:
site:мойсайт.рф
Проверка индексации в Яндексе
Или воспользоваться Яндекс Вебмастером. Открываем «Индексирование» – «Статистика обхода». Здесь увидим то, как часто робот Яндекса обходит страницы сайта для добавления их в индекс.
Проверка обхода в Яндекс Вебмастере
А в отчете «Страницы в поиске» увидим, какие страницы находятся в индексе, а с какими есть проблемы:
Проверка индексации в Яндекс Вебмастере
У каждой страницы будет отображен статус в столбце «Статус». Что значит каждый из них и как исправить ошибки, читайте в Яндекс Справке.
❗️ Ещё индексацию можно проверить в «Анализе сайта» Топвизора. Загрузите URL для проверки и запустите «Анализ сайта». Когда проверка закончится, откройте «Сводку» – там будет информация об индексируемости. Можно посмотреть, сколько страниц заблокировано, сколько, наоборот, присутствует в индексе, какие запрещены к индексации директивами robots.txt и так далее: Проверка общей индексируемости в Топвизоре Еще можно посмотреть индексируемость конкретных страниц детально: Индексируемость конкретных страниц сайта Сервис покажет:
|
Почему страница не индексируется
Есть несколько причин, по которым страница может не индексироваться:
-
Сайт закрыт от индексации файлом robots.txt
В robots.txt можно запретить индексацию сайта роботам разных поисковых систем. Например, мы указываем, что всем роботам (значок *) запрещена индексация всего сайта (директива disallow указывает на запрет, знак / – на весь сайт).
User-Agent: *
Disallow: /
-
На странице установлены теги noindex, запрещающие индексацию
Еще закрытие страницы от индексации можно прописать прямо в ее коде. Вот как он может выглядеть:
< meta name=“robots” content=“noindex” >
Тег noindex указывает ПС на то, что страницу не нужно индексировать. Бывает, что этот тег ставится для страниц в разработке, а потом его забывают убрать, поэтому страница и не попадает в индекс.
-
Индексация запрещена файлом .htaccess
Файл .htaccess описывает правила работы сервера. Он тоже может закрыть роботу возможность индексации страниц. Например, так можно закрыть доступ всем, кроме посетителей с определенным IP:
order allow,deny
deny from all
allow from IP
Обычно файл находится в корневой папке сайта. Найдите его и просмотрите на наличие таких запрещающих указаний.
-
У сайта нет файла sitemap
Файл sitemap.xml показывает поисковым роботам структуру вашего сайта. Если его нет, некоторые страницы робот может просто не найти.
-
На сайт наложены штрафы или санкции
Если контент сайта некачественный или вредоносный (например, спам, клоакинг, фишинг, скрытый текст и прочее), поисковики могут применить к нему санкции и закрыть часть страниц или все страницы от индексации.
Google так и пишет на этот счет:
|
-
На сайте цикл перенаправления
Такое бывает, когда одна страница с каноническим тегом ссылается на себя же.
Каноническая страница – основная, наиболее предпочитаемая страница.
Каноническая ссылка (URL) – ссылка, которая ведет на эту страницу.
rel=”canonical” – атрибут, который указывается в контейнере тега < link >, чтобы указать поисковому роботу: конкретная страница каноническая, то есть главная.
Если один каноникал ссылается на другой или на страницу с редиректом или вообще каноникалы установлены на сайте неверно, роботу сложно ориентироваться, и он может не обработать часть страниц.
-
Не все свойства домена добавлены в панели вебмастеров
Для ПС домен вашего сайта с http:// и https:// – это два разных домена. То же самое касается домена с www и без, а также различных зеркал сайта. Другими словами, добавьте все домены в Google Search Console и Яндекс Вебмастер, чтобы всё точно индексировалось.
-
Прошло мало времени или сайт/страница новые
Иногда нужно просто подождать. Роботы не заходят на сайт сразу же, как вы добавили новую информацию.
Как ускорить индексацию сайта
-
Улучшите сайт
Оптимизируйте скорость загрузки страниц. Улучшите качество контента, чтобы он соответствовал запросам пользователей и поисковые алгоритмы считали его полезным.
-
Обеспечьте внутреннюю перелинковку
Благодаря перелинковке сайта поисковые роботы могут быстрее находить новый материал и страницы на сайте или новые сайты, если на них ссылаются другие ресурсы.
Поэтому, когда создаете новый материал, ставьте на него ссылки на более старых страницах сайта.
-
Обеспечьте внешнюю перелинковку
Размещайте ссылки на ваш сайт на других ресурсах: в блогах, соцсетях, на форумах и так далее. Это даст роботам дополнительные сигналы о том, что страницу нужно проиндексировать.
-
Обеспечьте доступность и открытость сайта для поисковых роботов
Проверьте файл robots.txt и тег noindex. Всё это также можно посмотреть в «Анализе сайта» Топвизора в разделе «Индексируемость»:
Проверка robots.txt и noindex
-
Создайте и загрузите sitemap
Карта сайта поможет передать роботам представление о структуре сайта, чтобы они быстрее обходили страницы. Sitemap можно создать из структуры сайта с помощью специальных сервисов – например, Топвизора.
Зайдите в «Мои проекты» и перейдите к «Карте сайта». Нажмите «Сгенерировать карту»:
Генерация карты сайта в Топвизоре
Цена будет зависеть от размера вашего сайта – количества страниц, которое вы укажете при настройке генерации. Ограничений нет: робот обойдет столько ссылок, сколько укажете. Так, обойти 100 страниц стоит 5 рублей.
Генерация карты сайта в Топвизоре
Вот что получится:
Карта сайта от Топвизора
Карту можно будет выгрузить в XML- или CSV-формате. Затем ее нужно будет загрузить в панели вебмастеров:
Добавление Sitemap в Вебмастере
Добавление Sitemap в GSC
-
Регулярно обновляйте страницы сайта
У ботов есть краулинговый бюджет. Краулинговый бюджет – это лимит на количество страниц сайта, которые поисковые роботы смогут обойти за сутки. То есть лимит на сканирование сайта.
Роботы составляют его сами на основе скорости сканирования и потребности в сканировании. Скорость сканирования зависит от того, насколько быстро роботы получают данные с сайта, для этого мы и советуем поработать с перелинковкой и картой сайта.
А потребность в сканировании зависит от популярности страницы (как часто на нее заходят), темы сайта, количества страниц на нем, важных изменений и частоты обновления контента. Чем чаще обновляете, тем чаще роботы к вам заходят.
-
Отправляйте страницы на переобход
Если нужно дополнительно привлечь внимание к определенной странице, можно воспользоваться «Переобходом страниц» в Вебмастере и «Инструментом проверки URL» в Google. Они работают одинаково: вы загружаете в них нужный URL и со временем робот должен на него прийти.
Что запомнить
-
Индексация – важный процесс, без которого страницы не покажутся пользователю.
-
Индексация бывает первичной и повторной. Первичная индексация – это когда новая страница впервые добавляется в базу поисковика. Повторная индексация означает обновление данных о странице в базе.
-
Чтобы проверить, проиндексирована ли страница, нужно ввести ее URL в поиске. Или часть текста с этой страницы – оба способа покажут, есть ли страница в поиске.
-
Еще увидеть, проиндексирована ли страница, можно с помощью следующего оператора (работает и в Яндексе, и в Google):
site:мойсайт.рф
-
Также индексацию покажут сервисы для вебмастера – Google Search Console и Яндекс Вебмастер. И «Анализ сайта» от Топвизора.
-
Сайт может не индексироваться по разным причинам:
-
сайт закрыт от индексации файлом robots.txt;
-
на странице установлены теги noindex, запрещающие индексацию;
-
индексация запрещена файлом .htaccess;
-
у сайта нет файла sitemap;
-
на сайт наложены штрафы или санкции;
-
на сайте цикл перенаправления;
-
не все свойства домена добавлены в панели вебмастеров;
-
прошло мало времени или сайт/страница новые.
-
-
Чтобы ускорить индексацию:
-
улучшите сайт;
-
обеспечьте внутреннюю перелинковку;
-
обеспечьте внешнюю перелинковку;
-
обеспечьте доступность и открытость сайта для поисковых роботов;
-
создайте и загрузите sitemap;
-
регулярно обновляйте страницы сайта;
-
отправляйте страницы на переобход.
-