Индексация

Индексация

Индекс или индексация сайта — сбор информации о сайтах. В собираемую базу главным образом входит информация о расположении ключевых слов в различных частях страниц сайта и исходящих ссылок с них. После обработки полученных данных, поисковые системы с помощью соответствующих алгоритмов ранжирования получают возможность выводить сайт в выдаче результатов. Так как базы данных постоянно обновляются, число проиндексированных страниц может периодически изменяться.

Существует два способа индексации сайта:

  • Ручной — подразумевает под собой добавление адреса сайта через соответствующую форму для индексации, в результате чего робот получает сведения о местонахождение сайта.
  • Автоматический происходит в автоматическом режиме без вмешательства пользователя. Так как данный процесс может длиться неограниченное время, для его ускорения используются внешние ссылки с уже проиндексированных сайтов.

Ограничения на индексацию типов данных

Существуют некоторые ограничения на типы индексируемых данных (javascript, flash файлы).

Для управления индексацией (например, запрета индексации той или иной страницы) используется файл robots.txt и такие директивы как Disallow, Allow, User-agent, Crawl-delay и другие. Также, для управления индексацией применяют теги <noindex> и атрибут <nofollow>, закрывающие содержимое сайта от роботов Яндекса и Google соответственно (Yahoo использует тег <nofollow>).

Скорость индексации новых сайтов в поисковой системе Яндекс занимает от одной недели до четырех недель, в Google — от нескольких дней до одной недели

Подготовка сайта к индексации.

  1. Качественный уникальный контент является одним из главных условий. Если на вашем сайте используется «ворованный» контент, то вероятность того, что индексация будет успешной, мала.
  2. Запретите себе использование «серых» и «черных» методы оптимизации страниц -включение списка ключевых слов в цвет фона страницы и различных ифреймовых структур. Если робот поисковой системы заподозрит вас в подобных нарушениях, то доменное имя будет вообще запрещено для индексации.
  3. После того, как сайт выложен на сервер, следует не торопиться, а проверить раз контент прежде чем выкладывать его повсеместно. Проверьте код на валидность, внутреннюю перелинковку страниц. Если всё сделано правильно, можно оповестить поисковых ботов и пригласить их на индексацию.
  4. Проверьте наличие метатегов, ключевых слов и описаний в них, тайтлов страниц и альтов изображений. Если всё это в наличии, то смело можете проводить индексацию. Добавьте свой сайт в поисковики через специальные панели.
  5. Используйте меньше php, java-scripts и flash скриптов, которые весомо затрудняют индексирование сайта. Важные коды, например — «форма регистрации» можно заключить в специальный парный тег — «noindex»…»/noindex», чтобы исключать из индексации не нужную информацию. Только учтите, что данный тег действует на Яндекс. Для запрета индексации целых разделов и папок на сайте, применяется файл — robots.txt. Данный файл может использоваться для любых поисковых систем;
  6. Создайте карту сайта.
  7. Делайте ссылки с одних страниц Вашего сайта на другие. Правило очень простое. Если одна страница сайта продолжает информацию другой или дает более полный материал, то они между собой должны быть связаны ссылками. Этот пункт можно коротко озаглавить — перелинковка.

Уроки по теме: