Стоп-слова

Стоп-слова — это слова, не несущие какой-либо самостоятельной смысловой нагрузки. В целях уменьшения баз данных поисковые системы не учитывают стоп-слова при индексировании, заменяя их специальным маркером. Данное обстоятельство имеет практическое значение при составлении поисковых запросов и оценки плотности ключевых слов, так как игнорирование стоп-слов влияет на некоторые показатели, которые в свою очередь влияют на релевантность сайта в выдаче поисковых результатов.

Виды стоп-слов:

Выделяют две группы стоп-слов: общие, зависимые.

  • Общие:
  • К общим относят предлоги, частицы, междометия, союзы, наречия, местоимения, вводные слова, числа от 0 до 9 (однозначные), другие часто употребляемые служебные, самостоятельные части речи, символы, знаки препинания. Относительно недавно этот список пополнили такие часто используемые в сети Интернет последовательности символов, как www, com, http и др.

  • Зависимые:
  • Во вторую группу попадают слова, которые в ключевом запросе определяются, как второстепенные. Пример: в запросе «Александр Сергеевич Пушкин» поисковые системы выделяют основной компонент запроса — «Пушкин» и второстепенные, то есть зависимые стоп-слова, имеющие значение только рядом с главным ключевым словом, — «Александр», «Сергеевич». Поэтому среди выпавших в поисковой выдаче страниц будут только те, которые содержат значимый компонент запроса — «Пушкин». Зависимые стоп-слова будут учитываться только при его наличии рядом с ними.

Примеры стоп-слов:

  1. Цифры
  2. 
        0, 1, 2, 3, 4, 5, 6, 7, 8, 9 — как простые, так и составные
        ноль, один, раз, два, три, четыре, пять, шесть, семь, восемь, девять
        нулевой, первый, второй, третий, четвертый, пятый, шестой, седьмой, восьмой, девятый, десятый
        
  3. Специальные символы
  4. 
        . , — _ = + / ! ” ; : % ? * ( )
        
  5. Буквы
  6. 
        а, б, в, г, д, е, ё, ж, з, и, й, к, л, м, н, о, п, р, с, т, у, ф, х, ц, ч, ш, щ, ъ, ы, ь, э, ю, я — как прописные, так и заглавные
        Отдельно стоящие буквы алфавита считаются шумовыми словами, потому как не несут в себе смысловой нагрузки.
    
    
  7. Слова частого употребления, предлоги, союзы, местоимения, причастия, частицы, междометия, суффиксы, вводные слова и конструкции, сокращения, клише и штампы
  8. 
        (предлоги) для, на, по, со, из, от, до, без, над, под, за, при, после, во
        (частицы)не, же, то, бы, всего, итого, даже, да, нет
        (союзы) или, но, дабы, затем, потом, коли, лишь только
        (наречия) как, так, еще, тот, откуда, зачем, почему, значительно
        (местоимения) он, мы, его, вы, вам, вас, ее, что, который/ая/ых/ое, их, все, они, я, весь, мне, меня, таким, весь, всех
        (сокращения) кб, мб, дн, руб, ул, кв, дн, гг
        (междометия) ой, ого, эх, браво, здравствуйте, спасибо, извините
        (неопределенные) что-то, какой-то, где-то, как-то, зачем-то, из-за, дальше, ближе, раньше, позже, когда-то
        (вводные) скажем, может, допустим, честно говоря, например, на самом деле, однако, вообще, в общем, вероятно
        (обобщения и неточные определения) всего, почти, примерно, около, где-то, порядка
        (усилители) очень, минимально, максимально, абсолютно, огромный, предельно, сильно, слабо, наиболее, наименьшее, самый
        (оценочные) красивый, мягкий, удобный, дорогой, эффективный
        (клише и штампы) масса ярких впечатлений, в лучших традициях, ударными темпами, трезвый взгляд, шаг за шагом, 
        так или иначе, сплошь и рядом, направо и налево, туда и сюда, доверие клиентов, решать задачи бизнеса, 
        расширить географию продаж, в настоящее время, в наши дни, в это столетие, в нашем веке, век высоких технологий, сегодня, сейчас
        
        (слабые глаголы) является, есть, иметь, хотеть, содержаться, существует
        (фразы с отглагольными существительными) осуществлять, оказывается
        (фразы с модальным глаголом) можно продолжать, можно заказать
    
    
  9. Часто употребляемые слова на веб-ресурсах
  10. 
        Интернет, без смс, авторизуйтесь, войдите, введите имя, сайт, закрыть окошко, вопросы, ожидайте ответа, прайс-лист, 
        заказ, меню, на этой странице, форма внизу страницы, нажмите на кнопку, напишите письмо, кликните здесь, зарегистрируйтесь, 
        перейти, закрыть, получить заказ, далее, следующий, имя, бесплатно, без пароля, без регистрации, без пароля
    
    
Оптимальная концентрация стоп-слов по отношению к общему количеству слов в тексте составляет около 30%, уровень тошноты текста (на которую также влияет количество стоп-слов) лучше удерживать в пределах значения указанных в таблице.
Символов Слов Допустимая тошнота
До 1000 ~167 До 3
До 2000 ~334 До 3.5
До 3000 ~500 До 4
До 4000 ~667 До 4.5
До 5000 ~834 До 5
До 6000 ~1000 До 5.5
До 7000 ~1167 До 6