Стоп-слова
Виды стоп-слов:
Выделяют две группы
- Общие:
- Зависимые:
К общим относят предлоги, частицы, междометия, союзы, наречия, местоимения, вводные слова, числа от 0 до 9 (однозначные), другие часто употребляемые служебные, самостоятельные части речи, символы, знаки препинания. Относительно недавно этот список пополнили такие часто используемые в сети Интернет последовательности символов, как www, com, http и др.
Во вторую группу попадают слова, которые в ключевом запросе определяются, как второстепенные. Пример: в запросе «Александр Сергеевич Пушкин» поисковые системы выделяют основной компонент запроса — «Пушкин» и второстепенные, то есть зависимые
Примеры стоп-слов :
- Цифры
- Специальные символы
- Буквы
- Слова частого употребления, предлоги, союзы, местоимения, причастия, частицы, междометия, суффиксы, вводные слова и конструкции, сокращения, клише и штампы
- Часто употребляемые слова на
веб-ресурсах
0, 1, 2, 3, 4, 5, 6, 7, 8, 9 — как простые, так и составные ноль, один, раз, два, три, четыре, пять, шесть, семь, восемь, девять нулевой, первый, второй, третий, четвертый, пятый, шестой, седьмой, восьмой, девятый, десятый
. , — _ = + / ! ” ; : % ? * ( )
а, б, в, г, д, е, ё, ж, з, и, й, к, л, м, н, о, п, р, с, т, у, ф, х, ц, ч, ш, щ, ъ, ы, ь, э, ю, я — как прописные, так и заглавные Отдельно стоящие буквы алфавита считаются шумовыми словами, потому как не несут в себе смысловой нагрузки.
(предлоги) для, на, по, со, из, от, до, без, над, под, за, при, после, во (частицы)не, же, то, бы, всего, итого, даже, да, нет (союзы) или, но, дабы, затем, потом, коли, лишь только (наречия) как, так, еще, тот, откуда, зачем, почему, значительно (местоимения) он, мы, его, вы, вам, вас, ее, что, который/ая/ых/ое, их, все, они, я, весь, мне, меня, таким, весь, всех (сокращения) кб, мб, дн, руб, ул, кв, дн, гг (междометия) ой, ого, эх, браво, здравствуйте, спасибо, извините (неопределенные) что-то, какой-то, где-то, как-то, зачем-то, из-за, дальше, ближе, раньше, позже, когда-то (вводные) скажем, может, допустим, честно говоря, например, на самом деле, однако, вообще, в общем, вероятно (обобщения и неточные определения) всего, почти, примерно, около, где-то, порядка (усилители) очень, минимально, максимально, абсолютно, огромный, предельно, сильно, слабо, наиболее, наименьшее, самый (оценочные) красивый, мягкий, удобный, дорогой, эффективный (клише и штампы) масса ярких впечатлений, в лучших традициях, ударными темпами, трезвый взгляд, шаг за шагом, так или иначе, сплошь и рядом, направо и налево, туда и сюда, доверие клиентов, решать задачи бизнеса, расширить географию продаж, в настоящее время, в наши дни, в это столетие, в нашем веке, век высоких технологий, сегодня, сейчас (слабые глаголы) является, есть, иметь, хотеть, содержаться, существует (фразы с отглагольными существительными) осуществлять, оказывается (фразы с модальным глаголом) можно продолжать, можно заказать
Интернет, без смс, авторизуйтесь, войдите, введите имя, сайт, закрыть окошко, вопросы, ожидайте ответа, прайс-лист, заказ, меню, на этой странице, форма внизу страницы, нажмите на кнопку, напишите письмо, кликните здесь, зарегистрируйтесь, перейти, закрыть, получить заказ, далее, следующий, имя, бесплатно, без пароля, без регистрации, без пароля
Оптимальная концентрациястоп-слов по отношению к общему количеству слов в тексте составляет около 30%, уровень тошноты текста (на которую также влияет количествостоп-слов ) лучше удерживать в пределах значения указанных в таблице.
Символов | Слов | Допустимая тошнота |
До 1000 | ~167 | До 3 |
До 2000 | ~334 | До 3.5 |
До 3000 | ~500 | До 4 |
До 4000 | ~667 | До 4.5 |
До 5000 | ~834 | До 5 |
До 6000 | ~1000 | До 5.5 |
До 7000 | ~1167 | До 6 |