Урок №1 
Алгоритм Яндекс Y1

Основные технологии поиска Y1 следующие:
YaTI
YaLM

Яндекс YaLM
YaLM — это семейство генеративных нейросетей от Яндекс, которое применяется при оценке релевантности текста.
Помимо оценки релевантности текста, нейросети YaLM сами способны создавать тексты на русском языке.
Модели YaLM обучаются на всём русском интернете.
В результате Яндекс YaLM способен генерировать ответы на запросы пользователя, которые близки к интенту пользователя.

Рекомендации: как оптимизировать сайт под Яндекс Y1
1 — Разметьте видео
2 — Оптимизируйте рейтинг
3 — Оптимизируйте текст
4 — Обновите кластеры
5 — Добавьте FAQ на продвигаемые страницы
6 — Уберите страницы без потенциала роста
7 — Оптимизируйте ключевые фразы страницы
Спикер: Валентин Петухов


ИЗУЧИТЬ

 Урок №2 
Виды поисковых систем

Основные понятия информационного поиска
Булев поиск
Ранжированный поиск
Индексная база
Создание инвертированного индекса
Зоны документа
Словарь терминов
Эшелоны: золотой и серебряный индекс
Вес слова
Кворум, неточный поиск
Координатный индекс
Распределение индексов: разбиение по терминам, разбиение по документам Современные поисковые системы
Яндекс, Google, Mail, Yahoo, Bing, DuckDuckGo
Новости
Картинки, Видео, Аудио
YouTube
Блоги, форумы, отзывы
Специализированные поисковые системы
Поиск в Excel
Поиск по базам данных
Локальный поиск от Яндекс и Google
Спикер: Леонид Гроховский


ИЗУЧИТЬ

 Урок №3 
Лингвистика и статистика

Токены
Лемматизация, лексемы
Термины
Корпус документов
Статистика
Стемминг
Словари (составление, использование)
Генерация текстов
Автоматический перевод
Цепи Маркова
Определение уникальности текста
Расстояние между словами
K-граммы
Шинглы
Пассажи
Опечатки
Аббревиатуры
Спикер: Леонид Гроховский


ИЗУЧИТЬ

 Урок №4 
Ранжирование

Текстовое ранжирование
Частота терминов, взвешивание терминов
TF IDF, BM25, LinkBM25, BM25F
Контрастность
Ссылочное ранжирование
PageRank, HITS, SEOLinks
HostRank, тИЦ - ИКС
TrustRank
Поведенческое ранжирование
BrowseRank
pFound
ClickRank
Паттерны поведения пользователей
host и url факторы
Прочие факторы
Классификация текстов и запросов
Машинное обучение
Асессоры
Апдейты
Оптимизация ранжирования
A/B тестирование
Спикер: Алексей Данилин


ИЗУЧИТЬ

 Урок №5 
Спам и антиспам

Текстовый спам
Определение нечетких дублей
Алгоритм шинглов
Вычисление контрольной суммы
Ссылочный спам
Спам в коде страниц
Дорвеи и редиректы
Клоакинг и свопинг
Заимствование контента
Аффилиаты
Поведенческий спам
Спам в рекламе
Парсинг
Спикер: Алексей Данилин


ИЗУЧИТЬ

 Урок №6 
Фильтры поисковых систем

Фильтры Яндекса
Ты спамный
Коммерческие ссылки
Задержка влияния ссылок
Ссылочный взрыв
АГС-40
Аффилиат
Дорвей
Порно-контент
Обнуление тИЦ
Навязчивая реклама
Накрутка поведенческих факторов
Возраст домена
Ты последний
Склейка зеркал
Ошибка при присваивании региона
Минусинск
Баден Баден Фильтры Google
Sandbox (Песочница)
Supplementary results (Дополнительные результаты)
Bombing (Бомбежка)
Bowling (Боулинг)
Brocken Links (Битые ссылки)
Too many links at once (Слишком много ссылок сразу)
Links (Линкпомойка)
Page load time (Время загрузки страницы)
Omitted Results (Опущенные результаты)
Duplicate Content (Дублирующийся контент)
Over optimization (Переоптимизация)
Panda (Панда)
Penguin (Пингвин)
Фильтр за медленную загрузку страниц
Фильтр за отсутствие мобильной версии
Спикер: Алексей Данилин


ИЗУЧИТЬ