Токены
Лемматизация, лексемы
Термины
Корпус документов
Статистика
Стемминг
Словари (составление, использование)
Генерация текстов
Автоматический перевод
Цепи Маркова
Определение уникальности текста
Расстояние между словами
K-граммы
Шинглы
Пассажи
Опечатки
Аббревиатуры