Лог файл

Лог-файл (или просто лог)— это основной источник информации о поведении посетителя на Web-сайте. В нее входит: например, какие ключевые слова он использовал, чтобы найти ваш ресурс, какие страницы посетил, насколько там задержался и т. д. Данные, представленные логом — сырые и требуют дальнейшей обработки для статистики.

Процесс отслеживания посетителя следующий:

  • Событие 1. Запрос страницы.
  • Событие 2. Выдача страницы.
  • Событие 3. Запись в лог.

А именно:

  1. Интернет-пользователь набирает в своем веб-браузере адрес какого-либо сайта (веб-страницы) и нажимает Enter;
  2. браузер пользователя передает на сервер (на котором находится сайт) запрос на выдачу веб-страницы (в лог-файле это оформляется записью «GET <адрес_ресурса>«);
  3. на сервер передается следующая информация:
    • IP-адрес посетителя; дата и время запроса;
    • используемый пользователем браузер;
    • используемая пользователем операционная система;
    • запрашиваемый URL;
    • адрес страницы, с которой зашел посетитель;
  4. сервер выдает посетителю запрашиваемый документ/страницу/картинку/файл (если он существует);
  5. сервер записывает информацию о произошедшей транзакции в журнал событий (лог-файл).

Анализируя логи веб-сайта, можно получить следующую информацию:

  • Посещаемость. по месяцам (Monthly Statistics), по дням (Daily Statistics), по часам (Hourly Statistics).
  • С помощью него можно выяснить часы наиболее активной посещаемости — пики, и часы затишья.

  • Трафик — суммарный и отдельно по страницам.
  • Уровень конверсии.
  • Сколько страниц просматривают посетители сайта.

  • Точки входа (Entry, Entry Pages) — это веб-страницы, с которых пользователи начинают работу с сайтом.
  • Это очень ценная информация! Например, если 80% посетителей не «видят» главную страницу вашего сайта, то нет смысла тратить время на ее модернизацию. Кроме того, точки входа показывают наиболее значимые страницы вашего сайта.

  • Точки выхода (Exit, Exit Pages) — это веб-страницы, с которых пользователи покидают ваш сайт.
  • Позволяют анализировать ситуацию: хорошо, если пользователь нашел то, что искал и потому уходит (довольный!), а если нет? Есть повод задуматься!

  • «Заброшенные» страницы — это веб-страницы, посещаемые очень-очень редко.
  • Требуется тщательный анализ ситуации: может быть, страницы неинтересны или их трудно отыскать на вашем сайте (например, они не указаны на карте сайта или не связаны ссылками с другими страницами сайта).

  • Популярные страницы (URLs) — это веб-страницы, посещаемые наиболее часто.
  • Они могут послужить хорошим образцом при создании других страниц сайта. Можно также направлять пользователей с этих страниц к другим, менее популярным или «заброшенным» страницам.

Образец

	213.180.195.231 - - [29/Jan/2007:00:07:17 +0000] "GET /excel/lsn015.html HTTP/1.1" 200 18918 "-" "YaDirectBot/1.0"
74.6.71.37 - - [29/Jan/2007:00:13:03 +0000] "GET /eralash HTTP/1.0" 301 317 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)"
213.186.116.166 - - [29/Jan/2007:00:26:51 +0000] "GET /eralash/soft/speed.zip HTTP/1.0" 200 217872 "-" "Wget/1.10.2 (Red Hat modified)"
213.180.207.25 - - [29/Jan/2007:00:27:14 +0000] "GET /robots.txt HTTP/1.1" 200 54 "-" "Yandex/1.01.001 (compatible; Win16; I)"