Как анализ файлов журналов работает с GoAccess

Файлы журнала вашего веб-сервера расскажут вам почти все, что нужно знать о прошлом и поведении ваших посетителей. Изучив файл журнала, вы можете узнать, какие браузеры используют ваши посетители, как долго они остаются на вашем сайте, сколько страниц они просматривают, какая поисковая система или ссылки привели их на ваш сайт. Вся эта информация делает файл журнала первоклассным источником для проверки удобства пользователей и оптимизации вашего веб-проекта. Поскольку оценить эти обширные текстовые файлы вручную невозможно, существуют различные инструменты анализа лог-файлов (log file analyzers), которые выполняют эту задачу и отображают результаты визуально. Интересным представителем таких анализаторов является инструмент с открытым исходным кодом GoAccess.

Основы работы GoAccess

Разработчик, Херардо Орельяна, опубликовал первую версию инструмента анализа лог-файлов GoAccess в июле 2010 года. Даже сегодня он все еще управляет им и продолжает развивать его на платформе GitHub. GoAccess можно использовать как свободное программное обеспечение и адаптировать под собственные идеи. Изначально она была под лицензией GNU, но с 2016 года — под лицензией MIT.

Основная идея GoAccess заключается в анализе и визуальном представлении веб-статистики в режиме реального времени. Для этого анализатор файлов журналов оценивает различные форматы файлов журналов веб-серверов и облачных сервисов, таких как Apache, nginx, Amazon S3 и CloudFront, и представляет результаты в виде графиков на приборной панели. Доступ к ним в Unix-подобных системах можно получить либо через браузер, либо через командную строку. Кроме того, статистика может быть выдана в формате HTML, JSON или CSV.

GoAccess имеет минимальные системные требования и, поскольку он написан на языке программирования C, в качестве предварительного условия требует только программную библиотеку C, ncurses. Для использования инструмента анализа журнальных файлов на операционной системе Windows необходим инструментарий Cygwin, который можно использовать для запуска некоторых приложений Linux на системах Microsoft.

Характерные особенности инструмента с открытым исходным кодом

Для использования GoAccess вам не нужно ничего настраивать. Достаточно выбрать файл журнала, который вы хотите проанализировать, запустить сканирование, после чего информация будет удобно отображаться в режиме реального времени. Различные данные перечислены в отдельных категориях, где показаны значения за отдельные периоды измерений, а также значения за весь период анализа. По умолчанию эти списки отсортированы в хронологическом порядке, но вы также можете упорядочить данные по количеству просмотров страниц или посетителей, потребленной полосе пропускания или времени загрузки сайта (общее, среднее или максимальное). Некоторые значения можно также отобразить в виде гистограмм или кривых диаграмм. В дополнение к актуальной информации GoAccess предоставляет вам сводку всех ранее оцененных данных журнала в разделе «Общие проанализированные запросы».

Как на терминале, так и на приборной панели браузера вышеупомянутые категории и диаграммы отображаются в привлекательной и удобной для пользователя форме, чтобы вы могли быстро сделать выводы о посетителях и вашем сайте. Следующая таблица показывает различные области, охватываемые анализатором файлов журналов, и суммирует выводы, которые можно извлечь из значений.

Категория Решающие значения Значение для веб-анализа
Уникальные посетители в день — включая пауков Просмотры, посетители, даты (данные) Под уникальным посетителем понимаются все просмотры, происходящие с одного IP-адреса. Наблюдая за количеством посетителей в течение длительного периода времени, вы можете понять, насколько успешны кампании или новый контент.
Запрошенные файлы (URL) Просмотры, пропускная способность, время загрузки (авг., кум., макс. Т.С.), URL (данные) В этой категории представлен обзор наиболее запрашиваемых URL. Здесь вы можете узнать, какие страницы вашего веб-проекта пользуются особой популярностью, сколько полосы пропускания потребляется и насколько стабильно время загрузки каждой страницы.
Статические запросы Просмотры, пропускная способность, время загрузки, файл (данные) Как и в предыдущем случае, здесь также речь идет о файлах, но только о статическом контенте, таком как изображения, иконки или элементы макета.
Не найденные URL (404s) Просмотры, URL (данные) URL, перечисленные в этой категории, привели посетителей к ошибке 404. Вы можете использовать эту статистику для выявления и устранения сетевых проблем или неправильных ссылок. Последние оказывают негативное влияние как на пользователей, так и на поисковые системы.
Хост-имена и IP-адреса посетителей Город, страна, имя хоста, IP (данные) В этом разделе вы найдете информацию о провайдере и IP-адресе ваших посетителей. GoAccess даже предоставляет данные о стране происхождения и местоположении. Полученные данные позволяют представлять пользователям персонализированный контент.
Операционные системы Просмотры, посетители, операционная система (данные) Здесь вы можете увидеть, какие операционные системы используют ваши пользователи (отсортированные по частоте). Вы можете использовать эти данные, например, чтобы определить, насколько высок объем мобильного трафика.
Браузеры Виды, посетители, браузер (данные) В этом разделе представлены типы клиентов, обращающихся к сайту. Прежде всего, вы увидите показатели различных браузеров, а также то, просматривают ли ваш сайт краулеры, и если да, то какие.
Распределение по времени Просмотры, посетители, время загрузки, час (данные) Вы получаете почасовой обзор количества посетителей. Таким образом, вы можете точно определить, когда ваши пользователи особенно активны, и затем разместить рекламу или опубликовать рекламные материалы или новое содержание.
Виртуальные хосты Просмотры, пропускная способность, хост (данные) Если вы используете несколько виртуальных хостов (доменов, IP-адресов) на своем веб-сервере, вы можете использовать эту статистику, чтобы отфильтровать ресурсы, которые создают наибольшую нагрузку на ваш сервер.
Ссылочные URL-адреса Просмотры, URL (данные) Реферер — это информация, которая появляется в файле журнала, показывающая, какой URL посетители использовали для доступа к вашему сайту. Вы можете использовать эту информацию для отсеивания сильных партнерских сайтов, а также узнать, какие поисковые запросы используют посетители, если они пришли непосредственно из поисковой системы.
Ссылающиеся сайты Просмотры, адрес сайта (данные) В отличие от предыдущей статистики, вы получаете не URL, а общий адрес сайта, с которого пришли посетители.
Ключевые фразы из поисковой системы Google Просмотры, поисковые запросы (данные) GoAccess предлагает отдельный список поисковых запросов к статистике рефереров — по крайней мере, для Google. Это избавляет вас от утомительной работы по самостоятельной оценке URL-адресов рефералов. Полученные результаты могут дать полезную информацию для вашей стратегии ключевых слов.
Геолокация Посетители, происхождение (данные) Под заголовком ‘Geo Location’ вы найдете информацию о географическом расположении IP-адресов.
Коды состояния HTTP Посетители, код состояния (данные) В этом разделе представлен обзор ответов вашего сервера. Из данных можно понять, правильно ли работает ваш веб-сервер и можно ли получить доступ ко всему содержимому без ошибок.

Как установить и использовать GoAccess

Чтобы убедиться, что вы установили последнюю версию GoAccess, скачайте установочный файл с официального сайта. С помощью командной строки загрузка и установка выполняются следующим образом:

$ wget http://tar.goaccess.io/goaccess-1.0.tar.gz
$ tar -xzvf goaccess-1.0.tar.gz
$ cd goaccess-1.0/
$ ./configure --enable-utf8
$ make
# make install

Не забывайте, что ncurses является необходимым условием для работы nginx и анализатора логов Apache, поэтому в вашей системе должна быть установлена последняя версия. Если вы еще не сделали этого, вы можете установить библиотеку C, используя следующий код:

$ wget http://ftp.gnu.org/pub/gnu/ncurses/ncurses-5.7.tar.gz
$ tar xzf ncurses-6.0.tar.gz
$ cd ncurses-6.0
$ ./configure --prefix=/opt/ncurses
$ make
# make install
$ ls -la /opt/ncurses

Подробный обзор опций конфигурации инструмента анализа лог-файлов можно найти в этом руководстве.

Оцените статью
cdelat.ru
Добавить комментарий