Инструменты, с помощью которых можно блокировать спам-трафик в Google Analytics
Спам в Analytics стал одной из самых «горячих» тем аналитики в 2015 году. Пик обсуждений этой проблемы пришёлся на лето 2015 года, затем в ноябре она снова набрала популярность и не потеряла актуальности и по сей день.
Динамика популярности
Google создал справку «Фильтрация переходов из определенных доменов», что говорит об осведомлённости компании о данной проблеме и попытках найти её решение. Адам Сингер (Adam Singer), сотрудник Google Analytics, подтвердил, что Google работает над устранением проблемы рефспама, но дата релиза пока не названа.
Команда The Daily Egg проанализировала 292 аккаунта Google Analytics, не установивших спам-фильтрацию, у которых не менее 25 реферальных сеансов в день. Общий реферальный спам-трафик составил 11%, а 57% всех веб-сайтов получают трафик с хотя бы с одного из 500 спам-доменов.
Как сохранить новый трафик чистым с помощью автоматизированных инструментов
Большинство решений, с помощью которых можно очистить от спама статистику Analytics, предполагают ручную установку фильтра для спам-доменов или общую фильтрацию в рамках GA.
На данный момент существует около 550 доменов, которые вызывают проблему со спамом (актуальную базу данных спам-доменов можно найти на открытом ресурсе GitHub).
Из-за увеличения числа подобных доменов установка фильтров вручную стала отнимать слишком много времени, а учитывая тот факт, что новые спам-домены возникают каждый месяц, их появление достаточно сложно отслеживать.
Чтобы справиться с постоянно растущим объёмом спама, были созданы специальные инструменты, большинство из которых бесплатны.
Analytics Referrer/Ghost Spam Blocker
Этот спам-блокер всегда содержит актуальную информацию. На данный момент в чёрном списке этого инструмента находятся около 550 доменов.
Инфо:
- Url: https://www.adwordsrobot.com/en/tools/ga-referrer-spam-killer
- Типы фильтра: фильтры по имени хоста, разрешению экрана, занесённым в чёрный список доменам
- Цена: бесплатно
Достоинства:
- Простой интерфейс с функцией поиска
- Легко обновляет несколько аккаунтов, ресурсов и представлений
- Можно удалить добавленные фильтры, если необходимо
- Всегда актуальная база данных (550+ доменов в чёрном списке, 39 фильтров)
- Создатели спам-блокера увеличили квоту до 10000 обращений в день
Недостатки:
- Вам придётся обновлять фильтры всякий раз, как публикуются новые домены
Analytics Toolkit
Это не бесплатный инструмент, но это небольшая цена за избавление от лишней головной боли. Этот спам-блокер является одним из инструментов аналитики, предоставляемых Analytics Toolkit.
Инфо:
- Url: https://www.analytics-toolkit.com/auto-spam-filters/
- Типы фильтра: фильтры по занесённым в чёрный список доменам
- Цена: $15 в месяц (в пакет включены и другие инструменты аналитики)
Достоинства:
- При появлении новых доменов в чёрном списке фильтры обновляются автоматически
- Фильтры можно применить ко всем аккаунтам, ресурсам и представлениям
- Простой интерфейс
- Нет квоты на обращения
Недостатки:
- Нужна регистрация
- Количество фильтруемых доменов не публикуется
Spam Filter Installer
Spam Filter Installer (бесплатный открытый ресурс) от Simoa Hava является одним из первых автоматизированных спам-фильтров.
Инфо:
- Url: http://www.simoahava.com/spamfilter/
- Типы фильтра: фильтры по занесённым в чёрный список доменам
- Цена: бесплатно
Достоинства:
- Open source код, вы можете загрузить и установить инструмент самостоятельно
- Можно выбрать несколько ресурсов и представлений
Недостатки:
- Может применятся только к одному аккаунту единовременно
- Квота до 2000 обращений в день
- Список спам-доменов не совсем актуален (400+ доменов, 26 фильтров)
Referrer Spam Blocker
Referrer Spam Blocker – бесплатный инструмент от Stijlbreuk, обладающий одним из самых привлекательных и удобных для пользователей интерфейсов в этом списке.
Инфо:
- Url: https://referrerspamblocker.com/
- Типы фильтра: по занесённым в чёрный список доменов
- Цена: бесплатно
Достоинства:
- Можно выбрать несколько ресурсов и представлений
- Квота увеличилась до 5000 обращений в день
Недостатки:
- Неполная база спам-доменов (203+ доменов, 17 фильтров)
Как работают инструменты и фильтры
Большинство инструментов содержат один или несколько следующих фильтров. Давайте рассмотрим, как они работают.
Exclude Empty Hostname
Исключить трафик пустого имени хоста
Большинство спам-ботов не присылает информацию с именем хоста, отправляя фейковые данные в GA.
Этот фильтр исключает все обращения с пустой колонкой «Имя хоста».
Exclude Empty Screen Resolution
Исключить трафик пустого разрешения экрана
Большинство спам-ботов не присылает информацию о разрешении экрана, отправляя фейковые данные в GA.
Этот фильтр исключает обращения с пустой колонкой «Разрешение экрана».
Include Only Own Hostnames
Включить трафик только собственных имен хоста
Иногда спам-боты всё же устанавливают имя хоста, используя в большинстве случаев имя хоста спам-домена, а не настоящего домена веб-сайта.
Фильтр удаляет все обращения с именами хоста, отличающимися от предоставленного списка имён.
Предупреждение: Этот фильтр включает только обращения с предоставленными именами хоста, исключая все остальные обращения. У этого есть отрицательная сторона: если вы измените домен в будущем или используете один и тот же GA аккаунт для нескольких доменов (например, для каждого языкового домена верхнего уровня или нескольких субдоменов), вы можете отфильтровать качественный трафик. Поэтому с этим фильтром стоит быть осторожнее, иначе можно лишиться большого объёма чистого трафика.
Хотя этот фильтр и хорош, он всё же неидеален. Некоторые спам-боты всё же посещают ваш сайт, используя верное имя домена, и в этом случае спам-трафик не отфильтровывается.
Exclude Blacklisted Domains (Campaign Source Filter)
Исключить трафик занесённых в чёрный список доменов (Фильтр по источникам кампании)
Когда не работает ни один другой фильтр, вам придётся исключить каждый занесённый в чёрный список домен вручную (на данный момент в базу дынных занесены около 550 доменов).
Большинство инструментов используют списки доменов, которые обновляются автоматически.
Как удалить спам из уже загрязнённого трафика
Вам не удастся очистить заспамленные данные в GA, используя вышеописанные методы. Google analytics поддерживает сегменты, которые позволят вам отфильтровать старый трафик.
Используя сегменты, вы можете скрыть все спам-домены в старых данных. Этот метод очень полезен в том случае, если у вас было много спам-трафика и вы его не фильтровали.
Просто импортируйте Analytics Spam Blocker (550 доменов) и вы сможете выбрать этот сегмент в любом представлении.
Нерекомендуемые решения
Существует ряд других решений, которые могут частично сработать, но не исключено, что они принесут больше вреда, чем пользы.
Создание специальных параметров для каждого сеанса (не лучше описанных фильтров)
Создание специальных параметров для каждого сеанса позволит вам отличить спам от качественного трафика. Для этого вам необходим доступ к коду отслеживания на веб-сайте.
Установка дополнительных параметров для триггера типа «Просмотр страницы» (не рекомендуется)
Чтобы установить дополнительные параметры, вам нужен доступ к коду отслеживания на веб-сайте.
Создание нового идентификатора отслеживания (не рекомендуется)
Создание нового идентификатора отслеживания GA не является удачным решением, так как вы потеряете все старые данные. Более того, спам-боты найдут ваш новый аккаунт и поступление спам-трафика возобновится.
Фильтрация IP адресов (не рекомендуется)
Фильтрация IP адресов не является эффективной, так как боты используют разные IP.
Вывод:
Google работает над решением проблемы спама в Analytics, и, будем надеяться, устранит её раз и навсегда в ближайшем будущем.
Однако до тех пор, пока решение не найдено, вы можете воспользоваться большим выбором автоматизированных инструментов, которые просты и удобны в использовании.
Источник: The Daily Egg