Jak pozbyć się semalt.com (i innego spamu) z raportów Google Analytics

Jeśli zauważyliście znaczną liczbę odesłań z semalt.com, to wiedzcie, że coś się dzieje. Ten spamerski bot nie tylko zjada transfer, ale również miesza nam w statystykach witryny, ponieważ jego wizyty odkładają się w Google Analytics, jako odesłania z witryny semalt.com. Trzeba się więc tego robaka pozbyć.

O samym spambocie nie będę się wiele rozpisywał, ponieważ nie to jest tematem tego artykułu. Jedynie słowo wyjaśnienia, dlaczego jego ruch może zaburzać nam statystyki.

semalt

Jak widać na screenie ruch z semalt.com powoduje wzrost współczynnika odrzuceń, spadek ilości podstron odwiedzanych podczas jednej sesji oraz czas spędzony w witrynie.

Aby zablokować gadzinę, należy przejść do panelu administracyjnego i dodać filtr wykluczający.

semalt_4

Po tym zabiegu możemy cieszyć się już statystykami wolnymi od semalt.com

semalt_3

AKTUALIZACJA:

W komentarzach pod wpisem padło pytanie jak pozbyć się buttons-for-website.com z Analytics’a. Podobne problemy występują również z domeną darodar.com i jej wieloma subdomenami. Żeby nie tworzyć kilku filtrów i wykluczać pojedynczo domeny, można zmodyfikować wzorzec tak, aby pasował do kilku domen, np:

 (.*)\.[semalt\.com|buttons\-for\-website\.com|darodar\.com]

Podobnie postąpić można z innymi spamowymi domenami.

Częściowym obejściem problemu jest ustawienie filtru, który uwzględnia ruch tylko z naszego hostname (nazwa domeny)

filtr_hosta

Większość spamowych refrerrali jako hostname ma ustawione (not set) lub generyczną nazwę, więc w ten sposób się ich pozbędziemy.

dodatkowy_wymiar

Pewne pocieszenie może też dać informacja, że zespół Google Analytics zauważa problem:

https://plus.google.com/u/0/+GoogleAnalytics/posts/3985ij5QeCa

 

48 myśli w temacie “Jak pozbyć się semalt.com (i innego spamu) z raportów Google Analytics”

  1. Dzięki za poradę – na czasie, bo semalty zawaliły mi GA. Mam jedno pytanie: czy opisane powyżej wykluczenie będzie działało również na subdomeny semalta? Pytam, bo ostatnio w GA pojawiły się takowe, np. semalt(kropka)semalt(kropka)com czy też niezliczone inne z liczbami na przodzie: 10(kropka)semalt(kropka)com itp. BTW: ostatnio pojawiły się tez śmieci z kambasoft… Pozdrawiam :-)

    1. Semalta najlepiej wyciąć z poziomu serwera w .htaccess, to jest zupełnie zbędny crawler chodzący po naszej stronie. Najgorsze z tym semaltem jest to, że kombinują z nowymi domenami :(

  2. Tak, powyższy filtr zadziała również na subdomeny semalt.com. We wzorcu filtra, przed nazwą domeny, zostało zastosowane wyrażenie regularne (.*), które oznacza dowolny ciąg znaków, a więc filtr ten „zbierze” wszystkie subdomeny.

    1. Działa świetnie, Pawle, również dla kilku dla innych śmieci, które się pojawiają od czasu do czasu. Na dole ustawień filtrów jest jeszcze opcja „Zastosuj filtr do widoków danych.” Profilaktycznie zaznaczyłem też: „Wybrane widoki danych: wszystkie dane witryny”. Czy wiesz może, jaka jest funkcja tej opcji i jaki to ma wpływ na działanie filtra??

  3. To powoduje, że filtr, który ustawiłeś, będzie zastosowany dla wszystkich widoków w ramach usługi. Czyli posiadając więcej widoków, na każdym z nich filtrujesz semalt.com. Dobrą praktyką jest pozostawienie 1 widoku beż żadnych filtrów, tak aby mieć dostęp do wszystkich danych.

  4. Witam, miałam ten sam problem, z semalt i również z witryną t.co, obie generowały mnóstwo niepotrzebnego ruchu na stronie. Przed chwilą zastosowałam filtr, mam nadzieję, że zadziała skutecznie ;) Dziękuję za pomoc! Pozdrawiam, E

    1. „t.co” to ruch z Twittera, a konkretnie z ich „skracacza” linków. Informacja o tym ruchu jest Ci potrzebna w GA, więc tego nie filtruj :)

  5. Witam, dziękuję, właśnie ostatnio 'odkrylam’, że to twitter ;) a z semalt już nie mam problemów – wystarczył ten jeden zabieg i od tamtego czasu spokój :) pozdrawiam i życzę miłej niedzieli :)

  6. Witam,
    Przydatny wpis, chyba jedyny taki w polskiej sieci. Mam prośbę, czy ktoś może mi wytłumaczyć które opcje zaznaczyć w filtrze w polskiej wersji językowej Analytics? Próbowałem już mnóstwa opcji i za każdym razem bez efektu.
    Chce usunąć semat.semalt.com i samo semalt.com
    Fałszuje mi obraz i zawyża współczynnik odrzuceń.
    Pozdrawiam
    Wojtek

  7. Niestety nie zadziałało.Zrobiłem wszystko dokładnie tak jak na obrazku. Zapisałem filtr. Wylogowałem się i zalogowałem ponownie i nic. W ciągu miesiąca ma 42 wejścia z semalta i 26 z buttons for webssite . com. Masz może jakiś inny pomysł jak to wykluczyć? Ja jeszcze spróbuję wykluczyć amerykę łacińską ale to raczej nie tak powinno być.

    PS. I tak dzięki za pomoc.

  8. Z mojej obserwacji wynika, że filtr działa tylko od momentu wprowadzenia. Nie działa na wcześniejsze wyniki albo ja nie wiem jak to zmienić.

    Pozdr.

    1. Dokładnie tak, filtry nie działają wstecz. Więc jeśli dodajesz nowy filtr, to zaczyna on działać od momentu skonfigurowania.

  9. Hej, a ja wchodzę w zakładkę Widok – Filtry i nie mam opcji, żeby dodać nowy filtr. Nie mam pojęcia dlaczego. Masz jakiś pomysł?

    1. Nie masz wystarczających uprawnień. Musisz mieć prawa do edycji, żeby móc dodawać nowe filtry.

    2. Musisz skontaktować się z osobą, która zarządza kontem – jest administratorem z prawami zarządzania użytkownikami. Poproś o dostęp do edycji (administracyjny, bez zarządzania użytkownikami), tak, żebyś mogła dodawać filtry, cele itp.

  10. Dzięki piękne :) . Też mam ten semalt i już go zablokowałem.
    Zobaczę na dniach czy zadziała.
    U mnie jeszcze to się pokazuje (.*)buttons-for-website.com .
    To wystarczy aby go zablokować ma się rozumieć ??

  11. A co w przypadku takiego komunikatu:
    „Ten filtr nie zmieniłby danych: konfiguracja filtra jest nieprawidłowa lub zestaw próbnych danych jest zbyt mały.”
    Zadziała czy nie?

    1. Też czasem dostaję taką informację, a mimo to filtr działa i nie wpada mi żaden spamowy bot w referalu

    2. Witam, mam ten sam problem co kolega powyżej, ale niestety filtr nie działa faktycznie i cały spam ląduje w analizach. Komunikat pojawia się nie okresowo, ale zawsze, choćbym nie wiem co wpisała… Co robić? Będę wdzięczna za pomoc…

    3. Możesz podrzucić screena, w jaki sposób masz skonfigurowany filtr?

  12. Na początku dzięki za dobrą robotę Pawle, Twój wpis jest bardzo przydatny (i aktualizowany, co ważne).

    Piszę z nowym problemem: od wczoraj pojawia się na moim GA nowy rodzaj fałszywego ruchu na stronie: tym razem kilkanaście wejść dziennie ale przez kanał Organic Search, przez słowo kluczowe „resellerclub scam”. Szczegóły na zrzucie: http://screencast.com/t/EM3OyuUexC36
    Spotkałeś się już z tym i czy jest jakiś sposób, żeby usunął to ze statystyk GA?

    Pozdrawiam.

    1. Na swoich stronach na szczęście jeszcze nie spotkałem „resellerclub scam”, ale z tego mi wiadomo to działalność bota z ilovevitally.com, który również w pada jako źródło odesłań i trzeba go filtrować podobnie jak semalt. Żeby pozbyć się tego słowa kluczowego, trzeba będzie zdefiniować nowy filtr niestandardowy i ustawić go wg tego zrzutu ekranu:
      https://dl.dropboxusercontent.com/u/1020658/blog/arty/semalt/filtr.png
      W języku polskim pole filtru to „Hasło kampanii”. Weryfikacja filtru powinna potwierdzić, że ta fraza nie będzie dłużej zbierana w GA.

  13. Witam też mam ten problem. Mam sklep na platformie Presta Shop i wejścia z semalt a także bardzo dużo wejść z jednego IP 66.249.67.158. – IP jest ze Stanów Zjednoczonych. W jaki sposób można to zablokować biorąc pod uwagę, że jestem laikiem?

  14. Dzięki za odpowiedź. Czy można blokować na Presta Shop (jeśli tak to w jaki sposób)? Czy też trzeba założyć konto na Google Analytics, i tam blokować? Bo założyłem tam konto ale utknąłem bo nie wiem gdzie trzeba wkleić wygenerowany kod. Czyli tego IP z Google nie należy blokować bo jest z Google czy tak? Czy ma to związek z pozycjonowaniem mojej strony? Bo to IP z Google też mi fałszuje i zawyża statystyki. Mam też jakieś częste wejścia z Francji http://whois.domaintools.com/188.165.15.94 cóż to takiego to OVH?

    1. Marcin, ale jakich statystyk obecnie używasz? Bo ten wpis traktuje o tym, jak usunąć semalt z Google Analytics. Inne narzędzia mogą to rozwiązywać w inny sposób. Co do IP Google, to zgadza się, nie należy go blokować.

      Ten drugi adres IP, który podałeś, to adres należący do ahrefs – narzędzia, które zbiera min. informacje o linkach zwrotnych, które kierują do Twojej strony.

  15. Używam statystyk z Presta Shop i tam właśnie się pojawia semalt. Chyba źle zrozumiałem. Uznałem, że jak zablokuje semalt przez Google Analytics to automatycznie semalt nie będzie mi się pojawiał w statystykach Presta Shop. A to tak nie działa, zgadza się? W takim razie czy może wiadomo w jaki sposób zablokować semalt w Presta Shop?
    Czyli tego drugiego adresu też nie należałoby blokować bo jest związany z pozycjonowaniem?
    Czy można w ogóle zrobić tak, żeby żadne roboty czy to te związane z pozycjonowaniem czy też te szkodliwe nie pojawiały się w statystykach?

  16. Bardzo dziękuję za cierpliwość w odpowiedziach na podobne pytania i jasny opis walki z tym śmieciem /semalt/ . Jestem laikiem ,ale instrukcja z Twojej strony pozwoliła łatwo dodać właściwy filtr. Bardzo dziękuję

  17. Wykryłam śmieciowy ruch u siebie i spróbowałam zastosować do wszystkich domen jeden filtr, wg wzoru podanego przez Ciebie. Coś mi jednak nie idzie, bo przy weryfikacji wyskakuje wiadomość: „Ten filtr nie zmieniłby danych: konfiguracja filtra jest nieprawidłowa lub zestaw próbnych danych jest zbyt mały.”

    Co z tym fantem zrobić?

    1. Też czasem dostaję taką informację, a mimo to filtr działa. Sprawdź kilka dni po zastosowaniu, czy konkretne spamowe referale przestają się zbierać.

  18. Witaj Pawle. Zauważyłem niepokojącą rzecz, może jest Ci znana. Otóż, pojawiły się na moich stronach dwa nowe odesłania – spamy: www . Get-Free-Traffic-Now . com oraz free-share-buttons . com Po zastosowaniu wspomnianego w Twoim artykule filtra, odesłania z tych stron nadal się pojawiają, dzień później i dłużej: http://screencast.com/t/bssBCeez Zastosowałem filtr (.*)adres witryny i nie działa on tym razem, tylko w przypadku tych 2 odesłań (filtrów mam już w sumie 19, w 17 pozostałych przypadkach działają). Spotkałeś się już z takim przypadkiem? Co może być powodem niedziałania filtra? Pozdrawiam serdecznie.

    1. Możesz podesłać ustawienie filtra. Zwykle jeśli jakiś filtr mi nie działał, to dlatego, że w pośpiechu lub przez nieuwagę coś źle ustawiłem.

  19. Akurat z semalt można się łatwo wypisać na ich stronie. Filtry są zbędne. Niepokoją mnie pozostałe śmieci, używam tych filtrów i niestety nie ma różnicy, analytics mam całe zaśmiecone spamem free share i podobnymi. Dołączam do pytań Włodzimierza

    1. W takim razie dodaj dodatkowy filtr, który uwzględnia ruch tylko z własnego hosta (nazwa domeny). U mnie wygląda to tak:
      https://www.dropbox.com/s/i706p0iujczex2o/filtr_hosta.png?dl=0

      większość spamowego ruchu ma jako hostname (not set) lub jakieś generyczne nazwy. Możesz to sprawdzić ustawiając w raporcie źródło/medium dodatkowy wymiar jako nazwa hosta:
      https://www.dropbox.com/s/53se40tw0vn7ugh/dodatkowy_wymiar.png?dl=0

      To spowoduje, że spam refy z hosta innego niż nasz zostaną odfiltrowane. Niestety są sprytne spamy, które to omijają.

      Pewną nadzieję na poprawę daje ten wpis:
      https://plus.google.com/u/0/+GoogleAnalytics/posts/3985ij5QeCa
      ale zobaczymy jak to wyjdzie w praktyce.

  20. Dzięki za porady ponieważ jest co raz więcej SPAMu i jest on bardzo uciążliwy. Myślę, że Google niedługo sobie z tym poradzi. Jeśli da rade filtrować SPAM na Gmailu to dlaczego miało by się tym nie zając raz a dobrze :)

  21. Witaj Pawle, jako ciekawostkę podam kolejny przykład spamowego ruchu na mojej stronie. Od paru tygodni miewam regularne wizyty z kanału „direct”: http://screencast.com/t/seSiVZhLe , bez odesłania. Jak widzisz, wejścia są z kilku różnych krajów i powodują duże zakłamania we współczynniku odrzuceń (wejścia z Polski są niespamerskie). Spotkałeś się kiedyś z czymś takim? Pozdrawiam.

    1. Tak, ruch direct też jest spamowany. Dlatego w aktualizacji swojego wpisu, jakiś czas temu, dodałem na końcu informację o ustawieniu filtru, który uwzględnia ruch tylko z naszego hostname. Dzięki temu od razu eliminujemy boty, które jako hostname mają (not set) lub jakąś generyczną nazwę.

  22. Potwierdzam, zadziałało. W godzinę od wprowadzenia nowego filtra ze statystyk zniknęło 40 spamerskich „directów”, które pojawiły się dziś rankiem. Dzięki za dobre porady!

Skomentuj Ela Wine Lady Anuluj pisanie odpowiedzi

Twój adres e-mail nie zostanie opublikowany.