Jeśli zauważyliście znaczną liczbę odesłań z semalt.com, to wiedzcie, że coś się dzieje. Ten spamerski bot nie tylko zjada transfer, ale również miesza nam w statystykach witryny, ponieważ jego wizyty odkładają się w Google Analytics, jako odesłania z witryny semalt.com. Trzeba się więc tego robaka pozbyć.
O samym spambocie nie będę się wiele rozpisywał, ponieważ nie to jest tematem tego artykułu. Jedynie słowo wyjaśnienia, dlaczego jego ruch może zaburzać nam statystyki.
Jak widać na screenie ruch z semalt.com powoduje wzrost współczynnika odrzuceń, spadek ilości podstron odwiedzanych podczas jednej sesji oraz czas spędzony w witrynie.
Aby zablokować gadzinę, należy przejść do panelu administracyjnego i dodać filtr wykluczający.
Po tym zabiegu możemy cieszyć się już statystykami wolnymi od semalt.com
AKTUALIZACJA:
W komentarzach pod wpisem padło pytanie jak pozbyć się buttons-for-website.com z Analytics’a. Podobne problemy występują również z domeną darodar.com i jej wieloma subdomenami. Żeby nie tworzyć kilku filtrów i wykluczać pojedynczo domeny, można zmodyfikować wzorzec tak, aby pasował do kilku domen, np:
(.*)\.[semalt\.com|buttons\-for\-website\.com|darodar\.com]
Podobnie postąpić można z innymi spamowymi domenami.
Częściowym obejściem problemu jest ustawienie filtru, który uwzględnia ruch tylko z naszego hostname (nazwa domeny)
Większość spamowych refrerrali jako hostname ma ustawione (not set) lub generyczną nazwę, więc w ten sposób się ich pozbędziemy.
Pewne pocieszenie może też dać informacja, że zespół Google Analytics zauważa problem:
https://plus.google.com/u/0/+GoogleAnalytics/posts/3985ij5QeCa
Dzięki za poradę – na czasie, bo semalty zawaliły mi GA. Mam jedno pytanie: czy opisane powyżej wykluczenie będzie działało również na subdomeny semalta? Pytam, bo ostatnio w GA pojawiły się takowe, np. semalt(kropka)semalt(kropka)com czy też niezliczone inne z liczbami na przodzie: 10(kropka)semalt(kropka)com itp. BTW: ostatnio pojawiły się tez śmieci z kambasoft… Pozdrawiam :-)
Semalta najlepiej wyciąć z poziomu serwera w .htaccess, to jest zupełnie zbędny crawler chodzący po naszej stronie. Najgorsze z tym semaltem jest to, że kombinują z nowymi domenami :(
Tak, powyższy filtr zadziała również na subdomeny semalt.com. We wzorcu filtra, przed nazwą domeny, zostało zastosowane wyrażenie regularne (.*), które oznacza dowolny ciąg znaków, a więc filtr ten „zbierze” wszystkie subdomeny.
Działa świetnie, Pawle, również dla kilku dla innych śmieci, które się pojawiają od czasu do czasu. Na dole ustawień filtrów jest jeszcze opcja „Zastosuj filtr do widoków danych.” Profilaktycznie zaznaczyłem też: „Wybrane widoki danych: wszystkie dane witryny”. Czy wiesz może, jaka jest funkcja tej opcji i jaki to ma wpływ na działanie filtra??
To powoduje, że filtr, który ustawiłeś, będzie zastosowany dla wszystkich widoków w ramach usługi. Czyli posiadając więcej widoków, na każdym z nich filtrujesz semalt.com. Dobrą praktyką jest pozostawienie 1 widoku beż żadnych filtrów, tak aby mieć dostęp do wszystkich danych.
Dzięki za poradę ;-) Pozdrawiam.
Witam, miałam ten sam problem, z semalt i również z witryną t.co, obie generowały mnóstwo niepotrzebnego ruchu na stronie. Przed chwilą zastosowałam filtr, mam nadzieję, że zadziała skutecznie ;) Dziękuję za pomoc! Pozdrawiam, E
„t.co” to ruch z Twittera, a konkretnie z ich „skracacza” linków. Informacja o tym ruchu jest Ci potrzebna w GA, więc tego nie filtruj :)
Witam, dziękuję, właśnie ostatnio 'odkrylam’, że to twitter ;) a z semalt już nie mam problemów – wystarczył ten jeden zabieg i od tamtego czasu spokój :) pozdrawiam i życzę miłej niedzieli :)
Witam,
Przydatny wpis, chyba jedyny taki w polskiej sieci. Mam prośbę, czy ktoś może mi wytłumaczyć które opcje zaznaczyć w filtrze w polskiej wersji językowej Analytics? Próbowałem już mnóstwa opcji i za każdym razem bez efektu.
Chce usunąć semat.semalt.com i samo semalt.com
Fałszuje mi obraz i zawyża współczynnik odrzuceń.
Pozdrawiam
Wojtek
Wchodzisz w zakładkę Administracja, następnie z kolumny Widok wybierasz Filtry. Następnie „Nowy Filtr” -> typ filtru „Niestandardowe”, a potem uzupełniasz jak na tym screenshocie: https://dl.dropboxusercontent.com/u/1020658/blog/arty/semalt/semalt_4.png
Niestety nie zadziałało.Zrobiłem wszystko dokładnie tak jak na obrazku. Zapisałem filtr. Wylogowałem się i zalogowałem ponownie i nic. W ciągu miesiąca ma 42 wejścia z semalta i 26 z buttons for webssite . com. Masz może jakiś inny pomysł jak to wykluczyć? Ja jeszcze spróbuję wykluczyć amerykę łacińską ale to raczej nie tak powinno być.
PS. I tak dzięki za pomoc.
OK. Zadziałało, tylko następnego dnia. Widocznie G. musiało przetrawić trochę dłużej semalta. Dzięki za pomoc.
Pozdrawiam
Z mojej obserwacji wynika, że filtr działa tylko od momentu wprowadzenia. Nie działa na wcześniejsze wyniki albo ja nie wiem jak to zmienić.
Pozdr.
Dokładnie tak, filtry nie działają wstecz. Więc jeśli dodajesz nowy filtr, to zaczyna on działać od momentu skonfigurowania.
Hej, a ja wchodzę w zakładkę Widok – Filtry i nie mam opcji, żeby dodać nowy filtr. Nie mam pojęcia dlaczego. Masz jakiś pomysł?
Nie masz wystarczających uprawnień. Musisz mieć prawa do edycji, żeby móc dodawać nowe filtry.
A jak to zmienić? Jestem laikiem w tej kwestii.
Musisz skontaktować się z osobą, która zarządza kontem – jest administratorem z prawami zarządzania użytkownikami. Poproś o dostęp do edycji (administracyjny, bez zarządzania użytkownikami), tak, żebyś mogła dodawać filtry, cele itp.
Dzięki piękne :) . Też mam ten semalt i już go zablokowałem.
Zobaczę na dniach czy zadziała.
U mnie jeszcze to się pokazuje (.*)buttons-for-website.com .
To wystarczy aby go zablokować ma się rozumieć ??
Tak, wystarczy. Zobacz też post Maćka Lewińskiego, który właśnie bardzo ładnie opisał blokowanie spamowego ruchu w GA – https://plus.google.com/110248575174994322315/posts/PC181Kt8Gzt
Cenny artykuł co prawda z semalt.com uporałem się trochę inaczej a mianowicie poprzez edycję pliku .htaccess – cały sposób opisałem i umieściłem na swoim blogu,
http://tomasz-urbanek.blogspot.com/2014/12/sprawdzajac-statystyki-odwiedzin.html
natomiast mam problem z usunięciem z raportów wizyt z forum.topic56681073.darodar.com (klika dziennie z różnych miast Rosji), mam nadzieję że opisany powyżej sposób pomoże…
A co w przypadku takiego komunikatu:
„Ten filtr nie zmieniłby danych: konfiguracja filtra jest nieprawidłowa lub zestaw próbnych danych jest zbyt mały.”
Zadziała czy nie?
Też czasem dostaję taką informację, a mimo to filtr działa i nie wpada mi żaden spamowy bot w referalu
Witam, mam ten sam problem co kolega powyżej, ale niestety filtr nie działa faktycznie i cały spam ląduje w analizach. Komunikat pojawia się nie okresowo, ale zawsze, choćbym nie wiem co wpisała… Co robić? Będę wdzięczna za pomoc…
Możesz podrzucić screena, w jaki sposób masz skonfigurowany filtr?
Na początku dzięki za dobrą robotę Pawle, Twój wpis jest bardzo przydatny (i aktualizowany, co ważne).
Piszę z nowym problemem: od wczoraj pojawia się na moim GA nowy rodzaj fałszywego ruchu na stronie: tym razem kilkanaście wejść dziennie ale przez kanał Organic Search, przez słowo kluczowe „resellerclub scam”. Szczegóły na zrzucie: http://screencast.com/t/EM3OyuUexC36
Spotkałeś się już z tym i czy jest jakiś sposób, żeby usunął to ze statystyk GA?
Pozdrawiam.
Na swoich stronach na szczęście jeszcze nie spotkałem „resellerclub scam”, ale z tego mi wiadomo to działalność bota z ilovevitally.com, który również w pada jako źródło odesłań i trzeba go filtrować podobnie jak semalt. Żeby pozbyć się tego słowa kluczowego, trzeba będzie zdefiniować nowy filtr niestandardowy i ustawić go wg tego zrzutu ekranu:
https://dl.dropboxusercontent.com/u/1020658/blog/arty/semalt/filtr.png
W języku polskim pole filtru to „Hasło kampanii”. Weryfikacja filtru powinna potwierdzić, że ta fraza nie będzie dłużej zbierana w GA.
Zadziałało!!! Dziękuję za poradę :-)
Witam też mam ten problem. Mam sklep na platformie Presta Shop i wejścia z semalt a także bardzo dużo wejść z jednego IP 66.249.67.158. – IP jest ze Stanów Zjednoczonych. W jaki sposób można to zablokować biorąc pod uwagę, że jestem laikiem?
Semalt zablokujesz postępując zgodnie z instrukcją we wpisie. Natomiast IP o którym mówisz, należy do Google: http://whois.domaintools.com/66.249.67.158
Dzięki za odpowiedź. Czy można blokować na Presta Shop (jeśli tak to w jaki sposób)? Czy też trzeba założyć konto na Google Analytics, i tam blokować? Bo założyłem tam konto ale utknąłem bo nie wiem gdzie trzeba wkleić wygenerowany kod. Czyli tego IP z Google nie należy blokować bo jest z Google czy tak? Czy ma to związek z pozycjonowaniem mojej strony? Bo to IP z Google też mi fałszuje i zawyża statystyki. Mam też jakieś częste wejścia z Francji http://whois.domaintools.com/188.165.15.94 cóż to takiego to OVH?
Marcin, ale jakich statystyk obecnie używasz? Bo ten wpis traktuje o tym, jak usunąć semalt z Google Analytics. Inne narzędzia mogą to rozwiązywać w inny sposób. Co do IP Google, to zgadza się, nie należy go blokować.
Ten drugi adres IP, który podałeś, to adres należący do ahrefs – narzędzia, które zbiera min. informacje o linkach zwrotnych, które kierują do Twojej strony.
Używam statystyk z Presta Shop i tam właśnie się pojawia semalt. Chyba źle zrozumiałem. Uznałem, że jak zablokuje semalt przez Google Analytics to automatycznie semalt nie będzie mi się pojawiał w statystykach Presta Shop. A to tak nie działa, zgadza się? W takim razie czy może wiadomo w jaki sposób zablokować semalt w Presta Shop?
Czyli tego drugiego adresu też nie należałoby blokować bo jest związany z pozycjonowaniem?
Czy można w ogóle zrobić tak, żeby żadne roboty czy to te związane z pozycjonowaniem czy też te szkodliwe nie pojawiały się w statystykach?
Niestety nie znam statystyk Presty, ale tu masz link do wątków na ich forum, może to Ci pomoże.
https://www.prestashop.com/forums/topic/376261-solved-semalt-spam-referrers/
Dzięki bardzo postaram się jakoś to ogarnąć.
Bardzo dziękuję za cierpliwość w odpowiedziach na podobne pytania i jasny opis walki z tym śmieciem /semalt/ . Jestem laikiem ,ale instrukcja z Twojej strony pozwoliła łatwo dodać właściwy filtr. Bardzo dziękuję
Wykryłam śmieciowy ruch u siebie i spróbowałam zastosować do wszystkich domen jeden filtr, wg wzoru podanego przez Ciebie. Coś mi jednak nie idzie, bo przy weryfikacji wyskakuje wiadomość: „Ten filtr nie zmieniłby danych: konfiguracja filtra jest nieprawidłowa lub zestaw próbnych danych jest zbyt mały.”
Co z tym fantem zrobić?
Też czasem dostaję taką informację, a mimo to filtr działa. Sprawdź kilka dni po zastosowaniu, czy konkretne spamowe referale przestają się zbierać.
Witaj Pawle. Zauważyłem niepokojącą rzecz, może jest Ci znana. Otóż, pojawiły się na moich stronach dwa nowe odesłania – spamy: www . Get-Free-Traffic-Now . com oraz free-share-buttons . com Po zastosowaniu wspomnianego w Twoim artykule filtra, odesłania z tych stron nadal się pojawiają, dzień później i dłużej: http://screencast.com/t/bssBCeez Zastosowałem filtr (.*)adres witryny i nie działa on tym razem, tylko w przypadku tych 2 odesłań (filtrów mam już w sumie 19, w 17 pozostałych przypadkach działają). Spotkałeś się już z takim przypadkiem? Co może być powodem niedziałania filtra? Pozdrawiam serdecznie.
Możesz podesłać ustawienie filtra. Zwykle jeśli jakiś filtr mi nie działał, to dlatego, że w pośpiechu lub przez nieuwagę coś źle ustawiłem.
Akurat z semalt można się łatwo wypisać na ich stronie. Filtry są zbędne. Niepokoją mnie pozostałe śmieci, używam tych filtrów i niestety nie ma różnicy, analytics mam całe zaśmiecone spamem free share i podobnymi. Dołączam do pytań Włodzimierza
Proszę bardzo Pawle, oto ustawienia mojego filtra: http://screencast.com/t/XwadvGSgSMJ6 Mimo każdorazowo takiej samej definicji filtra zaśmiecają mnie również inne shity, jak te np.: http://screencast.com/t/EUBW2l7l7F Czyżby się uodporniły? :-)
W takim razie dodaj dodatkowy filtr, który uwzględnia ruch tylko z własnego hosta (nazwa domeny). U mnie wygląda to tak:
https://www.dropbox.com/s/i706p0iujczex2o/filtr_hosta.png?dl=0
większość spamowego ruchu ma jako hostname (not set) lub jakieś generyczne nazwy. Możesz to sprawdzić ustawiając w raporcie źródło/medium dodatkowy wymiar jako nazwa hosta:
https://www.dropbox.com/s/53se40tw0vn7ugh/dodatkowy_wymiar.png?dl=0
To spowoduje, że spam refy z hosta innego niż nasz zostaną odfiltrowane. Niestety są sprytne spamy, które to omijają.
Pewną nadzieję na poprawę daje ten wpis:
https://plus.google.com/u/0/+GoogleAnalytics/posts/3985ij5QeCa
ale zobaczymy jak to wyjdzie w praktyce.
Dzięki za porady ponieważ jest co raz więcej SPAMu i jest on bardzo uciążliwy. Myślę, że Google niedługo sobie z tym poradzi. Jeśli da rade filtrować SPAM na Gmailu to dlaczego miało by się tym nie zając raz a dobrze :)
Witaj Pawle, jako ciekawostkę podam kolejny przykład spamowego ruchu na mojej stronie. Od paru tygodni miewam regularne wizyty z kanału „direct”: http://screencast.com/t/seSiVZhLe , bez odesłania. Jak widzisz, wejścia są z kilku różnych krajów i powodują duże zakłamania we współczynniku odrzuceń (wejścia z Polski są niespamerskie). Spotkałeś się kiedyś z czymś takim? Pozdrawiam.
Tak, ruch direct też jest spamowany. Dlatego w aktualizacji swojego wpisu, jakiś czas temu, dodałem na końcu informację o ustawieniu filtru, który uwzględnia ruch tylko z naszego hostname. Dzięki temu od razu eliminujemy boty, które jako hostname mają (not set) lub jakąś generyczną nazwę.
Potwierdzam, zadziałało. W godzinę od wprowadzenia nowego filtra ze statystyk zniknęło 40 spamerskich „directów”, które pojawiły się dziś rankiem. Dzięki za dobre porady!