Ghost Spam este una dintre cele mai recente tactici de spamming. Numai că este o tactică diferită de restul, chiar dacă seamănă mult cu Crawler Spam, pentru că nu ţinteşte nimic altceva decât conturile de Google Analytics ori alte tipuri de software folosit pentru monitorizare şi analiză a traficului web.
În articol, voi face referire la tactici relevante pentru conturile GA, pentru că este cel mai popular software de monitorizare a traficului web.
Practic, Ghost Spam ţinteşte doar să apară în statistici, să deformeze realitatea oferită de statistici. Pentru că, de altfel, nici un spam referrer din această categorie nu va accesa site-ul ci doar va specula mici probleme de securitate ale programelor de monitorizare a traficului.
Impact real?
Impactul real al Ghost Spam este unul minim, limitat direct la ceea ce arată statisticile de trafic. Astfel că, datorită Ghost Spam, conturile de Google Analytics arată din ce în ce mai multe vizite de 0,01 secunde (ori chiar 0,00 secunde), rată de respingere de 92-99% (ori chiar 100%) s.a.m.d.
Nu implică riscuri de securitate (hacking), riscuri de downgrade în SEO. Doar riscul că vei citi date eronate în GA, pentru că, repet, exceptând alterarea datelor din statistici, Ghost Spam nu face nimic altceva.
Soluţii?
Pentru că nu ţinteşte direct site-ul şi nici nu-l accesează, acest tip de spam referrer nu poate fi oprit la nivel de site (gen prin editarea .htaccess).
Singura modalitate de a opri acest tip de spam este de a-l ascunde. Mai exact, se foloseşte filtrarea. În GA este destul de uşor. Se creează un filtru personalizat (Custom), fie axat pe Include Campaign/Source (bun, dar recomandat mai mult pentru Crawler Spam), fie pe Include Hostname (recomandat pentru Ghost Spam dar si pentru Crawler Spam). În acest filtru se includ toate sursele şi numele gazdă (hostnames) care spamează. Apoi, se aplică filtrul în segmentările de analiză din proprietatea GA.
Important de reţinut, filtrul îşi va face simţit efectul pe traficul viitor, adică pe traficul primit după ce a fost creat. Pentru a aplica filtrul şi pe traficul din trecut este necesară o segmentare personalizată, avansată şi condiţionată (new segment + advanced + conditions, include hostname & include source, ambele în match regex). Dar asta numai dacă vreţi să aveţi date exacte în momentul analizei, aplicând pe traficul deja contorizat.
Ce recomand?
Folosirea ambelor tipuri de filtrare, atât axat pe sursă cât şi pe hostname (nume gazdă). Asta pentru că este destul de greu de deosebit Ghost Spam de Crawler Spam. Totuşi, trebuie să vă asiguraţi că aveţi site-ul afectat de Ghost Spam. Pentru că, cel mai frecvent, îl puteţi avea afectat doar de Crawler Spam (altfel numit Crawler Referrer Spam).
Crawler Spam, printre multe alte surse:
- semalt.com
- buttons-for-website.com
- buttons-for-your-website.com
- succes-seo.com
- videos-for-your-business.com
- semaltmedia.com
- 100dollars-seo.com
- best-seo-solution.com
- dailyrank.net
- forum.topic58942889.darodar.com
- event-tracking.com
Ghost Spam:
Cum acest tip de spam ţinteşte conturile GA, implicit ID-urile proprietăţilor, primul pas pentru a află cum să limitezi Ghost Spam este să mergi la Audience / Technology / Network, schimbi vizualizarea în Hostnames (la dimensiuni). Iar de acolo trebuie să preiei tot ce ţine de locurile unde înserezi codul GA. Poate fi blogul tău, poate fi magazinul tău online, pagini speciale de checkout, subdomenii etc. Asta pentru a face diferenţa corectă (deşi oricum nu ar fi prea greu) între Valid Hostnames şi Ghost Hostnames.
Toate astea sunt trecute în filtrul de care vorbeam mai sus. Printr-o expresie de tip Match Regex, pentru Valid Hostnames, în genul:
yourdomain.com|otherdomain.com|translateservice.com|yourshoppingcart.com|otherservice.net
După ce verificaţi impactul filtrului, incluzând Valid Hostnames (adică acele site-uri care chiar sunt gazdă), veţi avea şansa să descoperiţi Ghost Spam. Numai dacă este aplicabil. Puteţi trece mai apoi la excludere, prin aceeaşi metodă.
Cu câteva chestiuni trebuie să fiţi foarte atenţi:
- înainte de a salva filtrele, să le verificaţi (aveţi funcţie specială în GA, chiar înainte de butonul de salvare)
- să vă asiguraţi că treceţi toate datele corect şi complet, mai ales când filtraţi în Regex şi Hostnames.
- în setările proprietăţii contului GA să aveţi activată funcţia de Exclude all hits from known bots and spiders.
- nu folosiţi Referral exclusion List la nivel de Tracking, pentru că Ghost Spam dar si Crawler Spam vor trece ca Direct Traffic (asta e greşeală pe care şi eu am făcut-o)
- editarea .htaccess este o soluţie pentru Referrer Spam, dar numai dacă datele statistice indică asta (gen Avg. Session Time unde în jurul a 0,1 – 2 secunde)
Sper să vă fie de ajutor informaţiile.
*ps: – scuze pentru rom-engleză, dar cum folosesc GA doar în engleză, îmi este destul de greu să fac o traducere adaptată corect.