在Google Analytics的引荐来源报告中,你一定看过类似这个,觉得很烦?
(注:t.co为Twitter的短网址域名,一般不要排除)
它影响数据报告,让引荐流量虚增!
这只是这些公司的一种推广途径而已,就像我们使用CNZZ、百度统计等国内分析工具可以看到很多来自其他网站的流量一样,其主要就是让站长去点开看看(类似品牌曝光式洗脑),利用人们的好奇心。
Piwik目前是已经系统内集成了这种机制,并且黑名单会不断更新。
如果我们使用Google Analytics则可以通过建立自定义过滤器的方式来进行排除,如下:
将收集到的垃圾域名放到Campaign Source的排除列表中,需要注意的是,我们需要使用正则格式,这里很简单,就是.前加上\,各域名之间加上|。
不过,GA在一个过滤规则中只能写入255个字符,因此,如果很多垃圾域名的话,我们可以拆分下,建立多个过滤器。
如你所知,过滤器只能应用到未来的数据,因此建议在账号建立初期就加上这个过滤器,然后建议定期更新下。
我们还可以测试验证下,比如下图所示,其中best-seo-offer.com这个域名就伪造了9个会话和页面浏览。
Piwik提供的黑名单列表,我这里转换为4个过滤器,已经改成正则格式,懒人专用:
4webmasters\.org|7makemoneyonline\.com|acads\.net|anal-acrobats\.hol\.es|anticrawler\.org|best-seo-offer\.com|best-seo-solution\.com|bestwebsitesawards\.com|blackhatworth\.com
brakehawk\.com|buttons-for-website\.com|buttons-for-your-website\.com|buy-cheap-online\.info|darodar\.com|econom\.co|event-tracking\.com|forum20\.smailik\.org|forum69\.info|free-share-buttons\.com|free-social-buttons\.com|get-free-traffic-now\.com|googlsucks\.com|guardlink\.org
hulfingtonpost\.com|humanorightswatch\.org|ilovevitaly\.com|iminent\.com|kabbalah-red-bracelets\.com|kambasoft\.com|makemoneyonline\.com|masterseek\.com|o-o-6-o-o\.com|ok\.ru
pornhub-forum\.ga|pornhub-forum\.uni\.me|priceg\.com|ranksonic\.info|ranksonic\.org|rapidgator-porn\.ga|savetubevideo\.com|semalt\.com|sexyteens\.hol\.es|simple-share-buttons\.com|social-buttons\.com|theguardlan\.com|webmaster-traffic\.com|youporn-forum\.ga|youporn-forum\.uni\.me
参考垃圾域名黑名单:
https://github.com/piwik/referrer-spam-blacklist/blob/master/spammers.txt
lonegoatuk.tumblr.com/post/107307494431/google-analytics-referral-spambot-list