为了节省空间和提升性能,Piwik的IP以二进制格式进行存储,通过以下MySQL,我们可以将IP转译回来。
同时结合一些基本的规则,如:同一个访客多次访问、来源数据、转化数据等其他相关辅助性的指标,我们可以将可疑的IP过滤出来,从而为进一步判断该IP是否可疑提供参考。
SELECT referer_url as referer_url, visitor_count_visits as visits, inet_ntoa(conv(hex(location_ip), 16, 10)) as ip, conv(hex(idvisitor), 16, 10) as visitorId FROM piwik_log_visit where referer_url like “%baidu.com%” and visitor_count_visits >3 ORDER BY visitor_count_visits DESC
实际运用上来说,我们可以做一个简单的页面把去重的IP显示出来,然后将其(由于百度只有200个限额我们可以再处理成IP段)添加到屏蔽IP库即可。