威宁热线

威宁团菜到家

[技术分享] 百度统计后台出现垃圾广告词的原因和解决方法

[复制链接]
wn0857 发表于 2021-2-10 22:13:59 | 显示全部楼层 |阅读模式
最近登陆百度统计后台的时候,却发现百度统计出现很多别的行业词及其它网站,本来并没注意这个问题,但是发现统计数据中的很多搜索词都是违禁广告词,来源域名都是违规域名。第一时间就想,难道寻小山博客被黑了?

检查很多遍并没有发现网站被黑的问题,按照搜索词自己搜索发现也并不能搜索到我的网站。于是网上找了下资料,发现很多站长都出现了类似“百度统计流量来源出现广告”的问题,很多人并不知道百度统计出现了很多别人的域名怎么回事?下面说下百度统计流量来源出现广告关键词及域名的原因和解决方法:一、百度统计原理分析想了解百度统计流量来源出现异常的原因之前,我们先了解下百度统计的工作原理是什么?在安装百度统计工具到网站的时候,我们会要求网站必须嵌入一段JS代码:1、统计代码
  1. var _hmt = _hmt || [];(function() {var hm = document.(“script”);hm.src = “https://hm.baidu.com/hm.js?23e1c6643232082cffb3b7e1f2d1238f”;var s = document.getElementsByTagName(“script”)[0];s.parentNode.insertBefore(hm, s);})();
复制代码


去除掉多余的代码,得到最重要的一行
https://hm.baidu.com/hm.js?23e1c6643232082cffb3b7e1f2d1238f

即引入这个JS文件就能实现统计了,问题后边的32位字符串就是每个站点特有的统计ID2、hm.js加载该代码加载时,会往用户浏览器中写入名为“HMACCOUNT”的永久cookie,有效期至2038年,以此来区分用户身份。同时会获取客户端环境,包括浏览器版本,屏幕分辨率,色深,语言等信息。

发送请求,传递参数当获取到所有信息的时候,就可以向服务器提交请求了,将之前获取到的参数进行整合,并以这些参数为后缀请求hm.gif,大概是这样一个地址:
  1. https://hm.baidu.com/hm.gif?cc=1&ck=1&cl=24-bit&ds=267×570&vl=570&et=0&ja=0&ln=zh-cn&lo=0&lt=1602558481&rnd=1822260024&si=b9752bda752a59c2b79457ec6e36bcb6&su=https%3A%2F%2Fwww.seekhill.com%2Fsafe%2Fiossafe%2F&v=1.2.76&lv=3&sn=31210&r=0&ww=267&ct=!!&u=https%3A%2F%2Fwww.seekhill.com%2Fother%2Foriginal-article%2F&tt=%E7%BD%91%E7%BB%9C%E5%8E%9F%E5%88%9B%EF%BC%8C%E6%88%96%E8%AE%B8%E4%B8%8D%E5%86%8D%E4%B8%80%E6%96%87%E4%B8%8D%E5%80%BC%EF%BC%9F%20-%20%E5%AF%BB%E5%B0%8F%E5%B1%B14
复制代码

退出请求,传递参数退出页面时候,发出一次请求,并传递参数
完成访问,数据记录到百度统计实际模拟时,只需要前三次请求即可在访问记录中看到访客记录。

二、百度统计数据异常原因分析相信大家了解了百度统计的原理之后,应该知道这些流量来源可能并没有真正访问你的网站,而是借助一些“模拟访问网站”工具就可以给你的网站刷广告词和访问来源了,导致你的百度统计代码被恶意盗用了。

事实上,根据很多站长反馈,百度统计出现行业广告词及别人网站的原因就是一些不法分子利用脚本实现百度统计流量来源广告推送,从而想达到宣传违规广告的目的,比较这种广告推送成本特别低。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表