浅谈CNZZ和百度统计流量数据差距很大的问题(有官方说法)

原创 明月SEO  2017-05-28 00:21  阅读 667 次

明月SEO在运营网站的时候发现:CNZZ和百度流量统计统计出来的数据相差接近一倍,约40%之多!同是行业内大数据分析工具,为何有如此大的数据分析结果的差异?实在是令人思考和怀疑。究竟是什么原因导致的呢?

我的第一反应是网站可能被刷了,但是百度统计能过滤掉被刷的流量,于是就亲自测试了一下网站刷流量。发现,百度统计并不能过滤到被刷的流量。所以也就排除了这个原因。

明月SEO继续对此问题,进入了一系列的调查研究和分析,其中包括技术大牛的说法和百度官方的说法等,对此问题的答案做一个汇总,方便大家了解。​

数据分析技术

1. 关键指标定义不同

不同统计软件对各种关键指标的技术定义不同,这是最直接导致数据差异的原因。例如,在百度统计中,当访客在未关闭浏览器的情况下30分钟内N次(N>1)进入您的网站,百度统计会视为1次访问,而很多其他统计软件会视为N次访问。由于30分钟访客的连续访问表示访客并没有意愿终止访问,因此百度统计会视为1次访问,以帮助您更加客观地分析访客行为。百度统计中所有指标的定义都从您的角度出发,尽最大可能保证定义的合理性,旨在客观的提供统计数据。

2.跟踪技术不同

(1)目前主要有两种跟踪方式。第一种基于COOKIE;另一种则基于IP+用户代理。两种方式各有优劣。

基于COOKIE的跟踪方式依赖于浏览器设置COOKIE,如果浏览器禁用了COOKIE,则相应的统计软件无法获取访问数据 ,但是基于COOKIE的跟踪方式可以排除蜘蛛程序等来源的点击量。

基于IP+用户代理的方式,一般是分析日志文件来获取数据,但无法排除蜘蛛程序等来源的点击量,通常会比基于COOKIE的跟踪方式获取的流量数据更高。

(2) 第一方COOKIE和第三方COOKIE:基于COOKIE跟踪技术的统计软件中,COOKIE本身也存在差异。 COOKIE分为第一方COOKIE和第三方COOKIE, 第三方COOKIE中的域信息设置为被访网站之外的网站,因此通常会遇到浏览器和安全软件的拦截;而百度统计使用的是第一方COOKIE,从而能够尽量获取更准确的数据。

(3)代码跟踪异常。跟踪代码添加问题,所有跟踪代码仅能够获取已安装代码的页面流量数据,如果各种监控代码所安装的页面范围存在差异,则获取的流量数据也会存在差异。

3.流量过滤规则的不同:

很多统计软件都提供了流量数据过滤设置功能,根据不同的过滤规则,各种统计软件最终获取的流量数据会存在差异。

浏览器设置:浏览器需要启用 JavaScript、图片和 COOKIE,优化助手才能获取相关数据,其他统计软件可能不受这些限制。

浏览器缓存:浏览器通常会缓存js文件:如果访问您网站的网民不手动去刷新一次页面,虽然百度统计的代码已经安装成功但网民的浏览器没有更新js文件,这样该更新后的js文件就不会被触发,从而不能统计到这类网民的点击。​​

部分来源的统计的支持方式:百度统计曾经不支持统计来自手机WAP的访问统计,故如有访客通过手机上网访问您的网站,百度统计将暂时缺失这部分数据。目前可能已经完善统计来源。

4.地域划分标准不统一

各统计软件采用的地域划分标准不一致。百度对IP地域的划分已经做到高精度更新,但众所周知,目前国际国内尚无权威的地域IP划分标准,且存在动态IP等情况,故可能导致您在查看流量分地域报告时存在数据差异。也有说是 时间差异:各种统计软件依赖的时间标准可能不一致,从而导致分时或分日的数据存在差异。

两种不同的数据统计的方式给大家提供两个不同的数据参考,建议大家对于不同的指标可以根据具体的情况来进行选择百度或CNZZ来进行分析。具体两种统计分析工具的各自的功能特性和优劣对比,请参考:CNZZ和百度统计两个流量分析工具哪个好?

本文地址:http://www.brightmoonseo.com/advanced/analysis/958.html
关注我们:请关注一下我们的微信公众号:扫描二维码,公众号:明月网络营销
版权声明:本文为原创文章,版权归 明月SEO 所有,欢迎分享本文,转载请保留出处!
西安网站制作

发表评论


表情