浅谈web分析
作者:佩瑛 来源:Taobao.com UI Team 发布时间:2008-12-02 15:52:00
记得很早以前看到过这样的一段介绍:
想象你在逛街边的一家书店,如果最终你没有购买任何图书就直接离开了,店长并不会知道你来过。但是如果你买了书,那么书店的员工就会知道他们卖出了一些商品(当然如果你在那里留了联系信息来预订另外一本书,他们就可以得到更多东西)。
回过头来,我们从信息收集的角度看看网站访问,那就是另外一个截然不同的世界了。无论你有没有买东西,在你访问站点时,总是会留下很多记录,通过收集这些访问者留下的大量数据,我们的网络专家就可以得到关于网站用户体验的很多结论。
从站点的记录中,可以知道你走过的每个通道、点击的每个链接、拿了哪些商品、收藏了哪些你感兴趣的话题等等。甚至知道你曾就搜索了哪些宝贝,网络广告推广商就会根据这些你感兴趣的商品,定向的给你投放一些“可能喜欢的宝贝”。
这就是最最简单的web分析概念了,那么我们进行web分析的最终动机又是什么?
你的客户需要什么?他并不需要“可用性”和“用户体验”本身,他真正需要的是实现他的目标,达到他的访问动机。
狭义地看,web分析是指分析网站访客的行为;广泛一点来说,web 分析是指评估、调整网站各个方面的运作,使其符合公司的商业目标。
换句话,web分析,最终动机并不是“报告”,也不是算计着如何向决策者们发送充满数据的垃圾邮件。它的真正目的是获得可行动的认识和度量。
Avinash Kaushik 在《Web Analytics: An Hour a Day》一书中,提到了单靠一些传统的web分析,有时会带来的YY般的数据报告,比如“退出最多的页面”、“访客屏幕分辨率”、“网站交互次数”等等,这些度量的一个共同点是,它们声称会说点什么,但几乎什么也没说明白。
可是反过来思考一下,基于日志数据的web分析真的就一无是处了么?答案当然是否定的。日志分析,依旧是web 分析的基石,他给我们提供的是最广泛的现象呈现,我们可以从中“知其然”。后面“知其所以然”的部分,就需要结合定性的分析研究来发现了。
那么我们能从日志中得到哪些基础数据呢?看看下面这个图,纵向的把收集到的数据进行分析并划分了几个层次,这个图也描述了一个目前很广泛使用的基于日志的统计分析步骤:日志文件->PV->会话->使用者->客户->忠实客户,我们可以明显地看出,金字塔越上层的数据就越具有商业价值。
对图中一些术语的解释:
命中(Hit)和请求是同一术语。为了获得服务器上的一个资源(可以是文本、图像或任何可以被包含在页面内的元素),浏览器和它连接的服务器之间进行的一次单一连接。日志文件中一条记录就是一个请求。
访问数(Visit)和用户会话是同一术语。从CNNIC对这个术语的定义看,没有详细定义什么算是Visit,什么算是Loss,目前,一个Visit必须至少完整下载一个页面到客户端,如果没有完全下载就被用户关闭窗口即结束请求,那么是一个Loss,而不是一个Visit或称Session。一般的度量方法:访问者在20分钟内与网站有交互活动则被认为是同一次进入网站,不记录新的用户会话数;当访问者持续20分钟与网站没有交互活动,当他再次访问网站时访问者被认为再一次进入了网站,记录新的用户会话数。


猜你喜欢
- 本文详细介绍了网站的反爬虫策略,在这里把我写爬虫以来遇到的各种反爬虫策略和应对的方法总结一下。从功能上来讲,爬虫一般分为数据采集,处理,储存
- 单神经元引论对于如花,大美,小明三个因素是如何影响小强这个因素的。这里用到的是多元的线性回归,比较基础from numpy import a
- 通过ip2region解析IP获得地域信息目标,从给的读取给的ip地址文件解析出ip地域名并输出CSV文件,我选用的是开源ip2region
- 如下:数据文件:上海机场 (sh600009)24.113.58东风汽车 (sh600006)74.251.74中国国贸 (sh600007
- Pandas Shift函数基础在使用Pandas的过程中,有时会遇到shift函数,今天就一起来彻底学习下。先来看看帮助文档是怎么说的:&
- 正文开始if name == "main":可以看成是python程序的入口,就像java中的main()方法,但不完全
- 朴素贝叶斯估计朴素贝叶斯是基于贝叶斯定理与特征条件独立分布假设的分类方法。首先根据特征条件独立的假设学习输入/输出的联合概率分布,然后基于此
- 可能很多人遇到过这个错误,当使用setup.py安装python2.7图像处理模块PIL时,python默认会寻找电脑上以安装的vs2008
- 数组元素两两相加count = 0c2 = []for i in range(len(c)): if count
- 前言分享一下最近在学习Django过程中,遇到和解决的一些有趣的方法和问题一、Django是什么?Django也不用在过多的去介绍了。使用p
- 和大多数的语言脚本一样,学习ASP最好的方法就是亲身尝试ASP,使用你自己的系统安装PWS或者IIS。你可以边学习边在你自己的服务器上测试A
- 概述map是基于key-value键值对的无序的集合Go语言中的map是引用类型必须初始化才能使用。语法声明和初始化配合make使用,否则是
- 本文介绍了详解Python实现多进程异步事件驱动引擎,分享给大家,具体如下:多进程异步事件驱动逻辑逻辑code# -*- coding: u
- 2.1数据的爬取代码:import pandas as pddata=pd.read_csv("example_data.csv&
- 引子之前clubot使用的pyxmpp2的默认mainloop也就是一个poll的主循环,但是clubot上线后资源占用非常厉害,使用str
- 1. 数据抽取的概念2. 数据的分类3. JSON数据概述及解析3.1 JSON数据格式3.2 解析库jsonjson模块是Python内置
- 前言??在vue项目中我们常常需要用到computed和watch,那么我们究竟在什么场景下使用computed和watch呢?他们之间又有
- CSS中最常用的布局类属性,一个是Float(CSS浮动属性Float详解),另一个就是CSS定位属性Position。1. positio
- 内容摘要:本文介绍了使用js来实现下拉伸缩导航菜单的功能,并带有渐显的效果,值得收藏。正好这几天公司不忙,学校又没有事情,所以想抽空架一个个
- 1.删除Git本地仓库删除Git本地仓库的根本原理是删除“Git本地仓库”里面的根目录下面的隐藏文件夹“.git”(1)方法1:自己手动删除