用户分类浅谈
作者:浩峰 来源:Tencent CDC Blog 发布时间:2009-09-27 12:14:00
说到网络产品,离不开的话题就是用户,就像传统行业的消费者。人是复杂的,网民的用户行为更加复杂,用户和用户是不一样的,或者说,每个用户都不一样。一款成功的互联网产品往往并没有满足所有用户的需求,而是准确定位了某一类用户并且很好地满足了那类用户的需求。到底定位哪一类用户是我们需要考虑的,所以就需要用户分类。
不分类不好定位, 好的用户分类让我知道了我在追求哪些人,满足哪些人,影响哪些人。但分不好类又会错位,更糟,那怎样才能对某一款产品的用户群进行合理分类呢,下面就来谈谈我对用户分类的一些看法。
一般提到某一款产品有几类用户可能主要包括以下几种情况:高端和低端用户、学生用户和白领用户、一二线城市和三四线城市用户、活跃和不活跃用户、会员与非会员用户、红钻与非红钻用户、IT和非IT用户、初级用户、普通用户、高级用户等,以上这些用户分类的共同特征是从一个维度或者二个维度对用户进行划分,就比如cooper的《About face 2.0》中提到从两个用户分类指标:业务领域水平(domain knowledge)和计算机技能水平,从而把用户划分为初级用户、普通用户、高级用户,更简化地说这种方法的用户分类模式就是基于操作频率,这个分类方法可以套用在任何一款产品上,但是这种用户分类的实际应用效果如何呢?
先来说下如何判断某一款产品的用户分类效果如何,主要从两个角度进行判断:分类的信度和效度,也就是分类的准确性和精确性。分类的准确性是指分完类后,是不是现实中每一个用户都能定位到反映该用户的类别,也就是说任何一个用户都能给他贴上属于某个类别的标签;而分类的精确性是指得到的用户类别在多大程度上反映了实际用户所包含的属性含义,也就是说用来描述各类别用户的特征信息与实际用户所有属性的吻合程度。在实际分类中准确性和精确性往往不能同时达到完美,当你追求100%的准确性时精度肯定会下降,比如只用性别去划分用户,准确度很高但是精度不够,所以在实际用户分类时找到准确性和精确性的一个平衡点,达到自己分类目的即可。
又回到前面提到的把用户划分为初级用户、普通用户、高级用户,这种划分的方法是准确性很高,但是精确度不够,每一个用户都能根据实际情况判断为初级用户、普通用户还是高级用户,但是描述用户的特征信息很少只有操作频率和计算机技能水平两个维度。这是很不精确的,在实际情况中,用户的特征信息是包含很多,用户间任何一个特征因素不同都会导致不同用户使用某个产品的行为习惯偏好等的不同。比如用户的年龄、性别、学历、收入水平、计算机水平、职业、地域、网龄以及使用某个产品的目标等因素都会导致不同用户不同的使用习惯和偏好。所以在用户分类时需要从多个维度的特征因素去考虑如何划分用户。实际又该如何操作呢?
首先考虑对某个产品进行用户分类时需要哪些特征因素,也就是从哪几个维度去划分用户。一般会从以下几个维度去考虑:用户的人口学信息,用户的计算机背景(包括用户的互联网使用背景),上网地点,收入水平,职业,地域,用户对于该产品的一些使用经验和偏好,使用过哪些同类产品,使用的目的是什么,认为哪款最好用,影响选择某款产品的因素有哪些,通过哪种途径得知的,使用产品的态度,使用产品的具体行为等因素。那具体到某个产品时应该选择哪几个因素去划分用户呢,解决的方法是先把所有维度都列出来,然后针对这些维度进行用户访谈,通过访谈能够得到大概的用户间的共同点和不同点。然后把所有因素转化成问卷题目,通过科学抽样的问卷调查得到用户调查数据。对这些用户数据进性行聚类分析即可得到您所需要的用户分类。用户聚类需要注意哪些呢?
聚类分析中有很多因素影响着最后的用户分类结果,影响较大的因素有:聚类方法选择,距离算法选择,聚类变量选择,用户类数选择。对于聚类方法和距离选择,我倾向于推荐选择两步聚类法和对数似然值距离算法,因为用户的人口学特征和使用某产品行为偏好等特征一般都是分类变量,用欧氏距离算法的话,它的距离公式所表示的含义很难用实际意义去描述,或者说它的距离值在现实中是没有实际意思的。聚类变量的话可以选择访谈得到差别较大的特征因素,但是这些变量之间也是有关系的,具体还要通过不断的尝试去调整,主要看去掉某个变量后聚类结果是否有大得差异,如果有该变量则为重要变量,用户类数确定可以结合实际聚类得到的描述性判断因素和访谈等得到的实际情况共同确定。
怎么对用户分类,细分到何等程度,不太会有一个模式或者方法来通用。所以涉及到某个具体产品的用户分类时,首先明确你得分类目的,分完类之后你需要面怎么利用这些类。当能够从用户分类中得到明确的产品用户群和产品定位时,说明该分类就基本有效了。


猜你喜欢
- pandas将表中的字符串转成数值型在用pd.read_csv读数据时,将要转换数据类型的列名和类型名构成字典,传给dtypeimport
- 点击按钮,出现半透明遮罩层弹框,说说自己之前发过的愁吧1、遮罩层半透明了 弹框也跟着半透明了 就像这样 绝望吧 是哪里错了呢?你的
- matlab图像滤波详解(二维傅里叶滤波)在matlab中,图像滤波有很多中比如平滑滤波(smooth()函数)中值滤波medfilt2()
- views,中设置请求的类型class LawDetailView(View): def get(self, request, law_id
- 一定要注重代码规范,按照平时的代码管理,可以将Python代码规范检测分为两种:静态本地检测:可以借助静态检查工具,比如:Flake8,Py
- golang并没有像C语言一样提供三元表达式。三元表达式的好处是可以用一行代码解决原本需要多行代码才能完成的功能,让冗长的代码瞬间变得简洁。
- 最近在做新闻发布系统的时候,用到了二级联动,我把使用方法记录下来,以便日后查阅以及帮助新手朋友们。下面是效果图:下面来讲解一下实现的方法:1
- python嵌套函数使用外部函数变量的方法,Python2和Python3均可使用python3 def b(): b = 1 def bc
- 这两天在搞Theano,要把mat文件转成pickle格式载入Python。Matlab是把一维数组当做n*1的矩阵的,但Numpy里还是有
- <%@LANGUAGE="xxx" CODEPAGE="936"%>一般又分为<%
- 在for循环中是否需要缓存length值,相信很多程序猿们都纠结过此问题,下面就这一问题的分析请看下文:在JS性能优化中,有一个常见的小优化
- 主题众所周知,django.forms极其强大,不少的框架也借鉴了这个模式,如Scrapy。在表单验证时,django.forms是一绝,也
- 一、内容简介本篇文章着重结合源码版本V3.2.20介绍Reactive和Ref。前置技能需要了解Proxy对象的工作机制,以下贴出的源码均在
- 本文实例讲述了PHP使用自定义key实现对数据加密解密的方法。分享给大家供大家参考,具体如下:客户端和服务端通信时,有个场景很常见,通过一个
- 什么是索引?哪些数据类型里有索引的概念? —> 字符串、列表、元组从最左边记录的位置开始就是索引索引用数字表示,起
- 对于现在很多工业检测,特别是对一些精密的器件进行筛选,往往都是像素级别的,十分的精确。主要思想将图像转化为二值图像在对图像进行腐蚀/膨胀处理
- 标题比较麻烦,都有些叙述不清;昨天下午在调试接口框架的时候,遇到了一个问题是这样的:使用python 写了一个函数,return 了两个返回
- 如下所示:>>> import pandas as pd>>> import numpy as np#
- 【OpenCV】⚠️高手勿入! 半小时学会基本操作 ⚠️ 概述模板概述OpenCV 是一个跨平台的计算机视觉库, 支持多语言, 功能强大.
- 字典是Python语言中唯一的映射类型。映射类型对象里哈希值(键,key)和指向的对象(值,value)是一对多的的关系,通常被认为是可变的