用户分类浅谈

作者：浩峰　来源：Tencent CDC Blog　发布时间：2009-09-27 12:14:00　

标签：用户,分类,产品

说到网络产品，离不开的话题就是用户，就像传统行业的消费者。人是复杂的，网民的用户行为更加复杂，用户和用户是不一样的，或者说，每个用户都不一样。一款成功的互联网产品往往并没有满足所有用户的需求，而是准确定位了某一类用户并且很好地满足了那类用户的需求。到底定位哪一类用户是我们需要考虑的，所以就需要用户分类。

　　不分类不好定位, 好的用户分类让我知道了我在追求哪些人，满足哪些人，影响哪些人。但分不好类又会错位,更糟，那怎样才能对某一款产品的用户群进行合理分类呢，下面就来谈谈我对用户分类的一些看法。

一般提到某一款产品有几类用户可能主要包括以下几种情况：高端和低端用户、学生用户和白领用户、一二线城市和三四线城市用户、活跃和不活跃用户、会员与非会员用户、红钻与非红钻用户、IT和非IT用户、初级用户、普通用户、高级用户等，以上这些用户分类的共同特征是从一个维度或者二个维度对用户进行划分，就比如cooper的《About face 2.0》中提到从两个用户分类指标：业务领域水平（domain knowledge）和计算机技能水平，从而把用户划分为初级用户、普通用户、高级用户，更简化地说这种方法的用户分类模式就是基于操作频率，这个分类方法可以套用在任何一款产品上，但是这种用户分类的实际应用效果如何呢？

先来说下如何判断某一款产品的用户分类效果如何，主要从两个角度进行判断：分类的信度和效度，也就是分类的准确性和精确性。分类的准确性是指分完类后，是不是现实中每一个用户都能定位到反映该用户的类别，也就是说任何一个用户都能给他贴上属于某个类别的标签；而分类的精确性是指得到的用户类别在多大程度上反映了实际用户所包含的属性含义，也就是说用来描述各类别用户的特征信息与实际用户所有属性的吻合程度。在实际分类中准确性和精确性往往不能同时达到完美，当你追求100％的准确性时精度肯定会下降，比如只用性别去划分用户，准确度很高但是精度不够，所以在实际用户分类时找到准确性和精确性的一个平衡点，达到自己分类目的即可。

又回到前面提到的把用户划分为初级用户、普通用户、高级用户，这种划分的方法是准确性很高，但是精确度不够，每一个用户都能根据实际情况判断为初级用户、普通用户还是高级用户，但是描述用户的特征信息很少只有操作频率和计算机技能水平两个维度。这是很不精确的，在实际情况中，用户的特征信息是包含很多，用户间任何一个特征因素不同都会导致不同用户使用某个产品的行为习惯偏好等的不同。比如用户的年龄、性别、学历、收入水平、计算机水平、职业、地域、网龄以及使用某个产品的目标等因素都会导致不同用户不同的使用习惯和偏好。所以在用户分类时需要从多个维度的特征因素去考虑如何划分用户。实际又该如何操作呢？

首先考虑对某个产品进行用户分类时需要哪些特征因素，也就是从哪几个维度去划分用户。一般会从以下几个维度去考虑：用户的人口学信息，用户的计算机背景（包括用户的互联网使用背景），上网地点，收入水平，职业，地域，用户对于该产品的一些使用经验和偏好，使用过哪些同类产品，使用的目的是什么，认为哪款最好用，影响选择某款产品的因素有哪些，通过哪种途径得知的，使用产品的态度，使用产品的具体行为等因素。那具体到某个产品时应该选择哪几个因素去划分用户呢，解决的方法是先把所有维度都列出来，然后针对这些维度进行用户访谈，通过访谈能够得到大概的用户间的共同点和不同点。然后把所有因素转化成问卷题目，通过科学抽样的问卷调查得到用户调查数据。对这些用户数据进性行聚类分析即可得到您所需要的用户分类。用户聚类需要注意哪些呢？

聚类分析中有很多因素影响着最后的用户分类结果，影响较大的因素有：聚类方法选择，距离算法选择，聚类变量选择，用户类数选择。对于聚类方法和距离选择，我倾向于推荐选择两步聚类法和对数似然值距离算法，因为用户的人口学特征和使用某产品行为偏好等特征一般都是分类变量，用欧氏距离算法的话，它的距离公式所表示的含义很难用实际意义去描述，或者说它的距离值在现实中是没有实际意思的。聚类变量的话可以选择访谈得到差别较大的特征因素，但是这些变量之间也是有关系的，具体还要通过不断的尝试去调整，主要看去掉某个变量后聚类结果是否有大得差异，如果有该变量则为重要变量，用户类数确定可以结合实际聚类得到的描述性判断因素和访谈等得到的实际情况共同确定。

怎么对用户分类，细分到何等程度，不太会有一个模式或者方法来通用。所以涉及到某个具体产品的用户分类时，首先明确你得分类目的，分完类之后你需要面怎么利用这些类。当能够从用户分类中得到明确的产品用户群和产品定位时，说明该分类就基本有效了。

投稿

用户分类浅谈

猜你喜欢