聚类分析在用户分类中的应用许
什么是聚类分析?
聚类分析属于探索性的数据分析方法。通常,我们利用聚类分析将看似无序的对象进行分组、归类,以达到更好地理解研究对象的目的。聚类结果要求组内对象相似性较高,组间对象而是心灵相似性较低。在用户研究中,很多问题可以借助聚类分析来解决,比如,站的信息分类问题、页的点击行为关联性问题以及用户分类问题等等。其中,用户分类是最常见的情况。
聚类分析的基本过程是怎样的?
选择聚类变量聚类分析找出各类用户的重要特征聚类解释命名
选择聚类变量
在设计问卷的时候,我们会根据一定的假设,尽可能选取对产品使用行为有影响的变量,这些变量一般包含与产品密切相关的用户态度、观点、行为。但是,聚类分析过程对用于聚类的变量还有一定的要求:
这些变量在不同研究对象上的值具有明显差异;这些变量之间不能存在高度相关。因为,首先,用于聚类的变量数目不是越多越好,没有明显差异的变量对聚类没有起到实质意义,而且可能使结果产生偏差;其次,高度相关的变量相当于给这些变量进行了加权,等于放大了某方面因素对用户分类的作用。
识别合适的聚类变量的方法:
对变量做聚类分析,从聚得的各类中挑选出一个有代表性的变量;做主成份分析或因子分析,产生新的变量作为聚类变量。|| 聚类分析
相对于聚类前的准备工作,真正的执行过程显得异常简单。数据准备好后,丢到统计软件(通常是spss)里面跑一下,结果就出来了。
这里面遇到的一个问题是,把用户分成多少类合适?通常,可以结合几个标准综合判断:
看拐点(层次聚类会出来聚合系数图,如右图,一般选择拐点附近的几个类别)凭经验或产品特性判断(不同产品的用户差异性也不同)在逻辑上能够清楚地解释|| 找出各类用户的重要特征
确定一种分类方案之后,接下来,我们需要返回观察各类别用户在各个变量上的表现。根据差异检验的结果,五种味道我们以颜色区分出不同类用户在这项指标上的水平高低。如下图,红色代表远远高于平均水平,黄色代表平均水平,蓝色代表远远低于平均水平。其他变量以此类推。最后,我们会发现不同类别用户有别于其他类别用户的重要特征。
聚类解释命名
在理解和解释用户分类时,最好可以结合更多的数据,例如,人口统计学数据、功能偏好数据等等(如下图)最后,选取每一类别最明显的几个特征为其命名,就大功告成啦!
参考资料:
《社会统计分析方法spss软件应用》
女人腰酸腿疼是什原因小儿积食辨证与处理二手热风循环烘箱-
粤登革热疫情呈现下降态势 病例以散发为主
粤登革热疫情呈现下降态势 病例以散发为主中新社广州11月1日电(蔡敏婕)广东省疾病预防控制中心1日通报称,随着...[详细]
-
带患者出走医生:不知道为啥大家都关注我 很郁闷
带患者出走医生:不知道为啥大家都关注我 很郁闷杨绍雷向媒体展示家属签字的同意转院协议书2月4日,贵航贵阳...[详细]
-
添加剂再成舆论风口浪尖 肃清须“法不许即禁”
添加剂再成舆论风口浪尖 肃清须“法不许即禁”江苏卫视记者近日在南京市场暗访时,发现了一种名为“肉宝王...[详细]
-
轻生男子顺利凑齐90粒安眠药 多家医院违规开药
轻生男子顺利凑齐90粒安眠药 多家医院违规开药夜幕时分,一名失意男子紧紧握着90多粒安眠药,在街头徘徊许久,...[详细]
-
act课程培训价格_地址_电话
act课程培训价格_地址_电话课程介绍 学习笔记 我国县乡村三级综治中心覆盖...[详细]
-
阿拉善盟便宜做项目实施方案好的公司阿拉善盟分析报告_3879341
善盟便宜做项目实施方案好的公司,索取善盟可行性研究报告/节能评估报告/商业计划书/概念规划设计/投标书/项目...[详细]