书名:《用户体验度量:收集、分析与呈现》
作者:Tom Tullis, Bill Albert
用户体验度量可以揭示用户和物件之间的交互,即可揭示出有效性、效率、满意度。
收集、分析和呈现用户体验度量的基本方法。
眼动追踪技术、情感计算技术等。
当设计一个可用性研究的时候,研究者必须清楚自己计划操控什么(自变量)和测量什么(因变量)。
了解数据对分析结果是至关重要的。
常见的描述性统计包括:
通常使用99%、95%、90%的置信区间,可以通过误差线来呈现置信区间。
比如,95%的置信区间可用如下公式计算:平均值 ± 1.96 * [ 标准差 / 样本量的平方根 ]
比较独立样本平均数的最简单的方法是使用置信区间的重叠情况来判断,其量化结果即:t 检查(Excel的TTEST函数)。
比较同一组参与者2次参与不同产品的体验的平均数时,应使用配对样本进行 t 检查。
比较两个以上的样本时,使用方差分析。
观察数据可视化后的样子。
用于分析称名数据和顺序数据。
比如卡方检查(Excel的CHITEST函数)。
采用哪种方法:
绩效和满意度并非总是相互关联。

非引导式的测试工具:
任务成功关注用户是否能使用产品完成任务。
任务时间关注用户能多快地使用产品完成任务。
分析手段:
错误关注用户完成任务的操作等的有效性。
分析手段:
效率关注用户完成任务所需的努力程度(包括认知上和身体上的)的大小。
分析手段:
易学性关注任一绩效度量如何随时间推移而变化。
需要多次收集易学性数据,每次收集被看做是一项施测(trial)。
分析手段:通过多次施测来检验一个任务上特定的绩效度量(如任务时间、操作步骤数或错误数)的变化情况。
可用性问题关注的是用户使用产品过程中的行为。
如何确保一致性和避免偏见方面尚没有好的办法,人们难以在何为可用性问题或者这个问题有多严重等方面达成共识。
偏差无法消除,可以归为以下几大类:
一般认为,通过前5个参与者的测试就会发现大多数或者80%的可用性问题。一般建议保持5-10个参与者。
自我报告数据可以提供有关用户对系统的认知及他们与系统交互方面的重要信息。
分析手段:
标准问卷SUS已被证明是相当有效且灵活的,及时只有8-10人的参与者时也是如此。
在许多针对具有相似任务的不同设计(比如Win XP和Win Me)而进行的可用性研究中,SUS被当做一种比较方法来使用。即针对同样的参与者,比较2种或多种不同设计的SUS分数谁更高些。
在线服务可以把网站评价结果与他们参考数据库中的大量网站进行比较,并呈现比较后的结果。
自发的言语表情可以为理解参与者使用产品时的情绪和心理状态提供很有价值的信息。
言语表情最有价值的度量方式是正面评价和负面评价的比值。
眼动数据可视化:
我们所关注的多个页面的特定区域被称为兴趣区,它的相关度量指标:
合并不同的度量以得到总体可用性得分的另一种备选方法是以图形的形式将度量结果呈现在一个概要性图表上,这种类型的图表被称为可用性记分卡。
图标的形式包括:条形图和折线图组合、雷达图,任务层面可以使用Harvey球表示各维度可用性度量。
Harvey球:
总结可用性数据时,可能有外部标准可用于比较的参照点,一般是预设的目标和专家级的(或最优的)绩效。
预设的目标的维度可以参考SUM设置的4个维度:任务完成、时间、准确度和满意度。专家绩效则尤其适用于时间数据。
最受欢迎的免费分析服务之一:谷歌分析。
一个好的A/B测试:
一般建议参与用户数量不少于15个比较合适,因为15个样本量得出的分类结果与全部用户的分类结果之间的相关系数达到0.90。
开放式卡片分类中,不指定组别的信息,而是靠用户自己去自定义组别并归类卡片;封闭式卡片分类中,会已经指定组别名称,用户仅作卡片的归类。
封闭式卡片分类不是很常用。一般是在一个开放式分类后紧跟着做一个或多个封闭式分类,并在封闭式分类中使用前面的开放式分类的得到的一个或多个组别结果,从而对这些组别结果是否合理进行验证。
开放式卡片分类数据的分析:
封闭式卡片分类数据的分析:
封闭式卡片分类数据的分析还有一种常用的方法是树测试:将建议的分类使用可交互的形式表现出来,一般是菜单的方式。指定一个任务(寻找某个选项),而用户可以通过逐级选择子菜单,直至寻找到该选项。在这个过程中统计出:任务成功数据、直线完成率(没有再返回过父菜单)、时间,来综合衡量分类的有效性。
树测试工具举例:C-Inspector、Optimal Workshop’s Treejack、PlainFrame、UserZoom Tree Testing。
此外,封闭式卡片分类数据也可以使用层级聚类法、多维标度分析法进行分析,方法同前,这样可以得到分类的直观信息。
可及性通常指残障人士如何有效地使用某一产品或功能。
得到最广泛认可的网站可及性指南是W3C的网页内容可及性指南(WCAG)第2版:
在对一个网站是否满足了这些标准进行量化分析时,有一种方法是评估网站上有多少页面没有满足这些指南中的某条或多条建议。
检测可及性的自动化工具有:Cynthia Says、Accessibility Valet Demonstrator、WebAIM’s WAVE tool、University of Toronto Web Accessibility Checker、TAW Web Accessibility Test。
有两类主要的ROI:
计算ROI虽然很有挑战性,但一般是可行的。一般需要将任务完成率的提升或总体满意度的提升等可用性指标换算成电话支持量的降低、销量的增加或客户忠诚度的提高等指标,并估算金额。