译者:shanmay
原文:http://www.useit.com/alertbox/20040719.html
How Many Users?
对于绝大多数可用性研究,我推荐使用5个测试者,因为他们可以提供足够多的数据来告诉你绝大多数的信息。但是对于卡片分类法,使用5个测试者,却仅仅只能提供75%的正确率。当然这是不够的。
你必须测试15个测试者来达到一个90%的正确率,这样就基本上可以停止继续测试了。在15个测试者之后,正确率的上升趋势将减慢,比方说,30个测试者,也仅仅只能提供95%的正确率,当然,正确率越大肯定越好。但是,一般来说不值得花双倍的钱来做这样一件事情。对于大于30个测试者的实验,就几乎不会再有更好的效果了。你既使用60位测试者,也只能再达到98%的正确率,这无疑是一种时间与精力的浪费。.
Tullis and Wood 根据他们的数据,推荐使用20-30个测试者。而我的建议是,使用15位测试者即可。
为什么我要建议使用相对少一些的测试者呢?因为我认为,90%的正确率又或者93%的正确率对于实际目标来讲是足够了的。当然,如果你们公司有一个很大型的项目,以及充裕的资金,我也绝对相信使用30位测试者带来95%的正确率是非常好的。但是,一般的项目都不会在用户研究方面投入大量的资源,所以,15位测试者是相对较好的选择。
同时,我并不推荐信息构架的建立仅仅以卡片分类的相关数为基础。当要决定具体的信息导向时,你需要依靠更多的是在测试环节中你所能得到的有用信息。比如说,大部分的价值是来自于在用户分类卡片时,他们的评论。这样,你就可以了解为什么用户将卡片如此分类,从而更深入的了解他们头脑中的模型实例。
Why More Users for Card Sorting?
我们已经知道对于用户研究环节,5位测试者就已经足够了。那么为什么我们在卡片分类时需要3倍多的测试者来达到预想中的高度呢?因为用户测试与卡片分类有两点本质的区别:
用户测试是一个评估的方法:我们已经拥有一种设计,我们需要测试,是因为我们希望了解,这个设计是否符合人类习惯与用户需求。虽然用户在他们的动手能力上是不同的,如果某一个设计元素导致了使用上的问题,那么我们通过测试几个用户行为就可以发现了。一个低端的用户比一个高端的用户可能需要碰到更麻烦的困难,但是困难的幅度并不会成为我们考虑的问题。我们只需要了解到,这个设计元素是有问题的,是不能很好的符合用户习惯的,那么我们就改变这个元素即可。
卡片分类是一个用户生成的方法:我们并没有一个完整的设计,我们的目标是通过卡片分类来了解用户对于某一些元素是怎么思考的。而这个过程的随意性就很大,因为不同的用户心中的产品原型都是不同的,并且他们对于同一种概念的描述也都是不同的。我们需要通过一定量的用户来收集数据,以达到一个稳定的用户偏好的结构。然后才能知道应该如何调整用户提供的不同模型的差异。
如果你已经拥有一个站点或者局域网,那么测试一部分用户就可以告诉你他们在那个结构上有使用上的困难。如果要重新组织一个结构,那么你需要更多的用户。
幸运的是,你可以将两种方法合并使用:首先,使用用户生成的方法去指引你的设计。然后,画一个设计的草图,最好是使用纸面原型,接着通过用户评估来完善设计。以为用户评估是最快并且费用最少的做法,你可以反复实验多次。他们也是基于你作品的最初设计的质量保证。这就可以解释为什么你不需要浪费大量资源而专注于那最后2%的正确率。你将在并行的用户测试中发现一些小的错误,这样比你扩大卡片分类的人数,可要便宜很多。
最新評論