1. 研究现状和研究背景
1.1. 研究现状
根据中华人民共和国工业和信息化部发布的《2022年软件和信息技术服务业统计公报》,2022年,软件产品收入26,583亿元,同比增长9.9%,增速较上年同期回落2.4个百分点,占全行业收入比重为24.6%。其中,工业软件产品实现收入2407亿元,同比增长14.3%,高出全行业整体水平3.1个百分点。在工业软件当中,三维设计软件作为一种新兴的计算机辅助设计手段,不仅在提高工程设计的效率和水平上发挥着积极作用 [1] ,而且还在在线汽车房产销售、三维动画、电商、自媒体、游戏等新兴行业被广泛应用。房天下CEO刘坚在《国际品牌观察》对其的专访中表示,“VR看房在疫情期间成为了购房者和租房者的主要途径,使用VR看房用户能够对房子的空间和动线了解更清楚,看房体验得到显著提升” [2] 。三维动画行业对于三维设计软件的研究也不断加深。栗世尧等对CINEMA 4D软件、3D Max软件和Blender软件在工业仿真动画中的应用进行了说明,详细论述了这些三维设计软件在工业三维动画制作中的优点和作用 [3] 。周寰、滕芳论述了将Cinema 4D三维软件引入电商设计中的众多优势,认为将“Cinema 4D引入电商广告设计中,节约了大量的成本,提高了广告制作的效率”并且“使电商设计师能够更加专注于广告本身的艺术化表达”,从而“更能创作出更加具有空间感、带入感的广告作品” [4] 。近年来自媒体行业与UGC产品的兴起,也使得三维设计软件从专业的领域普及到普通用户层面,越来越多个人使用者接触到三维设计软件利用其进行创作,所以市场上对于三维设计软件的需求也日益旺盛。
1.2. 研究背景
目前,国内使用三维设计软件辅助生产设计时遇到的普遍性问题主要有以下几个:1) 目前市面上常用的三维设计软件均是由国外工作室开发,获取正版授权的费用较高,且由于软件汉化不彻底的问题,对于国内使用者来说仍然不方便;2) 而且三维设计软件对电脑配置要求较高,尤其是渲染时效率与精度不兼容问题;3) 三维设计软件操作复杂,使用繁琐,需要使用者投入大量的学习和理解成本才能熟练运用。这也是三维设计软件无法真正在大众中普及和限制其自身发展的主要原因 [1] 。
笔者参与A公司的“基于WebGL的图形引擎”项目正是基于以上背景和问题、以功能强大且操作简单易上手为目标进行开发设计的一款三维设计软件。WebGL技术解决了三维设计软件对配置要求较高(WebGL利用底层的图形硬件加速功能进行图形渲染,促使Web开发人员借助系统显卡来在浏览器里更流畅地展示三维场景和模型,同时还能创建复杂的导航和数据视觉化) [5] 、安装使用困难的痛点,只需要一个链接便可以在任何浏览器上进行三维设计;而在进行软件的体验设计时,重视界面设计的合理性、简洁性和易操作性,运用科学的分析评估方法设计出适合普通用户的方案,解决了三维设计软件上手难、学习成本高的最大痛点。
本文通过选取软件开发过程当中保留的操作主界面的A/B两个方案,利用眼动追踪技术对使用其的被试进行眼动数据监控,分析数据后对A、B两个方案进行评估和分析,从界面布局、界面设计、交互设计、使用效率和整体满意度几个方面综合分析与评估A、B两个方案的优缺点,以此确定软件的主操作界面的设计方案。
2. 研究方法概述
认知负荷理论认为,每完成一项任务都需要运用心理资源,但是人的心理资源的总量是有限的。只要同时进行的两项或多项任务所需要的资源之和不超过人的心理资源的总量,那么,同时操作这两项任务就是可能的;反之则完成困难甚至无法完成 [6] 。在人机交互界面当中,界面的复杂度越高,用户处理信息时消耗的认知资源就越多 [7] ,如果加工信息所需要的认知资源超过了人本身所具有的认知资源的总量,就会造成认知超负荷(cognitive overload),从而影响操作的效果和效率 [8] 。复杂的界面信息和操作会增加用户对于信息的处理时间,反映在眼动数据指标上就是注视点数和注视时长会增加 [7] 。因此眼动数据能够直观地展示软件的视觉设计、交互设计、流程设计等是否合理,甚至根据数据反馈反过来指导并改进设计。
眼动追踪是指度量凝视点或者测量眼球运动的过程,它通过眼动追踪监视器记录每只眼睛的运动和在可视点上最活跃的区域。利用眼动跟踪仪器,可将用户对不同界面的使用参数(注视时间、注视频率、视觉轨迹、细节比较)进行测量和统计,通过量化的数据来测试界面的优劣发现界面中的问题。因此视觉认知(眼动跟踪)生理评估方法是非常有效的界面优劣评判方法 [9] 。近年来,眼动追踪技术作为一种有效的人因分析手段已被广泛应用于电子商务、广告、游戏、医学等行业。2008年,Harald Weinreuch等 [10] 针对企业网站或搜索引擎进行可用性测试,帮助网站在用户登录时就准确提供个性化的搜索界面,以此使流量投放更加精准。2014年,Sohye Lim [11] 采用眼动追踪方法研究了游戏玩家在游戏过程中对游戏GUI元素的视觉注意的性质,以检查它们对游戏玩家视觉注意力的影响,从而提高玩家在游戏界面的操作效率 [11] 。2018年,Jiang Mingyin、Liu Shenglin等通过客观测量、问卷调查和眼动追踪仪器收集数据(任务完成时间、瞳孔直径、瞳孔直径变化的平均斜率和主观评价),评估了重症监护呼吸机用户界面的人体工程学因素,为呼吸机的人体工程学改进提供了有价值的证据,并认为眼动追踪可以成为评估用户界面人体工程学的有前途的工具 [12] 。2020年,Melissa Emanuele等人 [13] 利用眼动追踪技术对机场航班信息显示系统(FIDS)的界面元素进行分析并优化了航班信息显示方式,有效提高了乘客的信息搜索效率。
本研究将眼动研究方法引入到软件界面的可用性评估中,与问卷调查,用户访谈等方法相结合,对三维设计软件的操作主界面进行研究。通过设定相同的任务,将被试分成两组,分析两组被试在操作A或B方案时的体验差异。通过对热点图、眼动轨迹图、注视点数量、注视时长等眼动数据进行分析,结合问卷及访谈结果,洞察用户使用感受,进而更好地对评价设计的可用性,设计出更好的方案。
3. 研究过程
3.1. 眼动指标选取
3.1.1. 注视点数量 [14]
注视点数量指用户在实验中注视点数之和,注视点数量与用户的搜索效率呈负相关,注视点数量的数量越多表示用户的搜索效率越低,界面布局越不合理。
3.1.2. 总注视时长
总注视时长由所有注视点注视时间相加得到,反映被试完成任务所花费的总时间,时长越长,用户完成任务的效率越低 [15] 。
3.1.3. 眼跳次数
眼跳也被称为扫视,眼跳次数也就是在实验中扫视的次数,眼跳次数与用户的搜索量呈正相关,眼跳次数越多表示用户的搜索量越大,界面设计问题越大。
3.1.4. 平均眼跳幅度
平均眼跳幅度即扫视的幅度,平均眼跳幅度越大,表明用户可以直接寻找到实验任务目标,界面设计合理;如果界面提供的线索不足或者线索具有误导性导致用户不能及时找到实验任务目标则眼跳幅度较小。本研究将平均眼跳幅度所表示的这种特性简称为“引导性”,平均眼跳幅度越大,界面的引导性越强,反之则越弱。
3.1.5. 兴趣区(AOI)注视率
兴趣区注视率表示兴趣区内的注视点数量占整个界面的注视点数量的比例,兴趣区注视率可以体现出兴趣区对被试的吸引力 [16] ;热力图是一种经过特殊处理的图片形式,是基于绝对注视时间长度创建的空间分布图,能够同时展示所有被试的视觉关注区域 [17] 。
3.2. 眼动实验设计
3.2.1. 被试
本次眼动实验人员共有32位大学生参与,其中均为本科或研究生学历,年龄分布在20~27岁,男生18人,女生14人,视力正常,满足设备要求标准。
由于三维设计软件是具有一定专业性的工具软件,为了保证实验能够准确收集被试对于界面操作的眼动数据,需排除:1. 被试无三维设计软件操作经验导致实验过程理解任务困难甚至无法完成任务;2. 被试对于三维设计软件的基础认知水平参差过大导致体验效果不客观两种情况。因此,被试在开始实验前需填写“对三维设计软件的认知问卷”。通过对认知问卷的综合统计,选定问卷得分在60~90分区间的被试为“具有一定三维软件认知基础的”且“对三维设计软件认知水平相近”的合格实验对象,最后从32名被试中筛选出了28名最为最终实验对象。其中男生17名,女生11名,且专业均与设计相关、均对三维设计软件有1年以上的接触时长。
3.2.2. 实验设备
设备采用Tobii Pro Glasses 2穿戴式眼动仪的Live View Package 50版本,设备采样率为50 Hz,通过Tobii官方软件Tobii Pro Glasses Controller (x64)进行数据采集,再将数据导入Tobii Pro Lab (x64)软件进行分析与导出。
3.2.3. 实验材料
材料是选取研发软件的主操作界面A/B两个方案,A/B方案所包含的功能完全相同,但是在界面设计和交互设计上有所差异。因此需要分析研究A/B方案的眼动数据,得出该软件主界面的优化意见并形成优化方案。
由于提供的A/B版本(表1、表2)是实验用demo (使用Figma绘制的可交互平面原型),并不是实际项目研发的软件,所以只还原了实验用的若干个功能,其余非实验相关功能并未在此实验A/B方案当中,即点击无反应的按钮即不属于本次实验相关功能。

Table 1. The interface status of each task in Plan A
表1. A方案各任务界面状态

Table 2. The interface status of each task in Plan B
表2. B方案各任务界面状态
3.3. 实验步骤
3.3.1. 实验预备阶段
a) 因为本实验需要将实验组和对照组的数据进行对比,为了数据的客观性,应该尽量保证两组被试对于三维设计软件认知基础(理解程度、操作水平等)相近似。实验前被试会填写对三维设计软件的认知评价问卷,选取认知分数相近似的(认知问卷分数在60~90分)被试进行实验。(排除对三维设计软件过于不熟悉导致操作效率低下和过于熟练操作效率过高的情况)
b) 主试将会在实验开始前向被试介绍实验用材料,并简单介绍实验的任务,要求被试了解并阅读任务后确定开始方可开始进行任务。
c) 将挑选过的被试通过抽签方式分成两组,一组使用A方案进行实验,另一组使用B方案进行实验。
d) 任务开始前需要配合被试调试好设备,并检查实验材料是否有误。
3.3.2. 实验进行阶段
a) 被试根据抽签结果对A或B方案进行操作,完成操作任务;被试需要按照任务流程依次完成,需前一个任务完成再进行下一个任务(demo设计为单线程操作,被试未完成上一个任务,下一个任务无法进行,点击无反应);
b) 任务过程中,被试需要依靠自己的经验和尝试来完成任务,可以思考和停顿,但是必须独立完成任务;
c) 眼动仪将记录任务过程中被试的眼动数据;
d) 任务结束后,被试需要填写问卷,针对刚刚对A或B方案的操作如实填写评价,主试收集并记录问卷数据。
3.3.3. 实验结束
所有被试都完成规定任务和量表评测,实验结束。
3.4. 实验任务
本次试验共有五个小任务(见表3),被试根据任务提示操作界面依次完成。其中任务一、二、三属于创建类任务,需要被试找到创建功能区并找到相应的创建对象;任务四、五属于对象面板的操作任务,需要找到对象面板并进行相应操作。在笔者参与开发的软件主操作界面中,“创建”、“对象操作”与“功能操作”是三个频率最高的操作行为,此次实验材料A/B方案中,“功能操作”的界面布局与交互设计等基本相同,主要是针对“创建”和“对象操作”的不同设计方案进行评估。
4. 实验结果与分析
4.1. 总注视时长分析
将被试在操作A、B方案完成预定的五个任务时的总注视时长进行分析统计,然后将A、B两组被试完成每个任务的注视时长进行SW正态性检验,结果表明数据组均符合正态性分布(任务一:P = 0.301 > 0.05;任务二:P = 0.078 > 0.05;任务三:P = 0.536 > 0.05;任务四:P = 0.616 > 0.05;任务五:P = 0.885 > 0.05),可以进行独立样本T检验。
独立样本T检验的结果显示A、B两组被试在操作界面时,任务一(P = 0.001 < 0.05)、任务二(P = 0 < 0.05)、任务四(P = 0 < 0.05)、任务五(P = 0.007 < 0.05)的注视总时长数据均具有显著差异,而在完成任务三(P = 0.056 > 0.05)时的注视总时长不具有显著差异(见表4)。

Table 4. Total duration of fixation in AOI
表4. 兴趣区总注视时长分析
注视时间总和反映被试完成任务所花费的总时间,与用户完成任务的效率呈正相关。鲁道夫·阿恩海姆在《艺术与视知觉》中提到,人眼受限于生理构造而必须按照有意或无意的流动顺序、有规律的来进行运动并感知外部世界 [18] 。李湘媛 [19] 在前人研究的基础上,将视觉流程分为单向视觉流程、复向视觉流程、导向视觉流程、焦点视觉流程和散点视觉流程五种,其中单向视觉流程、导向视觉流程的布局视点之间排布的逻辑性最优,视觉流动性最好(图1),其次是复向视觉流程、焦点视觉流程,而散点视觉流程的情况相对较差 [20] 。

Figure 1. The relationship between visual flow and fluidity
图1. 视觉流程与流动性的关系①
结合A、B方案的界面布局和被试实验结束后的体验调研问卷可知,A方案“创建功能区”的按钮呈两列左右依次向下排列,寻找特定功能按钮时视觉流程呈“之字形”分布,相对于B方案的“纵向”排列创建按钮,被试需要反复搜寻多次才能找到目标按钮。因此,A方案被试在完成各任务时总注视时长整体长于B方案,除任务三的注视时长不具显著差异,其余任务操作时的注视时长均多于B方案且具有显著差异。据此可以得出结论:在三维设计软件的创建功能区域,对于创建功能按钮的排布应尽量呈单向、导向视觉流程分布,以提高用户的搜索和操作效率。
4.2. 注视点数分析
将被试在操作A、B方案完成预定的五个任务时的注视点数进行分析统计,然后将A、B两组被试完成每个任务的注视点数进行SW正态性检验,结果表明数据组均符合正态性分布(任务一:P = 0.137 > 0.05;任务二:P = 0.532 > 0.05;任务三:P = 0.235 > 0.05;任务四:P = 0.135 > 0.05;任务五:P = 0.487 > 0.05),可以进行独立样本T检验。
独立样本T检验的结果显示A、B两组被试在操作界面时,任务一(P = 0.005 < 0.05)、任务二(P = 0.010 < 0.05)、任务三(P = 0.037 < 0.05)的注视点数数据均具有显著差异,而在完成任务四(P = 0.086 > 0.05)、任务五(P = 0.593 > 0.05)时的注视点数不具有显著差异(见表5)。

Table 5. Number of fixations in AOI
表5. 兴趣区注视点数分析
注视点数量与用户的搜索效率呈负相关,注视点数量的数量越多表示用户的搜索效率越低。结合A、B方案界面和被试实验结束后的体验调研问卷,得知在完成任务一、任务二、任务三时,两方案被试的注视点数具有显著差异的原因是:被试无法在没有文字提示的情况下第一时间分辨创建功能区“线形”“基本体”“异面体”“钢笔”几个logo的含义,导致需要花费更多时间去理解图标含义和进行试错理解。因此,在三维设计软件主操作界面的功能logo都应该辅助文字信息提示,用以降低用户的理解成本,提高操作效率。
4.3. 眼跳次数分析
将被试在操作A、B方案完成预定的五个任务时的眼跳次数进行分析统计,然后将A、B两组被试完成每个任务的眼跳次数进行SW正态性检验,结果表明数据组均符合正态性分布(任务一:P = 0.581 > 0.05;任务二:P = 0.125 > 0.05;任务三:P = 0.555 > 0.05;任务四:P = 0.086 > 0.05;任务五:P = 0.111 > 0.05),可以进行独立样本T检验。
独立样本T检验的结果显示A、B两组被试在操作界面时,任务一(P = 0.002 < 0.05)、任务二(P = 0.001 < 0.05)、任务三(P = 0.013 < 0.05)、任务四(P = 0 < 0.05)的眼跳次数数据均具有显著差异,而在完成任务五(P = 0.593 > 0.05)时的眼跳次数数据不具有显著差异(见表6)。
美国认知心理学家乔治·A·米勒认为,人对单维刺激变量的绝对判断,有一个“明显而确定的界限” [21] ,这个界限称之谓绝对判断广度,而人在单维判断的广度通常在七左右,即大多数人类只能同时处理加工和记忆5~9种(数字7上下浮动2)左右的信息 [22] 。在方案A的创建功能区域共有“线形”、“基本体”、“异面体”、“钢笔”4个创建分类,其下的子功能数分别是11个、7个、5个、0个。A方案的创建“线形”分类下的子功能数较多且大于9个,超过了人在处理同一区域内的单维变量时的“绝对判断广度”,并且在切换到“基本体”、“异面体”等其它功能分类时,其子功能均展示在同一区域,被试在快速切换功能选项时同一区域所要处理的变量甚至等于两个分类的子功能数之和。加之前文提到的该区域按钮布局属于复向视觉流,流动性较差的原因,反映在眼动数据上就是A方案被试的眼跳次数在前4个任务中都远多于B方案,且具有显著差异。因此,对于三维设计软件的创建功能区的子功能按钮,应该:一、将子功能按照功能相似性进行分类,“把输入的刺激同时编为不同的维度和连续组成一系列组块,就能打破或至少扩展用户对信息量的局限” [21] ,从而减少决策次数,提高操作效率。二、不同子功能按钮尽量不要在同一区域显示,并尽量保持7 ± 2个的数量范围。
4.4. 平均眼跳幅度分析
将被试在操作A、B方案完成预定的五个任务时的平均眼跳幅度进行分析统计,然后将A、B两组被试完成每个任务的平均眼跳幅度进行SW正态性检验,结果表明数据组均符合正态性分布(任务一:P = 0.479 > 0.05;任务二:P = 0.476 > 0.05;任务三:P = 0.086 > 0.05;任务四:P = 0.065 > 0.05;任务五:P = 0.629 > 0.05),可以进行独立样本T检验。
独立样本T检验的结果显示A、B两组被试在操作界面时,任务一(P = 0.001 < 0.05)、任务四(P = 0.047 < 0.05)的平均眼跳幅度数据均具有显著差异,而在完成任务二(P = 0.209 > 0.05)、任务三(P = 0.097 < 0.05)、任务五(P = 0.926 < 0.05)时的平均眼跳幅度数据不具有显著差异(见表7)。
平均眼跳幅度的大小与界面的引导性强弱呈负相关。对比A、B方案的界面布局,发现B方案在创建功能icon下方都标示了文字,且当用户将鼠标悬停在对应的功能按钮上时,会有“hover”的状态以区别于其它同类按钮,给操作者以实时反馈;而A方案则无悬停状态,只有选中和非选中两种反馈状态,在用户搜索功能时无法起到及时提示的作用。此外,A方案在任务四的“对象面板操作”环节,由于创建功能按钮与对象面板共用一个区域,两部分内容无法同时显示,导致用户花费了较多时间来回寻找切换显示对象面板的按钮。
由此可以得出,在三维设计软件的功能区域和按钮应当考虑“反馈设计”。Jakob Nielsen认为系统应该在适当的时间内做出适当的反馈,让用户知道系统的当前状态 [23] 。在三维设计软件的操作主界面,每个功能按钮和区域都应该有与用户的具体操作行为相对应的反馈状态显示,即满足“系统可见性”原则。

Table 7. Average amplitude of saccades
表7. 平均眼跳幅度分析
4.5. 兴趣区注视率分析
兴趣区注视率表示兴趣区内的注视点数量占整个界面的注视点数量的比例。笔者依据本次任务所涉及的功能区域预先将A、B方案的兴趣区划分出来,然后利用眼动设备对A、B方案的兴趣区注视点数和整体区域注视点数分别进行分析导出。结果显示A方案的兴趣区注视率约为56% (保留小数点后两位),B方案兴趣区注视率约为77%,即B方案的兴趣区吸引力高于A方案(见表8)。

Table 8. Area of interest fixation rate scheme analysis
表8. 兴趣区注视率分析
结合界面分析可知,被试在完成A方案时注意力经常会被顶部的功能区吸引,而在此方案中该区域并不属于与任务相关的兴趣区;被试在操作B方案时注意力比较集中,因为此方案中兴趣区与任务操作的区域相近或一致。由此可知,在三维设计软件的主操作界面当中,操作频率较高的创建功能区可以放置在较显眼的顶部功能区,使用户能够在最易察觉的区域找到最频繁使用的功能。
5. 优化与验证
根据前文对三维设计软件主操作界面A、B方案的总注视时长、注视点数、眼跳次数、平均眼跳幅度、兴趣区注视率各指标分析,我们可以归纳出以下优化意见:
a) 在创建功能区域,功能按钮应当呈纵向视觉流排布;
b) 主操作界面的功能logo应该辅助文字信息提示;
c) 将相似功能进行分类,不同子功能的显示区域分开,单个区域内显示按钮保持在7 ± 2个最好;
d) 每个功能按钮和区域都应该有与用户的具体操作行为相对应的反馈状态;
e) 将操作频率较高的创建功能区放置在的顶部功能区,使用户能快速找到最频繁使用的功能。
依据以上的优化意见,结合A、B方案的优缺点和被试的主观调研问卷,对三维设计软件的主操作界面进行了再设计形成优化方案C (见表9),并再次使用Tobii Pro Glasses 2眼动仪对新一组近似认知水平的被试进行眼动数据收集和分析。结果显示,优化方案C在总注视时长、注视点数、眼跳次数、平均眼跳幅度、兴趣区注视率的指标维度均优于A和B方案(见表10)。C方案在界面的功能上并未做任何修改,只从UI设计,交互设计的角度进行调整优化,但结果表明本次优化取得了较好的效果。

Table 10. Analysis of indicators by programme in the A/B/C plan
表10. A/B/C方案各指标分析(保留小数点后两位)
6. 结语
本次研究结果表明,眼动研究方法能够很好地应用到网页的优化设计中,通过眼动研究可以获取用户真实、客观的数据,对用户内部认知加工过程进行定量研究,弥补传统方法过于主观的缺点 [24] 。但是运用眼动追踪技术优化界面设计存在两个问题:一是眼动测试依赖大量的被试数据和准确的分析,这其中既需要大量的人力和精力组织实验 [15] ,也决定了其很难运用于复杂的、动态的界面交互设计评估;二是眼动测试过程当中数据的采集仍然不可避免地存在一定误差。例如本次实验用到的Tobii Pro Glasses 2眼动仪在眼动数据匹配Snapshot (参考图)时,虽然Tobii Pro Lab软件自带的强大算法可以快速辅助匹配,但是仍然存在匹配不准确或遗漏的情况,需要手动进行匹配标注。下一步的研究可以在挑选被试时进行精确筛选,尽量保持数据收集的有效性和减小误差;其次是可以考虑更加复杂的,甚至是三维与二维结合的界面交互操作研究。
注释
①图1来源:百度地图截图