1. 引言
随着移动互联网的飞速发展,智能手机应用程序(APP)已成为我们日常生活中不可或缺的一部分。它们不仅重塑了信息传播和社交互动的方式,还极大地提升了工作效率和生活便利性。然而,对于老年人群体来说,智能手机的使用却并非易事。这一现象主要源于两个方面:首先,当前市场上的APP设计主要针对年轻用户,往往未能充分考虑到老年人的特殊需求;其次,老年人的生理素质普遍下降,包括视力、感知能力、肌肉控制能力和记忆能力等,这些因素均对智能手机的使用构成了障碍。为缓解老年人使用智能手机时的生理和心理障碍,促进他们更好地融入现代社会,享受科技带来的便利,对智能APP进行适老化设计显得尤为迫切。适老化设计应当成为移动互联网行业的重要发展方向,以确保技术进步惠及所有年龄段用户。
如何评价一款APP是否适合老年人使用?一款所谓为老年人开发的APP能在多大程度上满足老年人的需求,提高老年人的用户体验?与此相关的设计评价的相关研究仍有较大的探索空间。本研究结合层次分析法和模糊综合评价法,建立了一种APP的适老化设计评价方法,并且通过案例验证了评价方法的科学性、可行性,以期为APP的适老化设计实践提供参考。
2. 模糊层次分析法
层次分析法(Analytic Hierarchy Process, AHP)是一种层次权重决策方法,能够处理一些较为复杂而模糊的问题[1],层次分析法将复杂的决策问题拆解成各种影响因素,并且依据影响因素之间的关系构建具有多层次结构的指标体系,从而把一个复杂的大问题转换为若干个相对简单的小问题。它的优点是简便、实用,适用于难以完全定量分析的问题,缺点是较为依赖参与专家的主观判断,可能因此造成系统偏差[2]。
模糊综合评价(Fuzzy Comprehensive Evaluation Method)往往用于主观评价问题,将难以确定的模糊问题转化为定量问题,将定性问题转化为定量问题的数据量化评价方法[3]。采用模糊综合评价能够综合多个评价主体的判断,一定程度上弱化了主观因素可能带来的影响,尽可能减少最终结果与理论值的偏差。模糊综合评价充分整合各个层次所包含的信息,从而提高评价结果的科学性和有效性。
将两个方法结合使用的模糊层次分析法,在企业管理、资源配置、环境和生产决策等各种复杂问题的分析评价决策有着广泛的应用[4]-[6],许多数字产品设计评价研究并用层次分析法与模糊综合评价法,融合了定性分析与定量分析,得了较好的研究成果。
2.1. 基于模糊层次分析法的APP适老化设计评价流程
通过文献梳理和咨询专家等建立APP适老化设计评价指标层次结构,利用层次分析法确定指标权重,在评价阶段让权重介入模糊综合评价法的计算,得到评价结果。
1) 构建层次结构:首先确定决策目标,即APP的适老化设计评价,并系统梳理相关影响因素之间的层次关系,将其分解成若干个层次的具体评价指标,形成清晰的评价指标层次结构。
2) 构建判断矩阵:组织专家对所有指标进行两两比较,判断指标对APP适老化的重要程度,将两两比较的结果构成判断矩阵。
3) 计算权重和一致性检验:通过特定的矩阵运算,基于判断矩阵计算出各个指标的权重,即指标对APP适老化的重要程度,并进行一致性检验,以确保判断矩阵的合理性和可靠性。
4) 确定评语集合:以APP的适老化设计为评价目标,建立可能的评价结果的集合,例如“优秀、良好、一般、差”等。
5) 建立模糊综合评价矩阵:针对具体评价对象,组织专家基于评价指标打分,整理各个评价指标对于评价集的隶属度,从而建立模糊评价矩阵。
6) 计算评价结果:确定模糊算子,结合评价指标权重以及模糊评价矩阵,计算出评价向量,基于最大隶属度原则,对照评语集合得到最终评价结果。
2.2. 构建APP适老化设计评价指标体系
2.2.1. 评价指标的筛选
基于目的性、科学性、全面性、独立性、可行性原则,筛选评价指标以构建APP适老化设计的评价指标层次结构。重点参考与适老化交互设计领域的研究文献,以及我国现行的适老化相关标准性质文件《移动互联网应用(APP)适老化通用设计规范》[7],提取其中关于设计评价指标的关键词。在此基础上进行专家用户访谈获取相关意见和建议,受访者包括2位信息交互设计领域教授、5位交互设计领域设计师、5位老年用户,围绕APP的适老化设计深入交流,记录整理访谈内容并从中提取关键词要点。
基于文献的梳理和访谈内容,功能精简、界面直观是适老化数字产品的两大显著设计特征,操作简单便利、信息传达是适老化设计所关注的重点,在实际应用中安全性是不容忽视的基本要求。于是从以上5个方面对关键词分类整合,结合专家意见确定5个一级评价指标:功能简洁性、内容易读性、操作简易、交互便利性、安全性;将同分类下含义相近的关键词整合,精练表述,构成17个二级评价指标,形成APP适老化设计评价指标层次结构,如表1所示。
Table 1. The hierarchy of evaluation indicators for the aging design of APP
表1. APP适老化设计评价指标层次结构
目标 |
一级指标 |
二级指标 |
APP适老化设计 评价(A) |
功能简洁性(B1) |
基础功能完善(C1) |
人工服务到位(C2) |
无诱导类链接(C3) |
内容易读性(B2) |
图文清晰易读(C4) |
图形图案易于理解(C5) |
布局简洁直观(C6) |
APP适老化设计 评价(A) |
内容易读性(B2) |
信息架构逻辑合理(C7) |
美术风格合适(C8) |
操作简易性(B3) |
操作流程简化(C9) |
操作时间充足(C10) |
无弹窗或弹窗易于关闭(C11) |
交互便利性(B4) |
交互组件大小适当(C12) |
引导信息明确(C13) |
反馈信息明确(C14) |
交互方式多感官互补(C15) |
安全性(B5) |
容错性高(C16) |
合理使用个人信息(C17) |
2.2.2. 判断矩阵的构建
构建判断矩阵是层次分析法的核心。假设Y1~Yn是同属于上一层元素X下的子元素,构建判断矩阵,两两比较子元素之间的对于总体目标的重要程度,如表2所示。
Table 2. Judgment matrix example
表2. 判断矩阵示意
X |
Y1 |
Y2 |
∙∙∙ |
Yn |
Y1 |
Y11 |
Y12 |
∙∙∙ |
Y1n |
Y2 |
Y21 |
Y22 |
∙∙∙ |
Y2n |
∙∙∙ |
∙∙∙ |
∙∙∙ |
∙∙∙ |
∙∙∙ |
Yn |
Yn1 |
Yn2 |
∙∙∙ |
Ynn |
其中,矩阵中的元素
表示元素
相比于
的重要程度,反之
表示元素
相比于
的重要程度,其数值一般规定取
的倒数[1],即:
(1)
在两两比较中采用的标度法会对判断矩阵的构建产生重要影响。在层次分析法中,往往选择采用1~9点标度法,在保证判断合理性和区分度的同时计算也较为简便,如表3所示。
Table 3. Judgment matrix 1~9 point scaling method
表3. 判断矩阵1~9点标度法
标度 |
释义 |
1 |
两元素相比,两者同样重要 |
3 |
两元素相比,前者稍微重要 |
5 |
两元素相比,前者明显重要 |
7 |
两元素相比,前者强烈重要 |
9 |
两元素相比,前者绝对重要 |
2,4,6,8 |
重要程度介于相邻判断中间值 |
为保证判断矩阵的客观、准确,参与构建判断矩阵的志愿者包括交互设计研究者、适老化设计研究者、老年手机用户三个领域的人员共36名。其中8位老年手机用户志愿者难以独自完成判断矩阵,在其家人引导下完成。引导过程中仅作文本含义的解释和操作的指导,而尽量避免对老年人的判断的影响。
由于各个志愿者构建了各不相同的判断矩阵,本研究采用专门进行层次分析法计算的软件YAANP,输入所有志愿者的判断矩阵,在软件中通过合适的算法集结不同志愿者对同一指标集做的判断矩阵,形成最终用于计算权重的集结判断矩阵,如表4~9。
Table 4. Judgment matrix of level-1 index after aggregation
表4. 集结后的一级指标判断矩阵
A |
B1 |
B2 |
B3 |
B4 |
B5 |
B1 |
1.00 |
1.20 |
1.17 |
1.24 |
1.46 |
B2 |
0.84 |
1.00 |
0.98 |
1.04 |
1.22 |
B3 |
0.85 |
1.02 |
1.00 |
1.06 |
1.24 |
B4 |
0.81 |
0.97 |
0.95 |
1.00 |
1.18 |
B5 |
0.68 |
0.82 |
0.80 |
0.85 |
1.00 |
Table 5. Aggregated second-level index judgment matrix (functional simplicity)
表5. 集结后的二级指标判断矩阵(功能简洁性)
B1 |
C1 |
C2 |
C3 |
C1 |
1.00 |
1.44 |
1.10 |
C2 |
0.69 |
1.00 |
0.77 |
C3 |
0.91 |
1.31 |
1.00 |
Table 6. Aggregated second-level index judgment matrix (inner readability)
表6. 集结后的二级指标判断矩阵(内容易读性)
B2 |
C4 |
C5 |
C6 |
C7 |
C8 |
C4 |
1.00 |
0.85 |
1.07 |
1.48 |
2.37 |
C5 |
1.18 |
1.00 |
1.27 |
1.75 |
2.81 |
C6 |
0.93 |
0.79 |
1.00 |
1.38 |
2.21 |
C7 |
0.68 |
0.57 |
0.73 |
1.00 |
1.61 |
C8 |
0.42 |
0.36 |
0.45 |
0.62 |
1.00 |
Table 7. Aggregated second-level index judgment matrix (ease of operation)
表7. 集结后的二级指标判断矩阵(操作简易性)
B3 |
C9 |
C10 |
C11 |
C9 |
1.00 |
1.84 |
1.01 |
C10 |
0.54 |
1.00 |
0.55 |
C11 |
0.99 |
1.82 |
1.00 |
Table 8. Aggregated second-level index judgment matrix (interactive convenience)
表8. 集结后的二级指标判断矩阵(交互便利性)
B4 |
C12 |
C13 |
C14 |
C15 |
C12 |
1.00 |
0.78 |
0.89 |
1.43 |
C13 |
1.28 |
1.00 |
1.14 |
1.83 |
C14 |
1.12 |
0.88 |
1.00 |
1.61 |
C15 |
0.70 |
0.55 |
0.62 |
1.00 |
Table 9. Aggregated second-level index judgment matrix (security)
表9. 集结后的二级指标判断矩阵(安全性)
B5 |
C16 |
C14 |
C16 |
1.00 |
1.35 |
C17 |
0.74 |
1.00 |
2.2.3. 权重计算
通过判断矩阵计算权重的常见的计算方法有:最小二乘法、几何平均法、算术平均法、特征向量法等[8]。本文采用几何平均法,首先将判断矩阵A中的每一行元素相乘并开n次方根,构成方根向量
:
(2)
将方根向量
归一化,得到判断矩阵
的排序权重向量
,即参与构成该判断矩阵的各个指标的权重分布:
(3)
(4)
一级指标对于总目标的权重分布以及二级指标对于对应的一级指标的权重分布结果如表10~15所示。
Table 10. The weight distribution of the first-level indicator to the total targe
表10. 一级指标对总目标权重分布
一级指标 |
对总目标权重 |
B1 |
0.239 |
B2 |
0.200 |
B3 |
0.204 |
B4 |
0.193 |
B5 |
0.164 |
Table 11. The weight distribution of the secondary index of “functional simplicity”
表11. “功能简洁性”的二级指标权重分布
二级指标 |
对“功能简洁性”权重 |
C1 |
0.385 |
C2 |
0.267 |
C3 |
0.348 |
Table 12. The weight distribution of the second-level indicator “inner readability”
表12. “内容易读性”的二级指标权重分布
二级指标 |
对“内容易读性”权重 |
C4 |
0.237 |
C5 |
0.281 |
C6 |
0.222 |
C7 |
0.162 |
C8 |
0.100 |
Table 13. Weight distribution of the secondary index “ease of operation”
表13. “操作简易性”的二级指标权重分布
二级指标 |
对“操作简易型”权重 |
C9 |
0.395 |
C10 |
0.215 |
C11 |
0.390 |
Table 14. The weight distribution of the second-level indicator of “interactive convenience”
表14. “交互便利性”的二级指标权重分布
二级指标 |
对“交互便利性”权重 |
C12 |
0.244 |
C13 |
0.312 |
C14 |
0.274 |
C15 |
0.170 |
Table 15. Secondary index weight distribution of “security”
表15. “安全性”的二级指标权重分布
二级指标 |
对“安全性”权重 |
C16 |
0.574 |
C17 |
0.426 |
2.2.4. 一致性检验
为避免决策者主观误差带来指标关系出现逻辑错误,需要通过一致性检验来确保判断矩阵的一致性在可接受程度之内[1]。定义
作为检验判断矩阵一致性的指标,常规来说,只要
指标在一定范围内,就可认为判断矩阵的一致性可接受,判断矩阵可用。在本研究中,规定若
,则判断矩阵满足一致性要求。
值越小,说明判断矩阵的一致性越好,可靠度越高。一旦
,则需要对判断矩阵进行合理的修正,重新判断,直到一致性满足要求,否则该判断矩阵不可用于后续计算。
值的计算方法如(5)所示:
(5)
式中,
是判断矩阵的阶数;
是平均随机一致性指数,各阶数
对应的数值见表16。
Table 16. Average random consistency index
表16. 平均随机一致性指标表
矩阵阶数 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
RI值 |
0 |
0 |
0.52 |
0.89 |
1.12 |
1.26 |
1.36 |
1.41 |
1.46 |
1.49 |
是判断矩阵的最大特征量,计算公式如下:
(6)
其中,
是向量
的第
个元素。经过计算最终得到36名志愿者的判断矩阵,并且其一致性在可接受的范围内。至此,得到APP的适老化设计评价指标体系,如表17所示。
Table 17. Evaluation index system of APP geriatric design
表17. APP适老化设计评价指标体系
目标 |
一级指标 |
二级指标 |
指标权重 |
APP适老化设计评价(A) |
功能简洁性(B1) |
基础功能完善(C1) |
0.092 |
人工服务到位(C2) |
0.064 |
无诱导类链接(C3) |
0.083 |
内容易读性(B2) |
图文清晰易读(C4) |
0.047 |
图形图案易于理解(C5) |
0.056 |
布局简洁直观(C6) |
0.044 |
信息架构逻辑合理(C7) |
0.032 |
美术风格合适(C8) |
0.020 |
操作简易性(B3) |
操作流程简化(C9) |
0.081 |
操作时间充足(C10) |
0.044 |
无弹窗或弹窗易于关闭(C11) |
0.080 |
交互便利性(B4) |
交互组件大小适当(C12) |
0.047 |
引导信息明确(C13) |
0.060 |
反馈信息明确(C14) |
0.053 |
交互方式多感官互补(C15) |
0.033 |
安全性(B5) |
容错性高(C16) |
0.094 |
合理使用个人信息(C17) |
0.070 |
2.3. 确定APP适老化评价结果
建立指标评语集
,志愿者从适老化的角度,基于这5个评价等级对目标案例的各个指标做评价打分。收集整理志愿者的评价数据,并做归一化处理,得到二级指标层的隶属度评价矩阵。例如
,其中,
为第
个指标在评价等级
中占有的比例,
为评价指标的数量。
(7)
计算模糊综合评价结果需要确定模糊算子类型,因为前文已经通过AHP得到了权重数据,所以本研究采取加权平均算法[9],公式如下:
(8)
其中,
是指标的权重向量。最后,根据最大隶属度原则得出综合评价结果。
3. APP适老化设计评价的实例应用
本研究以“携程旅行”以及其“关怀版”为案例,运用前文形成的评价体系分别对其做模糊综合评价,以验证前文评价体系的合理性和可行性。
3.1. “携程旅行”简介
“携程旅行”(下称“标准版”)是一款致力于为消费者提供交通出行订票、酒店预订等旅游服务的旅游类APP,在全球有4亿多用户,是中国主流的旅游消费平台之一。考虑到日益庞大的老年用户群体,携程于2021年推出旗下产品的适老化改造版本“携程旅行关怀版”(下称“关怀版”),该成果被选入我国首批智慧旅游适老化改造示范案例[10],因此该案例的评价结果具有较高的参考价值。“标准版”以及“关怀版”的界面截图如图1所示。
Figure 1. “Ctrip” (left) and “Care version Ctrip” (right)
图1. “携程旅行”APP (左)和“携程旅行关怀版”(右)①
3.2. 模糊综合评价过程
评价主体由30名志愿者组成,包括交互设计研究者10名、适老化设计研究者10名、老年手机用户10名。其中,老年用户的评价由其家人辅助完成,辅助时仅仅指导软件操作和词语解释,而不干涉其主观判断。收集打分结果并做归一化处理,得到“标准版”隶属度评价矩阵
,以及“关怀版”的隶属度评价矩阵
,如表18和表19所示:
Table 18. Membership evaluation matrix of “Ctrip”
表18. “携程旅行”的隶属度评价矩阵
G1 |
糟糕 |
差 |
一般 |
良好 |
优秀 |
C1 |
0.13 |
0.30 |
0.30 |
0.23 |
0.03 |
C2 |
0.20 |
0.23 |
0.23 |
0.30 |
0.03 |
C3 |
0.07 |
0.10 |
0.37 |
0.23 |
0.23 |
C4 |
0.13 |
0.20 |
0.57 |
0.10 |
0.00 |
C5 |
0.20 |
0.40 |
0.23 |
0.17 |
0.00 |
C6 |
0.13 |
0.40 |
0.37 |
0.10 |
0.00 |
C7 |
0.13 |
0.53 |
0.23 |
0.10 |
0.00 |
C8 |
0.13 |
0.23 |
0.37 |
0.23 |
0.03 |
C9 |
0.20 |
0.33 |
0.37 |
0.10 |
0.00 |
C10 |
0.07 |
0.10 |
0.43 |
0.37 |
0.03 |
C11 |
0.07 |
0.10 |
0.23 |
0.50 |
0.10 |
C12 |
0.13 |
0.43 |
0.30 |
0.10 |
0.03 |
C13 |
0.27 |
0.50 |
0.10 |
0.10 |
0.03 |
C14 |
0.20 |
0.23 |
0.50 |
0.03 |
0.03 |
C15 |
0.33 |
0.33 |
0.23 |
0.10 |
0.00 |
C16 |
0.13 |
0.23 |
0.37 |
0.23 |
0.03 |
C17 |
0.07 |
0.17 |
0.43 |
0.30 |
0.03 |
Table 19. Membership evaluation matrix of “Ctrip Care Edition”
表19. “携程旅行关怀版”的隶属度评价矩阵
G2 |
糟糕 |
差 |
一般 |
良好 |
优秀 |
C1 |
0.00 |
0.00 |
0.10 |
0.57 |
0.33 |
C2 |
0.00 |
0.00 |
0.07 |
0.37 |
0.57 |
C3 |
0.00 |
0.00 |
0.00 |
0.13 |
0.87 |
C4 |
0.00 |
0.00 |
0.00 |
0.23 |
0.77 |
C5 |
0.00 |
0.00 |
0.00 |
0.23 |
0.77 |
C6 |
0.00 |
0.00 |
0.00 |
0.33 |
0.67 |
C7 |
0.00 |
0.00 |
0.07 |
0.47 |
0.47 |
C8 |
0.00 |
0.00 |
0.10 |
0.57 |
0.33 |
C9 |
0.00 |
0.00 |
0.00 |
0.33 |
0.67 |
C10 |
0.00 |
0.00 |
0.00 |
0.23 |
0.77 |
C11 |
0.00 |
0.00 |
0.00 |
0.13 |
0.87 |
C12 |
0.00 |
0.00 |
0.00 |
0.43 |
0.57 |
C13 |
0.00 |
0.00 |
0.00 |
0.33 |
0.67 |
C14 |
0.00 |
0.00 |
0.00 |
0.73 |
0.27 |
C15 |
0.00 |
0.07 |
0.43 |
0.17 |
0.33 |
C16 |
0.00 |
0.00 |
0.10 |
0.50 |
0.40 |
C17 |
0.00 |
0.00 |
0.00 |
0.30 |
0.70 |
结合各指标权重计算,得到“标准版”综合评价向量:
(9)
“关怀版”的综合评价向量:
(10)
依据最大隶属度原则,“标准版”的适老化综合评价的结果为“一般”,而“关怀版”为“优秀”,即从适宜老年人使用的角度出发,“关怀版”明显优于“标准版”,本研究所构建的评价指标体系能够正确衡量一款手机APP的适老化程度,具有科学性和可行性。
3.3. 指标权重排序分析
指标权重的排序可以在设计实践中指导开发,有助于分析适老化设计过程中需要着重考虑的方面,以及可以让位于其他要素最后考虑的方面。二级指标对于总目标的权重排序如图2所示,大致可以分为三个梯队:权重高于0.08的指标,权重介于0.04和0.08之间的指标,以及权重低于0.04的指标。
Figure 2. Ranking of secondary index weights
图2. 二级指标权重排序②
影响最大的指标是“容错性”和“基础功能完善”,权重分别为0.094和0.092。由于老年人辨别能力较差,网络安全问题在老年人使用互联网的情境下更加重要。较高的容错性可以允许老年人操作不当或者操作错误时,不易造成严重的后果,有利于消除老年人使用的顾虑,更加放心使用数字产品。因此,在APP的适老化设计中,要重点考虑软件整体的容错性。“基础功能完善”是手机应用适老化设计中不可忽略的又一重要因素,功能性是现代产品设计的核心,老年人使用的产品更是要建立在完善的核心功能的基础之上的。
其次,“无诱导类链接”,“无弹窗或弹窗易于关闭”,“操作流程简化”,这三项指标的重要程度在0.08以上,成为影响老年人使用的第二梯队因素。诱导类链接和忽然的弹窗广告等对于普通用户就已经具有严重的干扰性,因此在老年人专用的产品中更应该杜绝此类元素。“操作流程简化”,要求尽可能减少操作步骤,这对于生理功能下降的老年人来说可以带来非常显著的体验上的优化。
最后,“多感官互补”的影响程度较低,为0.033,老年人的感官灵敏度下降,交互方式上可以利用多感官联动来互相补足,例如声音反馈,震动反馈等。“信息架构合理”权重为0.032,是软件设计的基本要求,然而这一标准主要是面向开发早期的要求,而且老年人对此专业词汇并不了解,因而在权重上的排名也靠后。“美术风格合适”权重最低,仅有0.020,可见无论是专家还是老年人用户都认为软件的功能性比美观程度更重要,对于APP的适老化设计,美术风格需要让位于其他更重要的因素。
4. 结语
本研究基于文献法、专家法等,确立APP适老化设计的评价指标层次结构,接着通过AHP计算各个指标对于APP适老化的重要程度,由此建立了一套设计评价指标体系。以“携程旅行”APP及其适老化版本作为案例,结合模糊综合评价法分别对两个案例做设计评价,结果验证了这套评价体系的合理性。最后,本研究分析总结了这些指标的权重分布,解析各个指标的含义。其中高权重指标例如“容错性基础功能完善”“无诱导类链接”等应当在未来的APP的适老化设计中得到更多重视,有助于提升老年用户的使用体验。
然而,本研究也有不足之处。例如在构建指标体系和运用AHP确定各个指标的权重时,参与的志愿者中老年用户占比有限,可能受到研究人员主观判断的影响,期望在未来的相关研究中继续改进。
注 释
①图1来源:“携程旅行”APP截图
②图2来源:作者自绘