1. 引言
随着信息技术的迅猛发展和人工智能技术的不断突破,生成式AI产品逐渐在各个领域展现出其强大的应用潜力和价值,同时大众对生成式AI产品的使用表现出深厚的兴趣和关注。大学生作为信息时代的原住民,对新技术、新应用保持着高度的敏感性和接受度。他们对于生成式AI产品的使用意愿,不仅反映了这一代年轻人对新技术的态度,也预示着未来教育技术和学习方式的变革趋势。
然而,尽管生成式AI产品在大学生中具有较高的关注度,但他们的实际使用意愿却受到多种因素的影响。一方面,大学生对新技术的好奇心和探索欲驱使他们尝试使用生成式AI产品;另一方面,对于数据安全、隐私保护、技术依赖等方面的担忧也可能制约他们的使用意愿。
本文通过对大学生对生成式AI的使用意愿的研究与分析,揭示了大学生群体对生成式AI的需求状况。科学运用多重数据模型和理论模型对现有生成式AI产品在大学生群体中的应用情况和需求状况进行了精准分析和科学预测,为未来生成式AI产品的技术优化和提升提供了有益的建议和启示。
2. 生成式AI产品研究现状
近年来,生成式人工智能技术的突破性进展彻底改变了人机交互范式,并在多个领域催生了创新产品。目前针对生成式人工智能产品的研究主要集中在以下几个方面:(1) 技术进展从单模态到多模态协同。胡满红等[1]指出,OpenAI的GPT-4具有万亿级别的参数量,通过强化学习与人类反馈显著提升了生成内容的逻辑性和安全性。肖子玉等[2]研究表明,多模态模型如Google的Gemini和Meta的CM3leon实现了文本、图像、音频、视频的跨模态生成与理解。Runway的Gen-2和Sora展示了从文本生成高保真视频的能力,标志着生成式AI向动态内容创作的延伸[3]。开源社区亦在推动技术民主化,Stability AI发布的Stable Diffusion 3允许开发者在本地部署图像生成模型,降低技术使用门槛[4]。(2) 应用场景拓展至多个垂直领域。李雅筝等[5]指出内容创作方面,ChatGPT、Claude等聊天机器人被用于文案撰写、代码生成;MidJourney和Adobe Firefly为设计师提供图像创作工具。教育医疗方面,Khan Academy推出AI导师“Khanmigo”,可定制化辅导学生;DeepMind的AlphaFold通过生成蛋白质结构加速药物研发[6]。在企业服务上,微软Copilot嵌入Office套件,实现文档自动摘要与数据分析;金山办公的WPS AI为企业生成个性化营销方案[7]。
3. 理论基础
(一) 技术接受模型[8]
该模型认为用户是否愿意使用某项技术,取决于他们对该技术的两个核心认知:一是感知有用性,即认为使用该技术能在多大程度上提高工作效率;二是感知易用性,也就是觉得该技术操作起来是否简便。在本研究中,大学生对生成式AI的使用意愿可通过其对产品“辅助学习、办公效果”(感知有用性)和“界面操作便捷性”(感知易用性)等评价来衡量。
(二) 计划行为理论[9]
该理论强调行为态度、主观规范与感知行为控制是影响使用意愿的核心要素。其中,行为态度体现为用户对技术使用的正负评价,主观规范反映社会环境对使用行为的作用,感知行为控制则关乎用户对自身技术运用能力的判断。在本研究中,“满意度”可反映行为态度,“专业群体使用习惯”可反映主观规范,“使用频率”可间接体现感知行为控制。
4. 研究设计
(一) 研究问卷编制
为全面了解全国各地大学生对生成式AI产品使用和发展现状的意见,本次研究编制了有针对性的调查问卷。调查内容涉及性别、年龄、专业、可支配资金水平、使用生成式AI产品的类型、频率和用途等问题。
(二) 研究对象
本研究以全国各地、所有专业的在校大学生为主要研究对象,共收集了500余份问卷,为本次研究提供了可靠的数据基础。研究样本由37.67%的本科三年级生、29.19%的本科二年级生、15.38%的本科四年级生、12.82%的本科一年级生和4.93%的本科五年级学生构成。其中约一半为工学、理学、医学、农学专业学生,管理学、经济学专业学生以及文学、历史学、法学、哲学、教育学专业学生各占约20%,剩余为艺术学军事学专业学生。
5. 数据基础分析
(一) 信度与效度分析
1. 信度检验
信度分析的核心在于用相同方法对同一对象重复测量,通过对比判断结果一致性,是问卷可靠性分析的关键方法。本次研究运用Cronbach系数进行信度分析,它的计算公式为:
(1)
其中k表示问卷中的题目数,
为第i题的调查结果方差,
为全部调查结果的方差。α系数的取值范围通常在0到1之间,值越大表示信度越高,见表1。
Table 1. Results of reliability tests for each dimension
表1. 各维度信度检验结果
|
删除项后的
标度平均值 |
删除项后的
标度方差 |
修正后的项与
总计相关性 |
删除项后的
克隆巴赫Alpha |
文本文本类信息 |
61.07 |
151.551 |
0.760 |
0.949 |
多媒体类信息 |
61.24 |
148.049 |
0.731 |
0.950 |
数据类信息 |
61.26 |
150.265 |
0.744 |
0.949 |
其他类信息 |
61.25 |
149.620 |
0.711 |
0.950 |
用户界面使用的难易程度 |
61.96 |
153.291 |
0.742 |
0.949 |
生成式AI产品对输入问题理解的难易程度 |
62.10 |
154.455 |
0.791 |
0.948 |
理解生成式AI产品输出回答的难易程度 |
62.00 |
153.377 |
0.758 |
0.949 |
续表
访问、使用方式的便捷性 |
61.92 |
153.917 |
0.765 |
0.949 |
功能操作的便捷性 |
61.92 |
154.711 |
0.740 |
0.949 |
交互过程的便捷性 |
61.93 |
153.851 |
0.766 |
0.949 |
知识获取与理解方面 |
60.99 |
153.500 |
0.763 |
0.949 |
写作辅助方面 |
61.05 |
154.146 |
0.742 |
0.949 |
日程规划与组织方面 |
61.22 |
150.457 |
0.689 |
0.950 |
创意启发与娱乐内容生成方面 |
61.20 |
150.784 |
0.704 |
0.950 |
语言辅助方面 |
61.05 |
151.463 |
0.750 |
0.949 |
一般来说,α系数为大于0.8表示内部一致性极好,0.7~0.8之间表示较好,α系数0.6~0.7表示一般,可以接受。而低于0.6表示内部一致性较差,则考虑修改问卷量表。从表2可知,本问卷Cronbach系数为0.952,表明此次研究信度非常理想。
Table 2. Reliability analysis of the questionnaire scale
表2. 针对问卷量表的可靠性分析
2. 效度检验
效度用于衡量问卷的有效性,本次借助SPSS中的KMO和Bartlett方法对问卷进行效度分析,见表3。Kaiser指出,KMO值若在0.45以下,该问卷应被舍弃;处于0.5~0.6之间,表明效度很差;在0.6~0.7区间,效度尚可;处于0.7~0.8范围,适合进行相关分析;大于0.8则非常适合。本研究的KMO值为0.964,效度高,且显著性为0.000,小于0.01,适合对问卷开展因子分析。
Table 3. KMO and Bartlett’s test
表3. KMO和巴特利特检验
KMO取样适切性量数 |
0.964 |
巴特利特球形度检验 |
近似卡方 |
5616.589 |
自由度 |
105 |
显著性 |
0 |
(二) 描述性分析
1. 使用普及率
调查样本的生成式AI使用情况为96.06%的调查样本使用过,3.94%的调查样本未使用过。图1表明生成式AI产品在大学生中普及程度极高,多数大学生都会使用生成式AI产品。
2. 使用类型
调查样本的生成式AI使用类型情况为在487个使用过生成式AI产品的调查样本中有83.0%使用过综合问答类AI,43.5%使用过艺术创作类AI,35.5%使用过程序编码类AI,46.2%使用过报告制作类AI,33.7%使用过阅读分析类AI。由表4可知,多数大学生选择使用综合问答类AI,可能是因为综合问答类AI功能全面,可以实现专项AI的功能,并且能够结合各类功能协调应用,更为便捷。
Figure 1. Composition diagram of generative AI product usage
图1. 生成式AI产品使用构成图
Table 4. Descriptive statistical table on the usage of generative AI product types
表4. 生成式AI产品类型使用情况描述性统计表
生成式AI产品类型 |
频率 |
百分比 |
有效百分比 |
综合问答类 |
404 |
83.0 |
83.0 |
艺术创作类 |
212 |
43.5 |
43.5 |
程序编码类 |
173 |
35.5 |
35.5 |
报告制作类 |
225 |
46.2 |
46.2 |
阅读分析类 |
164 |
33.7 |
33.7 |
3. 使用频率区间
如图2所示,调查样本每周生成式AI使用频次情况为40.66%的调查样本使用3次以下,31.42%使用3~6次,13.96%使用6~9次,13.96%使用9次以上。多数大学生每周使用生成式AI的频次在6次以下,说明大部分大学生每周都会使用生成式AI,对其需求度处于较稳定的水平。
Figure 2. Composition of frequency of using generative AI products weekly
图2. 每周使用生成式AI产品频次构成图
4. 使用用途
如图3所示,调查样本的生成式AI产品用途在487个使用过生成式AI产品的调查样本中81.1%用于辅助完成工作,73.9%用于信息资料收集,58.3%用于梳理逻辑思路,52.8%用于提供创新灵感,44.8%用于想法具象创作,1.6%用于其他。大多数使用生成式AI的大学生倾向于利用Al技术来优化学习与工作的流程。
Figure 3. Distribution map of the uses of generative AI products by college students
图3. 大学生使用生成式AI产品的用途分布图
5. 使用目的
使用生成式AI产品的好处在487个使用过生成式AI产品的调查样本中,72.3%是减轻学业负担,67.4%是提高工作效率,42.9%是扩大知识范围,39.4%是打开思维格局,29.4%是培养兴趣爱好,0.4%是其他。由图4可知,多数大学生使用生成式AI帮助完成课业工作,减少简单的机械重复劳动,可见生成式AI可以有效完成辅助工作、节约时间成本。
Figure 4. Distribution map of purposes for using generative AI products
图4. 使用生成式AI产品的目的分布图
(三) 列连分析
1. 所处年级与使用情况
由表5可得,不同年级受访者与生成式AI产品使用情况之间均不存在显著性差异。卡方检验结果如上表所示,其Pearson卡方检验对应P值等于0.142,大于0.05,故认为年级与受访者对生成式AI产品使用情况之间均不独立,不具显著相关性。
Table 5. Chi-square test table of grade and generative AI products usage situation
表5. 年级与生成式AI产品使用情况卡方检验表1
|
值 |
自由度 |
渐进显著性(双侧) |
皮尔逊卡方 |
6.885a |
4 |
0.142 |
似然比 |
6.190 |
4 |
0.185 |
有效个案数 |
507 |
|
|
Figure 5. Cross chart of respondents’ grade and generative AI product usage
图5. 研究对象年级与生成式AI产品使用情况交叉图
由图5可知,使用过AI的群体显著多余未使用过AI的群体。不同年级的生成式AI产品使用情况差别不显著,各年级使用率均大于90%,由此可知年级与生成式AI产品使用情况关系不显著。综上所述,各年级对生成式AI的使用较为普遍。
2. 专业、使用频率及可支配资金
由卡方检验结果可知,专业与生成式AI产品使用频次及每月可支配资金水平具有一定的相关性。将专业与生成式AI产品使用频次及每月可支配资金水平进行列联分析,如图6所示。由上图可知,除军事学以外的专业,在每周的生成式AI产品使用频次与每月可支配资金水平呈正相关。除艺术学专业外,各专业周的生成式AI产品使用频次在大部分每月可支配资金水平下,有50%以上的受访者均在6次以下。究其原因,团队认为是生成式AI产品能完全适应当代大学生的生活资金水平,多数专业的学生认可、接受并能够使用生成式AI产品,导致当代大学生对生成式AI产品的使用普遍频次适中。
Figure 6. Cross-diagram of research objects’ majors, usage frequency and monthly disposable fund level
图6. 研究对象的专业与使用频次及每月可支配资金水平交叉图
3. 专业与对文本类信息质量的满意程度
卡方检验结果如表6所示,其Pearson卡方检验对应P值均小于0.001,故认为专业与对生成式AI产品搜索到的文本类信息质量的满意程度之间均不独立,具有显著相关性。
Table 6. Chi-square test table of majors and satisfaction with the quality of searched text-based information
表6. 专业与对搜索到的文本类信息质量的满意程度卡方检验表
|
值 |
自由度 |
渐进显著性(双侧) |
皮尔逊卡方 |
61.212a |
20 |
4.62 × 10−6 |
似然比 |
73.0343 |
20 |
5.78 × 10−8 |
有效个案数 |
487 |
0 |
0 |
对专业与对生成式AI产品搜索到的文本类信息质量的满意程度进行交叉分析,同样证明了上述结论:
Figure 7. Cross-diagram of research subjects’ majors and their satisfaction with the quality of searched textual information
图7. 研究对象专业与对搜索到的文本类信息质量的满意程度交叉图
通过图7的对比分析可知,各个专业中“满意”“很满意”生成式AI产品搜索找到的文本类信息的明显多于“不满意”“很不满意”“一般”的学生。学生对生成式AI产品搜索到的文本类信息质量的满意程度和专业明显呈相关性。军事学专业选择“满意”“很满意”的学生明显偏多,占比94.4%;工学、理学、医学、农学选择“不满意”和“很不满意”的学生明显较多,占比18.9%;整体上选择“满意”的学生明显高于选择“很满意”的学生。各专业中,选择满意及以上选项的学生均大于70%。综上所述,不同专业类别的学生对于生成式AI产品搜索到的文本类信息的满意程度普遍偏高。
6. 消费者群体有序Logistics分析
(一) 有序Logistics模型构建与变量说明
为了更加深入的分析用户的基本信息对生成式AI产品使用满意程度的影响,运用有序Logistic回归模型对大学生对于生成式AI产品使用的满意程度进行分析,以此来得到生成式AI产品的消费者群体画像。
1. 因变量:大学生对生成式AI产品的满意程度。
2. 自变量:包括性别、年级、月可支配薪资、每周使用频率等用户基本信息。
3. 模型公式:
(2)
其中k表示对生成式AI产品的满意程度,π1、π2...πk−1分别为因变量取第一类程度、第二类程度到第(k − 1)类程度时的概率,这里,对生成式AI产品满意程度共分为5个等级,分别用1至5来表示,“1”代表“很不满意”,“5”代表“很满意”,
代表用户基本信息中对生成式AI产品满意程度有显著影响的变量,有序Logistics模型的拟合结果见表7:
Table 7. Ordered logistic analysis table of consumer groups
表7. 消费者群体的有序Logistics分析表
变量 |
系数β |
显著性水平p |
Exp(β) |
性别(对照组为女性) |
男(X1) |
−0.319 |
0 |
0.727 |
年级 (对照组为本科一年级) |
本科二年级(X2) |
−0.114 |
0.892 |
0.367 |
本科三年级(X3) |
0.209 |
1.232 |
0.51 |
本科四年级(X4) |
0.061 |
1.063 |
0.357 |
本科五年级(X5) |
−0.095 |
0.909 |
0.217 |
月可支配薪资 (对照组4000元以上) |
1000元以下(X6) |
−1.511 |
0.116 |
0.221 |
1000~2500元(X7) |
−0.773 |
0.352 |
0.461 |
2500~4000元(X8) |
−1.108 |
0.224 |
0.330 |
每周使用频率 (对照组9次以上) |
3次以下(X9) |
−0.267 |
0.520 |
0.766 |
3~6次(X10) |
−0.063 |
0.884 |
0.939 |
6~9次(X11) |
0.634 |
0.270 |
1.885 |
(二) Logistics模型拟合结果分析
1. 性别影响
男性的满意度显著低于女性,男性的回归系数小于0,Exp(β) = 0.727,表明男性对生成式AI产品的满意程度约女性的0.727倍,女性对生成式AI产品的满意程度更高。
2. 年级影响
Exp(β)先随着变量年级上升而增大,后逐渐减小,本科三年级学生对生成式AI产品的满意程度最高(β = 0.209);其他年级学生对生成式AI产品的满意程度相对较低。表明本科三年级的学生更依赖生成式AI产品来辅助学习和工作,可能与其面临的学业压力大有关。
3. 月可支配薪资影响
每月可支配薪资在1000~2500元的大学生对于生成式AI产品的满意程度最高,Exp(β) = 0.461,满意程度为对照组的4倍,月可支配薪资低于1000元或高于2500元的大学生对生成式AI产品的满意程度较低,表明生成式AI产品的定价符合大部分大学生的消费能力。
4. 每周使用频率影响:
每周使用6~9次的大学生对生成式AI产品的满意程度最高,其中β = 0.634,Exp(β) = 1.885;使用频率低于6次或高于9次的大学生对生成式AI产品的满意程度相对较低。表明生成式AI产品在大学生日常学习和工作中的使用频率较高,帮助大学生完成日常的工作与学习,为他们减轻了一定的压力。
(三) 依据Logistics模型生成的结论与建议
1. 性别差异
女性用户对生成式AI产品的满意度显著高于男性,产品设计应更多考虑女性用户的需求和偏好。
2. 年级差异
本科三年级学生对产品的依赖度最高,产品功能应更多针对该年级学生的学术需求进行优化。
3. 收入水平
生成式AI产品的定价策略应继续瞄准月可支配薪资在1000~2500元的大学生群体,确保产品价格符合其消费能力。
4. 使用频率
产品应进一步优化高频使用场景下的用户体验,确保在高频使用时仍能保持高效和稳定。
7. 生成式AI产品发展策略研究
(一) 优势优化策略
1. 强化用户界面的易用性
生成式AI产品应继续保持现有的界面使用便捷性风格,并在此基础上进一步优化,使其更加直观和易用。例如,将功能模块合理分区、尽量减少操作层级、增强自然语言输入和语音交互辅助查找功能以及功能按键的智能提示等帮助用户快速锁定自己所需的功能。
2. 提升生成内容的质量
现有生成式AI虽在生成内容上表现出色,用户满意度测量结果较为乐观,但如若满足于现状,停滞不前,生成式AI产品的竞争力便会大大降低。科技发展不断进步,社会生活日新月异,原本的观点和结论也会随着进一步的研究而有所不同,因而生成式AI产品的算法模型也需要紧跟时代,不断地优化和改进,进一步融入未来的人类社会发展。生成式AI需通过高质量的数据训练和持续的模型优化来减少生成内容的错误和偏差,确保生成内容更加具有准确性、相关性和权威性。
3. 增强对学习和办公的辅助效果
生成式AI产品在学习和办公领域展现出强大的辅助功能,收获最为显著的高满意度反馈。现有生成式AI可以出色的辅助学生和办公群体进行复杂困难问题的解决,并进行条理性的规划分析,给用户提供了有效的方向。但大部分生成内容的出处和来源并不明确,给用户带来了不十分信任的心理。因此,生成式AI应就生成内容的来源和出处进行明确的标注和公开展现,在增强用户对内容的可信度的同时也给用户提供了修改和注释的空间,缓解了用户对AI是否虚构或生成不可靠内容的焦虑感,提升用户体验感。
(二) 问题解决策略
1. 改进模型架构提升文本分析精确度
现有生成式AI产品在文本分析上问题频出,主要体现为抓不住用户问题的重点泛泛而谈、问题要求理解偏差生成用户期待的答案以及生成的回复很空泛不具体没有引用意义等问题。为此,生成式AI可以通过优化内部模型架构来提升文本生成的精确度,如BERT双向预训练模型和NSA稀疏注意力机制,更好地捕捉文本的重要信息,从而进行准确回复。同时,还可以针对特定领域的任务创建定制化的训练数据进行领域微调,从而显著提升模型在特定场景下的性能。
2. 增强生成内容的逻辑性和易读性
根据用户对生成内容的理解难易度调查发现,现有生成式AI生成内容存在逻辑不合理、专业术语出现频率高、长难句多等造成用户难以理解的文本问题。因此,生成式AI技术需要对语言的简洁性和通俗性进行专业训练,同时增强生成内容的逻辑性和连贯性,给用户提供一个快捷舒适的理解环境。
3. 推动多模态交互技术发展
现有生成式AI所具有的语言交互设计是AI产品在学习和办公领域具有核心竞争力的重要原因。现有生成式AI在语言交互设计方面具有诸多缺陷,如多轮对话上下文结合不足、难以捕捉语气转换差异、数据偏见与歧视等问题。为此,生成式AI不但要通过Transformer-XL等模型和丰富文化背景知识库等方法改进自然语言处理技术,提升语言交互的流畅度和自然度,还可以推动多模态交互的发展。结合文本、图像、语音等多种信息的多模态融合,生成式AI可以为用户提供更加丰富、自然的用户体验,满足不同场景下的用户需求。
NOTES
1a.3个单元格(30.0%)的期望计数小于5。最小期望计数为0.99。