基于动态案例生成系统的职业怀疑态度培养研究——一项随机对照实验的证据
Cultivating Professional Skepticism through a Dynamic Case Generation System —Evidence from a Randomized Controlled Trial
DOI: 10.12677/ae.2025.1571335, PDF, HTML, XML,    科研立项经费支持
作者: 张英婕, 丁羽婷, 彭庭靖:上海理工大学管理学院,上海
关键词: 职业怀疑态度会计专业噪声植入Professional Skepticism Accounting Majors Noise Embedding
摘要: 本研究基于轻量化动态案例生成系统,创新性地采用噪声植入的案例教学方法,探究其对会计专业本科生职业怀疑态度和实务能力的影响。通过随机对照实验设计,研究发现动态案例教学能显著提升学生的职业怀疑态度和实务能力,尤其在质疑精神和求知欲等维度表现突出。性别分析表明女性在证据审慎性方面更具优势,但教学效果整体上不受性别或实习经历影响,具有普适性。研究为审计教学改革提供了创新性的解决方案,对培养适应数字时代的高素质审计人才具有重要实践价值。
Abstract: This study innovatively employs a noise-embedded case teaching approach based on a lightweight dynamic case generation system to examine its impact on professional skepticism and practical competencies among accounting undergraduates. Through a randomized controlled trial design, the results demonstrate that dynamic case teaching significantly enhances students’ professional skepticism and practical competencies, with particularly notable improvements in critical thinking and intellectual curiosity. Gender analysis reveals female students exhibit greater advantage in evidentiary prudence, while the pedagogical effectiveness remains universally applicable regardless of gender or internship experience. The research provides an innovative solution for auditing education reform, offering significant practical value for cultivating high-quality auditing professionals in the digital era.
文章引用:张英婕, 丁羽婷, 彭庭靖. 基于动态案例生成系统的职业怀疑态度培养研究——一项随机对照实验的证据[J]. 教育进展, 2025, 15(7): 1151-1160. https://doi.org/10.12677/ae.2025.1571335

1. 引言

随着数字经济的快速发展,审计行业正经历着重大的变革与挑战。传统审计教学模式存在的问题日益突显,如知识更新滞后、实务场景单一等,已难以满足新时代审计人才培养的需求。尤其在职业怀疑态度培养方面,现有教学常局限于理论灌输,缺乏有效的实践训练手段[1]。职业怀疑态度作为保障审计质量的核心要素,其培养效果直接关乎学生的专业胜任能力[2]

生成式人工智能(AIGC)技术的突破为教育创新带来了新的契机。然而,当前相关研究大多侧重于提升知识传递效率,对职业怀疑态度这一高阶认知能力的培养关注不够。基于上述背景,本研究创新性地将轻量化动态案例系统引入审计教学,采用“技术开发 + 教学实验”的混合方法,探索在技术赋能下职业怀疑态度培养的新范式。在技术层面,构建了包含政策抓取、案例生成、噪声植入三大模块的动态案例系统;在实验层面,以104名会计专业本科生为研究对象,开展了为期8周的对照实验;在评估层面,采用Hurtt (2010)量表[2]结合案例任务测试,从多维度对教学效果进行评估,为审计教学模式的革新与完善提供科学依据。

2. 文献综述

2.1. 审计教育的现实困境与改革诉求

传统审计教育长期面临三重结构性矛盾。一是知识更新滞后与政策迭代加速的矛盾。审计涉及国际财务报告准则、审计准则和会计准则等高频修订的法律规章体系,而纸质教材更新周期通常长达3~5年[3]。大数据、区块链等技术倒逼审计方法革新,但课程内容仍以传统抽样审计为主[4]。二是实践场景匮乏与能力培养需求的矛盾。审计实务依赖敏感财务数据(如上市公司内部交易记录),但高校受保密协议限制,难以获取完整案例[5]。现有教学案例多源自公开审计报告,缺乏原始凭证、会议纪要等细节,学生难以理解“从数据到结论”的完整逻辑链[6]。三是标准化教学与个性化发展的矛盾。Sweller (2016)的认知负荷理论指出,传统课堂中,教师需同时处理知识传递、互动反馈与进度控制,导致学生高阶思维训练不足[7]。例如,审计风险评估教学多采用“填鸭式”讲授,而非案例驱动的探究式学习[8]

针对上述问题,国内外学者提出了部分解决方案。例如,美国注册会计师协会(AICPA)推动“审计模拟平台”建设,通过虚拟现实(VR)技术还原审计现场[5];国内学者郭洪建等(2023)倡导“新文科”框架下的跨学科课程整合,主张将Python数据分析纳入审计教学[9]。然而,这些探索多停留在工具引入或课程结构调整层面,尚未触及AI驱动的教育范式变革。刘平和焦雨起(2023)研究认为,现有AI审计工具侧重业务流程优化,缺乏对教学场景的适配性设计,导致“技术应用与教育目标脱节”[10]

2.2. AIGC技术的教育赋能潜力

生成式人工智能(AIGC)的突破性进展为破解上述困境提供了新思路。区别于传统AI的规则驱动模式,AIGC通过大语言模型(LLM)实现了知识生成与情境理解的融合,其核心优势体现在三方面:一是动态知识整合,基于检索增强生成(RAG)技术,可实时抓取最新政策法规并生成教学案例[11];二是复杂任务分解,通过提示词工程(Prompt Engineering)将审计流程拆解为可交互的阶段性任务[12];三是认知负荷优化,利用AI助手处理低阶记忆性工作,释放学生高阶思维能力[7]

在会计教育领域,已有初步尝试证明AIGC的价值。例如,德勤开发的人工智能机器人“小勤人”能自动提取财报异常指标并生成风险提示;清华大学团队利用GPT-4构建财务舞弊分析模型,帮助学生识别虚假交易模式。这些实践印证了AIGC在专业教育中的可行性,但现有研究仍然存在一定的局限:(1) 存在技术本位倾向。多数研究过度聚焦高成本工具开发(如VR实训平台、定制化大模型),忽视低资源场景下的教学模式创新[13]。(2) 评价体系缺失。现有评价依赖复杂实验设计(如眼动仪、脑电监测),难以在低预算下验证工具效果。少数研究尝试通过轻量化混合方法(如行为日志分析 + 反思日志编码)降低成本[14],但其在审计教育中的可行性尚未验证。(3) 个性化支持稀缺。高成本的个性化系统(如深度学习推荐引擎)难以普及,而轻量级开源工具(如基于K-means聚类的学生能力画像)虽能降低技术门槛,却未被充分探索[8]。这些不足也正是本研究力争突破的地方:通过整合开源工具、动态案例生成与噪声教学法,探索在有限资源条件下提升审计教学效果的可行路径,也为其他专业领域的教育创新提供有益的参考。

3. 研究设计与实施

3.1. 噪声植入的动态案例教学设计

在《审计学》课程教学中,如何培养和提升本科生的职业怀疑态度是一个重要课题。Oakleaf等(2009)指出,每个教学评价计划都应依据评价背景与教学目标来选择合适方法[15]。本研究聚焦于将轻量化动态案例系统生成的植入噪声的案例应用于本科生《审计学》课程,旨在探究植入噪声的案例运用与否对本科生职业怀疑态度与实务能力的影响。

3.1.1. 轻量化动态案例系统

系统核心功能包括政策动态抓取、案例生成与噪声植入,以及简易交互界面。具体而言,该系统通过Scrapy爬虫实时抓取财政部和审计署等官网的最新文件和审计报告,确保知识库的时效性和准确性。在案例生成方面,系统调用GPT-3.5 Turbo API,生成具有一定质量的审计案例,还通过随机植入错误类型(详见表1)来模拟真实世界中的不确定性,从而训练学生的职业怀疑态度和问题解决能力。同时,系统提供由Streamlit构建的简易交互界面,实现“输入–生成–下载”的一站式操作。

Table 1. Correspondence between noise types and instructional objectives

1. 噪声类型与教学目标对应表

噪声类型

示例

教学目标

法规过时

引用审计准则旧条款

训练政策追踪能力

证据链断裂

缺失合同文件

强化证据完整性意识

逻辑矛盾

数据与结论不一致

培养批判性思维

3.1.2. 案例任务类型及教学设计

植入噪声的案例任务类型主要包括:(1) 清晰目标案例任务。此类案例具备明确的审计方向和具体目标。例如,给定某公司特定时间段的财务数据,要求学生核查是否存在虚增收入的情况,学生能够清晰知晓需要审计的内容和达成的目标。(2) 模糊目标案例任务。案例所提供的信息较为隐晦,审计目标不明确。比如,仅告知某企业近期运营中可能存在财务风险,但未指明风险具体表现和产生环节,需要学生自行挖掘问题并开展审计工作。(3) 事实查证案例任务。具有确切的事实依据和答案,学生的任务是通过审计流程去证实或证伪相关事实。例如,检查企业某笔固定资产购置的真实性,判断其交易是否合规。(4) 综合分析案例任务。要求学生对复杂的审计情形进行全面总结、深入分析,并做出合理决策和提出解决方案。例如,分析企业在新的市场政策下的财务可持续性,提出相应的审计意见和改进建议。

案例涵盖《审计学》多个关键知识点的教学内容,主要包含以下5个部分:(1) 审计基本概念与职业怀疑的内涵;(2) 财务报表审计中的职业怀疑关键环节;(3) 审计风险评估与职业怀疑的关联;(4) 审计证据的收集与职业怀疑的运用;(5) 审计报告撰写中体现职业怀疑态度。案例教学共计12个课时,过程中依据植入噪声案例在复杂程度、干扰类型、潜在风险等方面呈现出的不同特点,以更为精细化、系统性的方式,将其融入课程的“风险评估”和“风险应对”等核心教学环节。

3.2. 职业怀疑态度和实务能力测评

鉴于学生职业怀疑态度较难直接衡量,本研究借鉴Nelson (2009)提出的“审计职业怀疑态度影响因素模型”,采用基于案例任务的测评方法。运用Hurtt (2010)开发的特质性怀疑与怀疑行为之间联系的量表,从多维度综合评估学生在教学前后职业怀疑态度的变化情况。在教学过程中,通过量化指标对学生的职业怀疑态度的应用结果进行评估。具体指标包括:第一,准则引用准确率。在案例审计过程中,学生正确引用相关审计和会计准则的比例。准确引用体现了学生对业务规范的掌握和运用能力,以及在审计工作中遵循专业标准的意识,这与职业怀疑态度中对合规性的关注密切相关。第二,风险识别准确率。学生在案例分析中正确识别风险维度的比例。能够从多个角度识别风险,反映了学生思维的全面性和敏锐性,是职业怀疑态度的重要体现。教学测评主要分为两个阶段:

(1) 教学前测评

将全班104名学生随机平均分成两组,一组作为实验组,采用轻量化动态案例系统生成的植入噪声的案例进行教学;另一组为控制组,采用常规案例进行教学。

在教学开始前,分别对两组学生进行职业怀疑态度测试,以此了解学生在教学前的职业怀疑态度特质和行为表现。测试满分为180分,学生的得分通常在90~150分之间,分数越高意味着其怀疑态度越强[2]。运用动态案例系统生成第4种类型的案例任务1份。学生需在规定时间内完成案例审计,根据案例提供的信息依据审计准则确定审计证据的来源和范围,选择合适的审计方法,制定审计策略获取证据,评估证据的相关性并得出审计结论,并在每份案例对应的表格中填写适用的会计准则及审计准则、已识别的风险维度数量。

(2) 教学后测评

在完成既定的教学周期后,再次对两组学生进行与教学前相同方式的职业怀疑态度测评,对比两组学生教学前后在量表测评和案例任务测试中的得分变化。运用统计学方法,分析两组学生后测得分的差异显著性,讨论植入噪声案例教学对学生职业怀疑态度影响的效果强度。

根据测评结果,全面分析学生职业怀疑态度的变化情况。若实验组学生在教学后的职业怀疑态度得分显著高于控制组,且准则引用准确率和风险识别准确率有明显提升,则表明植入噪声的案例教学法对提升学生职业怀疑态度和实务能力具有积极作用。进一步分析学生个体因素例如性别、实习情况等对职业怀疑态度、案例任务测试结果的影响,为后续教学策略的调整提供依据,不断提高《审计学》课程的教学质量和学生职业怀疑态度的培养效果。

4. 结果统计

4.1. 基础数据统计

本次实验中104名学生均提供了有效的测试记录,其中实验组为52份,控制组为52份。实验组中女性33名,男性19名;控制组中,女性41名,男性11名。实验组与控制组的前测和后测结果如表2所示。采用独立样本t检验分析项目实施前实验组和控制组的职业怀疑态度、案例任务完成情况、以及实习经历等职业怀疑态度可能影响因素的差异。研究显示,实验组与控制组仅在求知欲方面存在较为显著的差异(P < 0.05),实验组求知欲均值较控制组高出1.52,其余指标差异均无统计学意义。

Table 2. Pre-intervention group comparisons

2. 实验组与控制组项目实施前各指标差异性检验

测试指标

实验组

控制组

t

P

职业怀疑态度

总分

107.27 ± 9.47

104.85 ± 8.32

−1.3859

0.1688

质疑精神

10.21 ± 2.70

10.67 ± 3.05

0.8181

0.4152

悬置判断

18 ± 3.62

17.52 ± 3.71

−0.6687

0.5052

求知欲

22.54 ± 3.67

21.02 ± 3.94

−2.0351

0.0444

人际理解

17.79 ± 3.68

17.33 ± 3.02

−0.6990

0.4861

自主性

21.27 ± 4.07

21.02 ± 4.83

−0.2852

0.7760

自信心

17.46 ± 3.33

17.29 ± 3.98

−0.2405

0.8104

案例任务

准则引用准确率(%)

0.32 ± 0.19

0.30 ± 0.17

−0.4659

0.6423

风险识别准确率(%)

0.21 ± 0.14

0.20 ± 0.14

−0.4758

0.6352

学生基本特征

实习次数(次)

2.15 ± 1.34

1.83 ± 1.30

−1.2541

0.2127

实习时长(月)

4.48 ± 3.15

5.06 ± 4.13

0.8010

0.4250

事务所实习经历(有/无)

0.52 ± 0.50

0.44 ± 0.50

−0.7798

0.4373

注:学生如有事务所实习经历,则其“事务所实习经历”指标赋值为1,否则赋值为0。

4.2. 项目实施前后学生职业怀疑态度的差异

将实验组和控制组的职业怀疑态度总分,质疑精神、悬置判断、求知欲、人际理解、自主性、自信心等各分项分进行重复测量方差分析,组间因素为组别(group)即实验组和控制组,组内因素为时间(time)即前测和后测,交互效应为时间 × 组别(group * time)。由表3可见,职业怀疑态度总分的时间效应显著(P < 0.01),组间效应显著(P < 0.01),交互效应显著(P < 0.01);职业怀疑态度各分项中,质疑精神、求知欲、人际理解、自主性、自信心等的时间效应、组间效应及交互效应均在1%水平上显著。悬置判断的时间效应和组间效应均在1%水平上显著,而交互效应在5%水平上显著。

由以上分析可知,随着时间的变化,两组职业怀疑态度总分、职业怀疑态度各分项的得分差异显著,交互作用显著,因此,对以上指标进一步进行简单效应分析,发现在职业怀疑态度总分中,随着时间的变化,实验组前测和后测的差异显著[F (1, 102) = 209.11, P < 0.01],控制组前测和后测的差异不显著[F (1, 102) = 2.5, P = 0.1167],但实验组和控制组后测时间点上得分的差异具有显著性[F (1, 102) = 185.87, P < 0.01]。职业怀疑态度各分项中,实验组前测和后测的差异、实验组和控制组后测时间点上得分的差异均显著,而控制组前测和后测的差异均不显著。综上,相比控制组,实验组的动态案例任务实施对会计专业本科生的职业怀疑态度及其各分项都产生了积极影响。

Table 3. Changes in professional skepticism scores: pre- vs. post-intervention comparison

3. 项目实施前后实验组和控制组职业怀疑态度得分差异

测试指标

实验组

控制组

时间效应

组间效应

交互效应

前测

后测

前测

后测

职业怀疑

态度总分

107.27 ± 9.47

132.88 ± 8.57

104.85 ± 8.32

107.73 ± 10.18

0.0000***

0.0000***

0.0000***

质疑精神

10.21 ± 2.70

13.37 ± 2.70

10.67 ± 3.05

10.58 ± 2.82

0.0001***

0.0033***

0.0000***

悬置判断

18 ± 3.62

20.87 ± 4.20

17.52 ± 3.71

17.67 ± 4.45

0.0072***

0.0011***

0.0157**

求知欲

22.54 ± 3.67

25.94 ± 4.13

21.02 ± 3.94

21.5 ± 3.69

0.0004***

0.0000***

0.0069***

人际理解

17.79 ± 3.68

22.60 ± 3.76

17.33 ± 3.02

18.44 ± 4.25

0.0000***

0.0000***

0.0004***

自主性

21.27 ± 4.07

27.19 ± 4.10

21.02 ± 4.83

21.83 ± 4.25

0.0000***

0.0000***

0.0000***

自信心

17.46 ± 3.33

22.92 ± 3.37

17.29 ± 3.98

17.71 ± 3.74

0.0000***

0.0000***

0.0000***

注:******分别表示10%、5%和1%的显著水平,下同。

4.3. 项目实施前后学生案例任务得分的差异

对实验组和控制组的准则引用准确率、风险识别准确率进行重复测量方差分析,结果如表4所示。准则引用准确率的时间效应、组间效应、交互效应均在1%水平上显著。风险识别准确率的时间效应、组间效应均在1%水平上显著,交互效应在5%水平上显著。

由以上分析可知,随着时间的变化,两组准则引用准确率、风险识别准确率差异显著,交互作用显著,因此,对以上指标进一步进行简单效应分析,发现在准则引用准确率方面,随着时间的变化,实验组前测和后测的差异显著[F (1, 102) = 59.31, P < 0.01],控制组前测和后测的差异不显著[F (1, 102) = 2.31, P = 0.1317],但实验组和控制组后测时间点上得分的差异具有显著性[F (1 102) = 41.09, P < 0.01]。在风险识别准确率方面,随着时间的变化,实验组前测和后测的差异显著[F (1, 102) = 32.29, P < 0.01],控制组前测和后测的差异显著[F (1, 102) = 13.12, P < 0.01],实验组和控制组后测时间点上得分的差异具有显著性[F(1, 102) = 10.58, P < 0.01]。综上,实验组的动态案例任务实施对会计专业本科生的准则引用准确率、风险识别准确率都产生了积极影响,为提升会计专业学生的实践能力和专业素养提供了有力支持。

Table 4. Changes in case task scores: pre- vs. post-intervention comparison

4. 项目实施前后实验组和控制组案例任务得分差异

测试指标

实验组

控制组

时间效应

组间效应

交互效应

前测

后测

前测

后测

准则引用准确率(%)

0.32 ± 0.19

0.63 ± 0.21

0.30 ± 0.17

0.36 ± 0.21

0.0000***

0.0000***

0.0000***

风险识别准确率(%)

0.21 ± 0.14

0.45 ± 0.27

0.20 ± 0.14

0.31 ± 0.17

0.0000***

0.0031***

0.0137**

4.4. 学生的基本特征对实验结果的可能影响

本研究采用双重差分法(DID)评估动态案例教学对学生职业怀疑态度和实务能力的影响,并进一步检验学生基本特征对实验结果的可能作用。表5表6呈现了包含协变量的DID回归结果。

Table 5. Determinants of professional skepticism scores

5. 职业怀疑态度得分的影响因素

变量

职业怀疑

态度总分

质疑精神

悬置判断

求知欲

人际理解

自主性

自信心

group

2.466

(1.337)

−0.477

(−0.856)

0.520

(0.649)

0.508

(0.679)

0.143

(0.165)

0.171

(0.233)

1.601**

(2.053)

time

2.885

(1.600)

−0.096

(−0.176)

0.154

(0.196)

1.115

(1.526)

0.808

(0.949)

0.423

(0.592)

0.481

(0.630)

group*time

22.731***

(8.917)

3.250***

(4.216)

2.712**

(2.446)

3.692***

(3.571)

5.115***

(4.251)

5.039***

(4.988)

2.923***

(2.710)

性别

0.579

(0.404)

0.663

(1.532)

−1.186*

(−1.906)

0.106

(0.182)

0.955

(1.413)

−0.165

(−0.291)

0.206

(0.341)

实习次数

0.310

(0.519)

0.061

(0.338)

0.343

(1.322)

−0.164

(−0.679)

0.034

(0.120)

0.154

(0.651)

−0.117

(−0.464)

实习时长

0.182

(0.814)

0.0320

(0.472)

−0.055

(−0.570)

0.065

(0.720)

0.053

(0.498)

0.026

(0.290)

0.062

(0.655)

事务所实习经历

−1.664

(−1.222)

−1.143***

(−2.776)

−0.011

(−0.019)

0.379

(0.686)

−0.273

(−0.425)

−0.099

(−0.183)

−0.516

(−0.895)

cons

103.395***

(44.016)

10.103***

(14.221)

18.614***

(18.225)

17.002***

(17.844)

19.656***

(17.728)

17.121***

(18.393)

20.898***

(21.024)

N

208

208

208

208

208

208

208

R2

0.619

0.208

0.130

0.251

0.269

0.306

0.206

注:group变量反映组别,实验组赋值为1,控制组赋值为0;time变量反映项目实施与否,实施后赋值为1,实施前赋值为0,下同。

Table 6. Determinants of case task scores

6. 案例任务得分的影响因素

变量

准则引用准确率

风险识别准确率

group

0.022

(0.547)

0.009

(0.240)

time

0.058

(1.498)

0.112***

(2.990)

Group * time

0.250***

(4.589)

0.131**

(2.479)

性别

−0.047

(−1.541)

−0.001

(−0.034)

实习次数

0.011

(0.859)

0.017

(1.355)

实习时长

0.005

(1.080)

0.000

(0.088)

事务所实习经历

0.025

(0.848)

−0.010

(−0.358)

cons

0.301***

(5.987)

0.171***

(3.521)

N

208

208

R2

0.338

0.239

在职业怀疑态度总分方面,交互项系数为22.731 (P < 0.01),验证了动态案例教学在培养学生职业怀疑态度上的有效性。从分项维度来看,质疑精神(β = 3.250)、求知欲(β = 3.692)、自主性(β = 5.039)等维度提升显著(均P < 0.01),表明噪声植入的教学方式特别强化了学生的主动探究能力。而在案例任务表现上,准则引用准确率(β = 0.250)和风险识别准确率(β = 0.131)的交互项均显著(P < 0.05),进一步证实了教学干预对学生实务能力具有积极的促进作用。

在探讨学生基本特征对职业怀疑态度及相关能力的影响时,从性别因素和实习经历两方面进行分析。就性别因素而言,在悬置判断维度,女性得分显著高于男性(β = −1.186, P < 0.1),这表明女性更倾向于延迟判断,在证据收集阶段更为审慎,与现有文献中关于性别与风险态度的研究发现相符。然而,在职业怀疑总分、准则引用及风险识别准确率等其他维度,性别并无显著影响。从实习经历方面来看,事务所实习经历仅对质疑精神有显著负向影响(β = −1.143, P < 0.01),这或许反映出实务经验使学生更关注确定性证据;而实习次数与时长对所有结果变量均无显著影响。

5. 研究结论

本研究基于轻量化动态案例生成系统,通过植入噪声的案例教学法对本科生职业怀疑态度和实务能力的影响进行了实证分析,结合Nelson (2009)的职业怀疑态度模型和Hurtt (2010)的量表测评,得出以下结论。

5.1. 植入噪声的案例教学显著提升职业怀疑态度

在教学实践中,实验组运用植入噪声案例教学,其职业怀疑态度总分由107.27大幅提升至132.88 (P < 0.01),这种提升具有高度的统计学意义。反观控制组采用常规案例教学,职业怀疑态度总分仅从104.85微增至107.73 (P = 0.1167),提升幅度微弱且未达到显著水平。两组后测数据对比差异显著(P < 0.01),直观地凸显了两种教学方式在效果上的巨大差距。进一步剖析分项指标可见,在质疑精神、求知欲、自主性等关键维度上,实验组学生的表现提升尤为显著(P < 0.01)。这意味着植入噪声的案例通过制造复杂、模糊的情境,有效激发了学生的批判性思维,促使他们不再满足于表面信息,而是主动去探究隐藏于其中的真相,进而强化了主动探究意识。

综合来看,实验组职业怀疑态度提升幅度显著高于控制组这一结果,有力地证明了噪声植入策略在培养学生职业怀疑态度方面的独特优势。该策略为审计学教学提供了一种创新且高效的方法,有助于提升学生在未来审计工作中应对复杂情况、保持职业怀疑的能力。

5.2. 植入噪声的案例教学显著增强实务能力

在准则引用准确率和风险识别准确率方面,实验组和控制组呈现出不同的变化趋势,凸显了植入噪声案例在提升学生审计专业能力上的显著优势。在准则引用准确率上,实验组由初始的0.32大幅提升至0.63 (P < 0.01),而控制组仅从0.30提升至0.36 (P = 0.1317),这一结果表明,相较于常规案例,植入噪声的案例能够更有效地强化学生对审计准则的精准运用能力。在风险识别准确率方面,实验组从0.21提升至0.45 (P < 0.01),控制组从0.20提升至0.31 (P < 0.01),虽然两组均有显著提升,但实验组的提升幅度更大(P < 0.05),这说明噪声案例营造的复杂信息环境,有助于学生从纷繁复杂的信息中敏锐地识别潜在风险,培养他们在实际审计工作中应对复杂情况的能力。

5.3. 教学实验的交互效应显著

时间 × 组别交互作用分析表明,职业怀疑态度总分及各分项的交互效应均显著(P < 0.05),DID回归结果同样证实了这一点。这意味着动态案例系统的教学效果具有时间累积性,长期应用该系统于教学过程中,可能会为学生职业怀疑态度的培养带来更持续的提升。

在性别差异方面,女性在悬置判断维度表现显著优于男性,这表明女性更倾向于延迟判断以收集充分证据;性别对其他维度和总分无显著影响,说明动态案例教学效果具有跨性别普适性。实习经历的作用较为有限,事务所实习仅与质疑精神相关,实习次数和时长对所有结果变量均无显著影响(P > 0.05)。

综合来看,动态案例教学的效果不受性别、实习经历等背景因素显著调节,这证实了该教学法适用于不同背景的学生群体,能够在不依赖学生性别和实习经历等条件的情况下,有效促进学生职业怀疑态度的培养。

6. 结语

本研究以轻量化动态案例生成系统为核心工具,通过植入噪声的案例教学法,系统探究了其对本科生职业怀疑态度的影响。研究基于Nelson (2009)的职业怀疑态度模型,结合Hurtt (2010)的量表测评,采用对比实验设计,验证了动态案例系统在审计学教学中的有效性。

在教学设计方面,本研究创新性地构建了噪声植入的动态案例生成框架,涵盖清晰目标、模糊目标、事实查证和综合分析四类任务类型,并通过规则驱动的噪声植入(如法规过时、证据链断裂)模拟真实审计场景的复杂性。案例内容与《审计学》课程的核心知识点深度融合,覆盖审计准则、风险评估、证据收集等关键环节,形成“生成–干扰–修正”的教学闭环。

在实施效果上,实验数据表明,植入噪声的案例显著提升了学生的职业怀疑态度(总分提升25.61分,P < 0.01)和实务能力(准则引用准确率提升97%)。交互效应分析进一步揭示,动态案例的教学效果具有时间累积性,性别在悬置判断维度上的差异化表现。

在范式转型上,本研究积极推动审计教学从传统的静态知识传授模式,转变为动态的能力训练模式,这种转变高度契合数字化时代对审计人才的需求,有助于培养出更具实践能力和创新思维的审计专业人才。

未来研究可进一步优化噪声类型的设计(如增加管理层舞弊信号),并探索多模态案例(如结合虚拟仿真)的拓展应用。本研究为审计教育的智能化改革提供了实证基础与范式参考,对培养具备高阶职业怀疑能力的审计人才具有重要意义。

基金项目

2025年度上海理工大学教师发展研究一般项目“AIGC驱动的审计人才培养新范式研究——基于动态案例生成的创新实践”(CFTD2025YB09)。

参考文献

[1] Nelson, M.W. (2009) A Model and Literature Review of Professional Skepticism in Auditing. AUDITING: A Journal of Practice & Theory, 28, 1-34.
https://doi.org/10.2308/aud.2009.28.2.1
[2] Hurtt, R.K. (2010) Development of a Scale to Measure Professional Skepticism. AUDITING: A Journal of Practice & Theory, 29, 149-171.
https://doi.org/10.2308/aud.2010.29.1.149
[3] 蒋峻松, 乔智, 罗婧瑜, 等. 本科“审计学”课程“SPOC + 课堂 + 虚拟仿真实验”三混合教学模式探讨——以云南大学会计学专业为例[J]. 东南大学学报(哲学社会科学版), 2023, 25(S2): 41-46.
[4] Alzamil, Z., Appelbaum, D. and Nehmer, R. (2020) An Ontological Artifact for Classifying Social Media: Text Mining Analysis for Financial Data. International Journal of Accounting Information Systems, 38, Article ID: 100469.
https://doi.org/10.1016/j.accinf.2020.100469
[5] Ratmono, D., Sari, R.C., Warsono, S., Ubaidillah, M. and Wibowo, L.M. (2024) Virtual Reality and Perceived Learning Effectiveness in Accounting Studies: The Mediating Role of Task-Technology Fit. Cogent Business & Management, 11, Article ID: 2316890.
https://doi.org/10.1080/23311975.2024.2316890
[6] 张俊瑞, 董雯君, 李静, 等. 数字经济时代注册会计师技术能力现状与提升对策研究——基于对注册会计师的问卷调查[J]. 中国注册会计师, 2024(11): 50-55, 5.
[7] Sweller, J. (2019) Cognitive Load Theory and Educational Technology. Educational Technology Research and Development, 68, 1-16.
https://doi.org/10.1007/s11423-019-09701-3
[8] Zawacki-Richter, O., Marín, V.I., Bond, M. and Gouverneur, F. (2019) Systematic Review of Research on Artificial Intelligence Applications in Higher Education—Where Are the Educators? International Journal of Educational Technology in Higher Education, 16, Article No. 39.
https://doi.org/10.1186/s41239-019-0171-0
[9] 郭红建, 梅轶群. “四新”建设背景下大数据审计人才培养模式探索与实践[J]. 大学教育, 2023(15): 111-113.
[10] 刘平, 焦雨起. 以智能审计提升企业治理效能[J]. 审计观察, 2023(7): 69-73.
[11] Lewis, P., Perez, E. and Yogatama, D. (2020) Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. arXiv: 2005.11401.
[12] Zhao, W.X., Zhou, K., Li, J., Tang, T., Wang, X., Hou, Y., et al. (2023). A Survey of Large Language Models. arXiv: 2303.18223.
https://arxiv.org/abs/2303.18223
[13] Hwang, G., Xie, H., Wah, B.W. and Gašević, D. (2020) Vision, Challenges, Roles and Research Issues of Artificial Intelligence in Education. Computers and Education: Artificial Intelligence, 1, Article ID: 100001.
https://doi.org/10.1016/j.caeai.2020.100001
[14] Crompton, H. and Burke, D. (2023) Artificial Intelligence in Higher Education: The State of the Field. International Journal of Educational Technology in Higher Education, 20, Article No. 22.
https://doi.org/10.1186/s41239-023-00392-8
[15] Oakleaf, M. and Kaske, N. (2009) Guiding Questions for Assessing Information Literacy in Higher Education. Portal: Libraries and the Academy, 9, 273-286.
https://doi.org/10.1353/pla.0.0046