摘要: 目的:探讨直接观察操作技能评估法(direct observation of procedural skills, DOPS)在普通外科本科实习医师临床技能培训中的应用效果及可行性。方法:选取2024年9月至2025年9月在某院普通外科轮转实习的临床医学专业本科实习医师60名,采用随机数字表法分为实验组和对照组,各30名。两组均接受以清创缝合术、换药术、腹部查体、无菌穿脱手术衣和腹腔穿刺为核心内容的常规操作培训法,常规操作培训法包括集中理论授课、标准化操作示教、模拟及床旁操作练习和一般性口头反馈等。实验组在常规操作培训法基础上,于轮转第2周和第4周分别接受1次DOPS形成性评估,由经过统一培训并完成评分校准的评估者在真实或模拟临床情境中对上述五项临床技能进行直接观察、评分并当场反馈;对照组不实施系统化DOPS评估,仅接受常规带教与终末考核。轮转结束前对两组学员进行终末临床技能考核,比较两组一般资料、第2周与第4周DOPS评估结果、终末操作技能总分及等级分布,以及五项具体临床技能得分。终末考核采用单盲方式进行。结果:两组学员在性别、年龄及入学平均成绩等一般资料方面差异均无统计学意义(P > 0.05)。实验组第4周DOPS评估的平均分及良好以上评价率均显著高于第2周(P < 0.05)。终末考核中,实验组总分和良好以上评价率均明显优于对照组(P < 0.05);在清创缝合术、换药术、腹部查体、无菌穿脱手术衣和腹腔穿刺五项临床技能中,实验组得分均显著高于对照组(P < 0.05)。结论:将DOPS作为形成性评价工具融入普通外科本科实习医师技能培训,在本研究条件下可改善终末临床技能考核表现,并有望促进学员操作相关临床技能的持续改进。考虑到本研究样本量有限、为单中心研究且对照组常规操作培训法的界定仍较粗略,相关结论仍需在更大样本、多中心及长期随访的研究中进一步验证,DOPS在本科实习医师培训中的应用尚显示出一定推广潜力。
Abstract: Objective: To explore the application effect and feasibility of the Direct Observation of Procedural Skills (DOPS) in the clinical skills training of undergraduate interns in general surgery. Methods: Sixty clinical medical undergraduate interns rotating in the general surgery department of a certain hospital from September 2024 to September 2025 were selected and randomly divided into an experimental group and a control group, with 30 in each group. Both groups received conventional operation training methods focusing on debridement and suture, dressing change, abdominal examination, aseptic donning and doffing of surgical gowns, and abdominal paracentesis. The conventional operation training methods included centralized theoretical lectures, standardized operation demonstrations, simulation and bedside operation practices, and general verbal feedback. The experimental group, in addition to the conventional operation training methods, received two DOPS formative assessments in the second and fourth weeks of rotation, respectively. Trained and calibrated assessors directly observed, scored, and provided immediate feedback on the five clinical skills in real or simulated clinical scenarios. The control group did not undergo systematic DOPS assessment but only received conventional teaching and final assessment. Before the end of the rotation, a final clinical skills assessment was conducted for both groups. General information, DOPS assessment results in the second and fourth weeks, total scores and grade distributions of final operation skills, and scores of the five specific clinical skills were compared between the two groups. The final assessment was conducted in a single-blind manner. Result: The results showed that there were no statistically significant differences in general data such as gender, age, and average entrance scores between the two groups of trainees (P > 0.05). The average score and the rate of good or above evaluations in the DOPS assessment at the 4th week of the experimental group were significantly higher than those at the 2nd week (P < 0.05). In the final assessment, the total score and the rate of good or above evaluations of the experimental group were significantly better than those of the control group (P < 0.05); in the five clinical skills of debridement and suture, dressing change, abdominal examination, wearing and taking off surgical gowns in sterile conditions, and abdominal puncture, the scores of the experimental group were significantly higher than those of the control group (P < 0.05). Conclusion: Integrating DOPS as a formative evaluation tool into the training of general surgery undergraduate interns can improve the final clinical skill assessment performance under the conditions of this study, and is expected to promote the continuous improvement of trainees’ operational clinical skills. Considering the limited sample size of this study, it is a single-center study, and the definition of the control group’s conventional operation training method is still relatively rough, the relevant conclusions still need to be further verified in larger sample, multi-center, and long-term follow-up studies. The application of DOPS in the training of undergraduate interns shows certain promotion potential.
1. 介绍
外科学具有较强的综合性与实践性,临床技能教学是外科学教学中的重点与难点。教师不仅要传授系统的理论知识,更要重视学生临床思维与实际操作能力的培养。传统“示范–讲授–模仿–终末考核”的教学模式在一定程度上保障了技能训练的基本质量,但带有明显的终结性评价特征,学生在学习过程中缺乏及时反馈与针对性指导,师生之间有效互动有限,理论与实践的结合往往不够紧密,从而影响了临床技能教学质量的进一步提升[1]-[3]。
随着以胜任力为导向的医学教育理念逐渐受到重视,形成性评价作为贯穿于教学全过程的反馈与指导体系,日益被认为是提升学习主动性和教学质量的重要抓手[4] [5]。直接观察操作技能评估(direct observation of procedural skills, DOPS)是一种基于工作场所的形成性评价工具,强调在真实或接近真实的临床情境中由受训教师直接观察学员完成特定操作,并给予结构化的即时反馈[6] [7]。该方法在住院医师规范化培训、专科医师培训等领域已有较多应用和报道[8] [9],但在普通外科本科实习医师临床技能培训中的应用研究仍相对有限。
本研究尝试将DOPS引入普通外科本科实习医师的临床技能培训体系中,与科室现行的常规操作培训方式进行比较,探讨其对学员操作相关临床技能的影响及可行性,以期为优化本科实习阶段外科临床技能教学提供参考。
2. 资料与方法
2.1. 研究对象
选取2024年9月至2025年9月在某三级综合医院普通外科进行轮转实习的临床医学专业本科实习医师60名作为研究对象。纳入标准:1) 首次在该院普通外科轮转实习的临床医学专业本科生;2) 轮转时间不少于4周;3) 自愿参加本研究并签署知情同意书。排除标准:1) 既往在普通外科科室有正式实习或规范化培训经历者;2) 因个人原因中途提前结束轮转或轮转时间不足规定周期者。采用随机数字表法将符合条件的学员分为实验组和对照组,每组30人。两组学员性别、年龄和入学平均学习成绩等基线资料比较差异均无统计学意义(P > 0.05),具有可比性。
2.2. 研究设计与分组
本研究采用前瞻性随机对照试验设计。两组学员均在普通外科轮转期间接受本科实习医师常规操作培训法。对照组仅接受常规操作培训法及轮转结束时的终末临床技能考核;实验组在此基础上于轮转第2周和第4周分别接受1次DOPS形成性评估和反馈。除DOPS干预外,两组在轮转时间安排、临床工作参与程度及教学资源方面尽可能保持一致。
2.3. 常规操作培训法
本研究中将本科实习医师在普通外科轮转期间科室常规实施的操作培训模式定义为“常规操作培训法”,其具体内容由以下几个相对固定的组成部分构成:
1) 培训目标与内容:以清创缝合术、换药术、腹部查体、无菌穿脱手术衣和腹腔穿刺五项临床技能为核心培训目标,围绕上述技能构建训练大纲,明确各项目标能力和操作要点。
2) 集中理论授课与病例讨论:由具有教学经验的普通外科医师结合本科教学进度和科室常见病种,采用小讲课与病例讨论相结合的方式,系统讲解相关解剖学、外科基础理论及操作注意事项,帮助学员在理论层面理解每一项操作的适应证、禁忌证及潜在风险。
3) 标准化操作示教与模拟练习:带教老师按照操作规范对清创缝合术、换药术、腹部查体、无菌穿脱手术衣和腹腔穿刺进行分步骤示范,突出关键步骤和易错环节;学员在模拟和真实临床环境中进行反复练习,教师根据操作过程随时进行口头纠正和补充示范,以保障操作步骤的规范性与连贯性。
4) 床旁带教与日常指导:在日常查房、换药和小手术等临床工作中,带教老师根据病情安排学员参与相关操作或辅助操作,强调无菌观念、病人沟通及安全意识,并针对学员在真实情境中的表现给予即时简要反馈。
5) 终末性考核与一般反馈:在轮转结束前由科室统一组织出科考试,对上述五项临床技能进行综合性终末考核,教师根据考核结果向学员反馈整体表现并提出改进建议,但一般不再进行系统化的结构化书面反馈与跟踪评价。
上述五个环节共同构成本研究中对照组所接受的常规操作培训法,实验组在此基础上叠加DOPS形成性评价干预。
2.4. 评估者组成与培训
本研究所有DOPS评估均由3名具有普通外科中级及以上职称、教学经验≥5年的医师担任评估者。为保证评分标准的一致性和可重复性,在正式实施前组织评估者进行统一培训,主要包括:1) 集中学习DOPS理念和本研究使用的评价量表条目,逐条明确各评分维度的含义和评分锚点;2) 通过模拟病例视频及现场演示进行两轮试评分,比较评估者间评分差异,对分歧较大的条目进行讨论和统一,形成较为一致的评分标准;3) 在正式DOPS评估过程中,每次评估尽量由2名评估者同时在场独立评分,若总分差值 > 3分,则由第三名评估者复核并协商形成最终得分。上述培训和校准程序在正式实施前完成,并在整个研究过程中保持不变,以尽可能减少评估者之间的主观差异,提高评分结果的可靠性。
2.5. DOPS评估实施
实验组学员在普通外科轮转第2周和第4周分别接受1次DOPS评估。评估在门诊换药室、治疗室或病房等真实或接近真实的临床环境中进行,每名学员在评估时至少完成上述五项临床技能中的1~2项。DOPS评价量表主要包括准备与沟通、体位与无菌观念、操作步骤是否规范、意外情况的处理、操作后的交代与记录等多个维度,各条目采用分级评分方式,计算总分并划分等级:<60分为未达预期,60~90分为达到预期,91~100分为超过预期,良好以上评价指达到预期 + 超过预期。评估结束后,评估者按照“肯定优点–指出问题–共同商定改进计划”的结构化方式向学员当场反馈,对操作过程中的优点与不足进行具体、可操作的点评,并鼓励学员在后续临床工作中有针对性地改进。对照组不实施系统化DOPS评估和结构化反馈,仅在日常操作中接受常规口头指导。
2.6. 终末临床技能考核与盲法实施
两组学员在轮转结束前1周统一参加终末临床技能考核。考核采用客观结构化临床考试(objective structured clinical examination, OSCE)的形式,设置清创缝合术、换药术、腹部查体、无菌穿脱手术衣和腹腔穿刺五个站点,考核内容与DOPS量表条目保持一致。为减少偏倚,本研究终末考核采用单盲方式实施:考核评估者为未参与本次DOPS实施与日常带教的普通外科教师,仅知学员编号,不知其所属分组及是否接受过DOPS评估;考核顺序由研究者使用随机数字表预先排定并在考核当天封存,考官按照顺序依次评估;考核过程中由固定记录员协助记录成绩,评估者不得访问学员既往DOPS记录,也不得与学员讨论其具体培训经历。终末考核按总分划分为未达预期、达到预期和超过预期三个等级,良好以上评价率为达到预期及以上比例。
2.7. 观察指标
主要观察指标包括:1) 两组一般资料:性别、年龄、入学平均成绩等;2) 实验组第2周与第4周DOPS评估结果:平均分及等级分布(未达预期、达到预期、超过预期及良好以上评价率);3) 终末临床技能考核总体结果:两组总分及等级分布、良好以上评价率;4) 五项具体临床技能考核结果:清创缝合术、换药术、腹部查体、无菌穿脱手术衣和腹腔穿刺五项技能的单项得分比较。其中,腹部查体虽不属于侵入性操作,但作为普通外科临床工作中最常见和基础的体格检查项目,其检查手法、沟通交流以及对阳性体征的把握均与外科操作技能密切相关。本研究将腹部查体与其他四项操作共同纳入“临床技能”考核框架,用以综合反映学员在操作相关临床技能方面的能力水平。
2.8. 统计学方法
采用SPSS 28.0软件进行数据处理。计量资料以(
)表示,组间比较采用独立样本t检验,实验组第2周与第4周DOPS评估结果比较采用配对样本t检验;计数资料以例数(百分比)表示,组间比较采用χ2检验或Fisher确切概率法。以P < 0.05为差异具有统计学意义。
3. 结果
3.1. 两组一般资料比较
如表1所示,两组学员在性别、年龄及入学平均成绩等一般资料方面差异均无统计学意义(P > 0.05),提示两组基线情况具有良好可比性。
Table 1. Comparison of general information between the two groups
表1. 两组学员一般资料比较
项目 |
实验组(n = 30) |
对照组(n = 30) |
t/χ2值 |
P值 |
平均年龄(岁,x ± s) |
22.5 ± 0.8 |
22.7 ± 0.9 |
0.455 |
0.65 |
性别[n(%)] |
男 |
16 (53.3) |
17 (56.7) |
0.067 |
0.80 |
女 |
14 (46.7) |
13 (43.3) |
- |
- |
入学平均成绩(分,x ± s) |
82.4 ± 3.1 |
81.9 ± 3.5 |
0.597 |
0.55 |
3.2. 实验组DOPS形成性评估结果比较
实验组学员在轮转第2周和第4周分别接受1次DOPS评估。第4周DOPS评估的平均分及良好以上评价率均显著高于第2周,未达预期人数明显减少,两次评估在总分及等级分布方面差异均具有统计学意义(P < 0.05) (见表2)。
Table 2. Comparison of DOPS assessment results for trainees in the experimental group at week 2 and week 4
表2. 实验组学员第2周与第4周DOPS评估结果比较
评估
时间 |
平均分(分,x ± s) |
超过预期[n(%)] |
达到预期[n(%)] |
未达预期[n(%)] |
良好以上评价率[n(%)] |
第2周 |
78.6 ± 8.4 |
3 (10.0) |
22 (73.3) |
5 (16.7) |
25 (83.3) |
第4周 |
88.9 ± 5.7 |
12 (40.0) |
17 (56.7) |
1 (3.3) |
29 (96.7) |
统计值 |
t = 5.892,P < 0.001 |
χ2 = 7.200,P = 0.007 |
- |
- |
χ2 = 3.968,P = 0.046 |
3.3. 终末临床技能考核总体结果比较
轮转结束前的终末临床技能考核结果见表3。与对照组相比,实验组学员的考核总分明显更高,良好以上评价率亦显著增加,而未达预期者比例减少,两组差异均具有统计学意义(P < 0.05)。
Table 3. Comparison of overall final operative skills assessment results between the two groups of trainees
表3. 两组学员终末操作技能考核总体结果比较
组别 |
人数 |
考核平均分
(分,x ± s) |
超过预期[n(%)] |
达到预期[n(%)] |
未达预期[n(%)] |
良好以上评价率[n(%)] |
实验组 |
30 |
90.5 ± 4.8 |
14 (46.7) |
16 (53.3) |
0 (0) |
30 (100) |
对照组 |
30 |
83.2 ± 6.9 |
5 (16.7) |
22 (73.3) |
3 (10.0) |
27 (90.0) |
统计值 |
|
t = 4.831,P < 0.001 |
χ2 = 6.238,P = 0.013 |
- |
- |
χ2 = 3.914,P = 0.048 |
3.4. 五项具体临床技能考核结果比较
为进一步分析DOPS对不同临床技能的影响,本研究比较了两组学员在清创缝合术、换药术、腹部查体、无菌穿脱手术衣和腹腔穿刺五项技能考核中的单项得分。结果显示,实验组在上述五项技能中的得分均显著高于对照组(P < 0.05)。其中,换药术和无菌穿脱手术衣等对细节把控和无菌观念要求较高的操作项目中,实验组优势尤为突出,提示DOPS在规范操作流程、强化无菌意识和细节执行方面具有较为明显的促进作用(见表4)。
Table 4. Comparison of assessment scores for each sub-item operative skill between the two groups of trainees (points, mean ± SD)
表4. 两组学员各分项操作技能考核成绩比较(分,x ± s)
操作项目 |
实验组(n = 30) |
对照组(n = 30) |
t值 |
P值 |
清创缝合术 |
91.2 ± 3.5 |
85.1 ± 6.2 |
4.674 |
<0.001 |
换药术 |
92.5 ± 3.1 |
87.3 ± 5.8 |
4.432 |
<0.001 |
腹部查体 |
87.8 ± 5.4 |
80.6 ± 7.5 |
4.285 |
<0.001 |
穿脱手术衣 |
94.1 ± 2.9 |
89.5 ± 4.3 |
5.012 |
<0.001 |
腹腔穿刺 |
88.9 ± 4.7 |
82.5 ± 6.9 |
4.221 |
<0.001 |
4. 讨论
在注重医学素质教育与胜任力培养的背景下,熟练的临床技能不仅是外科学教学的重点,更是医学生迈向临床岗位的基础[9]。本研究在普通外科本科实习医师中引入DOPS作为形成性评价工具,结果显示,实验组学员在DOPS评估和终末临床技能考核中均优于仅接受常规操作培训法的对照组,提示DOPS有助于提升操作相关临床技能水平。
4.1. DOPS促进技能持续改进的可能机制
本研究中,实验组学员在第4周DOPS评分及良好以上评价率均高于第2周,说明在连续的“评估–反馈–再练习–再评估”循环中,学员能够有的放矢地修正错误、巩固优点,从而实现技能水平的螺旋式上升。一方面,DOPS强调在真实或接近真实的工作场所中完成操作,评估者能够全面观察学员在准备、沟通、操作细节及无菌观念等多个维度的表现,反馈更加贴近实际临床需求[10]-[13];另一方面,结构化即时反馈有助于学员明确“自己在哪一步做得不够好”,避免以往终末性考核中“只知分数、不知原因”的状况,从而提高学习的针对性和主动性[14]。本研究还发现,实验组在换药术、无菌穿脱手术衣等对规范性和细节要求较高的操作项目上优势更为明显,这与DOPS评价条目中对无菌操作、手部动作和操作流程的精细化要求高度一致,提示DOPS不仅能够提升“是否会做”,更有助于规范“是否做得规范、是否安全”。
4.2. 可能的风险与实施中的现实挑战
尽管DOPS在本研究中取得了较为积极的结果,但其实施也存在一定风险和现实挑战,若处理不当,可能削弱其教学成效。首先,DOPS是一种高度依赖师资的评价工具。评估者不仅需要具备扎实的临床技能和教学经验,还需接受额外的评价培训和校准,这对临床科室的时间和人力投入提出了更高要求[6] [10]。在临床工作任务繁重、带教师资相对紧张的背景下,大规模、常态化推广DOPS可能面临较大压力。本研究中仅在特定时间点、由固定评估者执行DOPS,已经占用了额外的教学时间,这在现实实践中需要医院和科室在排班及绩效考核方面给予相应支持。其次,尽管本研究通过统一培训、试评分和协商机制在一定程度上控制了评估者之间的主观差异,但DOPS本身仍不可避免地受评估者主观判断的影响,存在一定评分偏倚风险。如果评估者对评分锚点理解不一,或在忙碌临床环境中难以做到充分观察和细致反馈,DOPS可能退化为“打分程序”,难以发挥其应有的形成性评价功能。
再次,DOPS在一定程度上会促使学员“围绕量表练技能”,即更关注被考核的具体条目,而对未被覆盖的其他临床能力(如团队协作、跨专业沟通等)关注不足。这种“以评促学”的优势与“以评限学”的风险并存,需要在评价工具设计中充分权衡。
4.3. 指标设置与对照组界定的局限
本研究在设计过程中统一了培训内容与考核指标,将清创缝合术、换药术、腹部查体、无菌穿脱手术衣和腹腔穿刺五项临床技能同时纳入常规操作培训法和终末考核。然而需要指出的是,普通外科临床工作中实际涉及的操作远多于上述五项,本研究主要选择对本科实习阶段最为重要且可操作性较强的技能作为终末指标,这在一定程度上可能导致培训内容与临床实际工作之间仍存在“部分不重叠”的现象。此外,腹部查体虽非侵入性操作,却与外科临床诊疗过程密切相关,本研究将其纳入“临床技能”框架有一定合理性,但也可能增加研究指标体系的复杂性。
同时,本研究中对照组接受的是“常规操作培训法”,该概念在不同医院和不同带教老师之间具体内容可能存在差异。尽管在本研究中,我们通过明确培训目标、统一培训内容和书面说明等方式对常规操作培训法进行了较为清晰的界定,仍无法完全排除带教方式和个人教学风格差异对结果的影响。此外,对照组在日常临床工作中也会获得一定程度的即时反馈,这在真实教学场景中难以完全避免,可能使两组之间DOPS干预的“剂量差”被低估,从而影响效应量的判断。
4.4. 研究局限与未来展望
本研究样本量相对较小且为单中心研究,结论的外推性有限;研究随访时间仅覆盖了一个轮转周期,尚不能评估DOPS对中长期技能保持和临床胜任力的影响[9] [15] [16]。此外,本研究主要关注操作相关临床技能,对学员的沟通能力、团队协作、职业态度等其他维度未进行系统量化评价,难以全面反映DOPS对整体临床能力的影响。未来研究可在多中心、大样本的基础上,进一步细化干预强度,明确“常规培训”与“DOPS强化培训”的具体差异,同时结合标准化病人、迷你临床演练评估(mini-clinical evaluation exercise, Mini-CEX)等工具,从多维度构建基于工作场所的形成性评价体系。通过延长随访时间、增加纵向观察,有望更全面地评估DOPS在不同阶段医学教育中的作用和适应边界。
5. 结论
综上所述,本研究在普通外科本科实习医师中应用DOPS作为形成性评价工具,结果显示,在本研究设定的培训模式和评价框架下,接受DOPS干预的学员在终末临床技能考核总分及清创缝合术、换药术、腹部查体、无菌穿脱手术衣和腹腔穿刺等具体临床技能方面的表现均优于仅接受常规操作培训法的学员。DOPS通过在真实工作场所实施直接观察并提供结构化即时反馈,可能有助于促进操作相关临床技能的持续改进和规范化掌握。然而考虑到本研究样本量有限、为单中心研究且对照组常规操作培训法的界定仍有进一步精细化空间,本研究结论仍具有一定局限性。总体来看,DOPS在普通外科本科实习医师技能培训中的应用显示出积极的实践价值和一定的推广潜力,建议在条件允许的教学单位中循序渐进地开展,并在更大样本、多中心及长期随访的研究中进一步验证其效果和适用范围。
基金项目
临床操作技能直接观察法评估在普通外科本科实习医师技能考核中的应用研究(项目编号:qyjg-202422);青海省“昆仑人才高端创新创业人才计划”(青年人才专项),No. [2021]第13号;2022年度青海省“昆仑英才·高端创新创业人才”柔性引进领军人才,商昌珍,青人才字[2023]1号。
NOTES
*通讯作者。