1. 引言
当前,我国经济发展正处于从粗狂式发展到高质量发展的转型期,创新作为主动力被提到经济发展战略层面,大学生的创新创业能力成为我国经济转型升级的重要力量[1]。科教兴国、人才强国战略强劲鼓舞了我国毕业生及其他团体、个人的创新创业浪潮。在全球经济形势下滑的影响下,如何提高大学生的科研能力、创新能力,助力中国经济高质量发展的问题,横亘在我们面前。2008年,国务院审批通过了《关于促进以创业带动就业工作指导意见》,其中明确提出要加强创业教育,提高公众的创业意识[2]。目前,我国高等院校已将提升大学生的创业能力视为高等教育的核心目标之一,各高校积极采取多种方式实施创业教育,例如设置创业相关课程、建立创业俱乐部、组织实践活动及举办科技创新竞赛等。特别是在这些活动中,科创竞赛因其能有效促进学生的创业意识并点燃他们的创业激情而受到高度重视,成为了创业教育不可或缺的一部分[3] [4]。诸如“创青春”全国大学生创业大赛和“互联网+”大学生创新创业大赛等赛事应运而生,蓬勃发展。自2020年起启动的双创示范基地创业就业“校企行”特别行动方案中,明确提出利用科技创新竞赛和项目展示会等方式,促进高校的创新创业成果与企业的有效连接[5]。这一举措不仅有助于企业吸引有潜力的创新创业者,同时实现了第一课堂与第二课堂有机结合、校内外实践教学资源整合,也为在校学生开辟了更多就业和创业的可能性[6]。通过这种方式,高校与企业之间形成了良性互动,共同推动了我国创新创业环境的持续优化和发展。
科研竞赛是一种围绕特定学科或跨学科领域展开的知识与技能比拼活动,它为当代大学生提供了一个展现自身创新实践能力的平台。尽管如此,目前高校在通过学科竞赛培养人才的过程中仍面临诸多挑战,比如竞赛平台建设不足、教师负担过重以及学生参赛积极性不高等。在高等教育转型的大背景下,学科竞赛被视为培养和提升学生创新实践能力的关键渠道,“四年制科创法”就是创新之一[7]。对于学生而言,参加这类竞赛不仅能够锻炼他们运用所学知识解决实际问题的能力,还能激励他们在挑战中不断超越自我,实现个人的全面发展[8]。然而,当前高校在推行学科竞赛育人模式时遇到的一些难题,确实在某种程度上制约了学生创新实践能力的发展。因此,高校需要给予足够重视,积极探索解决这些问题的方法,以更好地发挥学科竞赛在人才培养中的作用。基于此,本文从高校教师的角度出发,分析了影响大学生参加科创竞赛的各种因素,探索如何改善学科竞赛的育人机制,提出了基于问卷调查预测大学生是否参加竞赛的模型。旨在提高大学生创新实践能力,探索为国育才有效策略,希望为高校深化教学改革提供参考。
2. 方法
2.1. 科研竞赛认定
尽管许多学者从不同角度对科技创新创业竞赛(简称“科创竞赛”)进行了探讨,但至今为止,对于这一概念并没有统一的定义。研究者们尝试通过分析参与者的特征、参赛作品的形式、竞赛的功能以及组织流程等多个维度来明确科创竞赛的概念[9]。在此研究中,我们将科技创新创业竞赛定义为一种以大学生为主要参与者,以技术创新和发明创造的作品为核心参赛内容,同时兼具选拔优质创新创业项目与培养相关人才双重目标的比赛形式。这类竞赛通常包含商业计划书编写、实验室测试、样品或原型制作、现场答辩等多个环节。例如,“挑战杯”全国大学生课外学术科技作品竞赛(侧重于科技发明制作)、全国大学生机械创新设计大赛、全国大学生节能减排社会实践与科技竞赛等,都是这一领域的典型代表。
2.2. 调查问卷设计
问卷调查是一种通过设计与研究主题紧密相关的详细问题列表,让受访者根据个人实际情况作答,从而收集数据的方法。作为社会科学研究中广泛采用的资料收集手段,问卷调查可以根据其传播媒介的不同,分为传统的纸质问卷和现代的网络问卷两种形式。鉴于网络问卷调查的便捷性,以及考虑到涉及的高校数量较多,本研究选择了网络问卷的方式来进行。具体操作是向选定的高校发放电子问卷,邀请相关人员在线完成并提交,之后收集和分析这些问卷反馈的信息。
本文设计的问卷调查根据优劣分析法设计。首先确定了主要研究对象“在校本科生”,为了保证采样的多样性分别选取了三所高校的工科、理科、文科以及艺术类学生并在每个类别里不同专业按人数占比分配采样数量最终获得了3000份调查问卷。因为大一学生刚入大学,对很多事情还处于朦胧阶段,大四学生处于考研、就业阶段,这两类人群均对比赛的关注较少因此本文通过随机抽取本校大二、大三在读本科生100人其中参与过比赛50人,从未参与比赛50人对已经设置好的问卷调查题目进行挑选和补充最终确定了参加科创竞赛的优势、劣势、机会、威胁方面制定四十道问卷调查题目用以调查大学生的主观意愿与客观条件对大学生参加科创竞赛的影响,优劣势如表1所示,机会和威胁如表2所示。所有问题为选择题,有非常关心、较关心、一般般、不关心、毫不在乎五个选项,每题只能选择一个。此调查表,通过线上发放的形式收集大学生参加科研竞赛的情况。
Table 1. Strengths and weaknesses of the strengths and weaknesses analysis
表1. 优劣分析法的优势和劣势调查题目
优势 |
劣势 |
1. 有无奖金 |
11. 占用时间长短 |
2. 是否对实践经验增加 |
12. 是否会增加您的学业压力 |
3. 是否对团队协作能力的提高 |
13. 可能会导致您的学习成绩下降 |
4. 是否对创新思维提高 |
14. 会需要很多精力 |
5. 是否对解决问题能力的提升 |
15. 可能会感到疲惫不堪 |
6. 是否增强您的自信心 |
16. 可能会感到压力大 |
7. 是否加学分 |
17. 可能会忽视其他重要的事情 |
8. 是否有助于建立良好的人际关系网 |
18. 可能会感到焦虑 |
9. 是否有助于提高您的领导力 |
19. 可能会感到孤独 |
10. 能了解行业发展趋势 |
20. 可能会感到不被理解 |
Table 2. Opportunity and threat of the strengths and weaknesses analysis
表2. 优劣分析法的机会和威胁调查题目
机会 |
威胁 |
21. 提供更多的就业机会 |
31. 影响心理健康 |
22. 能够帮助您获得奖学金 |
22. 导致与同学的关系恶化 |
23. 得到老师指导 |
33. 导致与导师的关系紧张 |
24. 能够帮助建立与企业的联系 |
34. 导致家庭关系受到影响 |
25. 能够帮助获得更多的实习机会 |
35. 导致经济负担增加 |
26. 能够帮助获得更多的科研项目机会 |
36. 导致个人时间被严重压缩 |
27. 能够帮助获得更多的国际交流机会 |
37. 导致健康状况下降 |
28. 能够帮助获得更多的创业机会 |
38. 导致社交生活受到影响 |
29. 能够帮助获得更多的社会资源 |
39. 导致个人兴趣爱好被忽视 |
30. 能够帮助获得更多的社会认可 |
40. 导致个人发展规划被打乱 |
2.3. 基于残差神经网络的科研竞赛参与度预测模型
残差神经网络(Residual Neural Network)是多个残差块构成,残差块的结构如图1。一个残差块由两个归一化批处理层(Batch Normalization Layer, BN)、两个整流线性单元(Rectififier Linear Unit, ReLU)激活层、两个卷积层(Convolutional Layer, Conv)和恒等映射组成,残差块通过预留一个通道使得未经处理的数据直达最后,允许一些关键信息绕过卷积层直接传递到后续层,解决了多层次卷积神经网络的训练问题,支持更深的网络架构[10]。该结构使得模型更容易训练,解决了传统深层神经网络在训练过程中容易遭遇梯度消失或梯度爆炸问题。残差神经网络通过引入残差块,另一方面,残差网络可以通过调整残差块的数量和配置来适应不同类别的任务需求,其学习框架有助于网络学习到训练集的更本质特征,而不是仅仅
Figure 1. Schematic diagram of desidual block
图1. 残差块结构
记忆训练样本。因此,残差网络具有较强的泛化能力和扩展性。在调查问卷应用场景中,残差神经网络相较于其他类型神经网络展现出独特优势。残差神经网络借助残差连接成功解决了梯度消失与退化问题,这使其能够构建深度网络架构,深入挖掘调查问卷数据中的复杂特征,在分析问卷时,可从多维度评价中发现潜在期望模式与关联因素,且能直接处理高维数据,无需复杂特征工程,有效应对问卷多问题多选项的情况。同时,残差连接这一核心优势可减少信息丢失,在处理问卷长文本回答等信息时,即便经过多层网络传播,仍能较好地保留原始信息,确保数据完整性与准确性,从而为调查问卷分析提供更精准、全面且高效的手段,有助于得出更具深度和价值的分析结论。而其他神经网络因梯度反向传播受阻难以达到如此效果,对问卷深层次语义及隐藏特征的提取能力受限。
残差块中的批量正则化操作,是对输入层做标准化处理,使得输出服从均值为0,方差为1的正态分布,从而避免变量分布偏移的问题。相当于把每层神经网络任意神经元这个输入值的分布强行拉回到均值为0,方差为1的标准正态分布。公式如(1)、(2)所示
(1)
(2)
其中
为输入的特征数据,
为本批次的平均值,
为误差,
、
为可学习的常数值。
卷积层包含许多具有加权参数的卷积核(也称为滤波器)。这些卷积核与正则化后的数据进行运算,运算结果进入下一层。那么第l层的结果如下:
(3)
其中,
为激活函数,
为卷积运算,
是偏置系数,
是第
个卷积层的第
个特征值;
是第
层的第
个卷积核,它与上一层输入的特征进行卷积运算,后加上偏置矩阵值就得到了当前层的特征值输出。激活函数可以有效避免在卷积过程中的梯度消失和梯度爆炸的问题。本文残差块中激活函数选择整流线性单元(ReLU)激活函数,其定义如下:
(4)
整体残差块的计算可表示为公式(5),
(5)
其中
表示输入的原始数据,Y表示经过残差块后的输出,
表示残差块内部的批量正则化、卷积、激活等操作,+表示逐元素相加。最后再通过softmax函数进行归一化处理,输出结果。
3. 实验与结果分析
3.1. 数据预处理
数据处理首先需要将调查问卷中的数据进行预处理,剔除调查问卷中选项整体一致的无意义问卷以及空白问卷,接着将不同大类不同学科的调查问卷分别随机混乱并随机剔除三分之二的问卷数量。不同大类不同专业的相对独立的数据处理可以保证问卷数量的均匀性和代表性。后将问卷调查题目的答案量化处理,根据其结果按照表3进行量化。最终结果为每个大学生的调查问卷转化成一个41维的向量,前40维为问卷调查的结果,最后一维为是否参加过科创竞赛,最后一维“0”为不参加,“1”为参加。最后本文选取1000位大学生的调查问卷为研究对象,其问卷信息的预处理结果如表4所示。
Table 3. Survey results quantified comparison table
表3. 调查结果量化对照表
类别 |
非常关心 |
较关心 |
一般般 |
不关心 |
毫不在乎 |
分值 |
1 |
3 |
5 |
7 |
9 |
Table 4. Quantitative results of questionnaire survey of college students
表4. 大学生问卷调查量化结果
问卷编号 |
问题1 |
问题2 |
问题2 |
问题2 |
… |
问题40 |
是否参加 |
Q0001 |
1 |
9 |
1 |
3 |
… |
3 |
0 |
Q0002 |
5 |
7 |
5 |
7 |
… |
3 |
0 |
Q0003 |
5 |
3 |
5 |
1 |
… |
9 |
1 |
Q0004 |
1 |
7 |
1 |
9 |
… |
5 |
0 |
… |
… |
… |
… |
… |
… |
… |
… |
Q1000 |
3 |
5 |
1 |
7 |
… |
7 |
1 |
3.2. 参数确定
残差网络模型需要对卷积核的大小、步长、填充、激活函数、层数及其其他参数进行选择。本文采用的残差网络包括残差块、池化层、分类层,其具体结构构成如图2所示。训练轮数为1000或者损失小于0.001。损失函数采用交叉熵损失函数(CrossEntropy Loss),优化算法采用Adam算法,初始学习率为0.001,最大池化,卷积核选择3 × 3,填充为1,批大小选择50。CNN的初始权重参数和偏置全为零。在所有的数据样本中,把70%的样本作为训练集,其余的用作测试集,测试集不做训练,仅供测试。
Figure 2. Flow of Residual neural network
图2. 残差神经网络流程
3.3. 实验环境以及参数设置
实验在配置了Python3.9的Pytorch2.0.0的移动工作站上进行,工作站配备了英特尔i5-10300H CPU、16GB内存,显卡1650Ti,显存4G的移动工作站上进行的。
3.4. 结果分析
需要根据1000个调查问卷数据中的优势、劣势、机会、威胁四个方面的信息预测所有大学生参加科创竞赛的概率。将处理后的数据作为输入,是否参加科创竞赛作为目标,训练残差神经网络模型,即可得到关于预测全体大学生参加科创竞赛的神经网络模型。该模型可以有效预测出所需要的结果。训练过程如图3所示,在前400步迭代的过程中,训练集和测试集的准确率逐步上升,并且上升的绝对值越来越小;在400步以后,预测模型精度虽然在上升,但是上升的幅度较小。在600到800步之间的测试集准确率平均达到94.6%。
Figure 3. Plot of training process for the proposed prediction model
图3. 所提出预测模型训图
经过1000次的训练,所提出模型的内部参数已经基本处于最优状态,此时用来预测大学生是否参加科研竞赛,训练集准确率达到98.7%,验证集准确率达到94.6%。预测结果如表5所示。
Table 5. Comparison table between predicted results and real results
表5. 预测结果与真实结果对照表
问卷编号 |
是否参加过科研竞赛 |
预测值 |
Q0001 |
0 |
0 |
Q0003 |
0 |
0 |
Q0004 |
1 |
1 |
… |
… |
… |
Q1000 |
1 |
1 |
4. 结语
本文所建立的基于残差网络的预测模型,残差网络可以多层堆叠,抓取到输入信息的全局特征,从而更精准地预测出结果。相比于卷积神经网络,它不会因为层数较多而发生梯度爆炸或衰减,能够保留初始特征。模型经过训练,预测大学生是否参加科研竞赛的准确率达到94.6%。
此外,结果显示影响大学生参加科研竞赛的主要因素有是否加学分、与个人兴趣是否相同、有无带教老师、有无奖金、时间是否充足等。其中有无带教老师占比较高,在当今的教育环境下大学生从高中的老师严管到大学的无忧无虑过渡得太快,而且相当一部分大学生缺少正确的指引或者可借鉴的方法,在科研竞赛方面经常处于一个迷茫或者不知所措的状态,因此需要老师一定的指引和教导,老师是一个知识载体,在科研竞赛方面具有宝贵的经验,通过老师的帮助和指引可以培养学生科研竞赛的方法和独立自主的科研能力。本模型探索了影响大学生参加科研竞赛积极性的客观条件、为培养大学生创新实践能力探索了有效路径,为高校深化教育教学改革提供有益参考。