1. 引言
学科评估是高等教育评估工作的一个重要组成部分。通过对高校学科的科学研究、人才培养活动及所要达到的目的、价值、效果、效率进行综合评价或估量,进行学科建设与管理。学科评估通过系统、有效的科学评价,可以明确认识自己的不足与优势,汲取有关未来科学的发展方向、研究途径、合理资源分配方案等一系列有利于实现学科科学管理的重要手段,提高学科知名度,最终达到全面提高科学研究和培养人才的效益和质量的目的,保持学科在国内或国外同类比较中的领先地位。要提高重点学科建设的效益,就要按照学科建设的科学规律,完善重点学科建设的质量,就要建立、健全科学的学科质量评价方法和体系。高校学科评估是指由高等学校与科研院所学位与研究生教育评估所组织 [1] 的一级学科整体水平评估。按照自愿申请参评的原则,学科评估采取主客观评价相结合的方式,所需数据由相关政府部门、社会组织公布的公共数据和参评单位报送的材料构成,通过对以上数据的公示,邀请学科专家、政府部门及企业人士进行评价,在此基础上形成最终评价结果。目前我国从2002年开始的第一次学科评估,至今已结束三轮,第四轮学科评估正在准备进行。可以看出,我国在学科评估方面已经取得了较大进展,但是仍然存在许多争议和问题。
2. 我国学科评估体系概况
有关高等教育、研究生教育的评估早在上世纪末本世纪初就在全国开始全面展开。1994年初,国家教委就有针对性地开始对普通高等学校本科的教学质量进行评估。在一系列的相评估项目中比较受高校认可和关注的是“一级学科整体水平评估”(以下简称学科评估)。
我国学科评估从2002年开始,教育部学位和研究生教育发展中心按照教育部和国务院学位委员会颁布的《学位授予和人才培养学科目录》,对研究生发展培养和学位授予资格的一级学科进行整体水平评估。此项工作于2002年首次在全国开展,学位中心预计于2016年开始进行第四轮学科评估工作。对四次学科评估进行比较,可以发现四次学科评估在评估目的方面越来越明确且全面,在参评条件方面越来越详细具体,参评的学科规模增长迅速、指标体系构建进一步细化与完整,评估程序也日趋完善(见表1)。
通过以上的介绍我们可以看出,我国由教育部学位与研究生教育发展学位主导进行的学科评估已经形成了一定的规模,参评学科数目显著增长,指标体系有了较大的完善,数据来源更加准确和全面,评估结果也更具有权威性。与此同时,每轮学科评估都会做出适当的调整与完善。以评估指标体系为例,从第二轮学科评估开始在统一框架下分类设置指标体系。在前三轮学科评估的基础上,到第四轮学科评估,更加细化学科门类分类设置,强化分类引导,将人文与社科分列,将理工科与农学、医学分列,

Table 1. The four discipline evaluation situation of the ministry of education degree profile center
表1. 教育部学位中心四次学科评估概况
资料来源:教育部学位与研究生教育发展中心http://www.cdgdc.edu.cn/xwyyjsjyxx/xxsbdxz/index.shtml。
指标体系由第三轮指标体系的7类拓展到9类。四轮学科评估朝着更加注重分类与特色评估、更加注重质量评估、更加注重社会贡献评估方向发展,使评估在服务国家大局、髙校学科发展以及社会、国际需要中发挥着重要的作用。
3. 我国学科评估体系存在的问题与原因分析
(一) 我国学科评估体系存在的问题
我国学科评估体系从最初的试行到后来的广泛应用,在取得客观的成绩的同时也存在许多制度上的问题。
1) 欠缺评估指标
我国学科评估体系的指标大多是量化性指标,有时为了便于比较和统计,将不适合量化的指标量化,将不能够比较的东西加以比较,使学科评估的质量降低,缺乏科学性和合理性,以数理统计的方法反映某一学科在某一特定评估体系下的水平,并不能全面、客观、真实的反映高校学科的水平。例如单纯追求高校取得博士、硕士学位的人数而忽视人才培养的质量;单纯追求论文、科研项目的数量而忽视论文的水平。学科评估过分注重对指标的定量分析,忽视了定性分析的指标,如学科建设理念、学科建设的目标和学科建设的规划等,而这些指标恰恰是反映学科建设灵魂和方向的指导性内容。这种重量轻质的做法可能在实践中只顾具体行为达标,很容易造成学科建设和学科研究的形式主义,不利于学科建设的长远发展。
2) 评估主体单一
目前我国的学科评估主体主要是政府,学科评估人员主要由专业研究人员、行政领导和第一线的实际工作者组成。高校学科评估主要是由国家教育部门主导或由其委托各省、市、部、委进行评价,而这必然带有一定的行政干预的成分,有时会存在为了“平衡”的因素,使评估结果具有明显的垄断性和封闭性,不够客观和全面,缺乏权威性。学科评价结果通常不会大范围公布,只会发布在一些专业刊物之中,大量读者无法直接接触到评估体系的程序和标准,使公众不能信服评估出来的结果,考生依旧无法根据评估结果放心的选择自己需求的高校,从而削弱了学科评估体系的服务社会的作用,也容易引起争议。同时,由于一些缺乏评估工作知识和经验的人参与评估,有时也会出现缺乏科学性甚至是“瞎指挥”的评估现象。所以对行政因素的介入和干预程度的控制,对于建立独立的、规范的、客观的评估机构具有重要意义。
3) 缺乏导向作用
目前的大多数学科评估体系只是简单罗列学科队伍、科研经费、论文数量及成果、毕业率和科研设备等因素,对学科过去的发展做一个阶段性的评估,而并不能衡量一个学科未来发展的走势和可能达到的水平 [2] 。割裂投入和产出的关系,只注重产出的数量,而忽视投入与产出共同构成的效率,因此无法对学科的建设发挥导向作用。
(二) 我国学科评估体系存在问题的原因分析
1) 评估体系重结果轻过程
学科评价重结果轻过程,无法发挥对学科建设的导向作用。目前大多数的学科评估属于学科的绩效评价,评价学科发展阶段性的成果,并以此结果来衡量学科的水平和配置战略资源的流向。以历史总量指标为依据的学科评价体系,具有狭隘性,只能衡量在一定时间内的一个学科所能达到的水平,但却无法衡量该学科未来的发展趋势和预测所学科所能达到的水平。对学术成果进行评价是大多数评价体系的评价因素。在学科评价体系中,少有对学科投入方面的指标,体现不出学科在不同水平的投入与产出的转化率。
2) 评估体系较缺乏独立性
以政府为主导的行政化学科评价模式削弱了其他评价主体的作用。容易导致评价的不客观和不全面。在实际的评估结果发布后,对政府的教育经费的审批,高校的分层和分类不产生影响,因此评估体系无法发挥其应有的价值和作用,导致政府和社会各界对其的重视程度普遍不足。在社会评价方面,虽然我国少数对大学学科进行评估的民间评估机构,如武汉大学中国科学评价中心、广东省管理科学研究院等推出过中国大学排名,但这些评价只是起到一定的参考作用,缺少对高校的强制力和约束力。
4. 英美学科评估体系的经验与启示
学科评估或学科排名是国际上普遍采用的一种教育评估手段,其主要目的是系统评估高等教育质量,其基本特征是关注效率和效益,注重结果和产出 [3] 。当前,各国学科评估的形式和侧重点不一。美国研究理事会(NCR)组织的博士点评估是对该国的博士点项目进行评估,它侧重评估人才培养的各项指标,至今已开展了3次;英国科研评估是对该国高校学科点的研究质量进行评估,它侧重评估科学研究的各项指标,至今已开展7次。
(一) 评估历史
20世纪80年代以前,英国的科研拨款主要由各学科委员会通过主观评价指标来决定。随着科学研究的重要性的提升,大学拨款委员会认为需要设计一套公正客观的科研评价方法。1984年,英国政府明确提出科研绩效要在大学资源配置中发挥重要作用,要采取新的经费分配办法保证科研资源的投入效益。随后,英国大学拨款委员会、大学资助委员会、高等教育资助委员会先后于1986年、1989年、1992年、1996年、2001年、2008年开展了6次科研评估 [4] 。2014年,英国高校科研评估工作被科研卓越框架(Research Excellence Framework 简称REF)所取代 [5] 。上述7次科研评估规模逐步扩大,参评学科数从1996年的2893个增长到2014年的7644个。
1924年在美国,雷蒙发起的高校教师博士点声誉调查开启了美国博士点评估的先河。随后,博士点评估在美国高等教育界陆续开展。20世纪80年代起,随着美国博士生教育规模的扩大、学科领域和就业方向的转变,博士点评估方法发生了巨大变化并得到越来越多的关注。1982年,美国研究理事会主持的博士点评估引起了较大反响,《华盛顿日报》等几个主要城市媒体对评估进行了报道,地方媒体也特别关注了当地大学的排名。随后,NRC分别于1995年和2006年开展了两次评估 [6] 。
(二) 评估方法
英国科研评估一直采用同行评估的评估方法,但是REF逐步意识到量化数据的重要性,计划引入计量数据并开展了前测研究,最终发现文献计量方法无法适用于所有学科,暂时不宜全面推广。因此,2014年REF仅加入了研究成果引用数据的计量数据,但该数据仅给同行作评估参考,并未作为本次评估的主要工具。
美国博士点评估方法经历了从声誉评估到量化评估三个阶段。第一阶段是声誉评估(1982年以前),第二阶段是声誉评估法的拓展和客观量化指标的融入(1982年、1995年),第三阶段是从声誉调查转向客观量化指标(2006年) [7] 。NRC组织的三次评估方法也经历了从主观到客观的渐变。1982年的评估是以博士点的基础数据和声誉调查数据为依据;1995年的评估加入了计量数据;2006年的评估直接使用量化数据来关联声誉数据。2006年的评估方法包括问卷调查和测量统计,问卷调查主要包括院校调查、项目调查、教师调查、学生调查和教师评价。测量统计包括S排列法和R排列法:S排列法首先向教师询问哪些指标在评估博士点质量时是重要的,并让他们给每项指标赋予权重,综合这些教师的评价,研究者获得了第一个权重,称之为S权重;R排列法是选取一批教师担任评估者,让他们对所在学科的博士点进行打分,然后将主观评价得分与通过其他途径收集到的20项客观定量数据进行回归分析,并通过回归系数确定各客观指标的权重,这一权重称为R权重 [8] 。
(三) 评估指标
英国科研评估的指标由专家组共同确定,先由主专家组确定一级指标体系和权重,再由次专家组根据不同学科特点对指标权重进行微调。一级指标主要包括研究成果、学术队伍、研究环境、研究经费等,其中研究成果所占权重最大,2008年RAE的研究成果占75% (研究环境占20%,声誉指标占5%),2014年REF的研究成果占65% (研究影响占20%,研究环境占15%) [9] 。
美国博士点评估一级指标包括研究活动、学生资助与结果、多样性3个;二级指标有20 [10] 。三次评估的指标均有所调整和变化,并呈现以下特点:1) 从声誉调查向量化评估转变,评价指标朝着纯量化指标方面发展,以实现评估方法的客观性。2) 从规模数据向人均和比例数据转变,规模数据的减少、人均和比例数据的增加重点考察了博士点培养的人均学术成果、博士生培养的效率和质量。3) 增加多样性数据。多样性指标包括少数族裔、女性、国际学生数量等,这与美国社会阶层的构成变化密切相关。4) 关注学科差异。主要体现在对人文学科和理工学科的区分,同样考察教师的论文发表数和获奖数,但人文学科数据来源为各博士点上报,理工学科数据直接来源于数据库。
通过对英美国家学科评估的历史、评估方法和评估指标体系构建的经验的介绍,我们可以看出,英美国家对于高校学科评估体系经历了较长时间的完善过程,逐渐形成了自己的评估方法且有所区分,比如英国改变同行评估的研究方法,逐渐加入量化数据,但发现无法适用于全部学科,未作为学科评估的主要工具,而美国则越来越倾向于量化数据的方法以追求结果的客观性。对于我国来说,英美已经构建成一个相对完善的学科评估体系,我国可以借鉴其探索过程中形成的思路、方法设计,结合我国高校和社会环境特征对我国的高校学科评估体系进行完善,推进我国学科评估体系的进一步发展。
5. 我国学科专业评估体系的完善建议
(一) 淡化条件,突出成效
学科建设水平的高低除了受到学科团队自身努力的影响外,还与其建设历史、学校投入程度、学校整体实力等因素相联系。如果仅仅评估一个学科现有的条件资源,那么发展历史久,基础雄厚的学科始终排在新建立的,基础薄弱的学科之前,学科评估体系则失去客观性。因此,高校学科评估体系应当重视成效产出,比较两次学科评估期间,各项指标的变化,计算投入与产出之间的关系,对学科建设的效率有一个准确的评价。
(二) 改进师资,重视团队
对师资队伍的评价,应当从教学、科研和示范作用等方面对其履行职责的情况进行严格规定。在教学方法和教学创新方面的标准是教师是否能顺利完成教学任务,并积极的参与教学改革的理论设计和实践当中;在科研方面考察教师是否具有专家级别的科研水平,能在一个领域著书立说,出版教材并主持高质量的课题研究。在示范作用方面,评估教师的品德修养、职业道德规范和学术学风。
重视团队建设,提高大学学科组织化程度,使学科组织的使命和战略目标的具体化、明晰化;学科在大学中实体化、建制化;学科建设参与者模式化、规范化。作为履行学校基本职能的基层学术组织的学科,由学科带头人进行推进,在学校与学院所限定的范围内,组织团队进行履职。让校、院、学科三级组织集中发挥各自不同的评估作用。学校通过评估来完成战略目标,依据评价结果进行绩效奖励,对资源进行优化配置。众多的学科组合成学院,所以对于学科的测评可以反应学院总体水平,同时学科评估结果也可以作为衡量学院价值的重要因素,充分调动学院进行学科建设的主动性和创造性。
(三) 培养人才,规范体系
学科评估体系的涉及应当将人才培养放在首位,从教学、科研和论文多个方面全方位的促进对高校学生的培养。
基于培养学生的知识素养和学习能力,为初步从事科学研究奠定基础,科学合理的设计培养目标和计划,了解本学科的研究现状和发展趋势,重点培养学生的创新意识和综合素质,强调学生的多元化发展。采取系统理论学习、进行科学研究、参加实践活动相结合的办法。实行导师负责和集体培养相结合的培养方式,指导教师加强学生的思想政治教育,营造良好的学术氛围,培养研究生严谨的学术精神,这样才能取得良好的教学效果 [11] 。
根据学科评估指标体系,使学位论文得到规范的撰写,程序能够得到切实的落实,完善考核管理办法,详细制定学位论文考核管理管理,要求导师将任务提前布置给学生,使研究方向乃至论文题目得到提前的明确,让学生提前进入论文选题与开题的阶段 [12] 。同时严格规定论文的选题、参考文献、工作量、评价标准等等内容,只有这样,才能逐年提高学位论文水平。
(四) 静态动态,双向评估
学科不是静态的,它是不断发展变化的。应同时对某一学科作“静态”和“动态”双重评估。发展趋势和发展速度应作为评价的影响因素,以不断促进社会的发展,督促学科不断改革创新。在评估过程中要特别评估它所具有的不断改善自己的发展状况以适应发展着的社会需求的自觉性。各个学科只有与时俱进,才能不断开拓和创新,以期不断培养出适应社会需要的学科建设性人才,真正促进学科实质的发展进步。
(五) 鼓励发展,民间评估
由于当前我国高校学科评估受到政府的介入和影响,缺乏独立性,因此难以客观评估搞笑学科建设和发展的水平。为了更好地体现学科评估体系社会服务的作用,在政府主导的学科评估体系之外发展独立的民间评估机构是十分有必要的,一来可以满足社会群体不同的需求,二来可以通过建立第三方监督机构来最大程度的保持学科评估体系的中立性。
在发展专业、独立、多元的民间评估机构的过程中,不同的部门分别负责不同的任务。政府部门的主要职责是对学科建设水平进行合格评估与激励引导,进行宏观上的管理和指导。评估机构从学术队伍、科研、人才培养等方面对学科质量水平进行评估,而高校在评估中的主要任务是配合政府和评估机构开展有关评估工作,同时要积极开展自我评估,通过加强学科建设的自我评估,促进自身学科建设的良性发展 [13] 。
(六) 科学设计,指标权重
学科整体水平评估包括很多方面,既包括学科队伍状况、人才培养、科学研究和学科声誉等可以量化的指标,学术氛围、学科的团队建设以及对社会贡献的程度等不可量化,但这些因素都是影响学科发展的关重要的因素 [14] 。因此,周密考虑设计指标体系是不可或缺的。
学科建设评估形式应本着客观、科学、全面的原则,采取以各学科点自查自评、互评为主,并与院、部(处)两级重点考核评估相结合的方式进行。
1) 学科点自评
学科点的自评是对学科点的一次深刻、全面的审视,使学科点发现许多不足之处,有些甚至是许多外评专家们都难于发现的漏洞,因此各学科点有必要对照评估指标体系进行自我评估,并由学科点带头人学术梯队负责人亲自参与,负责组织学科点全体人员就学科现状、存在问题、今后目标及对策等问题做自查综合报告,并组织全体人员认真讨论反省,对学科建设改进提高,进一步加快学科点的发展。
2) 学科点互评
各学科点自我评估完成后,学科点进行相互评估。进行学科点互评的好处有以下两点:第一,在了解其他学科点的优点和不足之处后从而能给出对其他学科点的客观评价;第二,在互评过程中,各学科点可以相互交流,相互学习,共同促进共同发展。这种方式也可以有效避免所谓的“人情”扣分情况。
3) 专家组评估
在自评和互评结束后,校、院(系部)两级组织评估专家小组,深入各学科点进行实地考察,对各学科点的自评、互评结果进行考查分析。专家组最好能够由校内专家和外聘专家构成。其中校内专家必须是经过精心挑选的各学科点负责人,同时也应有少量职能部门的专家;而外聘专家则是与待评估学科点相关研究领域的资深专家。外聘专家的作用是能够从不同角度审视和检查各学科点,从而对各学科点的评估更加科学和客观,还可以对学科点的改进和发展提出很多新的看法。因此,专家组评估是高校对学科点的一次大型的集中人力、财力的智力投资,能够为学科点今后的建设方向和发展规模提供很好的理论指导。
4) 主管职能部门进行检查、监督
在整个学科点评估过程中,主管部门应始终起到严格的监督作用。在评估的最后阶段,主管部门应结合所有评估意见及得分情况,指出各学科建设目前存在的不足之处,并为其制定出未来的总体规划。
另外,当前的很多指标体系的国际化程度低,各项指标与其他国家的实践缺少可比性。我们要以国际视野来看待学科评估问题,不断学习他国先进经验。在指标体系设计权重的设置上,更要牢牢紧扣最能体现学科水平的本质指标和具有标志性的学科成果,要适当降低数量指标所占权重,提高质量指标所占比重。
6. 结论
作为一种跨学科、跨层次的综合性高校学科评估工作,它既具有自然科学和社会科学的综合性特征,还要求多方参与的有机结合,这就对评估工作的运行模式提出了较高的特殊要求。所以,开展高等院校重点学科评估工作,就是要建立一种公平高效、优胜劣汰的激励机制,建立起程序性的客观评价业绩的操作方案。为此,高校重点学科评估工作的理论需要在实践中加以运用。总之,完善学科评估指标体系,将一些有价值的定性分析指标如学科建设理念、学科建设的目标和学科建设的规划等纳入到评估指标体系中,采取切实可行的方法使指标定量化,从而具体规范教育教学,这样,会使教育教学事半功倍,形成一套长效机制,更好地促进教育教学工作长效发展。