1. 知识产权要素式智能审判系统的价值定位
知识产权保护以及提高知识产权保护的法治化水平,是新时代对我们提出的工作要求。习近平总书记在中央政治局第二十五次集体学习时强调,要全面开展知识产权保护工作,提高知识产权保护工作的法治化水平,尤其是要提高知识产权审判质量和效率 [1]。在尊重知识产权、防范产权滥用、维护司法公正的理念指导下,我国知识产权诉讼案件的数量呈现出井喷式增长趋势,2020年我国法院共审结一审知识产权案件46.6万件,同比增长了11.7% [2]。除了案件数量的不断增加,知识产权诉讼也不同于一般的民事案件,具有诉讼周期长、专业难度大、涉案范围广、耗费众多法院资源的特征,对法院应对工作和法官的审理能力提出更高的要求。
随着互联网、人工智能、大数据、5G技术等现代科技的不断发展,运用现代化科技手段解决应用问题,受到越来越多的关注,也产生一系列应用成果。广州互联网法院立足于深化民事诉讼程序繁简分流的总体目标,为满足人民群众对公正高效化解纠纷的司法需求,针对新类型层出不穷、侵权现象不断频发的知识产权案件,积极探索互联网、人工智能、大数据、5G通讯等现代信息技术在知识产权诉讼中的深度应用,同时引入要素式审判的诉讼机制,根据“人工智能 + 要素式审判”的产品设计理念,研发出一种基于知识图谱技术支撑的知识产权要素式智能审判系统(以下简称“要素智审系统”)。该系统可以充分赋能知识产权案件的诉讼服务与审判业务,搭起司法服务和司法审判之间的桥梁,不仅能快速指引当事人实现要素化起诉、应诉、举证、质证,还能协助法官高效审理知识产权案件,提升审判效率、统一裁判尺度,切实推动破解知识产权“举证难、周期长、成本高、赔偿低”等传统难题。具体而言,要素智审系统的司法价值主要体现在以下三个方面。
(一) 支持类案检索功能,统一案件裁判尺度
类案检索是人工智能在司法领域的代表性应用,其作用在于依托裁判文书网和专业办案平台为法官提供类案与关联案件检索功能,从而达到类案类判、同案同判的司法效果。类案检索也是目前人民法院信息化建设必不可少的智能服务之一,主要包含类案推送、类案提示等功能,部分智慧法院还开发出类似案件适用的法条推荐、争议焦点推荐、主要证据推荐等功能 [3]。本文介绍的要素智审系统也同样具备类案检索功能,其主要借助大数据技术,对中国裁判文书网中的海量文书进行量化分析,归纳出类似案件的共性规则和共同要素,辅助法官从浩如烟海的法律法规库和司法案例库中快速找到类似案例和裁判依据。值得注意的是,该系统不仅支持适用法律、类案串案的智能推送,也能为法官提供待检索案件在事实认定、裁判理由、裁判结果上的模板推荐或类案段落推送,进一步拓展了类案的检索范围和检索类型,强化了要素智审系统的检索作用。
类案检索制度的设立初衷为统一法律适用的标准和案件裁判尺度,维护司法尊严和权威。其背后蕴涵的司法价值是实体正义和程序正义的有机统一,也是司法公正原则的内在要求。要素智审系统的类案检索功能可以满足趋于多元化和新颖化的知识产权案件,为法官处理管辖区域内的新型案件提供全国范围内的指导案例参考,从而对知识产权审判的法律适用起到统一的规范和指引作用。
(二) 诉讼流程一键办理,促进案件降本增效
要素智审系统依托于人工智能和互联网技术的应用,搭建起全流程一体化的网上诉讼平台,支持案件从起诉到立案阶段的自动审查、庭审排期、文书送达,再到庭审阶段的一键办理服务,打造真正的智能司法诉讼服务。广州互联网法院研发的要素智审系统在应用上具有操作程序简单易懂、交互界面清晰简明、操作功能丰富齐全等技术优势,为原告起诉提供了快速便捷、高效简约的一键办理服务,让人们足不出户也可享受全天候的自动化立案业务,真正贯彻了“让百姓少跑腿,让数据多跑路”的便民服务理念,极大地减轻了当事人寻求司法救济的诉累成本。同时,面向社会公众的网上诉讼服务也能对法院立案庭的业务起到繁简分流、双向引流的作用,有效缓解了立案登记制所带来的案件压力,切实减轻了司法人员的立案负担,以司法服务的智能化和自动化实现定纷止争的降本增效。
(三) 融入要素式审判法,推动案件繁简分流
要素智审系统的研发逻辑在于通过要素式审判法与人工智能的深度联动,将司法审判的新思路融入信息技术的新应用,实现要素式审判的“在线办理”和“一键完成”。该智审系统的要素化应用主要体现在两个方面:一是被告的要素化答辩,二是法官的要素式审理。其中,在要素化答辩中,系统能为法律关系明确、案件事实清楚的案件提供要素化答辩方式,主要分为诉讼时效答辩、作品属性答辩、权属答辩、侵权答辩及侵权责任答辩。每个要素模块都代表不同法律关系的抗辩事由,也是此类案件审理中经常运用到的抗辩策略,具有类型化和模块化的特征,也有利于被告人的选择和适用。要素式审理表现在法官可以登陆智审系统的法官工作台,查阅业已受理且经过要素化处理的案件信息,从中提炼案件的争议焦点和关键证据进行审理。同时,法官还能借助系统的文书辅助功能实现要素式裁判文书的一键生成,该功能可以基于标准的文书模板样式,为要素内容生成文书初稿,还支持批量文书生成,能有效提高审判人员的法律文书制作效率。
因此,要素智审系统作为要素式审判和人工智能技术的耦合产物,既具有在审理制度上的程序价值,又体现出人工智能司法的技术优势,二者极大地解放了知识产权案件的司法生产力,也推动了案件的繁简分流和快速审结,充分彰显了要素式智能审判系统在解决知识产权案件纠纷中的司法价值和技术优势。
2. 知识图谱在要素式智能审判系统的嵌合原理
在要素智审系统的底层应用中,知识图谱属于人工智能技术的核心组成部分,其作为一种由节点(Point)和边(Edge)组成的语义网络结构,在智审系统中的作用有二:一是通过图谱的知识加工深度剖析涉诉作品基本信息,辅助法官决策;二是从海量的知识产权判决书中提炼关键数据,为人工智能的应用提供知识支撑。因此,知识图谱对于要素智审系统而言具有推陈出新的知识供给作用,也是不可或缺的底层技术。
从结构上看,知识图谱的整体架构可以分为逻辑架构和技术架构。首先,逻辑架构包括了数据层和模式层,前者以“实体,关系,实体”或“实体,属性,数值”的三元组形式对数据源进行基础表示,并存储在具有海量实体网络关系的图数据库中,如“张三–作品–《XX》”、“张三–专利权–专利号ZLXXXXXXXX”;后者则是在前者的数据基础上进行提炼、加工和处理,是知识图谱的核心应用层,主要是对数据层中的零散数据按照一定的模型和方法有规律地加以归类,形成实体、属性和关系之间的规范联系,如在著作权侵权纠纷,某个司法案件的数据层内容为“张三–剽窃作品–李四”,将之映射到模式层则表现为“侵权人–民事侵权关系–被侵权人”,进而为知识推理提供决策信息。
其次,技术架构则包括了知识抽取、知识融合与知识推理,也是本文重点介绍的对象。从智审系统的整体构成上看,广州互联网法院研发的要素智审系统包括要素建模模块、页面生成模块、要素采集模块、存储模块以及展示模块五大模块。五大模块依次实现了要素的建模、采集、存储、加工和生成等流程。其中,知识抽取用于要素建模和页面生成模块,知识融合涵盖在要素采集和要素存储模块,知识推理则体现在要素存储和展示模块,在此过程中,开发者还需辅以自然语言处理(NLP)、深度文本相似度匹配算法、电子证据智能比对等关键技术,从总体上构建起知识图谱在智审系统中的作用路径。
(一) 知识抽取
知识抽取是司法知识图谱构建的首要任务,主要是对数据库进行实体提取、属性抽取、关系提取。司法知识图谱的数据主要来源于两个方面:一是半结构化数据,如基于爬虫技术对百度百科等搜索引擎进行抽取;三是非结构化数据,国家法律法规数据库、国家裁判文书网和各级法院内部所保存的司法案例、法律规范和司法案件文本信息大都属于非结构化数据,如证据材料、庭审答辩、案件信息 [4]。其中,在信息抽取的过程中,开发人员的核心数据来源于国家裁判文书网。从裁判文书的数据类型上看,判决书主要由类结构化的案件基本信息和非结构化的文本组成。首先,类结构化的案件基本信息反映了案件事由、案件主体以及判决依据,其既是司法判决的基本构成要素,也是司法知识图谱直接的信息来源,在抽取上具有便捷性。其次,非结构化文本类型主要包括案件当事各方的陈述、法院认定事实、法院说理及裁判结果这三种文本类型 [5]。案件当事各方的陈述虽描述了一定的客观事实,但由于个案之间存在较大差异,即使是同一案件事由,基于人工活动的主观能动性,不同当事人对案件的描述不尽相同,不同法官对于案件的说理论证和认定事实也不相一致,因此可能会出现同一案由的不同事实、同一事实的不同描述,同一描述的不同理解等自然差异,这些差异虽然在具体个案中被认为是合理的存在,但对于知识图谱的知识抽取而言将产生举足轻重的影响,需要经过更加细致深入的自然语言加工和文本语义消歧,才能适用于接下来的知识推理环节。
1) 实体抽取
实体抽取是指从文本数据中抽取识别具体的命名实体 [6]。实体是知识图谱最基本的组成元素,也是智能审判系统进行自动化分析和决策的具体对象。如在著作权权属侵权诉讼中,实体可表现为案件的权利主体和权利客体。权利主体一般是指著作权人,根据主体身份的不同,又可以细分为合作作品的著作权人、职务作品的著作权人、汇编作品的著作权人、影视作品的著作权人、汇编作品的著作权人等。权利客体则是《著作权法》第二条所保护的“作品”,通常指文学、艺术和科学领域内具有独创性并能以某种有形形式复制的智力成果。这种智力成果的表现形式也具有多样性,《著作权法》第4条将之归纳为文字作品、口述作品、音乐作品、戏剧作品、曲艺作品、舞蹈作品、杂技艺术作品、美术作品、建筑作品、摄影作品、电影作品、图形作品以及模型作品等十三类对象。在知识图谱的信息抽取中,按照“实体、关系、实体”的三元组路径,唯有厘清每个知识产权案件中的涉案主体和客体,才能准确抓取案件的核心数据,提炼出智能审判系统所需要的裁判案由、权利客体、权属类型,实现智审系统的要素化审理。
2) 关系抽取
司法数据经过实体抽取,得到的是一系列离散的命名实体,为了提供能够为智审系统利用的语义规则,还需要从相关数据层中提取出法律实体之间的关联关系,通过关系将实体(概念)联系起来,才能够形成网状的知识结构。换言之,关系抽取的目的是根据知识产权案件的民事关系基本原理,基于符号化和向量化的表示方式,在零散的法律主体和客体之间搭建起兼具代码形式逻辑和法律实质关系的连接桥梁,形成实体之间的有机联系。同样以著作权案件为例,在一般的著作权纠纷中,被侵权人(著作权人)与侵权人之间的诉讼关系通常滥觞于权利客体指向的争议作品。根据《著作权法》以及相关司法解释,这种关系表现为著作权及与著作权有关的权益权属、侵权与合同纠纷。因此,著作权人与侵权人的诉讼关系大多产生于作品的权属争议、侵权行为和合同违约等情形。其对于知识图谱的构建而言,意味着关系抽取要着重识别个案中因不同法律事实所引起的诉讼纠纷,通过事先设定的要素值,对司法数据库中的案件事实进行解析,从事实理由中提取争议焦点,利用关键字搜索抓取核心信息。例如在著作权案件中,关键词宜设定为“确认权利”、“许可使用合同”、“擅自使用”、“未经许可使用”、“非法销售”“主观过错”“停止侵害”、“赔偿损失”等样式,能够更加高效精准地提取出实体之间的关系类型,也为下一步的信息融合与信息加工沉淀科学合理的数据基础。
3) 属性抽取
属性抽取的目标是从不同信息源中采集特定实体的属性信息.从司法者的视阈上看,属性抽取是指针对某个实体概念(法律主体或者权利客体),从裁判文书系统和法律法规司法库中提炼出该类实体的特征。例如,根据新《著作权法》第18条,职务作品的特征为:a) 性质上属于自然人为完成法人或者非法人组织工作任务所创作的作品;b) 作者与法人或其他组织之间存在劳动关系;c) 作品由作者独立完成并体现作者的个人意志。有了以上属性的附加认定,知识图谱才能围绕“职务作品”这类实体进行全方位的概念廓清和特征描绘,在数据整合的过程中对不同的数据源进行实体的准确抓取,减少无用的数据处理成本,提高司法数据的实用性和精准性。
(二) 知识融合
知识融合的作用在于对司法数据库所抽取的知识进行初步的筛选和整理,并消除实体、关系、属性等指称项与事实对象之间的歧义,形成高质量的知识产权智审数据库。在信息融合的过程中,主要运用到的底层技术为实体对齐和实体消歧。前者能根据多个司法数据库的信息来源确定同一个目标术语,解决的是“一义多词”问题;后者则能根据司法案例或司法文书的上下文准确识同一法律术语的不同含义,解决的是“一词多义”问题。二者在最终目的上具有同一性,都是为了解决知识利用过程中所产生的模糊性和歧义性。
1) 法律实体对齐
实体对齐旨在解决多个指称项对应于同一实体对象的问题,通常用作判断两个来自不同或者相同知识库中的实体是否表示同一对象。在垂直领域的知识图谱里,法律实体是图谱最基本的组成元素,其主要来源于浩如烟海的法律法规和司法案例数据库,实体之间的差异可归因于法律语言的模糊性以及部门法的多元性。在不同的法律部门中,法律规范、法律文书和法官说理都存在或多或少的区别,即便是同一个专业名词,在不同的司法情景中的表现形式和具体内容也可能相去甚远。譬如,诉讼当事人在三大司法诉讼中的代称和内涵不尽相同。同样被用作指代发起诉讼和被动应诉的人,民事诉讼和行政诉讼使用“原告”和“被告”作为诉讼当事人的代名词,刑事案件则使用“公诉人”和“被告人”以突显刑事诉讼活动的强制性和严厉性特征。研发人员对裁判文书数据库进行实体抽取时,要意识到不同类型的判决文书对当事人的描述并非全然一致。另外,法官在写作时为了方便书写和阅读,还会以“其”、“他”、“她”等代词或缩略语指代当事人,无疑为机器的文义识别和语料提取增添难度。因此,无论是“原告”、“公诉人”、“被告”、“被告人”抑或是其他缩略代称,这些表述并不影响诉讼主体在诉讼结构中的角色定位,本质上都属于诉讼当事人的范畴,需要经过对齐步骤,将之添加上相应的实体标签,确保法律实体的完整性和周延性。
诸如此类的专业表述不胜列举,也揭示了实体对齐的重要意义。如果未经过对齐程序而贸然进行数据加工和推理,司法知识图谱的数据质量将难以保证,智能系统在面对错综复杂、灵活自由的语法句型时也容易陷入张冠李戴的识别困境。为此,实体对齐是知识图谱获取准确的法律概念和周全的司法数据库所需要的必经程序。从实现路径上看,法律实体的对齐离不开自然语言处理技术的处理和加工,需要将晦涩难懂的法律术语转化为可供程序开发的计算机语言,并将文本以向量化的形式进行表达,从而将以文字存储的法律语言转化为以数字、字母和符号为表示的算法模型,通过统计和匹配相似度的方式完成实体对齐。
2) 法律实体消歧
实体消歧则旨在回应同个法律实体在不同情景中存在多层含义应如何剔除冗余词义的问题。尤其在立法和司法领域中,一词多义的滥觞原因主要源于法学与其他人文科学之间存在的领域界限和专业隔阂,同一个术语在不同的科学领域中的内涵可达天壤之别。例如,在文学领域,“作品”一词在文学词典中被定义为“文学艺术创造的成品”。但在法律领域,《著作权法》第三条将其规定为“文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果”。不仅如此,2020年新修订的《著作权法》在该条款的第9项采用“符合作品特征的其他智力成果”作为兜底条款,将作品类型的法定列举修改为开放式列举,进一步强化了作品的“独创性”和“思想性”特征。这对于著作权知识图谱的样本辨识和抽取而言,既要区分“作品”在不同专业领域和使用场景中的具体内涵,还要基于算法的训练模型对涉案实体的属性进行相似度计算,判断其是否满足著作权法对作品的保护要求。因此,实体的概念外延和属性特征直接关系到知识图谱的信息资源是否准确,如果不对纷繁复杂的领域术语进行筛选和整理,冗赘的数据来源将削减知识图谱的决策的真实性和科学性。正如机器学习的悖论:“Garbage in, garbage out”(垃圾进,垃圾出),无用或错误的数据将产生错误的结论。实体消歧在知识图谱构建过程中扮演了数据清洗员的角色,对于法律实体的抽取起到去伪存真、删繁就简的作用。
(三) 知识推理
经过知识的抽取和融合,智审系统的知识图谱即可从原始的司法数据库中提取出有关知识产权案件中所涉及到的实体、关系与属性等知识要素。再经过一系列的知识融合程序,可以消除不同情景下法律实体指称项与实体对象之间的歧义,得到一系列符合司法逻辑和法律术语的事实表达。然而,事实并不能涵盖知识的范围,智能审判系统能够回答知识产权案件中相关法律问题的“Who、What、When、Where”“4W”封闭性问题,但并不能以系统化、逻辑化的方式回答案件中的“Why”和“How”等开放性问题。这是由于此时的法律知识仍处于零散化和碎片化的状态,尚未按照特定的技术规则进行糅合加工,形成连贯且具有法律逻辑的结构化知识体系,需要借助知识推理实现司法数据的系统串联和有机结合。因此,为了形成结构化、体系化的知识网络,还需要经过知识推理环节。知识推理可以基于由众多实体所组成的数据模型,通过人工建立的推理规则对实体的属性和关系进行深度挖掘和分析,从而在实体与实体之间搭建起知识节点和边的新路径,在此基础上建立新的知识关联,挖掘隐藏的知识关系网络,从而形成深入的知识积累储备,由此向外界提供丰富全面的知识决策。
3. 知识图谱在要素智审系统中的应用路径
回归法官审判的视野,传统的司法裁判准则是“以事实为依据,以法律为准绳”。事实在案件中表现为具有真实性、合法性和关联性的证据材料,而法律属于事先制定的裁判规则,二者来源于独立的数据库,并不存在必然的实体联系。在传统的人工审判中,法官需要借助演绎推理的基础三段论,对作为大前提的法律规范和属于小前提的证据采用严密的涵摄和论证方法,目光往返于法律规范与证据材料之间,判断证据构成是否置于法律要件的范围之内,最后在事实和法律之间人为构建起合乎法理的内部联系。
(一) 知识图谱在传统司法审判中的应用难题
知识推理作为机器学习的典型代表,虽然具有基于数据和算法进行高效运行和精确推理的技术优势,但也存在明显的技术缺陷。一方面,囿于机械主义缺乏人文关怀和感性思维的局限,人工智能无法立足于人的伦理视野和社会关系对司法案件进行综合性考量,若是将法官的人类思维生搬硬套于机器的推理算法上,既不具备技术上的实现条件,也无法做到对人脑活动的完全复制,因此不能以常规的审判模式为标准建构机器学习的训练模型。
另一方面,虽然法律的灵魂是普遍性和明确性,但法律语言存在天然的模糊性,有学者认为这种模糊性主要表现在法的类属边界和形态上的不确定性 [7]。英国法哲学家哈特则主张,“当我们把特殊情况纳入一般规则时,任何东西都不能消除这种确定性核心和非确定性边缘的两重性。这样所有的规则都伴有含糊或‘空缺结构’的阴影” [8]。即使是明确的、具体的法律规范,其在个案中仍会面临界限模糊的问题,因为法的普遍性和模糊性如同硬币的正反面相伴相生,不可避免。从逻辑上看,法律内在的明确性要求与司法结果的确定性和可执行性相辅相成,前后呼应,这也与人工智能符号主义所追求的严谨、科学和逻辑的理念不谋而合。但法律语言的模糊特征不仅给法官准确适用法律造成困难,也会为知识图谱的自然语言处理和实体三元组的加工推理带来技术和专业上的双重障碍。
(二) 要素式审判的特征与优势
面对人工智能的机械主义缺陷和法律语言的模糊性难题,当前各地法院正在积极探索的一种新型司法审理机制能够对其起到立竿见影的治理效果,学界将之命名为要素式审判法。所谓要素式审判,是指根据类型化案件的特点和规律,提取类案审理中必备的事实和法律要素,简化无争议要素审理程序,重点围绕争议要素进行审理并撰写裁判文书的一种审判工作方法 [9]。目前,要素式审判主要用于民商事裁判领域,其设立的初衷在于简化裁判文书和诉讼流程,推动民事审判程序的繁简分流,缓解“案多人少”的司法难题,纾解法官的审判压力。随着要素式审判改革在各地法院的深入推进,人们逐渐认识到这种新型审判机制不仅在优化诉讼流程上拥有降本增效的独特优势,且对于人工智能在司法审判的应用而言也具有高度的内在契合性,具体表现在以下几个方面:
1) 庭前准备的表格化
庭前准备是保障要素式审判顺利推进的必经程序,准备工作主要包括召开庭前会议、组织填写诉讼要素表、形成庭前报告。其中,准确填写诉讼要素表是前期工作的关键步骤,直接影响到要素式审判的质量和成效。要素表的内容由法官根据诉讼案由和诉讼请求预先拟制,再形成清晰、规范、明确的格式文本。换言之,要素表是对案件事实和法律关系的结构化和可视化再现,对要素化审判具有三个方面的作用:其一,阐明诉讼流程,规范裁判指引。法官在引导当事人填写要素表时,还应为其释明要素式审理的程序规则,使之在内心树立良好的规范意识,保证其适用程序的自愿性;其二,突出争议焦点,方便法官审阅。在庭前准备阶段,法官可以召开庭前会议,明确原告的诉讼请求和被告的答辩意见,归纳争议焦点,组织并指导当事人填写诉讼要素表,将繁琐的诉讼文书压缩为简洁明了的表格式提纲,从而减轻法官的阅卷负担;三是提炼案件重点,提高庭审效率。要素表为当事人提供了程序上的选择权。一方面,对于事实清楚,权义关系明确,标的争议不大的案件,当事人可以在要素表中对存在争议的事实予以自认,由此免除对方在该部分事实上的证明责任,实现举证问题的高效化解;另一方面,对于案情关系复杂,存在明显争议的案件,当事人也可以对争议焦点所涵盖的诉讼请求和答辩意见进行要素化提炼,剔除无足轻重的观点和材料,围绕案件的核心事实填写要素表,真正实现案件的繁简分流,提高庭审效率。
2) 庭审阶段的要素化
传统民事庭审主要涵盖法庭准备、法庭调查和法庭辩论三个阶段,制度设计的初衷是通过严谨周全的庭审活动,贯彻程序法定主义以保护当事人的诉讼权利,实现程序正义的理念。其缺点在于庭审程序冗赘,用时相对漫长,庭审的争点效应不够突出,因而普遍存在庭审效率低下的问题。要素式审判可以有效弥补传统审判的痛点,其能摆脱法庭调查、法庭辩论等程序的束缚,将庭审的重心置于庭前准备形成的要素表。法官着重审理经过要素表固定的诉讼请求、争议焦点和主要事实,组织当事人围绕上述重点问题进行举证、质证和辩论,对双方无争议事实结合相关证据直接确认。要素式庭审改革在提升司法诉讼质效,促进司法审判精细化上具有重要作用。一方面,法官不必再劳顿于繁复的法庭调查和法庭辩论,只需引导当事人对要素表的内容展开庭审活动,厘清争议事实,根据事先预设的案件关系进行裁判,实现定纷止争的“门诊式”庭审;另一方面,要素表具有结构化、类型化的特征,具体列举的文书要素使得要素式庭审变得透明化和可视化。这在无形中也为法官框定了裁判思路,意味着法官在审判中应以要素表的内容为裁量基准,不能擅自扩大自由裁量权的范畴,更不能跳出要素表的指引另辟蹊径,因此要素式庭审也充当了司法监督者的角色,强化了庭审的实质化要求 [10]。
3) 裁判文书的简明化
要素式审判的效率价值还体现在裁判文书制作上的要素化和模块化,其对传统的民事裁判文书进行了体例上的改良。与传统民事裁判文书的相比,要素式裁判文书具有以下几个特征:一是结构体系的简约化,裁判文书不再受制于原被告的诉辩陈述、本院查明和本院认为的格式要求,而是将主要内容集中在原被告的诉讼意见与关联证据,极大地简化了裁判文书的整体架构和文书篇幅;二是裁判内容的条款化。要素式裁判文书在内容的编排和撰写上可采用合同式的列举方法,将要素内容按照从整体到部分,由一般到特殊的顺序依次列明。在上述北京高院发布的指导文件中,附件一提供了要素式判决书的模版,其以“买卖合同纠纷”为例对案件进行要素式处理,在法院认定事实部分采取条款化的方式,从前往后分别介绍了合同关系、合同的签订情况、管辖权、标的物质量、合同解除条件、争议解决和违约金计算方法等 [11]。条款化、要素化的文书结构将裁判文书的案件事实以泾渭分明,一目了然的排列形式呈现出来,切实提高了法官阅读和制作文书的效率。
(三) 知识图谱在要素式审判中的作用路径
基于要素式审判在庭前准备、庭审阶段和裁判文书阶段所具备的三大特征,其在推动民事程序繁简分流和民事纠纷高效化解方面具有传统民事诉讼无可比拟的程序价值。同时,要素式审判通过对案件事实和法律关系的化繁为简和高度提炼,使存在模糊性和不确定性的非结构化数据向可解释性、确定性的结构化数据进行转变,能在一定程度上克服传统司法数据在人工智能系统中的应用难题。换言之,要素式审判从司法数据源头上实现了数据的系统优化和科学归纳,既有利于人工智能对要素式法律文书进行共性提炼和机器学习,也与知识图谱运用自然语言处理对司法数据进行抽取、融合、加工的算法逻辑高度契合,进而形成高质量的司法知识图谱。
1) 知识图谱与要素式审判结合的司法原理
要素式审判与知识图谱的契合优势不仅体现在司法数据的处理机制中,还反映于要素式审判的作用路径上。有学者(高翔,2018)提出以要件事实型民事裁判为基础的审判方法来构建法律知识图谱在民事司法领域的应用,基本的应用路径为:依据要件事实型民事裁判论,对案件事实进行要素式提取和解析,按照不同层级的方法加以分类,最基础层级的要素即为分词,并由法律专家适时予以标注,从而形成分词标注的大数据,以供机器学习,最终实现人工智能的知识积累 [12]。所谓要件事实型民事裁判,是指在明确要件事实法律性质的基础上,依据民事实体法规范的结构以及民事诉讼审理的结构而展开的民事裁判方法 [13]。从审判原理上看,这种裁判方法本质上与请求权基础分析法、要件审判九步法等审判方法存在异曲同工之处,都是以传统请求权规范分析法为基础,在实体法律关系和程序法律关系的规范适用上进行综合的考量和取舍,从而达到认定事实清楚、适用法律正确的裁判效果。作为目前民事审判改革的理论新成员,要素式审判法实际上是对上述审判方法的继受与创新 [14]。其同样离不开请求权基础规范分析、诉讼争议焦点提炼和要件事实证明等关键步骤的支撑作用。因此,要素式审判法也能为人工智能和知识图谱嵌入司法裁判提供最佳的建构路径和应用原理,主要通过实体法律适用和程序法律适用两方面实现要素式智能系统的审判。
2) 知识图谱在要素式审判中的实体规则提炼
在实体法律层面,要素式审判的合法性前提是民事实体裁判规则,其旨趣在于围绕事实和法律两大关键要件进行审理。其中,事实部分表现为根据诉讼请求提供的关联证据,对其证据资格和证明力予以认定,并结合当事人的举证和质证意见判断争议证据的真实性、关联性与合法性,最后决定是否将之采纳为案件的事实基础;法律部分则表现为根据诉讼案由和当事人的法律关系确定请求权基础规范,在法律辩论环节从当事人的陈述和辩论意见中厘定争议焦点,最后法官根据对法律条文的理解和把握,依职权正确适用法律,作出最终裁判。
要素式智审系统需要借助知识图谱对要素式审判的实体裁判规则进行解析和重构,亦即利用自然语言处理技术将要素表和要素式裁判文书的类型化文书转化为向量化和符号化的计算机语言,这个过程主要运用到要素解构和分词设置两种方法。其中,有待解构的要素是要素式文书中经过固定化和层级化的法律实体,包括对请求权基础规范的解构、对争议焦点的解构以及对案件基础事实的解构。其次,经过解构程序,知识图谱从结构化的要素式司法数据中抽取出知识库的法律实体,还需对这些要素进行分词设置。分词设置实际上是对要素的标注和归类的活动,在技术逻辑上属于知识融合的范畴。其基本路径是根据实体法律规范对分词之间的法律关系和法律属性予以标注,主要利用RDF、RDFS与 OWL三种本体语言,描述各个分词要素之间的关系,通过剔除语义噪音,从文书中完成相关知识图谱实体的筛选和分类 [15]。在传统的民事审判中,由于非结构化的数据类型居多,数据呈现出零散、模糊的形态特征,难以依靠机器学习实现数据的自动提取和标注,因此要素解构和分词设置都高度依赖于法律专家系统的人工构建,要素式审判借助预先设定的结构化文书弥补了上述的不足。基于要素式文书的层次性和格式性,知识图谱可以通过监督学习算法有的放矢地从文书数据中提取目标要素,并借助特定的知识推理算法对实体进行模型设计,从而在不同的法律要素之间建立起民事实体裁判规则的有机联系,实现新知识的挖掘和创造。
3) 知识图谱在要素式审判中的程序规则提炼
在程序法律层面,要素式审判主要根据民事程序裁判规则,围绕诉讼程序的法庭调查和法庭辩论两大环节,引导当事人依法行使诉讼权利。一般而言,原被告当事人基于“两造”的对立地位而分别享有请求权和抗辩权。因此,要素式审判的程序逻辑也应遵循“原告主张诉讼请求–被告行使抗辩权–提炼争议焦点–围绕争点进行辩论”的基本路径,在诉讼要素表的固定指引下,当事人的诉讼攻防活动将以标准化、格式化的方式呈现,进而实现诉讼的程序价值。
与实体规则的提炼方法相似,知识图谱对程序规则的抽取同样也离不开层级解构和要素标注的路径。不同的是,经过实体规则提炼所形成的知识类型属于实体法调整的对象,如案由类型、争议焦点、法律关系、法律行为、法律适用等实质内容;程序规则是对程序法所调整的诉讼权利和诉讼活动的关键要素进行提炼,旨在为知识图谱补充司法程序规则知识库。其中,按照上述“主张–抗辩–再主张”的程序逻辑,两造对抗的核心程序是举证和质证活动,因而知识图谱对要素式审判的规则提炼应着重针对原被告的举证过程进行解构和标注。
首先,根据“谁主张,谁举证”的举证责任分配原理,原告应对自己主张的诉讼请求承担证明责任,而且需将证明标准固定到高度盖然性的程度,才能获得法官的内心确信。其次,按照民事证据的分类理论,民事裁判常用的证据类型按照不同的划分标准,可以分为直接证据和间接证据1、原始证据与传来证据2、言词证据和实物证据3、本证和反证4。准确区分证据的不同属性,能够帮助法官准确地理解和把握案件证据,基于清晰、全面的证据知识图谱形成客观理性的裁判认识,正确引导当事人完成举证和质证,促进诉讼活动的精细化和实质化。
因此,司法知识图谱在程序性规则提炼中的首要任务是对当事人的举证责任和证明标准进行解构,分别廓清原告和被告的举证责任、待证事实和证明标准,在此基础上对规则要素的实体节点进行分词标注,从而构建司法举证的专业知识图谱。其次,要素式审判的证据类型也是知识图谱重点提炼的程序要素。当事人在主张请求权和行使抗辩权过程中,其所运用到的证据将以多个维度展现出来,通常与前述的举证责任和证明标准密切联系,既可能表现为直接证据和间接证据的关系,也可以表现为原始证据和传来证据的关系,还能表现为本证与反证之间的关系。知识图谱须对相关进行全方位的属性和关系分析,运用神经网络算法和深度学习对案件事实包含的证据类型依次予以要件解构、节点标注和模型构建,进而形成网络化、精细化、可视化的证据知识图谱,为智审系统的类案检索、证据比对、文书生成提供更高质量的知识决策能力,提升要素式审判的智能化水平。
4. 结语
在司法审判机制改革和人民法院信息化建设浪潮的双重推动下,要素式智能审判系统成为“人工智能 + 要素式审判”耦合的集大成者,对智慧法院的建设而言具有繁简分流、挖潜增效的应用优势。作为人工智能的知识大脑,知识图谱在要素智审系统中发挥着不可替代的知识补给作用,也是未来人工智能在司法领域向更高水平发展的核心技术。面对知识产权等新型案件类型层出不穷、诉讼数量急剧攀升的司法现状,各级法院应积极探索科技司法的新模式,深化理念创新、技术创新、制度创新,不断推动网络空间审判体系和审判能力的现代化建设。
NOTES
1按照诉讼证据与待证事实的关系进行划分:凡是能够单独证明案件主要事实的为直接证据;凡是只能证明案件事实的某个方面,需要与其它证据结合使用才能证明案件事实的为间接证据。
2按照证据的不同来源进行划分:凡是直接来源于案件事实本身的证据材料为原始证据;凡是非直接来源于案件事实本身的证据材料为传来证据。
3按照证据的表现形式进行划分:凡是能够证明案件情况的事实是通过人的陈述形式表现出来的证据,称为言词证据;凡是能够证明案件情况的事实是通过物品的外部形态特征或者记载的内容思想表现出来的证据,称为实物证据。
4按照是否为负有证明责任的当事人所提出的待证事实进行划分:凡是由负有证明责任的一方当事人提出的用来证明该方主张事实的证据的,即为本证;凡是为了推翻对方所主张的事实,而提出与对方相反的、即相抵消的事实根据的,称为反证。