1. 问题的提出
在数字信息技术不断快速发展的当下,新技术在司法实务中的应用也越来越多。2015年我国提出大数据的国家战略,国务院通过《促进大数据发展行动纲要》,文件指出于2018年建立国家统一数据开放平台。2018年1月,公安部组建了全国公安大数据工作领导小组,旨在全面推动公安大数据战略的实施。2021年6月,党中央印发《中共中央关于加强新时代检察机关法律监督工作的意见》,其中明确要求:“运用大数据、区块链等技术推进公安机关、检察机关、审判机关、司法行政机关等跨部门大数据协同办案”。2022年12月,最高人民法院发布《关于规范和加强人工智能司法应用的意见》,规定了人工智能司法应用应当遵循的五项基本原则。在刑事案件侦查中,大数据侦查亦成为一个十分有力的侦查手段工具,但任何新实用工具的出现,都有其两面性,在发挥工具效用的同时,也要注意规制,避免其负面影响。
“大数据侦查”目前在学理界尚未形成一个权威的法律概念,但是近些年大数据在刑事侦查领域当中已经有了不少的应用,基于当前的研究与实践探索,我们可以从两个维度来阐释“大数据侦查”的概念。从宽泛的意义上讲,“大数据侦查”是由侦查思维、模式、方法及机制等构成的一个全面体系,这些均融入了大数据的理念与技术。而从较为狭窄的角度来理解,“大数据侦查”则聚焦于侦查过程中大数据技术的具体应用,即指法定侦查机关为揭露已发生或潜在的犯罪行为、明确犯罪事实或预测犯罪,采取的以大数据技术为主导的侦查行为[1]。
大数据侦查的应用范围要大于传统侦查。我国2018年修正的《刑事诉讼法》第115条明确规定:“公安机关对已经立案的刑事案件,应当进行侦查。”可见,传统的侦查启动时间应当是在立案之后,没有立案不能实施侦查。大数据侦查的实施情形可以分为两种,一种与传统侦查被规定的实施范围一样,是针对确已立案的犯罪活动实施的侦查措施;另一种则是针对尚未发生或是即将发生的犯罪活动,以及虽已发生但还未被察觉、未被立案的犯罪活动。而对后一种在立案前的刑事初查阶段进行的大数据侦查措施,目前我国还没有法律法规予以规制,但大数据侦查作为初查工具存在诸多问题,若不及时加以规制,会对当事人或民众的权利造成损害。
2. 大数据侦查的法律性质界定
要对初查阶段的大数据侦查进行有效地规制,我们首先要界定其法律性质,尽量将其纳入到现行的法律规范体系中去。20世纪90年代中期,刑事诉讼法学理论界从日本引入了任意性侦查与强制性侦查这一对概念。这对概念的区分使得我们对侦查措施的实施范围有了立案前后的区分,立案前的初查阶段只能实施任意性侦查,禁止使用强制侦查措施;而立案后两种侦查措施皆可使用。这种区分也应当适用于大数据侦查措施,即初查阶段实施的大数据侦查措施不能属于强制性侦查措施[2]。
2.1. 强制性侦查措施的界定标准
关于任意性侦查与强制性侦查的划分界限,学术界在国内外依旧持有多样化的理论见解与观点,主要包括以下三种主流看法:“基于侦查对象同意与否的划分”、“基于是否侵害公民核心权益的划分”以及“融合侦查对象同意与否及是否侵犯公民核心权益的综合考量”[3]。
“基于侦查对象同意与否的划分”的理论主张,区分强制性侦查与任意性侦查的核心在于侦查行为是否建立在侦查对象自愿配合的基础之上。“基于是否侵害公民核心权益的划分”则认为,强制性侦查措施是指那些触及并损害个人重大权益的手段,反之,任意性侦查措施则不涉及对个人重大权益的侵犯。“融合侦查对象同意与否及是否侵犯公民核心权益的综合考量”则进一步提出,强制性侦查行为是指通过强制手段实施,且对当事人生活重要利益产生侵害的侦查措施,例如逮捕、拘留、搜查及扣押等;而任意性侦查行为则是不依赖强制手段,不对当事人生活利益构成侵害,且基于当事人自愿参与的侦查活动,比如对犯罪嫌疑人的询问及对证人的问询等。
我国《刑事诉讼法》对任意性措施并没有明确的规定,但从对强制性侦查的法律规定层面看,其适用并不需要侦查相对人的同意。从经验角度看,如果要采取强制性的侦查措施必须要先获得侦查相对人的同意的话,会导致侦查活动展开困难,大部分的侦查相对人对于被侦查存在着本能的抵触心理,让其主动配合、自愿同意被采取侦查措施有悖于一般人的心理活动规律。所以,对于任意性侦查措施与强制性侦查措施的区分与界定标准采取“基于是否侵害公民核心权益的划分”比较合适。
2.2. 刑事初查阶段大数据侦查的行为样态
1) 数据搜索。按照数据的不同获取途径,能够把数据搜索分为数据库数据搜索、互联网数据搜索和电子数据搜索三类。数据库搜索获取数据的途径主要有从侦查机关已经建立的信息数据库和能够被取得、分析的社会行业数据库获取;互联网搜索其实和我们日常使用的网络检索基本相同,是获取、利用海量的互联网数据进行大数据侦查;通过以上两种数据搜索技术,可以获得大量相关的数据。侦查人员通过以上大数据源头获得初始的海量数据之后,还需要采取电子搜索技术进一步筛选出有用的数据信息。
2) 数据碰撞。采用特定的计算机程序工具,对至少两个数据库或数据集执行匹配对比操作,并深入探究由此产生的重叠信息及交叉数据的内涵。
3) 数据挖掘。数据采掘构成了大数据技术中的精髓部分,其本质在于从海量数据中自动筛选出有价值的信息。这一过程涵盖了揭示数据间的关联性、对数据进行类别划分、聚类具有共通特征的数据项、识别数据随时间演变的规律,以及检出与预设模式显著相异的数据点等多个方面。
4) 数据画像。借助大数据解析手段,把嫌疑人或关联人员的身份信息、行为模式、兴趣偏好、社交联系等转化并整合为全面的数据肖像,为刑事侦查工作提供有价值的线索与情报支持。
5) 从互联网企业调取数据。一些掌握有海量个人数据的公司、企业,多为大型互联网公司,在为用户提供网络服务的同时,经过多年的积累,也收集了用户的大量数据,例如百度掌握有全国大量用户的网络搜索数据,阿里巴巴公司掌握有大量的用户交易数据等。侦查机关在初查阶段必要时可以从这些大型互联网企业调取数据[1]。
2.3. 大数据侦查是否属于强制性侦查措施
根据“是否侵犯公民重要利益说”的标准,可以将大数据侦查按照侵犯公民权利的程度进行分类。大数据侦查所涉及的公民基本权利主要有隐私权、个人信息权与财产权[4]。
1) 隐私权。每个公民都拥有隐私权,公民有权使个人的私生活不被他人所知晓,任何人不得对其个人生活进行非法刺探、侵扰和公开。隐私权属于人格尊严保护中的重要部分,我国《宪法》中也规定了公民的人格尊严不受侵犯,且随着《民法典》当中的人格权独立成编,人们对隐私权的保护也越来越重视。而有时在初查阶段运用大数据侦查时,会需要调取海量的公民个人数据进行比对分析,在这个过程当中,极有可能会侵犯到公民的个人隐私权。
2) 通信自由与通信秘密权。我国《宪法》在第四十条规定了公民通信自由和通信秘密权:“中华人民共和国公民的通信自由和通信秘密受法律的保护。除因国家安全或者追查刑事犯罪的需要,由公安机关或者检察机关依照法律规定的程序对通信进行检查外,任何组织或者个人不得以任何理由侵犯公民的通信自由和通信秘密。”随着互联网技术的快速发展,如今人们很少再使用纸质的信件进行交流,而是大多使用电子邮件、微信、微博等网络交流方式,使得这些软件当中的电子数据也承载了公民的通信自由与通信秘密权。在初查阶段使用大数据侦查措施时,也会向以上这些大型互联网公司调取公民的各种通信信息,但在初查阶段尚不清楚是否有犯罪发生,是否需要追究刑事责任,不符合《宪法》中规定的情形,有可能会侵犯公民的通信自由与通信秘密权。
3) 财产权。公民的个人数据具有财产权的属性。民众个人信息数据的表现形式本身就承载着一定的价值,能够在交易市场中流通并带来经济收益。其次,有些数据的内容就属于公民的无形财产,例如股票交易账户等等。大数据侦查当中使用的所收集的数据可能本身并未获得公民的同意,对公民个人数据的擅自使用也可能会侵犯公民因处分该数据而获得经济效益的财产权[5]。
因此,将隐私权、通信自由与通信秘密权以及财产权作为公民重要权益的考量标准,可以根据该标准来判断大数据侦查是否涉及到了公民的重要权益,从而对不同的大数据侦查的措施是属于任意性侦查还是强制性侦查做出一个清楚的界定。
如果要完善初查阶段大数据侦查的法律规制,那么对其所涉及的所有电子数据,必须进行全面且深入的覆盖分析,准确判断各类数据是否关联着重要权利,以及具体涉及的是何种权利,初查阶段的大数据侦查的行为样态当中,数据碰撞、数据挖掘、数据画像都是对已有数据的处理措施,而重点的规制对象应当是数据搜索和从大数据公司调取数据这两类获取数据的措施,后续的数据处理措施也应当按照上游获取数据的类型与获取过程进行对应的分类。因此,重点在于大数据侦查的数据获取阶段,我们可以依据大数据侦查措施中的数据来源的类型与获取过程对公民重要权益的限制程度进行如下分类:
1) 完全不涉及重要权利的大数据侦查措施。
大数据侦查中使用的来源于互联网的公众自行公开的数据信息、来自官方的数据以及公安机关的大数据进行分析的侦查措施属于完全不涉及重要权利的大数据侦查措施。来源于互联网的公众自行公开的数据主要是一些互联网公司旗下的社会网络平台例如新浪微博、豆瓣、虎扑、小红书等服务器中存储的海量公众自行公开发布的信息;来自官方的大数据是指在公权力运行过程中,官方机构(党政机关、司法机关、群团机关等)为实施有效管理,通过各种内设系统输入和输出的话语、文件、口号、音频、视频等数据,其中包含免费公开的数据、通过有偿订阅等可以获取的数据以及不可公开的数据;来自公安机关的大数据主要是指我国“金盾工程”项目中建设的多种专门的数据信息系统,如违法犯罪人员信息系统、出入境人员管理信息系统、机动车辆管理信息系统等[6]。以上数据为公民自行公开或者是经过公民同意并提交给官方的数据信息,使用这些信息进行的大数据侦查措施并不涉及公民的重要权利,可以归于任意性措施当中。
2) 部分涉及重要权利的大数据侦查措施。
大数据侦查中使用的来源于互联网企业、银行、物流等第三方平台存储的部分公民信息进行分析的侦查措施属于部分涉及重要权利的大数据侦查措施。这些信息是公民为了便利自己使用平台的业务而提交给相关企业的个人信息,例如一些视频网站收集的用户提交的关于自己感兴趣的领域信息,或者是在使用这些平台的服务时产生的相关数据,例如银行转账信息、酒店入住信息等,相关企业对这些数据也负有保密、不得对外泄露的义务。由于这些信息对公民隐私权的侵犯程度不高,人们对该类数据被官方监测使用的排斥心理不强,且不涉及通信自由与通信秘密权,但若公民不知情可能会侵犯其处置数据的财产权。所以本文认为,对这些大数据的处置措施在初查阶段可以使用,但是要规定严格的前置条件与程序。
3) 绝对侵犯重要权利的大数据侦查措施。
大数据侦查中使用的来源于互联网企业等第三方平台存储的公民未公开的内容信息以及未经公民同意进行的大数据监控措施获取的数据进行分析的侦查措施属于绝对侵犯重要权利的大数据侦查措施。内容信息主要包括公民在微信、QQ、电子邮件等网络平台当中的通信交流信息,大数据监控包括收集的个人位置数据等。这些信息涉及到的公民基本权利较深入,绝对侵犯了公民的隐私权与通信自由与通信秘密权。因此使用这些信息进行的大数据侦查措施可以归于强制性侦查当中[7]。
3. 刑事初查阶段大数据侦查存在的问题
3.1. 初查时大数据侦查的启动条件不明
如今,我国现行法律中还没有针对大数据侦查的规制程序的相关规定。虽然大数据侦查和技术侦查、搜查在内容上拥有部分相同点,但是我国《刑事诉讼法》当中有关技术侦查与搜查的内容不能直接套用于大数据侦查[8]。技术侦查仅针对特定犯罪类型且需要经过审批之后才可以采取,其可以采取的方式也不如大数据侦查多,大数据侦查也更注重对于数据的获取与处理而非电子侦听等的技术手段;而搜查大多只对固定的物理介质使用,大数据侦查则针对电子信息与数据。因此,大数据侦查目前无法可依[9]。
在我国,立案之前的初查阶段一般只能采取任意性的侦查措施,避免强制性侦查措施的使用,但是由于目前在实践当中,大数据侦查的法律属性模糊,是属于任意性侦查还是强制性侦查并无定论与严格的界定标准,所以侦查机关常常以大数据侦查不属于强制性侦查为由,在立案前的初查阶段就随意启动大数据侦查。这样做虽然有效地提高了立案率与初查工作效率,但却极大可能会对公民的基本权利造成侵害[10]。
3.2. 初查时大数据侦查与正当程序的冲突
1) 程序缺乏透明度。首要问题在于技术程序的不透明性。在大数据侦查所采用的各项专业技术的运作过程中,诸如数据清洗、数据算法等关键环节往往处于未知状态,使得人们无法确定数据在收集过程中是否会出现偏差、数据的质量是否可靠、数据模型的设计是否合理,这些问题均缺乏相应的审查机制。进一步而言,技术程序的不透明性又在一定程度上引发了法律程序上的不透明问题,甚至侦查人员本身也不了解数据算法的逻辑、依据与原理[11]。
2) 难以确保知情与辩护权。鉴于大数据运行程序的不透明性,当事人的知情权难以得到有效保障。他们无从得知自己是否已被大数据系统归类为高风险个体或潜在嫌疑人,也无法了解对其采取侦查措施的具体依据,从而在维护自身权益方面面临困境,也就更没有机会提出辩解,更何况普通人也并不具备质疑大数据运行技术的专业知识[12]。
3.3. 缺少对大数据的合法性审查以及对大数据收集、处理过程的监督
1) 目前也没有关于大数据侦查措施中的非法证据排除的规则,“毒树之果”原则的适用仍然存在缺陷。有部分大数据的获取过程对公民的基本权利的侵犯较为严重,但是却没有对其证据能力有影响[13]。
2) 数据获取以及分析的质量无法得到有效监督。首先,由于大数据具有数据量巨大、结构混乱复杂的先天性特征,无法保证海量数据中的每一笔数据都具有准确性,而且数据也很容易被篡改,在数据获取、数据分析的每一阶段都有出错的可能。在大数据侦查的实践中,数据质量常面临多重挑战:数据准确性问题,例如数据字段存在错误或拼写失误;数据冗余现象,即同一实体可能以多种不同的数据格式呈现,比如地址编码在侦查录入时常遇到的一地多码、重名地址等困扰;数据不完整情况,具体表现为某个数据集合中遗漏了关键信息;此外,还包括数据不一致性和数据时效性方面的问题。这些问题的存在,会在一定程度上削弱数据分析结果的准确性和可信度[14]。其次,数据分析过程可能出错。在大数据分析的过程当中,在数据集成、算法确定、模型建立等的任一环节都有可能出错。而对这些数据质量问题,我们也缺少相应的检查、监督的机制。
4. 完善刑事初查阶段大数据侦查的法律规制
4.1. 按照比例原则规制初查阶段大数据侦查的启动
大数据侦查中使用的大数据种类多、范围广,承载着公民的隐私权、通信自由与通信秘密权与财产权等重要权利,在初查时运用大数据侦查时,要兼顾侦查效率与保护公民的基本权利,依照比例原则将大数据侦查按照不同分类确定是否可以在初查阶段使用及其不同的启动条件。比例原则是指公权力在符合法律规定的情况下,限制公民基本权利时,应衡量公权力行为的必要性和充分性。根据以上依据大数据侦查措施中的数据来源的类型与获取过程对公民重要权益的限制程度做出的分类,我们可以对其启动条件进行如表1所示的规制[15]。
Table1. Classification of big data investigations and corresponding conditions for initiation of the preliminary investigation stage
表1. 大数据侦查的分类以及对应的初查阶段启动条件
对公民重要权益的限制程度 |
数据类型 |
是否可以在初查阶段使用以及启动条件 |
完全不涉及重要权利 |
来源于互联网的公众自行公开的数据信息、来自官方的数据以及公安机关的大数据 |
侦查机关可以自行决定使用与否 |
部分涉及重要权利 |
来源于互联网企业、银行、物流等第三方平台存储的部分公民信息数据 |
针对特定犯罪类型、经过备案审批可以使用 |
绝对侵犯重要权利 |
来源于互联网企业等第三方平台存储的公民未公开的内容信息以及未经公民同意进行的大数据监控措施获取的数据 |
绝对禁止使用 |
对于完全不涉及重要权利的大数据侦查措施,由于其法律属性为任意性侦查,所以可以由侦查机关自行决定是否在初查时使用。
对于部分涉及重要权利的大数据侦查措施,由于其对公民的基本权利有一定的限制,我们可以引入令状制度并且按照比例原则限制适用对象,即该类大数据侦查措施的适用对象可以参考技术侦查的相关规定,仅适用于几种危害程度较为严重的犯罪,这与我国实务当中的现实实践也是相匹配的,例如侦查机关会通过对银行跨境大额转账的数据监测来发现洗钱等的犯罪事实,这样会减少对现行的侦查状况的不利影响。且如若以后侦查机关在初查阶段想启用该类大数据侦查措施时,应当将侦查方式、措施类型、侦查对象等信息向有关机关进行请示备案,经批准后方可使用该类侦查措施,并将审批责任、使用责任落实到审批人与申请人之上[16]。
对于绝对侵犯重要权利的大数据侦查措施,由于其对公民权利的侵犯较为严重且其法律属性为强制性侦查,所以应当禁止在初查阶段使用该类大数据侦查措施。
4.2. 构建初查阶段大数据侦查的正当程序
为了对初查阶段的大数据侦查进行有效地规制,使得当事人能够尽量充分知情且为自己进行辩护,最大化保护当事人的权益,应当构建必要的程序性机制,并且培养配套的大数据技术人才,能够为当事人释明背后原理并帮助后续立案标准达成的说明。
1) 设置告知及解释程序。对于那些因大数据决策流程而受到负面影响的当事人,在确保案件顺利推进的前提下,司法工作者有责任向涉案嫌疑人说明大数据侦查所得出的分析结果、所依赖的数据资源以及基础的算法逻辑等信息。
2) 赋予当事人数据辩护权。在将大数据分析结果通报给相关当事人的同时,理应保障那些因分析结果而受到不利影响的当事人拥有提出质疑的权利。当事人有权对数据来源的可靠性、数据算法的合理性、分析结果的准确性和恰当性提出疑问,或者也可以直接提供与大数据分析结果相悖的其他证据来支持自己的观点[17]。
4.3. 完善对大数据的合法性审查
对初查阶段大数据侦查的启动条件的规定属于前置的法律规制手段,我们还需要事后对大数据侦查获取的数据进行审查,只有符合以上启动条件的大数据侦查措施获得的证据才可能具有证明能力,以明确非法证据排除适用的规则。
对大数据的合法性审查可以按照审查主体分为官方审查与当事人及其辩护人审查两类。首先,可以参考我国《刑事诉讼法》对于立案监督的规定,授权同级检察机关审查公安机关在初查阶段使用大数据侦查手段是否符合以上启动条件的规定,并对不符合要求的大数据侦查所获得的证据进行排除使用。其次,侦查机关应当将刑事初查阶段进行大数据侦查的大数据来源与分析过程如实、详细地记录在案,可供当事人与辩护人进行查阅,使得其有申请非法证据排除的机会。
4.4. 加强对大数据收集、分析过程的监督
由于数据极易被篡改的特性,为了保障大数据侦查获得的结果的可靠性,尽量减少数据质量出现问题的可能性,应当加强对大数据收集与分析过程的监督。
1) 进行数据清洗、数据备份、数据检查等内部监督。对于收集获取到的大数据,可以首先进行数据检查与清洗工作,清除一些重复数据,修改错误数据,弥补上缺失的数据,尽量减少数据质量问题对后续数据分析过程及结果的影响。
2) 建立数据追溯程序。大数据运作与决策流程的纷繁复杂,为日后错误根源的追溯及责任追究增添了不小的难度。鉴于此,构建一套大数据侦查的追踪回溯机制显得尤为重要,它要求从数据的初始阶段就详细记录其流转与处理的每一步骤,确保权利与责任的对等,并保障整个操作链条的可追溯性。
5. 结语
随着科学技术的不断进步,侦查措施也出现了较大的变革,大数据侦查便是其中代表,其在立案之前的初查阶段的应用也逐渐增多,并且发挥了巨大的作用,大幅提高了立案率、提升司法效率,节约了大量的人力、物力,使得立案的标准更加的客观,但由于法律面对复杂多变的现实的滞后性,对初查阶段的大数据侦查的法律规制手段较少,使得其在应用过程中极易侵犯公民的重要权利,为了平衡司法效率与对公民基本权利的保护,应当按照比例原则适用大数据侦查措施,在初查阶段做到审慎启用,按照其对公民基本权利的限制程度适用不同的启动条件,并加强对大数据的合法性审查与对其运行过程的监督。