1. 引言
《经济学人》曾发文:“世界上最有价值的资源不再是石油,而是数据”。为什么数据将成为最有价值的资源,笔者引用经济学中的边际收益递减律[1]进行解释,边际收益递减律是指在技术水平不变的情况下,当把一种可变的生产要素投入到一种或几种不变的生产要素中时,最初这种生产要素的增加会使产量增加,但当它超过一定限度时,增加的产量将要递减,最终还会使产量绝对减少。一般情况下,数据并不存在严格意义上的边际收益递减。因为数据集的规模越大,所蕴含的信息就越多,因此每新增加一条数据所提供的信息会持续增加,在某个点之前并没有出现明显的递减趋势;同时,当有固定用户之后,单条数据的收集成本很低,数据量的增加不会造成成本的成比例增加。
综上,虽然数据也存在小量的边际效益递减,但是其几乎不存在边际收益递减,通俗来讲,数据量越大,互联网平台的收益越高。这是数据作为新型生产要素较传统生产要素的重要不同之处。
2. 数据垄断的内涵
2.1. 数据垄断的定义
数据垄断的概念目前在学界并未形成统一定论,主要存在以下学说,第一是独占说[2],即数据垄断就是数据持有人对数据的独占。理论上,独占就意味着数据持有人可以依靠其对数据的独占使其对相关市场的份额占有率可以达到百分之百;根据我国现行的《反垄断法》,数据独占并不违反《反垄断法》,只有形成了相关市场的支配地位,并对该市场支配地位进行滥用,从而对市场竞争秩序造成损害,才违反《反垄断法》。第二是数据流动说,该学说认为数据垄断是指企业将数据分享的路径切断,从而使数据失去流动性,其他平台无法对相关数据进行获取、处理和使用。第三是市场力说,该学说认为数据垄断是指排除限制市场竞争,对新企业进入相关市场设置了技术壁垒等消极手段。第四是个人信息说,该学说认为数据垄断是企业将个人信息获取之后,对个人信息进行控制、加工和使用,但是并未获得个人授权的行为。第五是收益说,该学说认为数据垄断是指企业独占他人数据并以此获得收益。
笔者认为,虽然当前理论界对于数据垄断的概念尚未形成统一理论,但是对于上述五个学说,我们很容易可以提取到公因式,即不同的数据垄断学说都认为数据持有人有独占数据的倾向,这一特征也是产生数据垄断的根源,不妨说破解数据垄断这一问题就是要破解数据独占问题。
2.2. 数据垄断的特征
2.2.1. 数据垄断的隐蔽性
在数字经济的高速发展背景之下,互联网平台企业为了保证自身的竞争优势,所采取的数据独占行为或者数据垄断行为大多具有较强的隐蔽性。在数据收集阶段,很多互联网平台会营造一种让利于消费者的假象,比如注册账号返现金,下单返现金等活动吸引流量,表面上并未直接侵犯消费者的利益,但是在此过程中,互联网平台会利用“合法”的《隐私协议》获取用户的个人数据,大多数用户会被一些返现活动蒙蔽双眼,进而注册账号,授权互联网平台收集其个人数据,从而被平台收集到大量个人信息数据;除了前端的数据收集存在隐蔽性,其后台的算法大多也存在更强的隐蔽性为其数据独占行为创造条件,甚至有些互联网平台形成隐形定价的算法来破坏正常的市场秩序。
我国现行反垄断体系构建是以芝加哥学派的价格理论为基础的,芝加哥学派认为,垄断行为最终都会表现为对消费者权益的损害,芝加哥学派主要从价格因素考虑,认为垄断会通过损害消费者利益表现出来[3]。但因为互联网平台数据垄断具有隐蔽性,短时间内无法直观地看出平台的相关行为损害消费者权益;由此可以看出传统的芝加哥学派并不能及时将互联网平台的相关行为定义为垄断行为,行政机关便无法采取下一步措施,这就间接导致了现行反垄断体系对互联网平台相关行为的规制十分无力。于是2021年2月7日,国务院反垄断委员会发布了《关于平台经济领域的反垄断指南》(以下简称《指南》),该《指南》的出台表明行政机关已经注意到平台数据垄断,并在积极完善现行反垄断监管体系。但由于《指南》受立法层级制约,不能从根本上扭转《反垄断法》在数据垄断方面的规制劣势,平台数据垄断现象依旧猖獗,这极大阻碍了我国互联网市场健康有序发展。
2.2.2. 数据垄断的软强制性
互联网平台行为的软强制性更像是国际法上的软法,其没有强制力作为支撑,但是对于互联网平台内部用户存在较强的约束。互联网平台几乎都存在双重身份,一方面,不论是阿里、京东、拼多多一类的购物服务平台,饿了么、美团等外卖服务平台,还是携程等旅行服务平台,各大互联网平台均会入驻大量商家,互联网平台可以利用合同等形式软强制商家按照自己平台的规则进行运营,使得互联网企业可以获得尽量多的营利,平台企业掌握着商家的数据,通过对大数据的分析即可掌握商家的动向,甚至利用对流量的掌控,使平台企业内商家的收益受影响。对此,即使平台企业逐渐提出过分的要求,商家也几乎没有拒绝和反抗的余地;另一方面,互联网平台一定有巨量的用户群体,即消费者,互联网平台收集到大量的个人信息数据之后,难免会通过大数据手段损害消费者的利益,如运用大数据方法对消费者进行画像,针对性地向消费者推荐商品,更有甚者恶意提高价格,出现“大数据杀熟”。互联网平台建立在数据独占的基础之上可以利用自己的双重身份同时伤害商家和消费者从中谋取不义之财。
2.2.3. 数据垄断的马太效应
正如前文所述,数据作为新兴“资源”,其基本不存在严格意义上的边际收益递减,这是数据的一个主要特性。互联网平台的数据垄断也存在特殊之处,这一特殊性其实也与互联网平台的双重身份有关,对于商家而言,互联网平台通过前期投入大量资本运营,获得巨大的具有消费粘性的消费者群体之后,便可以以此“要挟”商家,此时几乎不会出现互联网平台请求商家入驻平台,而是商家主动要求加入平台;对于消费者,互联网平台通过前期掌握消费者个人信息数据制作针对每一位消费者的个性化产品,使得消费者进入平台营造的舒适圈,此时消费者就会对平台产生依赖,在此过程中,互联网平台便可以收集更多消费者个人信息数据,由此形成一个正循环[4]。在此情况下,互联网平台在竞争过程中就会出现强者越强,弱者渐渐退出竞争的马太效应,新平台很难再进入到竞争序列当中。如Google搜索引擎正是利用此特性,通过分析消费者的数据,以此得到更为精确的消费者习惯和喜好,进而为消费者提供更为合适的搜索服务,同时新用户数量呈井喷式激增,形成反馈循环。
综上,数据垄断虽然不是所有的数据产业都会出现的现象,但是如果存在垄断企业或组织的存在,将会对数据市场以及大众利益产生严重的影响。因此,需要政策和监管的加强以维护数据市场的公平,以及大众的权益。
2.3. 数据垄断的弊端
2.3.1. 侵害商家权益
互联网平台可以说是云端的集贸市场,互联网平台会尽量增加自己的用户群体来提高自己的市场占有率。互联网平台与集贸市场很像,只有商家多,商家的商品质量上乘,才能吸引更多的消费者前来买单;反之,更多的消费者前来买单就积累了更多的老顾客,而且互联网平台的老顾客会更加有用户粘性,更多的消费者群体便会吸引更多的商家入驻平台,由此,商家和消费者群体的增长也形成正循环。互联网平台便会从用户数量层面进行切入,尽量提高自己的用户数量,使自己的平台成为交易更为活跃的场所。随着互联网平台的蓬勃发展,平台便会凭借庞大的消费者群体要挟平台商家进行“二选一”,商家处于营利最大化只能被迫选择仅在优势平台进行经营,放弃在其他平台经营的机会。基于此,优势平台便会通过“二选一”策略提高自己的卖家数量,同时减少竞争对手平台的卖家数量[5]。强制商家“二选一”也会加剧优势平台在商家数量和用户数量上的双重马太效应,最终导致竞争机制完全失效,出现某个行业某个平台一家独大的现象。
2.3.2. 侵害消费者权益
大数据“杀熟”是电子商务经营者在信息收集、搜索推荐和差别定价等方面滥用算法权力,谋取不正当利益的典型表现。优势平台由于用户数量较多,在大数据和算法综合运用下,获取数据和利用数据能力得以提升,能够轻松实现对消费者“千人千面”的定价模式。某些平台会通过用户授权、私下窃听和信息买卖等多种途径获取消费者数据,包括联系方式、收货地址和手机型号等必要交易信息,也包括交易记录、搜索偏好和职业等无关交易的信息。消费者从平台数据提供者也同时逐渐成为平台数据垄断受害者。平台经营者通过获取非必要数据形成不合理的信息不对称,从而探知不同消费者最大支付意愿,以获取更多消费剩余。大数据“杀熟”的危害具有泛在性和隐蔽性的特点,即对消费者权益与市场公平交易秩序的影响是潜在的、不特定的。此行为若得不到有效治理可能会导致消费者在平台交易更加谨慎或者放弃平台交易,形成信任危机,导致互联网市场无法有效运转[6]。
2.3.3. 阻碍技术创新
在数字经济时代,数据是互联网平台商业经济的基础,一旦一些优势平台在其对应行业形成了数据垄断,便会阻碍科技创新[7],主要体现在两方面,一方面,互联网平台形成数据垄断之后,由于其独自占有数据集群,新平台进入该行业时难度骤增,需要面对市场中已经占有领先地位的优势平台,想要收集到可以与优势平台匹敌的数据量是十分困难的,再加之优势平台形成垄断之后,行政机关必然会收紧数据收集政策,新平台将会更难进入该行业与优势平台进行竞争;另一方面,优势平台形成数据垄断地位之后,便会出现“躺平式”经营,在现有经营模式之下,只需要维护好当前系统,便会有营利出现,加之数据垄断的正循环特性,在不创新的前提下,其盈利规模也会不断扩大,难免会让优势平台主动放弃创新。更何况创新本就是一种投资周期长和回报不确定的高风险活动。优势平台天然的逐利性可能将更多资金从创新研发转向数据获取,以获得数据优势带来的短期确定性利润。
3. 数据垄断的治理路径
数据垄断源于数据封闭,即在传统的认知观念下,互联网平台已经形成了一种思维惯性,其认为数据的权属应当遵循谁收集谁占有的原则,事实证明,这一原则正是导致数据垄断出现的根源,因此要解决数据垄断,就必须将数据的权属相对开放,让数据能够流动起来,为社会创造更大价值。
3.1. 数据共享平台领导机制
国家数据局是由国家发展和改革委员会管理,负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字中国、数字经济、数字社会规划和建设等。肖钢认为,目前大概有15个政府部门拥有数据管理权限,“九龙治水”的现象较为突出,管理手段不适应,如何实施数据分级分类管理也存在不少问题[8]。周汉华教授指出,我国缺乏对平台经济二元分治以及数据监管转型的必要认识,有必要以强化数据监管为重点,推动构建我国二元分治的平台经济治理体系。他建议设立国家数据局,与国家反垄断局一道,为二元分治发挥作用提供动力保障[9]。还有一些通信业资深人士指出,国家数据局要解决的问题,除了数据监管分散外,还有数据垄断。数据垄断形成是平台经济发展的必然结果。从当前的格局来看,数据垄断主要体现在两方面:一是政府在构建智慧城市时产生的公共数据;一个是企业运营掌握的用户数据。
笔者认为,未来,数字经济是国家发展的新引擎。数据是最核心要素,要把数据治理好、管理好。在国家数据局决定成立之前,各个省份基本都成立了大数据管理局,但是上级并无统一领导机构。国家数据局的成立就是要建设数字中国全国“一盘棋”,国家数据局的智能更加明确之后,不仅可以进行基础数据的建设,在数据资源统筹的基础上进行整体规划,将来垂直管理更方便,最终推动数字中国建设。
3.2. 数据共享协作系统
此前,欧洲一些国家为了解决数据垄断的相关问题,也探索了一些路径,具有代表性的即数据中介机构,但是仅仅在英国已过内部对于数据中介结构的概念也未形成统一结论。于是,欧盟于2022年6月出台《数据治理法案》,其表明数据中介机构是指在通过技术、法律或其他手段在数量不确定的数据主体和数据持有人与数据用户之间建立商业关系以实现数据共享的服务,包括为了行使数据主体有关个人数据的权利1。《数据治理法案》特别强调“建立商业关系”这一特质,将既不是为了在数据持有人和数据用户之间建立商业关系,也不允许数据中介服务提供商为数据共享目的建立商业关系而获取信息的服务,排除在数据中介机构之外,如云存储、web浏览器、浏览器插件等。这些服务只是单纯提供数据存储服务,并没有在数据主体或者数据持有者与数据用户之间建立具有商业意义的桥梁或渠道。
结合欧盟《数据治理法案》的相关立法经验,笔者对数据共享中心的具体运作模式进行了一定程度的构想。数据共享中心首先要接受国家数据局的统一领导,在具体职能方面,数据共享中心要把数据提供主体和数据使用主体以及信息来源方(个人)联系起来,其像是一个机关性质的数据交易所,但是其与数据交易所的本质区别主要有两点,其一,其具有强烈的公共属性,数据共享中心并非营利机构,其目的不是为了赚交易费或者差价,即数据共享中心是非盈利性质的;其二,数据共享中心的职能远大于且包含数据交易所的职能,其除了进行数据的流入流出交易之外,还需要对数据流出行为作出价值判断等。
数据共享中心共享协作系统可以分为以下几部分:
1) 构建合理的数据收集机制
具体来讲,由于数据权属不明,加之数据存放于平台方难免会造成数据垄断,因此数据共享中心应当成为数据的最终持有方,数据共享中心的运作模式就在于数据合理地流入和流出,数据共享中心要想汇聚最庞大的数据群,必须要有供给方。笔者认为,数据的主要供给方就是容易坠入数据垄断“泥沼”的平台,但是对于平台而言,自身前期投入大量资本收集来的数据“上交”给数据共享中心难免会造成平台方索性不进行数据收集,为了避免该情况的出现,必须严格落实谁提供谁使用原则,即数据的提供方拥有广于其所提供数据范围的使用权,换言之,平台方不应仅仅是数据的提供者,其也应当是数据的共享者,享受其他主体提供的数据。
2) 构建公平的数据定价机制
平台对于数据的收集和提供必然会出现多寡,如何将数据提供量和数据使用量二者平衡,便需要引入定价机制,但是由于数据本身的价值目前难以形成统一标准,我们可以尝试其他维度,如使用有效数据量等指标对其价值进行衡量,即数据的价值不一定需要用金钱来衡量,不妨可以用原始的“以物易物”的形式对其价值进行估计。由此可以进一步推导出数据共享中心的抵消机制,即数据的提供方可以享受其提供的数据和与其提供量相当或一定比例的其他数据。当然,上述仅是笔者的一种创新性思考,笔者相信,随着数据定价机制的不断发展,最终大概率还是会回归到用金钱来衡量数据的价值。
3) 构建严格的数据授权机制
建立在上述两个机制之上,大致可以看到一个同时存在数据流入流出的数据中心,但是,对于不同行业的数据或者不同层级的数据,其价值一定是不相同的,这一问题我们可以粗略地使数据定价机制解决;但数据本身并非是一个独立的无主物,每一条数据都来源于一个主体,有可能是企业等法人,但更多的还是自然人,这就不得不顾及数据安全这一老生常谈的话题,这一问题的解决就需要对数据协作系统增加一项职能,即价值评判。价值评判完全异于上述提到的价格评估,价值评判最终应当体现在数据的出口;细言之,数据的收集可以不加约束,只要有足够的存储内存和合理的分级分类方法,无论多么庞大的数据群均可以有条不紊地存储起来;相反,数据收集至数据共享中心之后如何使用是我们需要严格把控的流程,如果不加限制地“按需分配”,势必会造成数据安全隐患,这难免会导致比数据垄断更为严重的社会危机甚至社会灾难,因此,数据共享中心需要对每一次数据的流出进行价值评判,尤其是数据使用方对数据的使用场景、使用目的和使用方式等,数据共享中心要构建多维度评价机制,对数据使用方的数据使用申请进行评估,如果不存在隐患或隐患发生概率极低,可以授权使用;否者,不应当授权数据使用方使用该数据;同时,数据共享中心不仅要做到事前申请备案,还要做到事后审查,有必要时可以要求数据使用方提供相应担保数据共享中心的共享协作系统。笔者认为,价值判断机制是数据共享中心构建过程中至关重要的一环[10]。
数据共享中心必须要保证期严格的中立性,要对数据持有人或数据主体和数据用户之间的数据共享保持中立,以增加各主体之间对数据共享的信任。
3.3. 个人信息信托系统
随着我国经济社会的不断发展,尤其是互联网平台经济的飞速发展,人们越来越意识到个人信息保护。2019年修订的《中华人民共和国政府信息公开条例》对于公民个人信息保护具有现实指引作用。2021年11月我国首部《个人信息保护法》正式实施,该部法律是我国第一部专门规范个人信息保护的法律,个人信息保护成为摆在互联网企业收集个人信息数据的第一道关隘,诚然,个人信息保护相关立法可以保护个人信息,但是如果自然人将自己的信息牢牢攥在自己的手中并不能促进当前社会向前发展。通俗来讲,数据垄断根源于数据封闭,数据共享得益于数据开放;这必然会引来公民对个人隐私的忧虑。但是过度保护个人信息又会导致信息收集效率低下甚至导致数据无效,因为个人数据收集不够全面;笔者认为可以在数据共享中心构建个人信息信托系统,根据上文所述,数据共享中心具有数据授权过程中价值判断的功能,因此,个人可以按照自己的意愿主动将自己的个人信息打包存放在数据共享中心,形成个人与中心的信托关系,基于此种信托关系,数据共享中心可以代替个人运用个人信息,在一定程度上,数据共享中心就像是个人信息的专业管家,何种情况可以授权其他主体使用交由专业的“管家”来做决断[11]。理论上,个人信息信托系统可以处理好个人信息保护与个人信息授权使用之间的平衡。
笔者认为,个人信息信托系统既然可以直接接手个人信息,是否可以避免互联网平台通过发布超长超复杂的所谓《隐私保护协议》来恶意收集个人信息,笔者认为答案是肯定的,因为互联网平台的博弈对象从消费者变成了数据共享中心,数据共享中心其审查互联网平台的《隐私保护协议》更有耐心,更专业;相反,互联网平台面对数据共享中心的严格审查,其相关数据收集不规范行为也会受到极大遏制[12];而且在互联网平台或者其他使用数据的主体使用数据不存在风险时,可以批量授权其使用个人信息,这也解决了个体授权的效率问题。
综上,个人信息信托系统可以解决个人信息保护与个人信息授权之间的矛盾,还可以解决效率问题,可谓一箭双雕。
4. 结语
随着数字经济的不断发展,数据俨然已经成为最有价值的资源,社会的快速发展离不开大数据,大数据的发展离不开数据,数据合规使用制度是当前规范互联网平台的一把利剑,国家数据局未来会在数据应用方面出台对数字经济有益的政策,让数据活起来、更加高效地用起来。
NOTES
1《欧盟数据治理法案》第2章第2条第11款。