1. 引言
2020年11月15日中国签署《区域全面经济伙伴关系协定》(Regional Comprehensive Economic Partnership, RCEP),标志着当前世界上人口最多、经贸规模最大的自由贸易区正式启航。随后,2021年9月16日,中国正式提出申请加入《全面与进步跨太平洋伙伴关系协定》(Comprehensive and Progressive Agreement for Trans-Pacific Partnership, CPTPP),国内外反响积极,认为这是中国在新时代扩大对外开放的重要举措。这也表示着中国积极参与全球化经济建设的决心。CPTPP是高标准国际经贸协定,具有全面与进步的特点,规模远超现有的世贸组织规则 [1] 。加入CPTPP有利于中国扩大高水平开放,提升国际循环的质量和水平,推进深层次改革,促进高质量发展,也有助于CPTPP成员国拓展中国这一个全球第二大经济体的市场,扩大对华经贸合作。本研究主要针对自贸协定文本数据,因此选取了复杂网络中能够更好体现共词关系的共现网络模型。所谓的共现网络是指从关键词之间的共现关系角度建立的网络,是一种无向无权重的网络结构。共现网络可以通过可视化和提取文档语料库中单词之间关系的信息,更加直观地去了解文本之间的区别及隐含的信息。因此,本文结合复杂网络与文本分析方法研究RCEP与CPTPP自贸协定规则文本,对于了解中国加入CPTPP仍需努力的方向具有一定的意义。
2. 模型构建及研究方法
2.1. 网络构建
根据复杂网络构成方法,本文将RCEP与CPTPP自贸协定规则文本词共现网络表示为
(1)
上式中,
表示第i个单词和第j个单词的共现次数;
表示单词i和单词j在文本中同时出现的次数。将文本中出现的单词作为节点,将单词之间的共现关系作为边,构建一个无向图。节点之间的边的权重可以表示为它们的共现次数。
网络结构测度指标
(1) 度中心性(Degree Centrality):衡量节点在网络中的连接数量,可以表示节点在网络中的重要性和影响力。具有高度中心性的节点通常是网络中最活跃的节点,也可能是网络中的关键节点。
(2)
其中
表示节点i的度中心性,
表示节点i和节点j之间的边的权重。
(2) 接近中心性(Closeness Centrality):衡量节点到其他节点的平均最短路径长度的倒数,可以揭示节点在网络中的影响力和信息接收能力。具有高接近中心性的节点通常是网络中的关键节点,能够快速地将信息传递到其他节点。
(3)
其中,
表示节点i的接近中心性,
表示节点i和节点j之间的距离。
(3) 介数中心性(Betweenness Centrality):衡量节点在所有最短路径中的出现次数,可以揭示节点在网络中的控制力和传递信息的能力。具有高介数中心性的节点通常是网络中的重要枢纽,控制信息的流动和传播。
(4)
其中,
表示节点i的介数中心性,
表示节点j到节点k的最短路径数,
表示节点j到节点k的最短路径数中经过节点i的路径数。
2.2. 研究方法
本研究采用了文本分析中常用的词频分析法,使用R软件中的jieba分词包、tm包、SnowballC包和tidytext包对RCEP与CPTPP文本进行文本预处理,构建矩阵,筛选表征词项,以及可视化操作。
在整理自贸协定文本时发现,文本中的高频词主要可归为三类:第一,体现文本结构的名词,例如annex (附表),chapter (章节)等。这类词能够大致反映出自贸协定的章节数量,进而可以体现自贸协定的内容丰富程度和文本结构特征。第二,法律合同文本常用规范词,例如refer (参见),accord (一致)等。Horn等(2010)在分析欧盟、美国签署的28个PTA (特惠贸易协定)时曾指出判断贸易协定的质量除了要确定其是否对相应议题作出明确法律承诺,还要考察该承诺的法律约束力 [2] 。而自贸协定中的法律术语、条约合同文本常用词正是条款法律约束力的一种体现。第三,自贸协定议题相关词,例如credit (信用),customs (海关)等,这类词能够清晰地显示出自贸协定的具体内容和所覆盖的议题,由此可以推断自贸协定的水平与深度。
接下来根据“文本结构词”,“法律规范词”,“自贸协定相关词”三种分类,利用TF-IDF方法对关键词进行词频分析。TF-IDF是由单词的频率(Term Frequency, TF)和逆文档频率(Inverse Document Frequency, IDF)两个指标计算而来的,具体计算公式如下:
(5)
(6)
(7)
式(5)表示词频(TF),是指词条项在一个文档中出现的频率,其中,
表示词条项t在某文档D中词频,
表示文档D中,特征词条t的频度(次数),
表示文档D中所有词条项的总数量。
式(6)表示逆向文档频率(IDF)是一种度量词条项在文档中重要性的方式。其中,
为词条项t的逆文档频率,N为所有文档数量,
为文档频率(document frequency),表示出现词条项t的所有文档的数量。
式(7)则表示词频–逆文档频率(TF-IDF)即通过综合考虑词的TF与IDF来计算特征词项的权重,其计算方法即特征词项的词频与逆文档频率的乘积。
3. 结果与分析
3.1. 数据来源
本文所采用的文本数据来自RCEP官网数据库,中华人民共和国商务部数据库,新西兰外交贸易部(MFAT)数据库以及WTO官网RTA数据库中有关RCEP与CPTPP自贸协定规则文本。由于CPTPP仅有官方的英文文件,中文翻译版本可能存在歧义,因此本文的研究对象选取了RCEP与CPTPP贸易规则的英文文本。
3.2. 关键词筛选结果分析
根据“文本结构词”,“法律规范词”,“自贸协定相关词”三种分类,共筛选出“文本结构词”共5个关键词;“法律规范词”共32个关键词;“自贸相关词”共120个关键词,所选择的157个关键词中,包含3个关键词仅出现在RCEP自贸协定文本中,15个关键词仅出现在CPTPP自贸协定文本中如表1所示:

Table 1. Differences in keyword screening results
表1. 关键词筛选结果区别
表1中显示仅在CPTPP中出现的词的数量是相对更多的,可见CPTPP所涉及到的范围是超过RCEP的,例如在CPTPP中所涉及到的state-owned (国有的),audiovisual (视听产业)等方面在RCEP中是没有体现的。以国有企业为例,CPTPP 中对于国有企业所设置的条款是详尽且具有针对性的 [3] ,而RCEP中更多的是对国有化相关方面进行讨论。
3.3. 词频与文频分析
本章节主要对“文本结构词”,“法律规范词”,“自贸协定相关词”三种分类的关键词所得出的实验结果进行分析。表2和表3分别展示了RCEP与CPTPP中“文本结构词”与“法律规范词”TF与IDF排名前五的关键词:

Table 2. TF and IDF of structural words in the text of RCEP and CPTPP FTAs
表2. RCEP与CPTPP自贸协定文本结构词词频与文频
从表2中可以看出文本结构词的词频和文频总量CPTPP均超过RCEP。这一点我们可以从两者的总章节数量上得出相同的结论,CPTPP自贸协定文本共有30章,而RCPE自贸协定文本只有20章。虽然CPTPP的总词频和总文频数量远超RCEP,但RCEP中Chapter
(章节)一词的词频与文频是超过CPTPP的。这是由于RCEP总章节少于CPTPP,但对于每一章节下面的附属章节设置的更加详细,同时对于之前的章节重新提及的次数也是较多的。

Table 3. Word frequency and text frequency of legal norms of RCEP and CPTPP FTAs
表3. RCEP与CPTPP自贸协定法律规范词词频与文频
由于篇幅限制,仅展示排名前5的词项。
对于表3的分析中借鉴了Horn等(2010)在研究中提到的“强约束力”和“弱约束力”的概念 [2] ,将筛选出的法律规范词再次划分为强约束力和弱约束力两类,确定了8个弱约束力关键词与24个强约束力关键词。其中,强约束力如referred (参见),specify (明确规定)是指能够体现自贸协定条款强制力的词项或者体现条款明确、详尽特征的词项,弱约束力如necessary (必要时),cooperate (合作)是指弱化条款的承诺力度或象征性措施中的常见词项。由于strive (努力),attention (关注)仅在CPTPP中出现,因此这两个关键词不计入统计,结果如表4所示:

Table 4. Comparison of the relative number of frequencies of “strongly binding” and “weakly binding” terms
表4. “强约束力”“弱约束力”词项频数相对数量对比
结合“约束力”的概念从表3中发现,两者法律规范词排在前五名的均为强约束力的词项,说明两者对于法律约束力都是较强的。从表4中可以看到,无论是强约束力还是弱约束力的词总量均为CPTPP大于RCEP。但RCEP中强约束力的词项占法律规范词总量的92%,CPTPP中强约束力的词项占总量的93%,两者之间的差距并不大。同时由于两者文本体量不同,仅通过词频与文频来判断约束力并不准确。通过占比可以看出,实际两者的法律约束力相差并不大,由此可知法律约束力方面两者是基本相同的,都属于高法律约束力的自贸协定。

Table 5. TF and IDF of words related to RCEP and CPTPP FTAs
表5. RCEP与CPTPP自贸相关词词频与文频
由于篇幅限制,仅展示排名前5的词项。
表5展示了“自贸相关词”的实验结果,自贸相关词是最能体现一个自贸协定文本所包含以及所涉及到的主要内容和相关项目,可以较为清晰的看出RCEP与CPTPP自贸协定文本涉及范围的区别。从表5中可以看出在RCEP自贸协定文本中关于RVC (区域价值成分)的TF和IDF都是最高的。RVC是增值标准的一种,通过比较各种原材料、非原产材料、费用等构成货物的价值成分的占比,判断非原产材料是否发生实质性改变。可见,RCEP与CPTPP的较大的一个区别之一便是针对原产地规则方面的规定。RCEP的一个关键性突破在于为整个区域制定了共同的原产地规则,而CPTPP设定了较高的CTC标准,以4位和6位的税目改变为主,但CPTPP的RVC标准总的来看不算太高 [4] 。
而在CPTPP中排名最高的词项是Services (服务贸易),是由于CPTPP协定是一个全方位严格的贸易协定,在服务贸易以及服务标准方面都做出了多项规定。同时,RCEP中自贸协定相关词总数是大于CPTPP的,这是由于RCEP成员国规模大、覆盖人口多,既包含了高收入和中等收入国家,也包含了更多的低收入、欠发达国家。因此,RCEP更加强调遵循以WTO为核心的多边贸易体制规则,侧重发展中国家的利益。不难看出RCEP更注重“灵活性”和“高标准”的权衡,RCEP的制度多样化条款是亚洲区域贸易协定的重要特色 [5] 。而CPTPP考虑的更多地是“高标准”,CPTPP在劳动和环境规则、竞争政策、国有企业、知识产权监管、互联网规则和数字经济等方面均设定了高标准。对于发展中国家而言,这样的“高标准”无疑为其发展带来众多掣肘和隐性壁垒。
4. 网络分析
4.1. 共现网络图分析
对RCEP与CPTPP的自贸协定文本进行关联分析的核心是通过文本分析输出的结果所创建的共现网络图及共现网络测度指标进行分析。将所输出的关键词共现的邻接矩阵导入到Gephi软件中,利用效果最佳的ForceAtlas2算法绘制出关键词共现网络图,在网络图中每一个节点表示一个关键词,图1展示了RCEP与CPTPP的自贸协定关键词共现网络图。

Figure 1. Network diagram of text-word co-occurrence between RCEP and CPTPP FTAs (RCEP on the left, CPTPP on the right)
图1. RCEP与CPTPP自贸协定文本词共现网络图(左图为RCEP,右图为CPTPP)
图中可以看到CPTPP的关键词共现网络的外围节点相较于RCEP的关键词共现网络更多,但外围节点的密集度更高。这说明虽然CPTPP中具有更多的中心性较弱的关键词节点,但这些中心性较弱的节点互相之间的关联性较高。可见,CPTPP自贸协定的文本结构以及稳定性相较于RCEP是更高的。
而从表1中也可以看到tourism (旅游业)一词仅出现在RCEP自贸协定中,但如图1(左)所示,该节点是严重远离网络图主体的。这也可以证明上述观点,虽然RCEP的自贸协定文本中存在CPTPP中未提及的关键词,但这类关键词通常在自贸协定中的重要性以及与其他关键词的关联性是较弱的。
4.2. 网络测度指标分析
由于关键词共现的邻接矩阵所创建的复杂网络图是无向图。这就导致对无向图中取距离是无关紧要的,而在有向图中会产生完全不同的结果。因为在无向图中,并没有出度和入度的区分,所以在无向图中利用接近中心性衡量节点到节点之间距离参考价值不高。这一点我们也可以在表中得到验证,可以看到接近中心性和度中心性排名前十的节点是相同的。因此节点的关键程度更多的是看一个节点连接其他节点的个数。表6和表7分别展示了两者的不同测度指标结果中排名前十的节点。

Table 6. Results of RCEP co-occurrence network measurement indicators
表6. RCEP共现网络测度指标结果

Table 7. CPTPP co-occurrence network measurement indicator results
表7. CPTPP共现网络测度指标结果
4.2.1. 度中心性
由于接近中心性和度中心性排名前十的节点相同,因此选取更具代表性的度中心性进行分析。将表6和表7的统计进行对比可以看到两者排名前三的节点是相同的,说明两者对于services (服务贸易)、investment (投资)和protection (贸易保护)的关注度及重视程度都很高。RCEP中排名第四和第五的节点分别是customs (海关)及origin (原产地),而CPTPP中两个词项排到了第七和第八。这是因为RCEP首次提出背对背原产地证明概念,即中间缔约方的出口商针对已由原出口方出具原产地证明的货物再次分批分期灵活出具的原产地证明,在所涉货物在其他缔约国通关时仍然享受协定税率。并且也允许在确定货物是否适用RCEP关税优惠时,将来自RCEP任何缔约方的原产成分都考虑在内,实行原产成分累积规则。而从3.3部分的词频中也能看出RCEP中词频排名第一的词项是RVC (区域价值成份),RCEP一个亮点在于为15个成员国之间制定了共同的原产地规则,RCEP的原产地规则有效的降低了跨国企业在亚洲供应链的生产成本,增强了其成员国产品在国际市场上的竞争。
CPTPP中排名第四和第五的词项分别是settlement (解决)及dispute (争端),而在RCEP中dispute (争端)排在了第六,而settlement (解决)并未出现在前十中。可以看出CPTPP对于贸易争端和解决的要求和提及次数更高,对争端解决机制的规定更为复杂详尽。这是由于CPTPP为成员国之间提供了更有效和更灵活的争端解决机制。CPTPP沿用了TPP的争端解决机制,即通过建立一个由专家组成的仲裁小组来审理争端案件,并根据协定规则做出裁决。CPTPP对TPP的争端解决机制进行了一些改进,如简化了仲裁程序、加快了仲裁进度、增加了仲裁透明度等。此外,CPTPP还为成员国提供了一些选择性或例外性的条款,以应对不同情况下的争端。
4.2.2. 介数中心性
具有高介数中心性的节点通常是网络中的重要枢纽。从排名的结果来看,排名第一和第二的词项都是investment (投资)和services (服务贸易),说明两者的关键词共现网络中这两个节点控制信息流动和传播的能力都很强,在网络中起到了关键的中介作用,是沟通和链接其他关键词的重要枢纽。但值得注意的是CPTPP中排名第三settlement (解决)并未在RCEP介数中心性排名前十的词项中出现。这可能是因为考虑到各方分歧和谈判难度,RCEP投资章节对于投资争端解决机制未作出实质规定,提及了外商投诉的协调处理的独立机制,并明确不受RCEP项下任何争端解决程序的约束或影响。而RCEP项下的争端解决程序依据RCEP联合委员会通过的《专家组程序规则》设立专家组,未涉及将争端提交ICSID (《华盛顿公约》下的国际投资争议解决中心)等仲裁机构的替代方式。CPTPP的投资章节明确规定了投资者与ISDS。因此,在CPTPP中对于争端解决与介数中心性排名前二的投资进行了关联,但RCEP并未对投资争端解决机制作出实质规定。
而RCEP和CPTPP排名介数中心性排名第十的词项都并未在对方的前十词项中出现。RCEP中介数中心性排名第十的词项为sanitary (卫生),在RCEP中卫生与植物卫生措施主要与农业产品(动物、植物与其他形式的生物制品)的贸易有关。这一部分的内容也基本上沿用了世界贸易组织《实施卫生与植物卫生措施协定》,但在世贸组织《卫生与植物卫生措施协定》的基础上,RCEP还加强了风险分析、审核、认证、进口检查,以及紧急措施等规则的执行。而CPTPP中介数中心性排名第十的词项为transparency (透明度),这是由于CPTPP强调透明度原则。CPTPP规定在政府采购、金融和财政补贴等多个领域提高透明度,以保证更加公平的市场准入和竞争环境。
5. 结论
本研究中主要进行了以下相关工作:第一,将复杂网络研究方法与文本分析相结合,通过可视化的方法构建关键词共现网络模型来分析RCEP与CPTPP贸易规则关联性。第二,本研究将RCEP与CPTPP自贸协定文本的整体进行拆分并加以分析,从细节层面把握两者之间的关联性,得出以下结论。
第一,CPTPP相较于RCEP所涉及的范围更加全面且严格,但RCEP对于附属章节的设置更为详尽。第二,RCEP与CPTPP法律约束力相差不大,都属于高法律约束力自贸协定。这说明RCEP和CPTPP对于各个缔约国直接的约束是十分标准且规范的,并且强调条款的承诺力度。第三,CPTPP文本结构以及完整性和稳定性高于RCEP。虽然CPTPP中具有较多的中心性较弱的关键词节点,但这些中心性较弱的节点互相之间的关联性还是较高的。因此,CPTPP自贸协定的文本结构以及完整性和稳定性相较于RCEP是更高的。第四,RCEP与CPTPP在自贸协定文本中一体化议题侧重点及标准差别明显。
基金项目
国家自然科学基金资助项目:产业互联“智造”供需网的结构、演化及其动力学研究,项目编号(71871144);
上海高校智库内涵建设计划(战略研究):上海加强新动能培育和关键核心技术突破研究,项目编号(5220303001)。