基于NLP的企业供应关系自动抽取研究
Research on Automatic Extraction of Enterprise Supply Relationship Based on NLP
DOI: 10.12677/CSA.2018.812202, PDF,  被引量    国家自然科学基金支持
作者: 杨传龙*, 王金龙:青岛理工大学信息与控制工程学院,山东 青岛
关键词: 供应关系实体关系识别信息抽取Supply Relationship Entity-Relationship Recognition Information Extraction
摘要: 供应链对企业竞争力具有巨大意义,而供应链中最重要的部分就是企业供应关系,现有的公司实体关系抽取方法没有考虑关系中公司实体的角色,不适用于企业供应关系抽取。基于此,本文采用人工构建和自动构建相结合的方式构建了关系指示词库,利用关系指示词库判断文本的主题,并使用最近句法依赖动词对实体之间的语义关系进行判断。最后在上市公司年报文本上进行了测试,取得了不错的效果。
Abstract: A good supply chain is indispensable for enterprises to improve competitiveness. For a supply chain, the most important part is the supply relationship between enterprises. Existing methods of extracting corporate entity relationship did not consider the role of corporate entity in the supply relationship. Therefore, these methods are not suitable for extracting enterprise supply relationship. To solve this problem, a library of relation word is constructed by combining manual construction with automatic construction. The relation word is used to judge the theme of the text, and the nearest syntactic dependent verbs are used to judge the semantic relationship between entities. Experiments on the annual report of listed companies have met the expected requirement.
文章引用:杨传龙, 王金龙. 基于NLP的企业供应关系自动抽取研究[J]. 计算机科学与应用, 2018, 8(12): 1823-1832. https://doi.org/10.12677/CSA.2018.812202

参考文献

[1] 孙晨, 付英男, 程文亮, 等. 面向企业知识图谱构建的中文实体关系抽取[J]. 华东师范大学学报(自然科学版), 2018(3): 55-66.
[2] 孟蕾. 基于网络数据的中文公司实体关系抽取研究[D]: [硕士学位论文]. 北京: 北京交通大学, 2018.
[3] 代江波, 毛建华, 刘学锋, 张鸿洋. 基于特征向量与SVO扩展的企业生态关系抽取[J]. 计算机技术与发展, 2018(10): 1-6.
[4] 车万翔, 刘挺, 李生. 实体关系自动抽取[J]. 中文信息学报, 2005, 19(2): 1-6.
[5] 程文亮. 中文企业知识图谱构建与分析[D]: [硕士学位论文]. 华东师范大学, 2016.
[6] 郭喜跃, 何婷婷, 胡小华, 等. 基于句法语义特征的中文实体关系抽取[J]. 中文信息学报, 2014, 28(6): 183-189.
[7] Guodong, Z., Jian, S., Jie, Z., et al. (2005) Exploring Various Knowledge in Relation Extraction. ACL 2005, Meeting of the Association for Computational Linguistics, University of Michigan, Michigan, 25-30 June 2005, 419--444. [Google Scholar] [CrossRef
[8] 朱艳辉, 李飞, 胡骏飞, 等. 基于三支决策的两阶段实体关系抽取研究[J]. 计算机工程与应用, 2018, 54(9): 145-150.
[9] 陈鹏, 郭剑毅, 余正涛, 严馨, 张志坤, 高盛祥. 融合领域知识短语树核函数的中文领域实体关系抽取[J]. 南京大学学报(自然科学), 2015, 51(1): 181-186.
[10] 秦兵, 刘安安, 刘挺. 无指导的中文开放式实体关系抽取[J]. 计算机研究与发展, 2015, 52(5): 1029-1035.
[11] 王树伟. 面向金融文本的实体识别与关系抽取研究[D]: [硕士学位论文]. 哈尔滨: 哈尔滨工业大学, 2014.
[12] 王月, 周刚, 南煜, 等. 基于关系指示词库的开放式实体关系抽取算法[J]. 信息工程大学学报, 2017, 18(2): 242-247, 252.
[13] 李颖, 郝晓燕, 王勇. 中文开放式多元实体关系抽取[J]. 计算机科学, 2017, 44(z1): 80-83.
[14] 刘安安. 开放式中文实体关系抽取研究[D]: [硕士学位论文]. 哈尔滨: 哈尔滨工业大学, 2013.
[15] 甘丽新, 万常选, 刘德喜, 等. 基于句法语义特征的中文实体关系抽取[J]. 计算机研究与发展, 2016, 53(2): 284-302.