基于HNC的现代汉语句子基本语义类型例句库建设
Building a Token Corpus of Canonical Semantic Sentence Types for Modern Chinese Based on HNC Theory
摘要:
句子语义类型例句库是开展基于语义的句子研究所需要的基础资源。我们以HNC (Hierarchical Network of Concepts,概念层次网络)理论为指导建立句子语义类型例句库,该理论建立了完整的句子语义类型体系,为基于语义的句子研究提供了良好的理论框架。我们已经建立了一个现代汉语句子基本语义类型的例句库,为每个类型配备了典型而真实的例句,并且采用XML (Extensible Markup Language,可扩展标记语言)技术标注了每个例句的语义结构,还提供了例句查询功能。我们将以这个例句库为基础,逐步扩展,为基于语义的句子研究不断积累资源。
Abstract: A token corpus of semantic sentence types provides elementary resource for the study of sentences from semantic perspectives. We have built such a corpus using the theory of HNC (Hierarchical Network of Concepts). As HNC contains a complete system of sentence semantic types, it provides a good theoretical framework for meaning-based sentence analysis. The corpus we built contains token sentences taken from real-life whose semantic structures are labeled using XML techniques (Extensible Markup Language). The search function for token sentence is also provided. We will use this token corpus as a basis for further developments so as to accumulate resources for meaning-based sentence analysis.
参考文献
[1]
|
黄曾阳 (1997) HNC理论概要. 中文信息学报, 4, 11-20.
|
[2]
|
黄曾阳 (1998) HNC(概念层次网络)理论——计算机理解语言研究的新思路. 清华大学出版社, 北京.
|
[3]
|
黄曾阳 (2004) 语言概念空间的基本定理和数学物理表示式.海洋出版社, 北京.
|
[4]
|
黄曾阳 (2010) HNC理论全书. 中国科学院声学研究所内部资料.
|
[5]
|
蒋严, 潘海华 (1998) 汉语语句的类型表达. In: 黄昌宁, Ed., 1998中文信息处理国际会议论文集, 清华大学出版社, 北京, 323-329.
|
[6]
|
鲁川 (2001) 汉语语法的意合网络. 商务印书馆, 北京.
|
[7]
|
苗传江 (2005) HNC(概念层次网络)理论导论. 清华大学出版社, 北京.
|
[8]
|
苗传江 (2006) 基于HNC句类体系的句子语义研究. 语言文字应用, 1, 126-133.
|
[9]
|
苗传江 (2007) 现代汉语句子的语义类型. 语文建设, 11, 56- 58.
|
[10]
|
苗传江, 刘智颖 (2010) 基于HNC的现代汉语词语知识库建设. 云南师范大学学报(哲学社会科学版), 4, 15-18.
|
[11]
|
苗传江, 刘智颖 (2003) 现代汉语语料的句子级语义标注. In: 孙茂松, 陈群秀, Eds., 语言计算与基于内容的文本处理, 清华大学出版社, 北京, 325-331.
|
[12]
|
徐烈炯 (1995) 语义学(修订本). 语文出版社, 北京.
|
[13]
|
朱晓亚 (2001) 现代汉语句模研究. 北京大学出版社, 北京.
|