查看大图
See English details
作者:卢达威 著
本书以小句复合体理论的话头话身结构为汉语篇章结构的形式模型,挖掘认知特征,建立话头话身结构的认知模型,研究话头话身结构的成分共享机制,并构建话头话身结构的计算模型,探索话头成分共享的自动识别问题。
本书遵循从形式模型到认知模型,再到计算模型的研究思路,贯彻了将语言研究、认知研究与语言工程相结合的研究理念,并利用大规模语料检验了这些语言知识和认知规律;验证了从认知视角进行篇章语法结构研究的可行性,发掘了自然语言文本作为认知科学研究的数据资源的潜力。在以大数据、大模型为主流的今天,具有可操作性和全覆盖性的形式化的语言知识在语言计算中依旧发挥着重要作用。
卢达威(著),博士,中国人民大学文学院讲师、硕士生导师、吴玉章青年学者,中国中文信息学会青年工作委员会委员。主要从事汉语小句复合体、中文信息处理、语言资源建设等方面的研究。曾在《中国社会科学》《中文信息学报》《语言教学与研究》等期刊发表论文多篇,主持国家社科基金项目、教育部人文社科基金项目、国家语委重点项目、中国博士后科学基金项目等省部级以上项目多项。
宋柔作序,基于小句复合体理论的认知和计算研究
《汉语小句复合体话头话身结构的认知和计算研究》一书在作者的博士论文基础上修订而成。汉语篇章结构分析是自然语言处理的一大难点,本书基于宋柔提出的小句复合体理论,从认知出发,落实于计算,针对小句复合体的本质单位——话头话身结构,结合其形式特征,设计了话头话身结构认知机,实现了对这一包含多种成分共享模式的结构的分析。本书是对形式、认知和计算相结合的研究思路的有益实践,也是对语言知识和语言模型相结合的研究方法的有益探索。
推荐对结合认知语言学和计算语言学进行自然语言处理感兴趣的研究生阅读