图书介绍
固定短语自动提取研究PDF|Epub|txt|kindle电子书版本网盘下载
![固定短语自动提取研究](https://www.shukui.net/cover/52/30023951.jpg)
- 刘荣著 著
- 出版社: 北京:科学出版社
- ISBN:7030473837
- 出版时间:2016
- 标注页数:163页
- 文件大小:63MB
- 文件页数:181页
- 主题词:
PDF下载
下载说明
固定短语自动提取研究PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第一章 绪论1
1.1 问题的提出1
1.2 固定短语的界定6
1.3 研究目标6
1.4 研究内容和研究重点6
1.5 研究意义9
1.5.1 对中文信息处理领域的意义9
1.5.2 对语言资源监测领域的意义9
1.5.3 对汉语语言学领域的意义10
1.5.4 对词典编纂领域的意义11
1.5.5 对对外汉语教学领域的意义12
1.5.6 对舆情分析领域的意义12
1.6 创新点13
参考文献14
第二章 短语提取相关研究综述15
2.1 国内语言学界对固定短语的研究15
2.1.1 国内语言学界对固定短语的定义15
2.1.2 国内语言学界对固定短语的研究方法和现状16
2.2 信息处理界对短语的研究综述16
2.2.1 国内外短语识别基本方法17
2.2.2 术语提取基本方法和技术18
2.2.3 国内对于短语研究所做的重要的工作19
2.2.4 搭配的度量指标——搭配强度、搭配离散度、搭配尖峰22
2.3 国外短语提取的最新进展24
2.3.1 多字词表达的定义24
2.3.2 多字词表达的复杂特性25
2.3.3 多字词表达的提取27
2.3.4 多字词表达研究的代表性工作28
2.4 本章小结29
参考文献30
第三章 固定短语提取的基础平台34
3.1 基础数据资源——DCC语料库34
3.1.1 语料库和语料库语言学34
3.1.2 动态知识更新理论与动态流通语料库36
3.1.3 基于动态流通语料库的主要研究37
3.2 工具简介38
3.3 基础数据资源加工——语料的准备和预处理40
3.3.1 语料的选择标准40
3.3.2 语料库的存储模式41
3.3.3 语料库的语料量42
3.3.4 原始语料格式转换42
3.3.5 文本分类42
3.3.6 文本分词43
3.4 本章小结44
参考文献44
第四章 利用特定领域的高频种子词提取固定短语候选串45
4.1 教育领域高频种子词提取45
4.2 面向特定领域的固定短语提取长度的确定50
4.2.1 已有的研究成果51
4.2.2 实验步骤和实验数据51
4.2.3 实验结果及分析51
4.2.4 结论55
4.3 固定短语候选串提取55
4.4 本章小结56
参考文献56
第五章 固定短语候选串的定量考察与分析58
5.1 结合紧密与搭配的关系58
5.2 搭配研究综述58
5.2.1 国外搭配研究综述58
5.2.2 国内语言学界对搭配的研究60
5.2.3 国内外语言界对搭配的研究63
5.2.4 国内计算语言学界对搭配的研究64
5.3 对结合紧密的搭配从统计量角度的分析65
5.3.1 互信息和熵简介65
5.3.2 互信息和熵的计算68
5.3.3 互信息和熵的计算结果68
5.4 按照频次、互信息结合的方法提取两个切分单位固定短语候选串69
5.4.1 实验方法69
5.4.2 实验结果及分析69
5.4.3 对“v+n”的考察73
5.5 利用频次、互信息、熵值结合的方法提取固定短语候选串74
5.5.1 实验方法74
5.5.2 实验结果74
5.5.3 数据分析75
5.6 本章小结76
参考文献76
第六章 固定短语候选串的句法角度考察与分析78
6.1 固定短语候选串从定量到定性分析78
6.2 句法角度考察79
6.2.1 类联接简介81
6.2.2 类联接的定义83
6.2.3 本文的类联接类型83
6.3 类联接模式对固定短语候选串的提取86
6.3.1 实验方法86
6.3.2 实验结果87
6.4 数据分析87
6.4.1 类联接“a+n”候选串分析87
6.4.2 类联接“n+n”候选串分析88
6.4.3 类联接“v+n”候选串分析91
6.4.4 类联接“n+v”候选串分析93
6.4.5 类联接“v+v”候选串分析95
6.5 本章小结98
参考文献98
第七章 固定短语候选串语义角度考察与分析99
7.1 搭配与语义的相互关系99
7.1.1 语义对搭配的制约99
7.1.2 搭配的语义基础100
7.1.3 搭配决定语义100
7.1.4 国内研究综述101
7.2 知网简介101
7.2.1 知网的结构102
7.2.2 知网对词的描述103
7.2.3 知网的信息结构规则103
7.3 基于知网的考察和过滤104
7.4 基于知网的考察实验105
7.4.1 实验方法105
7.4.2 实验数据105
7.4.3 实验分析过程106
7.5 本章小结124
参考文献125
第八章 固定短语候选串的历时考察126
8.1 历时中包含有共时和共时中包含有历时的相对时间观126
8.1.1 索绪尔的时间观126
8.1.2 历时中包含有共时和共时中包含有历时的相对时间观127
8.2 时点和时段的相对性128
8.3 历时考察相关研究工作130
8.4 历时考察工作131
8.4.1 语料数据131
8.4.2 历时考察对象131
8.4.3 历时考察方法141
8.4.4 数据分析142
8.5 本章小结144
参考文献144
第九章 结语145
9.1 全文总结145
9.2 进一步的工作146
附录148
附表1 位序比法提取的教育领域高频词(按频次降序排序前一百)148
附表2 左熵排序(按左熵降序排序前一百)151
附表3 右熵排序(按右熵降序排序前一百)154
附表4 “v+n”互信息排序前100(按互信息降序排序前一百)158
后记162