图书介绍

智能信息处理 汉语语料库加工技术及应用PDF|Epub|txt|kindle电子书版本网盘下载

智能信息处理 汉语语料库加工技术及应用
  • 郑家恒等著 著
  • 出版社: 北京:科学出版社
  • ISBN:9787030291356
  • 出版时间:2010
  • 标注页数:318页
  • 文件大小:16MB
  • 文件页数:330页
  • 主题词:人工智能-信息处理

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

智能信息处理 汉语语料库加工技术及应用PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 绪论1

1.1 语料库的定义和作用1

1.1.1 什么是语料库1

1.1.2 语料库的作用2

1.2 语料库的建立3

1.2.1 什么是语料库标注4

1.2.2 语料库标注的原则5

1.2.3 建立语料库需要考虑的几个问题6

1.2.4 语料库标注和建立的方法10

1.2.5 语料库的质量检验15

1.3 本书的编排16

参考文献17

第2章 自动分词20

2.1 自动分词概述20

2.1.1 自动分词的意义20

2.1.2 自动分词的主要难点21

2.1.3 自动分词方法简介23

2.1.4 自动分词评测26

2.2 分词规范27

2.2.1 制定分词规范的目的和意义27

2.2.2 几种典型的分词规范介绍28

2.3 歧义字段的切分技术31

2.3.1 歧义字段现象分析31

2.3.2 基于统计的歧义字段排歧33

2.4 未登录词识别40

2.4.1 专有名词识别41

2.4.2 新词语识别66

2.5 缩略语识别73

2.5.1 缩略语特征分析75

2.5.2 缩略语资源库的建立78

2.5.3 缩略语识别模型79

2.5.4 缩略语的还原82

2.6 分词一致性检验86

2.6.1 分词不一致性现象分析87

2.6.2 基于规则的分词一致性检验方法90

2.6.3 基于统计的分词一致性检验方法95

2.6.4 分词一致性检验系统99

参考文献102

第3章 词性标注105

3.1 词性标注概述106

3.1.1 词性标注的意义106

3.1.2 词性标注的难点107

3.1.3 词性标注方法简介109

3.1.4 常用语料库120

3.2 词性标注规范122

3.2.1 制定词性标注规范的目的和意义122

3.2.2 几种典型的词性标注规范介绍123

3.3 兼类词的标注130

3.3.1 什么是兼类词130

3.3.2 典型的兼类词标注方法133

3.4 词性标注一致性检验139

3.4.1 问题描述和分析139

3.4.2 一致性检验模型的建立140

3.4.3 实验结果和分析145

3.4.4 方法评价145

3.5 词性标注自动校对146

3.5.1 基于分类的词性标注自动校对146

3.5.2 基于决策表的词性标注自动校对148

参考文献152

第4章 句法分析155

4.1 完全句法分析155

4.1.1 完全句法分析概述155

4.1.2 形式语法体系156

4.1.3 树库资源的建设162

4.1.4 汉语句法分析的特点167

4.1.5 句法分析方法169

4.1.6 相关会议及评测178

4.1.7 句法分析模型的评价方法178

4.2 浅层句法分析180

4.2.1 浅层句法分析概述180

4.2.2 组块库的获取181

4.2.3 组块的类型及其标注规范185

4.2.4 组块分析方法191

4.2.5 相关会议及评测196

4.2.6 评价参数197

4.3 句法树库的一致性检验197

4.3.1 不一致现象分析198

4.3.2 不一致的发现和消解201

参考文献203

第5章 语义标注语料库206

5.1 语义标注范围206

5.1.1 词义标注206

5.1.2 句义标注207

5.1.3 篇章级的语义标注209

5.2 语义标注语料库的建立方法209

5.2.1 传统的以人工标注为主的方法209

5.2.2 自动构建语义标注语料库210

5.3 主要的语义标注语料库212

5.3.1 词义标注语料库212

5.3.2 句义标注语料库215

5.3.3 语篇关系标注语料库216

5.3.4 时间关系标注语料库218

5.3.5 信息抽取方面的语料库223

5.3.6 生物医药领域中的语义标注语料库224

参考文献225

第6章 语料库评测229

6.1 语料库评测的意义229

6.2 语料库分词质量评价230

6.2.1 评价样本的抽样230

6.2.2 抽样样本的聚类及评价231

6.2.3 实验及分析239

6.3 语料库可用性评价242

6.3.1 可用性评价体系243

6.3.2 可用性评价计算247

6.3.3 评价结果分析250

参考文献251

第7章 基于语料库的应用研究253

7.1 网页信息处理253

7.1.1 重复网页分析253

7.1.2 基于语义的网页去重255

7.1.3 基于网页文本结构的网页去重260

7.2 特殊领域的信息抽取265

7.2.1 基于HMM的农业信息抽取266

7.2.2 基于NLP的土壤污染数据抽取270

7.2.3 基于Bootstrapping的交通工具名识别275

7.3 基于大规模语料库的汉语韵律边界研究279

7.3.1 基于统计语言模型建立二叉树结构282

7.3.2 基于树结构的汉语韵律边界预测292

7.4 基于大规模语料库的欺骗行为检测296

7.4.1 欺骗性语料库的建设297

7.4.2 欺骗检测的特征线索300

7.4.3 文本特征抽取306

7.4.4 欺骗行为检测方法312

7.4.5 实验结果和分析314

参考文献316

热门推荐