图书介绍

信息检索技术导论PDF|Epub|txt|kindle电子书版本网盘下载

信息检索技术导论
  • 邰晓英,北研二编著 著
  • 出版社: 北京:科学出版社
  • ISBN:7030178440
  • 出版时间:2006
  • 标注页数:213页
  • 文件大小:12MB
  • 文件页数:224页
  • 主题词:情报检索-教材

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

信息检索技术导论PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 概论1

1.1 信息检索的概念1

1.2 信息检索与数据库检索2

1.3 信息检索模型3

1.3.1 内容型检索模型3

1.3.2 全文检索模型4

1.4 多媒体信息检索6

1.4.1 基于内容的检索特点6

1.4.2 多媒体特征7

1.4.3 多媒体内容描述标准MPEG-77

1.4.4 多媒体信息检索8

1.5 信息检索技术应用举例9

1.5.1 Web信息检索工具9

1.5.2 市场营销工具9

1.5.3 数字图书馆10

1.6 信息检索相关技术11

1.6.1 信息过滤11

1.6.2 文本自动分类12

1.6.3 交叉语言信息检索13

1.6.4 信息抽取13

1.7 信息检索的发展14

1.8 本书内容导读15

习题16

第2章 信息检索系统性能评价17

2.1 信息检索系统的有效性17

2.2 性能评价指标18

2.2.1 查全率和查准率18

2.2.2 查全率-查准率曲线与平均查准率19

2.2.3 R查准率20

2.2.4 F调和均值21

2.2.5 E均值21

2.2.6 Ranking指标21

2.3 Web检索系统性能评价22

2.4 信息检索领域的相关组织和会议23

习题25

第3章 索引项提取与加权26

3.1 索引项提取26

3.1.1 索引项26

3.1.2 索引单位26

3.1.3 停用词的去除27

3.1.4 词干提取29

3.2 索引项加权30

3.2.1 局部权重30

3.2.2 全局权重31

3.2.3 文本规范化33

3.3 单词分布模型34

3.3.1 二项分布与泊松分布35

3.3.2 RIDF36

3.4 基于KeyGraph的索引项提取37

3.4.1 基础概念的构成38

3.4.2 意图的提取39

习题41

4.1 线性代数基础42

4.1.1 向量42

第4章 基于向量空间模型的检索42

4.1.2 矩阵44

4.1.3 向量空间46

4.2 基于向量空间模型的检索48

4.3 文本检索中的相关反馈50

4.4 潜在语义索引53

4.4.1 主成分分析53

4.4.2 奇异值分解55

4.4.3 基于潜在语义索引的检索57

4.5 高维稀疏矩阵60

4.5.1 高维稀疏矩阵的压缩60

4.5.2 高维稀疏矩阵的特征值问题61

习题64

第5章 全文检索——字符串匹配技术65

5.1 字符串匹配问题概述65

5.2 简单字符串匹配算法66

5.2.1 SimpleSearch的字符串匹配过程66

5.2.2 SimpleSearch算法67

5.2.3 算法分析67

5.3 Knuth-Morris-Pratt算法68

5.3.1 KMP字符串匹配过程68

5.3.2 KMP算法69

5.3.3 next函数计算70

5.3.4 next函数71

5.3.5 KMP算法效率72

5.4 Boyer-Moore算法73

5.4.1 BM算法字符串匹配过程73

5.4.2 BM算法74

5.4.3 skip函数75

5.4.4 BM算法效率76

5.5 Aho-Corasick算法76

5.5.1 AC机77

5.5.2 AC字符串匹配过程78

5.5.4 AC算法效率79

5.5.3 AC算法79

5.5.5 AC机构成方法80

5.6 AC机的动态构成86

5.6.1 关键字的增加87

5.6.2 增加关键字的算法91

5.6.3 关键字的删除94

5.6.4 关键字删除算法96

习题98

6.1 签名文件99

6.1.1 签名文件的构成方法99

第6章 全文检索——索引技术99

6.1.2 签名文件检索102

6.1.3 多查询词检索104

6.1.4 分块管理的签名文件108

6.1.5 签名文件评价111

6.2 倒排文件112

6.2.1 倒排文件的构成113

6.2.2 倒排文件检索115

6.2.3 采用N元组索引的倒排文件118

6.2.4 文本号向量的压缩方法120

6.2.5 倒排文件评价122

6.3.1 Patricia Trie124

6.3 采用Patricia Trie的全文检索124

6.3.2 Patricia Trie检索方法127

6.3.3 Patricia Trie的长处与不足128

6.4 Patricia Trie的压缩129

6.4.1 PAT数组129

6.4.2 PaCB树压缩方法130

6.4.3 PaCB树检索方法131

6.4.4 PaCB树的效率评价134

习题135

7.1.1 图像检索方式136

7.1 图像检索技术概述136

第7章 图像检索技术136

7.1.2 图像检索系统概念结构137

7.1.3 图像的多级描述模型140

7.1.4 典型图像检索系统141

7.2 图像特征抽取142

7.2.1 颜色空间143

7.2.2 颜色特征147

7.2.3 纹理特征149

7.2.4 形状特征155

7.2.5 空间关系特征158

7.3 相似性度量160

7.4 图像检索中的相关反馈技术163

7.4.1 图像多级特征的相关反馈164

7.4.2 图像特征规范化165

7.4.3 特征权重的调整167

7.5 综合特征检索169

7.5.1 不同特征的特点169

7.5.2 特征的综合使用170

7.6 图像检索示例170

7.7 图像检索技术发展趋势177

7.7.1 数据模型177

7.7.3 压缩域图像检索技术178

7.7.2 底层特征检索技术178

7.7.4 高维索引技术179

7.7.5 语义图像检索技术180

7.7.6 用户查询接口181

7.7.7 相关反馈技术181

习题183

第8章 Web信息检索184

8.1 Web信息特点及组织形式184

8.1.1 Web信息特点184

8.1.2 Web的信息组织185

8.1.3 Web信息检索方式187

8.2 Web信息检索系统分类188

8.2.1 搜索引擎与目录索引189

8.2.2 元搜索引擎190

8.2.3 信息检索代理191

8.3 搜索引擎192

8.3.1 工作原理和系统结构192

8.3.2 搜索引擎的分布检索193

8.3.3 搜索引擎组成194

8.3.4 搜索引擎工作过程197

8.4 Web信息检索的关键技术198

8.4.1 文档搜集198

8.4.2 文档预处理200

8.4.3 索引数据库的建立201

8.4.4 相似度计算与排序方法204

8.5 Web信息检索系统技术发展趋势208

8.5.1 提高检索结果的有效性208

8.5.2 提供个性化服务209

8.5.3 提供更完善的检索功能210

8.5.4 企业搜索引擎的应用210

8.5.5 提高系统规模和性能211

习题211

主要参考文献212

热门推荐