图书介绍

Web数据仓库构建指南PDF|Epub|txt|kindle电子书版本网盘下载

Web数据仓库构建指南
  • Ralph Kimball,Richard Merz著;张丽萍等译 著
  • 出版社: 北京:清华大学出版社
  • ISBN:7302105022
  • 出版时间:2005
  • 标注页数:248页
  • 文件大小:28MB
  • 文件页数:262页
  • 主题词:计算机网络-数据库

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

Web数据仓库构建指南PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

引言1

第1部分 将Web引入数据仓库14

第1章 为什么要把Web引入数据仓库14

1.1 为什么说点击流不只是另一种数据资源15

1.2 行为分析16

1.3 隐私保障18

1.4 Web数据仓库的结构19

1.4.1 用户和ISP20

1.4.2 公共Web服务器和商业事务20

1.4.3 热响应缓存22

1.4.4 Web数据仓库系统24

1.5 小结25

第2章 跟踪网站用户的操作26

2.1 用户操作的主要类别29

2.2 购买产品的步骤29

2.2.3 搜索关于可替换产品的信息30

2.2.1 察觉需要30

2.2.2 试着找到所需商品30

2.2.4 选择31

2.2.5 相关商品销售和升级商品销售31

2.2.6 结账31

2.2.7 订单之后的处理过程33

2.3 购买软件或内容的步骤34

2.4 跟踪的要素34

2.4.1 用户来源35

2.4.2 会话识别35

2.4.3 用户识别37

2.5 行为分析40

2.5.1 入口点40

2.5.2 驻留时间40

2.5.5 出口点41

2.5.3 查询41

2.5.4 站点导航41

2.6 关联各种操作43

2.7 个性化的要求43

2.7.1 重访识别44

2.7.2 用户界面和内容的个性化44

2.7.3 相关销售和刺激性销售44

2.7.4 有效协作过滤44

2.7.5 日程表和有关生活方式的事件45

2.7.6 本地化46

2.8 小结46

第3章 利用点击流来进行决策47

3.1 关于辨认客户的决策48

3.1.1 通过识别客户来定制营销活动48

3.1.2 通过对客户进行集群分析来锁定营销活动的目标49

3.1.3 决定是否鼓励或者支持引荐相关链接51

3.1.4 判定客户是否将要离开52

3.2 关于通信的决策52

3.2.1 判定一个特定的Web广告是否有效52

3.2.2 判定客户问候是否有效53

3.2.3 判定促销是否有利可图54

3.2.4 对客户的生活变化做出响应55

3.2.5 提高网站的有效性56

3.2.6 培育社区感觉57

3.3 关于网络业务的基本决策57

3.3.1 决定通过网络提供哪些产品和服务57

3.3.2 提供对操作的实时状态跟踪58

3.3.3 判断我们的Web业务是否有利可图59

3.4 小结61

4.1 Web客户端/服务器互动——概要指南62

第4章 把点击流理解为数据源62

4.1.1 基本的客户端/服务器互动63

4.1.2 广告64

4.1.3 引用站点64

4.1.4 特征文件65

4.1.5 复合站点65

4.2 代理服务器和浏览器缓冲65

4.3 Web服务器日志67

4.3.1 主机68

4.3.2 识别70

4.3.3 审核70

4.3.4 时间70

4.3.5 请求70

4.3.6 状态71

4.3.9 用户代理72

4.3.7 字节数72

4.3.8 访问者72

4.3.10 文件名73

4.3.11 服务时间73

4.3.12 IP地址73

4.3.13 服务器端口73

4.3.14 进程ID73

4.3.15 URL73

4.4 Cookie74

4.4.1 Cookie内容75

4.4.2 Cookie手册——检查自己的cookie文件76

4.5 统一系统标识符77

4.6 查询字符串78

4.7 小结79

5.1 单块集成电路与分布式Web服务器的比较80

第5章 支持数据仓库的网站设计80

5.2 使你的服务器同步81

5.3 页面内容标签84

5.3.1 用于静态HTML的内容索引85

5.3.2 用于动态HTML的内容索引85

5.3.3 一个简单的内容索引应用程序86

5.4 一致的Cookie87

5.5 空日志记录服务器88

5.6 个人数据仓库90

5.7 建立信任90

5.8 小结92

第6章 创建点击流数据集市93

6.1 多维建模快速浏览93

6.2 点击流维99

6.2.1 日历日期维100

6.2.2 一日时间维102

6.2.3 客户维103

6.2.4 页面维106

6.2.5 事件维107

6.2.6 会话维108

6.2.7 引荐维108

6.2.8 产品(或服务)维109

6.2.9 因果关系维111

6.2.10 商业实体维111

6.2.11 点击流追踪关键字113

6.3 点击流数据集市113

6.3.1 用于分析完整会话的点击流事实表114

6.3.2 用于分析个体页面使用情况的点击流事实表117

6.3.3 聚集点击流事实表119

6.4 小结120

7.1 销售交易数据集市122

第7章 装配点击流价值链122

7.2 客户通信数据集市123

7.3 网络收益率数据集市124

7.4 针对网络零售商的供应链127

7.5 保险业中的保险单和索赔链129

7.6 销售流水线链130

7.7 卫生保健价值环132

7.8 小结133

第8章 实现点击流后处理机135

8.1 后处理机体系结构136

8.1.1 页面事件提取器137

8.1.2 内容解析器138

8.1.3 会话识别器138

8.1.4 计算驻留时间139

8.1.5 主机和引用站点解析器140

8.2 小结142

第2部分 把数据仓库引入Web143

第9章 为什么要把数据仓库引入Web143

9.1 Web拉动数据仓库144

9.2 Web推动数据仓库145

9.2.1 紧化用户界面反馈回路145

9.2.2 查询与更新的整合146

9.2.3 速度是不可商量的146

9.2.4 Sun从不设置Web数据仓库147

9.2.5 多媒体合并到通信中148

9.2.6 Web是大规模定制的149

9.2.7 网络仓库是深度分布式的149

9.2.8 我们必须面对安全及其隐私问题150

9.3 小结151

10.1 两次革命之间的差异152

第10章 设计用户体验152

10.2 第二代用户界面指导方针153

10.2.1 确保准瞬态性能154

10.2.2 满足用户要求160

10.2.3 让每个页面都成为愉快的体验165

10.2.4 简单化过程168

10.2.5 安定用户170

10.2.6 提供分解问题的手段171

10.2.7 建立信任173

10.2.8 提供通信钩子(Communication Hook)175

10.2.9 支持国际化透明175

10.3 小结176

第11章 通过网库驱动的数据挖掘177

11.1 数据挖掘的起源177

11.2 数据挖掘的行为178

11.3 数据挖掘的准备工作179

11.3.1 一般的网库数据转换180

11.3.2 适用于所有形式的数据挖掘的数据转换181

11.3.3 依赖于数据挖掘工具的特定的数据转换182

11.4 将数据提交给数据挖掘工具184

11.5 OLAP、数据挖掘和网库187

11.6 小结188

第12章 创建国际Web数据仓库189

12.1 发展中的国际Web190

12.1.1 UNICODE190

12.1.2 并行的超文本和机器翻译192

12.1.3 多语言搜索193

12.1.4 时区转换服务193

12.1.5 节日查找服务195

12.2 国际网库技术195

12.2.1 在多个时区和时间格式之间实现同步195

12.2.2 支持多国日历和日期格式196

12.2.3 集中多种货币形式的收入197

12.2.4 处理国际名称和地址199

12.2.5 支持不同的数字格式204

12.2.6 支持国际电话号码204

12.2.7 处理跨国查询、报表和对照序列204

12.2.8 本地化在Web数据仓库中的应用205

12.3 小结206

第13章 Web数据仓库安全207

13.1 推荐的安全技术208

13.1.1 提供双因素认证208

13.1.2 保护连接210

13.1.3 将通过认证的用户与角色联系在一起212

13.1.4 通过角色访问所有的网库对象213

13.2 管理安全过程,而不是解决方案214

13.3 小结215

第14章 网库的缩放216

14.1 网库不是Web服务器216

14.2 点击流活动突变217

14.2.1 上网人数增长218

14.2.2 越来越多的点击率219

14.2.3 用户级自动搜索219

14.2.4 更深的经济渗透220

14.2.5 一夜成名220

14.2.6 IP成为一种通用传输协议220

14.2.7 XML——通用传输221

14.3 对数据仓库服务需求的剧变221

14.4 软硬件的严重瓶颈221

14.4.1 避免单一瓶颈222

14.4.4 操作系统224

14.4.3 物理上的考虑:托管224

14.4.2 避免进程重复224

14.4.5 编程语言225

14.4.6 数据库225

14.4.7 查询和报告软件226

14.4.8 平衡电子邮件和链接的使用226

14.4.9 硬件特性227

14.5 粒度权衡227

14.6 小结228

第15章 管理网库项目229

15.1 定义项目229

15.2 确定角色230

15.2.1 全体决策人员:主管与监督人232

15.2.2 教练:项目经理和领导232

15.2.3 常规阵容:核心项目团队233

15.3 搜集业务需求和审计数据236

15.4 计划并管理实现237

15.5 启动系统238

15.6 回过头来再做一遍239

15.7 小结239

第16章 网库的未来240

16.1 CRM将继续推动Web数据仓库240

16.2 更好地描述行为241

16.3 我们最终将需要数据挖掘242

16.4 ISP拥有一座金矿243

16.5 寻求更好的搜索引擎244

16.6 数据能否战胜存储和速度245

16.7 数据库的完全转置246

16.8 网站应用程序日志246

16.9 每件东西都是一个模块247

16.10 小结248

热门推荐