图书介绍
数据仓库工具箱 维度建模权威指南 第3版【2025|PDF下载-Epub版本|mobi电子书|kindle百度云盘下载】

- (美)金博尔,(美)罗斯著 著
- 出版社: 北京:清华大学出版社
- ISBN:9787302385530
- 出版时间:2015
- 标注页数:384页
- 文件大小:90MB
- 文件页数:406页
- 主题词:数据库系统
PDF下载
下载说明
数据仓库工具箱 维度建模权威指南 第3版PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 数据仓库、商业智能及维度建模初步1
1.1 数据获取与数据分析的区别1
1.2 数据仓库与商业智能的目标2
1.3 维度建模简介5
1.3.1 星型模式与OLAP多维数据库6
1.3.2 用于度量的事实表7
1.3.3 用于描述环境的维度表9
1.3.4 星型模式中维度与事实的连接11
1.4 Kimball的DW/BI架构14
1.4.1 操作型源系统14
1.4.2 获取-转换-加载(ETL)系统14
1.4.3 用于支持商业智能决策的展现区16
1.4.4 商业智能应用17
1.4.5 以餐厅为例描述Kimball架构17
1.5 其他DW/BI架构19
1.5.1 独立数据集市架构19
1.5.2 辐射状企业信息工厂Inmon架构20
1.5.3 混合辐射状架构与Kimball架构22
1.6 维度建模神话22
1.6.1 神话1:维度模型仅包含汇总数据23
1.6.2 神话2:维度模型是部门级而不是企业级的23
1.6.3 神话3:维度模型是不可扩展的23
1.6.4 神话4:维度模型仅用于预测23
1.6.5 神话5:维度模型不能被集成24
1.7 考虑使用维度模型的更多理由24
1.8 本章小结25
第2章 Kimball维度建模技术概述27
2.1 基本概念27
2.1.1 收集业务需求与数据实现27
2.1.2 协作维度建模研讨27
2.1.3 4步骤维度设计过程28
2.1.4 业务过程28
2.1.5 粒度28
2.1.6 描述环境的维度28
2.1.7 用于度量的事实29
2.1.8 星型模式与OLAP多维数据库29
2.1.9 方便地扩展到维度模型29
2.2 事实表技术基础29
2.2.1 事实表结构29
2.2.2 可加、半可加、不可加事实29
2.2.3 事实表中的空值30
2.2.4 一致性事实30
2.2.5 事务事实表30
2.2.6 周期快照事实表30
2.2.7 累积快照事实表30
2.2.8 无事实的事实表31
2.2.9 聚集事实表或OLAP多维数据库31
2.2.10 合并事实表31
2.3 维度表技术基础31
2.3.1 维度表结构31
2.3.2 维度代理键32
2.3.3 自然键、持久键和超自然键32
2.3.4 下钻32
2.3.5 退化维度32
2.3.6 非规范化扁平维度32
2.3.7 多层次维度32
2.3.8 文档属性的标识与指示器33
2.3.9 维度表中的空值属性33
2.3.10 日历日期维度33
2.3.11 扮演角色的维度33
2.3.12 杂项维度33
2.3.13 雪花维度33
2.3.14 支架维度34
2.4 使用一致性维度集成34
2.4.1 一致性维度34
2.4.2 缩减维度34
2.4.3 跨表钻取34
2.4.4 价值链34
2.4.5 企业数据仓库总线架构35
2.4.6 企业数据仓库总线矩阵35
2.4.7 总线矩阵实现细节35
2.4.8 机会/利益相关方矩阵35
2.5 处理缓慢变化维度属性35
2.5.1 类型0:原样保留35
2.5.2 类型1:重写35
2.5.3 类型2:增加新行36
2.5.4 类型3:增加新属性36
2.5.5 类型4:增加微型维度36
2.5.6 类型5:增加微型维度及类型1支架36
2.5.7 类型6:增加类型1属性到类型2维度36
2.5.8 类型7:双类型1和类型2维度36
2.6 处理维度层次关系37
2.6.1 固定深度位置的层次37
2.6.2 轻微参差不齐/可变深度层次37
2.6.3 具有层次桥接表的参差不齐/可变深度层次37
2.6.4 具有路径字符属性的可变深度层次37
2.7 高级事实表技术37
2.7.1 事实表代理键37
2.7.2 蜈蚣事实表38
2.7.3 属性或事实的数字值38
2.7.4 日志/持续时间事实38
2.7.5 头/行事实表38
2.7.6 分配的事实38
2.7.7 利用分配建立利润与损失事实表38
2.7.8 多种货币事实39
2.7.9 多种度量事实单位39
2.7.10 年-日事实39
2.7.11 多遍SQL以避免事实表间的连接39
2.7.12 针对事实表的时间跟踪39
2.7.13 迟到的事实40
2.8 高级维度技术40
2.8.1 维度表连接40
2.8.2 多值维度与桥接表40
2.8.3 随时间变化的多值桥接表40
2.8.4 标签的时间序列行为40
2.8.5 行为研究分组40
2.8.6 聚集事实作为维度属性41
2.8.7 动态值范围41
2.8.8 文本注释维度41
2.8.9 多时区41
2.8.10 度量类型维度41
2.8.11 步骤维度41
2.8.12 热交换维度42
2.8.13 抽象通用维度42
2.8.14 审计维度42
2.8.15 最后产生的维度42
2.9 特殊目的模式42
2.9.1 异构产品的超类与子类模式43
2.9.2 实时事实表43
2.9.3 错误事件模式43
第3章 零售业务45
3.1 维度模型设计的4步过程46
3.1.1 第1步:选择业务过程46
3.1.2 第2步:声明粒度46
3.1.3 第3步:确定维度47
3.1.4 第4步:确定事实47
3.2 零售业务案例研究47
3.2.1 第1步:选择业务过程49
3.2.2 第2步:声明粒度49
3.2.3 第3步:确定维度50
3.2.4 第4步:确定事实50
3.3 维度表设计细节53
3.3.1 日期维度53
3.3.2 产品维度56
3.3.3 商店维度59
3.3.4 促销维度60
3.3.5 其他零售业维度62
3.3.6 事务号码的退化维度63
3.4 实际的销售模式63
3.5 零售模式的扩展能力64
3.6 无事实的事实表65
3.7 维度与事实表键66
3.7.1 维度表代理键66
3.7.2 维度中自然和持久的超自然键68
3.7.3 退化维度的代理键68
3.7.4 日期维度的智能键68
3.7.5 事实表的代理键69
3.8 抵制规范化的冲动70
3.8.1 具有规范化维度的雪花模式70
3.8.2 支架表72
3.8.3 包含大量维度的蜈蚣事实表72
3.9 本章小结74
第4章 库存75
4.1 价值链简介75
4.2 库存模型76
4.2.1 库存周期快照76
4.2.2 库存事务79
4.2.3 库存累积快照80
4.3 事实表类型81
4.3.1 事务事实表81
4.3.2 周期快照事实表82
4.3.3 累积快照事实表82
4.3.4 辅助事实表类型83
4.4 价值链集成83
4.5 企业数据仓库总线架构84
4.5.1 理解总线架构84
4.5.2 企业数据仓库总线矩阵85
4.6 一致性维度89
4.6.1 多事实表钻取89
4.6.2 相同的一致性维度89
4.6.3 包含属性子集的缩减上卷一致性维度90
4.6.4 包含行子集的缩减一致性维度91
4.6.5 总线矩阵的缩减一致性维度91
4.6.6 有限一致性92
4.6.7 数据治理与管理的重要性92
4.6.8 一致性维度与敏捷开发94
4.7 一致性事实94
4.8 本章小结95
第5章 采购97
5.1 采购案例研究97
5.2 采购事务与总线矩阵98
5.2.1 单一事务事实表与多事务事实表98
5.2.2 辅助采购快照101
5.3 缓慢变化维度(SCD)基础101
5.3.1 类型0:保留原始值102
5.3.2 类型1:重写102
5.3.3 类型2:增加新行104
5.3.4 类型3:增加新属性106
5.3.5 类型4:增加微型维度108
5.4 混合缓慢变化维度技术110
5.4.1 类型5:微型维度与类型1支架表110
5.4.2 类型6:将类型1属性增加到类型2维度111
5.4.3 类型7:双重类型1与类型2维度112
5.5 缓慢变化维度总结113
5.6 本章小结114
第6章 订单管理115
6.1 订单管理总线矩阵116
6.2 订单事务116
6.2.1 事实表规范化117
6.2.2 维度角色扮演117
6.2.3 重新审视产品维度119
6.2.4 客户维度120
6.2.5 交易维度122
6.2.6 针对订单号的退化维度123
6.2.7 杂项维度124
6.2.8 应该避免的表头/明细模式125
6.2.9 多币种126
6.2.10 不同粒度的事务事实128
6.2.11 另外一种需要避免的表头/明细模式129
6.3 发票事务130
6.3.1 作为事实、维度或两者兼顾的服务级性能131
6.3.2 利润与损益事实131
6.3.3 审计维度133
6.4 用于订单整个流水线的累积快照134
6.4.1 延迟计算136
6.4.2 多种度量单位137
6.4.3 超越后视镜138
6.5 本章小结138
第7章 会计139
7.1 会计案例研究与总线矩阵139
7.2 总账数据141
7.2.1 总账周期快照141
7.2.2 会计科目表141
7.2.3 结账141
7.2.4 年度-日期事实143
7.2.5 再次讨论多币种问题143
7.2.6 总账日记账事务143
7.2.7 多种财务会计日历144
7.2.8 多级别层次下钻145
7.2.9 财务报表145
7.3 预算编制过程146
7.4 维度属性层次148
7.4.1 固定深度的位置层次148
7.4.2 具有轻微不整齐的可变深度层次149
7.4.3 不整齐可变深度层次149
7.4.4 不规则层次中的共享所有权152
7.4.5 随时间变化的不规则层次153
7.4.6 修改不规则层次153
7.4.7 其他不规则层次的建模方法154
7.4.8 应用于不规则层次的桥接表方法的优点156
7.5 合并事实表156
7.6 OLAP角色及分析方案包157
7.7 本章小结158
第8章 客户关系管理159
8.1 客户关系管理概述160
8.2 客户维度属性162
8.2.1 名字与地址的语法分析162
8.2.2 国际姓名和地址的考虑164
8.2.3 客户为中心的日期165
8.2.4 作为维度属性的聚集事实166
8.2.5 分段属性与记分166
8.2.6 包含类型2维度变化的计算169
8.2.7 低粒度属性集合的支架表169
8.2.8 客户层次的考虑170
8.3 应用于多值维度的桥接表171
8.3.1 稀疏属性的桥接表172
8.3.2 应用于客户多种联系方式的桥接表173
8.4 复杂的客户行为173
8.4.1 客户队列的行为研究分组173
8.4.2 连续行为的步骤维度175
8.4.3 时间范围事实表176
8.4.4 使用满意度指标标记事实表177
8.4.5 使用异常情景指标标记事实表178
8.5 客户数据集成方法178
8.5.1 建立单一客户维度的主数据管理179
8.5.2 多客户维度的局部一致性180
8.5.3 避免对应事实表的连接180
8.6 低延迟的实现检查181
8.7 本章小结182
第9章 人力资源管理183
9.1 雇员档案跟踪183
9.1.1 精确的有效和失效时间范围184
9.1.2 维度变化原因跟踪185
9.1.3 作为类型2属性或事实事件的档案变化185
9.2 雇员总数周期快照186
9.3 人力资源过程的总线矩阵187
9.4 分析解决方案软件包与数据模型188
9.5 递归式雇员层次189
9.5.1 针对嵌入式经理主键变化的跟踪190
9.5.2 上钻或下钻管理层次190
9.6 多值技能关键字属性191
9.6.1 技能关键字桥接表191
9.6.2 技能关键字文本字符串192
9.7 调查问卷数据193
9.8 本章小结194
第10章 金融服务195
10.1 银行案例研究与总线矩阵195
10.2 分类维度以避免出现维度太少的情况196
10.2.1 家庭维度199
10.2.2 多值维度与权重因子199
10.2.3 再谈微型维度200
10.2.4 在桥接表中增加微型维度202
10.2.5 动态值范围事实202
10.3 异构产品的超类和子类模式203
10.4 热可交换维度205
10.5 本章小结205
第11章 电信207
11.1 电信业案例研究与总线矩阵207
11.2 设计评审的一般性考虑209
11.2.1 业务需求与实际可用资源的权衡209
11.2.2 关注业务过程209
11.2.3 粒度210
11.2.4 统一的事实表粒度210
11.2.5 维度的粒度和层次210
11.2.6 日期维度211
11.2.7 退化维度211
11.2.8 代理键212
11.2.9 维度解码与描述符212
11.2.10 一致的承诺212
11.3 设计评审指导212
11.4 草案设计训练的讨论214
11.5 重新建模已存在的数据结构215
11.6 地理位置维度216
11.7 本章小结216
第12章 交通运输217
12.1 航空案例研究与总线矩阵217
12.1.1 多种事实表粒度218
12.1.2 连接区段形成旅程220
12.1.3 相关事实表221
12.2 扩展至其他行业221
12.2.1 货物托运人221
12.2.2 旅行服务222
12.3 相关维度合并222
12.3.1 服务类别223
12.3.2 始发地与目的地224
12.4 更多有关日期和时间的考虑225
12.4.1 用作支架表的特定国家日历225
12.4.2 多时区的日期和时间226
12.5 本地化概要226
12.6 本章小结227
第13章 教育229
13.1 大学案例研究与总线矩阵229
13.2 累积快照事实表231
13.2.1 申请流水线231
13.2.2 科研资助项目流水线232
13.3 无事实的事实表232
13.3.1 招生事件233
13.3.2 课程注册233
13.3.3 设施使用235
13.3.4 学生考勤236
13.4 更多关于教育分析的情况237
13.5 本章小结237
第14章 医疗卫生239
14.1 医疗卫生案例研究与总线矩阵239
14.2 报销单据与支付241
14.2.1 日期维度角色扮演243
14.2.2 多值诊断243
14.2.3 收费的超类与子类245
14.3 电子医疗记录246
14.3.1 度量稀疏事实的类型维度246
14.3.2 自由文本注释247
14.3.3 图像247
14.4 设施/设备的库存利用247
14.5 处理可追溯的变化248
14.6 本章小结248
第15章 电子商务249
15.1 点击流源数据249
15.2 点击流维度模型252
15.2.1 网页维度252
15.2.2 事件维度253
15.2.3 会话维度254
15.2.4 推荐维度254
15.2.5 点击流会话事实表255
15.2.6 点击流网页事件事实表256
15.2.7 步骤维度258
15.2.8 聚集点击流事实表258
15.2.9 Google Analytics(GA)259
15.3 将点击流集成到Web零售商总线矩阵中259
15.4 包含Web的跨渠道赢利能力261
15.5 本章小结263
第16章 保险业务265
16.1 保险案例研究266
16.1.1 保险业价值链266
16.1.2 总线矩阵草案267
16.2 保单事务268
16.2.1 维度角色扮演268
16.2.2 缓慢变化维度268
16.2.3 针对大型和快速变化维度的微型维度269
16.2.4 多值维度属性269
16.2.5 作为事实或维度的数值属性270
16.2.6 退化维度270
16.2.7 低粒度维度表270
16.2.8 审计维度270
16.2.9 保单事务事实表270
16.2.10 异构的超类和子类产品271
16.2.11 辅助保险累积快照272
16.3 保费周期快照272
16.3.1 一致性维度272
16.3.2 一致性事实273
16.3.3 预付事实273
16.3.4 再谈异构超类与子类273
16.3.5 再谈多值维度274
16.4 更多保险案例研究背景274
16.4.1 更新保险行业总线矩阵275
16.4.2 总线矩阵实现细节275
16.5 索赔事务277
16.6 索赔累积快照278
16.6.1 复杂工作流的累积快照279
16.6.2 时间范围累积快照279
16.6.3 周期而不是累积快照280
16.7 保单/索赔合并的周期快照280
16.8 无事实的意外事件280
16.9 需要避免的常见维度建模错误281
16.9.1 错误10:在事实表中放入文本属性281
16.9.2 错误9:限制使用冗长的描述符以节省空间281
16.9.3 错误8:将层次划分为多个维度282
16.9.4 错误7:忽略对维度变化进行跟踪的需要282
16.9.5 错误6:使用更多的硬件解决所有的性能问题282
16.9.6 错误5:使用操作型键连接维度和事实282
16.9.7 错误4:忽视对事实粒度的声明并混淆事实粒度282
16.9.8 错误3:使用报表设计维度模型283
16.9.9 错误2:希望用户查询规范化的原子数据283
16.9.10 错误1:违反事实和维度的一致性要求283
16.10 本章小结284
第17章 Kimball DW/BI生命周期概述285
17.1 生命周期路标286
17.2 生命周期初始活动287
17.2.1 程序/项目规划与管理287
17.2.2 业务需求定义290
17.3 生命周期技术路径294
17.3.1 技术架构设计294
17.3.2 产品选择与安装296
17.4 生命周期数据路径297
17.4.1 维度建模297
17.4.2 物理设计297
17.4.3 ETL设计与开发299
17.5 生命周期BI应用路径299
17.5.1 BI应用规范299
17.5.2 BI应用开发299
17.6 生命周期总结活动300
17.6.1 部署300
17.6.2 维护和发展300
17.7 应当避免的常见错误301
17.8 小章小结302
第18章 维度建模过程与任务303
18.1 建模过程概述303
18.2 组织工作304
18.2.1 确定参与人,特别是业务代表们304
18.2.2 业务需求评审305
18.2.3 利用建模工具305
18.2.4 利用数据分析工具306
18.2.5 利用或建立命名规则306
18.2.6 日历和设施的协调306
18.3 维度模型设计307
18.3.1 统一对高层气泡图的理解307
18.3.2 开发详细的维度模型308
18.3.3 模型评审与验证311
18.3.4 形成设计文档312
18.4 本章小结312
第19章 ETL子系统与技术313
19.1 需求综合314
19.1.1 业务需求314
19.1.2 合规性314
19.1.3 数据质量314
19.1.4 安全性315
19.1.5 数据集成315
19.1.6 数据延迟316
19.1.7 归档与世系316
19.1.8 BI发布接口316
19.1.9 可用的技能317
19.1.10 传统的许可证书317
19.2 ETL的34个子系统317
19.3 获取:将数据插入到数据仓库中318
19.3.1 子系统1:数据分析318
19.3.2 子系统2:变化数据获取系统319
19.3.3 子系统3:获取系统320
19.4 清洗与整合数据321
19.4.1 提高数据质量文化与过程322
19.4.2 子系统4:数据清洗系统323
19.4.3 子系统5:错误事件模式324
19.4.4 子系统6:审计维度装配器325
19.4.5 子系统7:重复数据删除(deduplication)系统326
19.4.6 子系统8:一致性系统326
19.5 发布:准备展现328
19.5.1 子系统9:缓慢变化维度管理器328
19.5.2 子系统10:代理键产生器332
19.5.3 子系统11:层次管理器332
19.5.4 子系统12:特定维度管理器333
19.5.5 子系统13:事实表建立器335
19.5.6 子系统14:代理键流水线336
19.5.7 子系统15:多值维度桥接表建立器337
19.5.8 子系统16:迟到数据处理器338
19.5.9 子系统17:维度管理器系统339
19.5.10 子系统18:事实提供者系统339
19.5.11 子系统19:聚集建立器340
19.5.12 子系统20:OLAP多维数据库建立器340
19.5.13 子系统21:数据传播管理器340
19.6 管理ETL环境341
19.6.1 子系统22:任务调度器341
19.6.2 子系统23:备份系统342
19.6.3 子系统24:恢复与重启系统343
19.6.4 子系统25:版本控制系统344
19.6.5 子系统26:版本迁移系统345
19.6.6 子系统27:工作流监视器345
19.6.7 子系统28:排序系统346
19.6.8 子系统29:世系及依赖分析器346
19.6.9 子系统30:问题提升系统346
19.6.10 子系统31:并行/流水线系统347
19.6.11 子系统32:安全系统347
19.6.12 子系统33:合规性管理器348
19.6.13 子系统34:元数据存储库管理器350
19.7 本章小结350
第20章 ETL系统设计与开发过程和任务351
20.1 ETL过程概览351
20.2 ETL开发规划351
20.2.1 第1步:设计高层规划352
20.2.2 第2步:选择ETL工具352
20.2.3 第3步:开发默认策略353
20.2.4 第4步:按照目标表钻取数据354
20.2.5 开发ETL规范文档355
20.3 开发一次性的历史加载过程356
20.3.1 第5步:用历史数据填充维度表356
20.3.2 第6步:完成事实表历史加载360
20.4 开发增量式ETL过程363
20.4.1 第7步:维度表增量处理过程363
20.4.2 第8步:事实表增量处理过程365
20.4.3 第9步:聚集表与OLAP加载367
20.4.4 第10步:ETL系统操作与自动化368
20.5 实时的影响368
20.5.1 实时分类369
20.5.2 实时结构权衡370
20.5.3 展现服务器上的实时分区371
20.6 本章小结372
第21章 大数据分析373
21.1 大数据概览373
21.1.1 扩展的RDBMS结构374
21.1.2 MapReduce/Hadoop结构375
21.1.3 大数据结构比较376
21.2 推荐的应用于大数据的最佳实践376
21.2.1 面向大数据管理的最佳实践376
21.2.2 面向大数据结构的最佳实践377
21.2.3 应用于大数据的数据建模最佳实践381
21.2.4 大数据的数据治理最佳实践383
21.3 本章小结384
热门推荐
- 3549033.html
- 643708.html
- 2129969.html
- 2023592.html
- 2611760.html
- 83990.html
- 480517.html
- 1125079.html
- 134350.html
- 3289730.html
- http://www.ickdjs.cc/book_3553661.html
- http://www.ickdjs.cc/book_2731643.html
- http://www.ickdjs.cc/book_2052695.html
- http://www.ickdjs.cc/book_1732669.html
- http://www.ickdjs.cc/book_3029946.html
- http://www.ickdjs.cc/book_1779672.html
- http://www.ickdjs.cc/book_2133876.html
- http://www.ickdjs.cc/book_1459657.html
- http://www.ickdjs.cc/book_2945309.html
- http://www.ickdjs.cc/book_570307.html