侠客书屋 通过搜索各大小说站为您自动抓取各类小说的最快更新供您阅读!
侠客书屋 >  离语 >   第288章 粽子!

数据仓库是一个面向主题的集成的相

对稳定的反映历史变化的数据集合Y用于支持管理决策

面向主题

2集成

3相对稳定

4反映历史变化

数据库是面向事务的设计Y数据仓库是面向主题设计的数据库

一般存储在线交易数据Y数据仓库存储的一般是历史数据数据

库是为捕获数据而设计Y数据仓库是为分析数据而设计的。

一个典型的数据仓库系统通常包含数据源数据存储和管理

oLAp服务器前端工具和应用等四个部分。

数据源x是数据仓库的基础系统的数据来源Y包含企业的各种内部数

据和外部数据内部数据包括存在于oLtp系统中的各种业务数据和办

公自动化系统中的各类文档数据外部数据包括各类法律法规市场信

息竞争对手信息及各类外部统计数据和其他相关文档等。

数据存储和管理x是数据仓库系统的核心是指在各业务系统基础上周

期性地对数据进行抽取按照主题进行重新组织Y最终确定数据仓库的物理存储结构Y同

时存储数据仓库的各种元数据?数据字典记录系统定义数据转换规

则数据加载频率及业务规则等?对数据仓库系统的管理Y就是对相

应数据库系统的管理Y通常包括数据的安全归档备份维护和恢复

等工作。

oLAp服务器x联机分析处理服务器将需要分析的数据按照多维数据模

型进行重组Y以支持用户随时多角度多层次进行数据分析Y发现数据

规律与趋势

前端工具和应用x数据查询工具自由报表工具数据分析工具数据

挖掘工具和各类应用系统。

实时主动数据仓库是一个集成的信息存储仓库Y既具备批量和周期性的数据

加载能力?采用EtL技术?Y也具备数据变化的实时探测传播和加载能力

?采用cdc技术?Y并能结合历史数据和新颖数据实现查询分析和自动规则

触发Y从而提供对战略决策和战术决策的双重支持。

数据整合。

不同数据源的数据被物理地集成到数据目标

利用EtL工具把数据源中的数据批量地加载到数据仓库就属于数据整

合。

数据联邦。

在多个数据源的基础上建立统一的逻辑视图Y对外界应用屏蔽数据

在各个数据源的分布细节

对应用而言Y只有一个数据访问入口Y但事实是被请求的数据只是

逻辑上的集中Y物理上仍然分布在各个数据源中

只有收到请求时Y数据仓库才临时从不同数据源获取相关数据Y进

行集成后提交给数据请求者。

数据传播。

数据在多个应用之间传播

在企业应用集成解决

方案中Y不同应用之间可以通过传播消息进行交互

4混合方式

对那些不同应用都使用的数据采用数据整合的方式进行集成Y而对

那些只有特定应用才使用的数据则采用数据联邦方式进行集成。

有多种技术可以为实时主动数据仓库提供数据集成服务Y比如脚本EtL

EAI和cdc但是Y只有部分技术能提供实时(连续)的数据集成x

?

1?脚本脚本是数据集成的一种快速解决方案Y其优点是Y使用灵活且比

较经济Y很容易着手开发和进行修改Y几乎任何操作系统和绝大部分dbmS都

可以使用脚本但是Y使用脚本也有很多问题Y比如Y耗费开发者的时间和

精力Y不好管理和操作Y以及不能满足服务水平协议?

等等。

有多种技术可以为实时主动数据仓库提供数据集成服务Y比如脚本EtL

EAI和cdc但是Y只有部分技术能提供实时(连续)的数据集成x

?

2?EtLEtL是实现大规模数据初步加载的理想解决方案Y它提供了高级

的转换能力EtL任务通常都是在 维护时间窗口进行Y在EtL任务执行期间Y

数据源默认不会发生变化Y这就使得用户不必担忧EtL任务开销对数据源的影

响Y但同时也意味着Y对于商务用户而言Y数据和应用并非任何时候都是可

用的。

有多种技术可以为实时主动数据仓库提供数据集成服务Y比如脚本EtL

EAI和cdc但是Y只有部分技术能提供实时(连续)的数据集成x

?

3?EAIEAI解决方案通常和EtL解决方案并存Y从而增强EtL的功能EAI

解决方案在源系统和目标系统之间进行连续的数据分发Y并且保证数据的成

功分发Y同时提供高级的工作流支持和基本的数据转换但是YEAI受到数据

量的限制Y因为EAI的初衷是为了实现应用的集成而不是数据的集成Y即它是

用来调用应用或者分发命令和消息的然而Y由于EAI具有在数据集成过程中

实时分发数据和维护数据一致性的特性Y所以也就能够提供实时数据获取的

能力Y而这种能力正是实时主动数据仓库所需要的。

有多种技术可以为实时主动数据仓库提供数据集成服务Y比如脚本EtL

EAI和cdc但是Y只有部分技术能提供实时(连续)的提供了连续变化数据的捕捉和分

发能力Y并且只需要很低的开销和时间延迟cdc在提交的数据事务上进行

操作Y从oLtp系统中捕获变化的数据Y再进行基本的转换Y最后把数据发送

到数据仓库中虽然在体系结构上Ycdc属于异步的Y但它表现出类似同步

的行为Y数据延迟只有不到1秒的时间Y同时能够维护数据事务的一致性。

EtL是将业务系统的数据经过抽取?

Extract?清洗转换?

transform?

之后加载?

Load?到数据仓库的过程Y目的是将企业中的分散零乱

标准不统一的数据整合到一起Y为企业的决策提供分析依据

EtL是指从原系统中抽取数据Y并根据实际商务需求对数据进行转换Y然

后把转换结果加载到目标数据存储结构中源和目标通常都是数据库和文

件Y也可以是消息队列等。

数据抽取

可以采用周期性的pull机制或者事件驱动的push机制

pull机制支持数据整合Y通常以批处理的方式工作

push机制通常采用在线方式工作Y可以把数据变化传播到目标数据存储

结构。

数据转换

包括数据重构和整合数据内容清洗或集成

数据加载

对整个目标数据存储结构进行刷新Y或者只是对目标数据存储进行增量更

新。

早期的EtL解决方案通常以固定的周期运行批处理工作Y从平面文件和

关系数据库中捕捉数据Y并把这些数据整合到数据仓库中最近这几年Y

商业EtL工具供应商已经对产品做了很大的改进Y对产品功能进行了扩

展Y具体如下x

1额外的数据源

2额外的目标

3改进的数据转换功能

4更好的管理

5更好的性能

6改进的可用性

7增强的安全性

8支持基于数据联邦的数据集成方法

数据抽取模块的功能x

1确定数据源Y即从哪些源系统进行数据抽取。

2定义数据接口Y对每个源文件及系统的每个字段进行详细说明。

3确定数据抽取的方式x是主动抽取还是由源系统推送Y是增量抽取。

还是全量抽取Y是每日抽取还是每月抽取。

数据清洗与切换

数据清洗与转换x

数据清洗主要是对不完整数据错误数据重复数据进行处理

数据转换包括如下操作

侠客书屋推荐阅读:我白天特案局办案,晚上地府当差我来自黄泉掀饭桌!小疯批夺回气运后不忍了一吻定情,总裁甜蜜囚爱开局逃婚,疯批太子穷追不舍炮灰父女入赘后,全家后悔了穿成霸总娇妻失败后,在恋综选夫穿越四合院之我有系统我怕谁杂货铺通古今,我养的将军醋翻了快穿神君大人的糖去哪了HP:东方来了个笑面蛇逼她给白月光顶罪?渣父子我不要了师尊怎么那么撩你崽崽让哪里逃灵异界大佬:全家跪求我带飞茅山弟子:我靠词条系统混诡异江澄重生后开局出生在魔域盗墓,被偷听心声后我暴露了荒村血祭人在奥特:从海帕杰顿幼虫开始快穿阎罗王:这个女配不太毒惊!陆爷的心尖宠竟是马甲大佬妻主罪恶滔天,死不悔改带着雷欧,穿越奥特宇宙HP万人迷在圣芒戈诱反派!勾疯批!顶级尤物撩疯了千方百计与千方百计快穿:殿下她是个万人迷重生80,从在大兴安岭打猎开始少年白马:把自己炼成药人霍格沃兹:魔法世界第一个资本家谁懂啊?我粉的主播成影后了!陈情令:如果长安牛马实录穿成反派大佬的漂亮毒妻七零:穿成了早逝炮灰她逆天改命书穿圣母女主:老娘双刀定人生娇美知青与糙汉酱酱漾漾的生活炮灰前妻觉醒后决定拿钱走剧情帝妃掌妖异血瞳乱天下在老师面前乱舞的麻瓜从mc开始的万界之旅逐星传说霍格沃茨:我靠MC伪装炼金教授原神:我是天理,不是你们老婆!盗墓:我的网游通盗笔Re:艾蜜莉雅很想让我当王妃!特摄盘点:铠甲假面?统统碗里来绝色狂徒炮灰太娇软,掐腰就会哭
侠客书屋搜藏榜:王爷别虐了,你的暗卫娇妻早跑了影视遇上对的人互绿!你舔白月光,我撩隔壁残王【变形金刚】俘虏求生记重生后,阿姨卷起来弃女觉醒退婚后,清冷权臣他以身相许精灵:从当大木博士助手开始误撩顶级豪门大佬后被天天放肆宠快让开!那个女孩是我的人生如意全靠演技这个女主竟然是食死徒明日方舟:迷途的旅人重生为博士奴隶修仙传繁花错位似流年王妃状态易崩坏公主殿下请理智,亡国敌君是绿茶开局就遭百鬼缠身要相信阳光总在久别重逢,傅先生总说我始乱终弃双面恋人我在斗罗开酒馆,醉倒朱竹清暗相思,无处说,夜来惆怅烟月用尽我的一切奔向你南街小子新书徒儿下山找师姐吧快穿:漂亮老婆又被抱走了八零二嫁小甜妻火影:斑爷等等我们不是兄弟情吗野小子与野百合太一神主之斗罗大陆梨子圆了小知青从末世来穿越后只想好好活着火影直播从剧场版开始变强从喰种开始我家当铺当鬼神我的二次元之旅,启程了闪婚大叔后,挺孕肚离家出走我才不是配角火影:人在宇智波,我能提取词条小道姑直播太准!日赚一亿成首富我们的岁月长河虎啸乾坤:万物传奇诡异修仙世界:我能豁免代价双世青佩十七时五十八分的落日快穿:炮灰剧本?抱歉我才是女主同谋合污【刑侦】杨然修仙传让你进宫当刺客:你居然偷了女帝的心
侠客书屋最新小说:为奴流放后,将军对我俯首称臣失约三次后,阮小姐闪婚了死对头完蛋!我养的炉鼎是正道仙尊捡到八零大佬,做精娇娇赢麻了观音泥笑着玩转战锤兽世,和闺蜜从种田到宫斗随军前,小军嫂夺回空间搬空全家穿越手记:论勇者的培养草根狂徒:我只想把田种好亿点点亡灵低语录谁家清冷师尊将妖徒按在怀里撩?雪中:污蔑当天,反手编辑北凉王!星穹弑神:我靠科技修真推三千年我家住在大陕北认亲侯府被当表小姐,真千金她不伺候了重生后逆袭大律师搬空家底去下乡李世民与渔家女曹婉儿的邂逅情缘风水云雷电我见公子多有病魔道祖师之魏无羡重生盗墓:别惹我,我兄弟南瞎北哑四合院:阅尽天下美女后宫佳丽三千,应要雨露均沾修仙:开局婴儿,我修炼超快宝贝,放松点2九尾狐恩仇录长相思夭柳回溯三生三世奇案擒凶嫡女重生:侯府娇宠穿书女配跟反派大佬领证剧情崩了禁娇鸾:惹上暴戾太子逃不掉!带着手机穿越之太子又又又疯了遨游诸天,弥补遗憾绿调四合院:空间异能者何雨柱仙侠传之混沌元始录青铜镜中电子狐灭族之夜前带宇智波去航海一眼惊鸿之倾世太子妃真千金养黄泉路后,全家火葬场了杏花落尽燕归时渣男太子,你家库房已被我搬空【借邪骨,我以鬼仙破阴阳】阴符九阙旮旯村旮旯事换亲改嫁绝嗣首长后,继姐哭瞎眼穿越废灵根,我靠修仙百艺逆袭茅山风云录