数据库

位置:IT落伍者 >> 数据库 >> 浏览文章

SAS数据仓库的体系结构


发布日期:2023年06月17日
 
SAS数据仓库的体系结构

数据仓库的加载和更新

从数据源抓取数据不仅有质量问题还存在有计划地按一定时间节奏从数据源取出和 装入更新数据仓库的问题因为SAS系统有主动去取外部数据的能力所以按时间节奏 从数据源取出数据的操作在和其它系统管理人员协调好的基础上就可完全在SAS系统内 制定从各系统取用数据的计划了在此基础上数据仓库按照数据和信息使用的时间要求 准时地加载更新就是完全有保障的了

从数据源到数据仓库一气呵成的集成式的操作这是SAS数据仓库技术的重要特点

按决策需要重组数据和信息清理好的数据还要进行重组按照决策的需要组织成不同主题的数据仓库表这是十分关键性的操作在再小的企业或组织中也总是有许多业务和技术环节的一般来说原来运行系统数据库的设计也总是针对这些业务和技术环节设置实体即数据库的表这样的设计使OLTP系统在线运行时发挥了最大限度的工作 效率但在开拓决策支持的OLAP时特别是对于全企业范围的数据进行操作时这种数据 结构效率极低这是因为可能要从许多表中取出所需数据而且还要进行数据的筛选 对 不同表中的数据进行拟合等操作这是极费时间和资源的企业范围的决策是对各个环节 分别进行业务处理的业务重组这就需要有相应数据结构的重组即按决策的需要组织成 不同主题的数据仓库表以及相应的数据视图汇总表等SAS为此设置了交互式操作的界 面以最大的主动性帮您完成决策支持所需的数据重组

丰富的决策数据处理能力 为更有效地支持决策必须进行广泛深入的数据挖掘( Data Mining)而不是仅仅提供简单的函数功能供编程使用

SAS在这方面有世界领先的丰富的决策支持数据分析处理软件

首先SAS/MDDB可帮您构造最适宜OLAP操作的多维数据结构

SAS/STAT覆盖了所有的实用数理统计分析方法是国际上统计分析领域的标准软件它提供了十多个过程可进行各种不同模型或不同特点的回归分析;为多种试验设计模型提 供了方差分析工具;在多变量统计分析方面为主成分分析相关分析判别分析和因子分 析提供了许多专用过程;还包括多种聚类准则的聚类分析方法

SAS/ETS提供了丰富的计量经济学和时间序列分析方法是研究复杂系统和进行预测的有力工具

SAS/OR提供了全面的运筹学方法

SAS/IML提供了功能强大的面向矩阵运算的编程语言帮助您研究新算法或解决SAS系统中没有现成算法的专门问题

SAS/INSIGHT是一个可视化的数据探索工具它将统计方法与交互式图形显示融合在一起为您展现了一种全新的使用统计分析方法的环境

还有SAS的人工神经元网络和SAS/ASSIST……等具有很大伸缩性的适合各个层次 各种类型人员使用的工具

灵活多样的结果展现方式 分析结果的展现方式对决策时人的判别有重大的影响SAS也有众多的方式方法供您选择:

在Base SAS中就有从简单列表到比较复杂的统计报表和用户自定义的式样复杂的报表的能力

SAS/ER(Enterprise Report)更是为企业级的决策过程提供了报告的制作能力

SAS/GRAPH是一个强有力的图形软件包可将数据及其包含着的深层信息以多种图形生动的呈现出来……

从各种数据源主动地取出数据;经过清理整合;再按决策支持的需要分主题重组数据;按照时序节奏不断地自动装载更新数据仓库;用世界权威的丰富的数据处理工具 进行决策分析;最后以多种形式将决策支持的意见呈现给您这就是完整的决策支持数据 仓库解决方案!

提醒您:在购买数据仓库产品时必须注意您所得到的产品是否能够实现决策支持所需的全部技术环节!

SAS数据仓库的体系结构

数据库技术大大推动了计算机应用的迅速发展特别是建立在EFCodd提出的ER理 论基础上的关系型数据库更是为OLTP(联机事务处理)应用开拓了广阔天地年EF Codd曾回答一个提问:为什么在对一个运行良好的基于ER理论的关系数据库进行查询 以制作一个较大的报告时系统的响应速度特别的慢他说:运行数据库是为OLTP需求环 境设计的这已有太多的成功事例但现在我们所面对的是OLAP(联机分析处理这个概念 述语EFCodd在此第一次提出)类型的需求要实现OLAP就要有适应它的整合的快速 的多维的信息架构和查询机制

SAS数据仓库就是一个适应于对企业级的数据信息进行重新整合适应多维快速查询;进行OLAP操作和决策支持的数据信息的采集管理处理和展现的架构体系可 用右图表示:

环境(Enviroment) 环境是SAS数据仓库体系结构的总根它由两大部分组成一部分 是分别含有不同主题内容的若干个数据仓库;另一部分是对数据源的定义这构成了从数 据采集到直接应用完整的支持体系

数据仓库(Data Warehouse) 为了使用上的方便可以存在多个数据仓库在一个大的企业或组织中不同部门在进行决策分析时可能使用徊然不同的数据重新整合后就没 有必要将它们放在一起了在体系结构层次中的数据仓库主要是管理性的作用其中有对 数据仓库所有组成单元的解释性数据Metadata在每个数据仓库中还可以设置若干个主 题这一般是同一部门中支持不同决策内容的数据主题是较大的数据载体相对精简或 汇总一些的是所谓数据市场在一个数据仓库中亦可存在若干个数据市场

主题(Subject) 在每个主题中有一个主题表系统放置与此主题相关的各种数据为 了支持决策还设置了若干个数据的汇总表组进一步还有若干个信息市场组其中放置 的是对数据处理后产生的决策支持信息

主题表系统(Detail) 这里放置的就是从各个数据源中取出经过清理整合的原始数据为了使用和管理的方便这些数据可放在多个表中

主题表(Detail Table) 从运行系统数据源取出的数据分别组成这里的若干表它 们可能是实际的表也可以是一些逻辑视图(View)从本质上讲它们和原来各个运行系 统数据源的数据内容是一致的但是为了方便地支持决策数据处理而对数据的结构进行 了重组为了决策支持数据处理工作的方便和提高工作的效率在数据重组过程中可能 还要增加一些数据冗余

汇总表组(Summary Groups) 在汇总表组中定义进行数据汇总处理时的层次维数和所 分析的变量当汇总表组是按SAS数据集和DBMS格式存放时可有六个层次若是采用SA S 的多维数据库产品MDDB时则可有任意多个层次实际上数据汇总就是最常用的决策支持

上一篇:CREATE DATABASE

下一篇:在可以为空的外键中检查数据的有效性