数据仓库应用具有从多个分散的部门级系统中捕捉大量共享信息的能力它们可以将机构的原始数据有效地转化为有用的知识信息于是这些知识信息就可以被用来进行战略决策支持从而提高企业效益在一个先进的数据仓库应用的帮助下企业决策者可以从质量区域收入和产量等基本面上对企业性能进行跟蹤并基于这些可靠的信息采取快速明智的行动
本文将阐述建立数据仓库的八条规则尤其是如何建立第一个数据仓库实际上对于如何建立一个成功的数据仓库现实中不存在也根本不可能存在一个涵盖万千放之四海而皆准的宝书几乎可以肯定的是在建立第一个数据仓库的时候用户肯定会犯错误这是不可避免的本文的规则的意义仅仅在于帮助用户避免一些已知的缺陷而对于那些不可避免的必然错误这些规则会尽可能地帮助用户减轻可能带来的危害
规则一:从小处着手
不要一上来就要完成一个大规模的企业范围的数据仓库这样会使用户陷入逻辑行政和财政的泥沼中而不能自拔
数据仓库不是越大越有效较小系统的价值对机构来讲可能会很大例如用户可以将第一个数据仓库的实现定位于一个特定的部门和应用或者业务线初始时采用规模向下的数据集市可以降低开发成本缩短实现周期并有助于为未来的数据仓库的发展培训IT人员
规则二:向大处考虑
即使在建立第一个面向特定部门或特定应用的数据集市时也一定要保证现在所使用的数据模型能够向将来企业范围的数据存储扩展以便于将来其他数据集市和战略数据仓库的实现
必须在部门之间进行一致性数据定义并使每个人都遵守例如如何构成一个销售体系?是预约登记开发票还是付款?在这些定义上的一致性协议会使以后部门数据的联合成为可行有效
[] [] [] [] []