首页 > 开发 > 综合 > 正文

初学数据仓库

2024-07-21 02:08:17
字体:
来源:转载
供稿:网友
  • 本文来源于网页设计爱好者web开发社区http://www.html.org.cn收集整理,欢迎访问。

  • 初学数据仓库

     

    创建日期:2003-12-26

    修改日期:2003-12-29

     

    [摘要    ] 本文是阅读《决策支持与数据仓库系统》一书的学习体会.

    [关键字] 数据仓库、决策支持

          

    书中有一段非常深刻的话,摘录如下:“当读者开始自己的职业生涯时,要记住技术是服务于组织需要的工具。如果不服务于组织的需要,技术将毫无价值。我们必须首先考虑组织的需要,在业务中学习技术是重要的,仅仅在以下的意义下才可帮助组织机构获得满足其需要的信息系统。只有当我们理解组织的需求时,才应当考虑满足组织需求的技术。反之,如果先考虑技术后考虑组织的需要,则将只能产生一座令人印象深刻的但却毫无用处的技术纪念碑。“

     

    顾名思义,数据仓库是一个存放货物或材料的地方,数据仓库的作用是辅助决策,也就是决策支持系统的一种。对于一个企业的决策者来说,并非所有的信息都是关键的,决策数据也并不需要来自厚厚的报告。较小的数据集合称作数据集市

     
    faq<书中的一些基本概念,对快速理解数据仓库有帮助>
    n      eis和ess的区别是什么?他们之间有什么共同点?

    1.eis: 高级管理人员信息系统

    2.ess:高级管理人员支持系统,在eis的基础上增加了一些附加功能,如连接电子邮件系统或办公日程安排表,还可能包括建模及专家系统的功能。

    n      数据仓库具有三个特征:

    1.包含大量数据

    2.组织数据仓库是为了更加便利地使用数据进行决策

    3.为最终用户提供了可用来存取数据的工具

    n      两个基本硬件的进步使得数据仓库实用

    1.需要大量的存储器(价格低廉而且容量高)

    2.需要大量的计算机资源(硬件的快速发展)

    n      什么为数据仓库提供输入信息?什么从数据仓库获取信息?

    答:操作数据库为数据仓库提供输入,用户从数据仓库中获取信息

    n      在数据装载进数据仓库之前对数据必须做的三件事是什么?

    答:准备、组织和呈现

    n      高级管理人员使用的信息系统有什么特点?

    1.跨部门

    2.面向数据

    3.本质上的汇总性质

    4.面向图形

    5.基于通信

    6.为高级管理人员个人偏好精心定制

    n      什么是数据立方?

    与组织数据仓库数据库的多维十分相似

    n      什么是系统?什么是系统的关键性?

    系统是具有目标的,由一组相互作用的组成部分构成,关键词是:组、相互作用、组成部分、目标

    n      信息系统与一般系统有何区别?

    信息系统的目的是存储、处理和交换信息

    n      数据流图表示什么?数据流图不表示什么?

    数据流图以处理和数据存储之间的数据流形式表明组成部分之间的相互作用。数据流图并不是对系统的完整描述,数据流图不能表示系统目标,但通常可从其他信息源推断系统的目标,数据流图也不能表示系统中各处理之间的时间关系.

    n      决策支持系统与一般信息系统有何不同

    决策系统是一种特殊的信息系统。使用不止一个数据存储(数据库或文件集合)以便提供支持决策的信息。决策支持系统不更新作为其外部信息源的数据库。决策支持系统与决策者交换信息

    n      为什么决策支持系统使用模型?

    如果劳模性能为决策者提供显示世界的观察所能提供的相同信息,并且同时提供胜过现实世界观察的优点,该模型就将成为有用的工具。

    n      模型的主要种类是什么?

    图形模型、叙述型模型、物理模型

    n      为什么在商业中通常不使用连续性模型?

    连续系统模拟模型描述了物理或经济过程,在其中描述系统的数字时刻在变化。简单的连续系统可通过积分和微分方程来研究。

    商业系统通常由系统中引起连续变化的可分辨的时间来刻画:定单到达、产品的发货。从商业计划观点来说,这些瞬间阶段是无关的。将这些瞬间阶段构造到模型中增加了模型的复杂性却未能增加其用途。因此,商业模拟通常不用连续模型。

    n      什么是伪随机数?为什么在模拟模型中伪随机数十分有用?伪随机数是如何得到的?

    由一个可重复的公式产生的数,这些数在统计意义上仿佛是真的随机数。所有的模拟软件包和大多数的编程语言均有可在一个很有用的范围上返回均匀分布的伪随机数的内置的函数。
    发表评论 共有条评论
    用户名: 密码:
    验证码: 匿名发表