excel学习库

excel表格_excel函数公式大全_execl从入门到精通

数据仓库系列7-认识一下OLAP

什么是OLAP?

在线分析处理 (Online Analytical Processing: OLAP)

分析师经常需要对数据进行分组、聚合和连接。数据挖掘中的这些 OLAP 操作是资源密集型的。使用 OLAP 可以预先计算和预先聚合数据,从而加快分析速度。

OLAP 数据库被分成一个或多个多维数据集。多维数据集的设计方式使得创建和查看报告变得容易。OLAP 代表在线分析处理。

在本教程中,您将学习-

  • OLAP 多维数据集

  • OLAP的基本分析操作

  • OLAP 系统的类型

  • ROLAP

  • MOLAP

  • 混合OLAP

  • OLAP 的优势

  • OLAP 的缺点

OLAP 多维数据集:

OLAP 多维数据集

OLAP 概念的核心是 OLAP Cube。OLAP 多维数据集是一种为非常快速的数据分析而优化的数据结构。

超立方体

通常,数据操作和分析使用简单的电子表格进行,其中数据值以行列格式排列。这是二维数据的理想选择。但是,OLAP 包含多维数据,数据通常来自不同且不相关的来源。使用电子表格不是最佳选择。多维数据集可以逻辑有序地存储和分析多维数据。

它是如何工作的?

数据仓库将从多个数据源和格式(如文本文件、Excel 表格、多媒体文件等)中提取信息。

提取的数据被清理和转换。数据被加载到 OLAP 服务器(或 OLAP 多维数据集)中,在那里预先计算信息以供进一步分析。

OLAP的基本分析操作

分析 OLAP 操作的四种类型是:

  1. Roll-up (汇总)

  2. Drill-down (挖掘)

  3. Slice and dice (切片与切块)

  4. Pivot/rotate(透视/旋转)

1) 汇总:

汇总也称为“合并”或“聚合”。可以通过 2 种方式执行 Roll-up 操作

  1. 缩小尺寸

  2. 攀登概念层次结构。概念层次结构是根据事物的顺序或级别对事物进行分组的系统。

考虑下图

OLAP 中的汇总操作
  • 在此示例中,城市 New jersey 和 Lost Angles 并卷入美国国家/地区

  • 新泽西和洛杉矶的销售数字分别为 440 和 1560。上卷后变成 2000

  • 在这个聚合过程中,数据是位置层次结构,从城市向上移动到国家。

  • 在卷起过程中,至少需要去除一个或多个维度。在本例中,城市维度被删除。

2) 挖掘

在向下挖掘中,数据被分成更小的部分。它与汇总过程相反。它可以通过

  • 向下移动概念层次结构

  • 增加维度

OLAP 中的挖掘操作

考虑上图

  • 季度 Q1 向下挖掘到 1 月、2 月和 3 月。相应的销售额也是寄存器。

  • 在此示例中,添加了维度月份。

3)切片:

在这里,选择了一个维度,并创建了一个新的子立方体。

下图解释了切片操作是如何执行的:

OLAP 中的切片操作

  • 使用 Q1 作为过滤器对维度时间进行切片。

  • 一个新的立方体被完全创建。

切块:

此操作类似于切片。切割的不同之处在于您选择了 2 个或更多维度,从而创建了一个子立方体。

OLAP 中的切割操作

4) 透视

在透视中,您可以旋转数据轴以提供数据的替代表示。

在以下示例中,数据透视基于项目类型。

OLAP透视操作

OLAP 系统的类型

OLAP 层次结构

OLAP 系统的类型

ROLAP

ROLAP 处理存在于关系数据库中的数据。事实和维度表存储为关系表。它还允许对数据进行多维分析,是增长最快的 OLAP。

ROLAP模型的优点:

  • 数据效率高。

  • 可扩展性。

ROLAP 模型的缺点:

  • 对资源的需求更高:

  • 汇总数据限制。

  • 查询性能慢。

MOLAP

MOLAP 使用基于数组的多维存储引擎来显示数据的多维视图。基本上,他们使用 OLAP 多维数据集。

混合OLAP

混合 OLAP 是 ROLAP 和 MOLAP 的混合。它提供了 MOLAP 的快速计算和 ROLAP 的更高可扩展性。HOLAP 使用两个数据库。

  1. 聚合或计算的数据存储在多维 OLAP 多维数据集中

  2. 详细信息存储在关系数据库中。

混合 OLAP 的好处:

  • 这种 OLAP 有助于节省磁盘空间,并且它也保持紧凑,这有助于避免与访问速度和便利性相关的问题。

  • 混合 HOLAP 使用多维数据集技术,可以为所有类型的数据提供更快的性能。

  • ROLAP 是即时更新的,HOLAP 用户可以访问这个实时即时更新的数据。MOLAP 带来了数据的清理和转换,从而提高了数据的相关性。这带来了两全其美。

混合OLAP的缺点:

OLAP 的优势

  • OLAP 是适用于所有类型业务的平台,包括计划、预算、报告和分析。

  • OLAP 多维数据集中的信息和计算是一致的。这是一个至关重要的好处。

  • 快速创建和分析“假设”场景

  • 轻松搜索 OLAP 数据库以获取广泛或特定的术语。

  • OLAP 为业务建模工具、数据挖掘工具、性能报告工具提供了构建块。

  • 允许用户按各种维度、度量和过滤器对立方体数据进行切片和切块。

  • 它有利于分析时间序列。

  • 使用 OLAP 可以轻松找到一些集群和异常值。

  • 它是一个强大的可视化在线分析过程系统,可提供更快的响应时间

OLAP 的缺点

  • OLAP 需要将数据组织成星型或雪花模式。这些模式实施和管理起来很复杂

  • 单个 OLAP 多维数据集中不能有大量维度

  • OLAP 系统无法访问事务数据。

  • OLAP 多维数据集中的任何修改都需要对多维数据集进行完整更新。这是一个耗时的过程

概括:

  • 数据仓库中的 OLAP 是一种使分析师能够从不同角度提取和查看业务数据的技术。

  • OLAP 概念的核心是一个 OLAP Cube。

  • 各种业务应用程序和其他数据操作都需要使用 OLAP Cube。

  • 数据仓库中有五种主要的分析型 OLAP 操作:1) 汇总 2) 挖掘 3) 切片 4) 切块和 5) 透视

  • 三种广泛使用的 OLAP 系统是 MOLAP、ROLAP 和混合 OLAP。

  • 桌面 OLAP、Web OLAP 和移动 OLAP 是其他一些类型的 OLAP 系统。

参考 guru99

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

«    2024年12月    »
1
2345678
9101112131415
16171819202122
23242526272829
3031
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
搜索
最新留言
    文章归档
      友情链接