大数据可视化应用——多维分析进阶

在之前的文章中,小易给大家分享了多维数据分析概念的入门介绍,但是多维数据分析的概念非常容易引起疑惑,它常常让人联想到超越三维的更高维空间中的一些几何概念。其实这是完全没有必要的,多维数据分析概念本质上是极为简单和容易理解的,今天小易就用深入浅出的方式介绍这几个概念。

图片1.png

多维数据结构


Ø 概念一:Cube(又称多维数据集或数据立方体)

举个例子,您在超市结账后会得到一个小票,上面有时间、店铺、商品类别、商品单价、购买数量、消费金额等信息,如果把某个地区全部消费者的小票收集到一起,那么这些购物小票中的数据就形成了一个关于消费者超市购物行为的数据集,这就是一个Cube。

Cube就是面向同一业务主题的数据集合,同理,一个港口的进出口数据集合、一个贸易公司的渠道销售数据集合、近几年各省份户籍变动数据都可以视为一个个Cube。


Ø 概念二:Dimension(又称维度)

超市小票的Cube里隐含着很多信息,如:

哪些商品呈现出季节性消费规律?

不同区域店铺的顾客购买力如何?哪几个店铺的顾客平均购买力最强?

不同年龄段消费者最爱购买的商品有没有差别?

哪些商品由于不受年轻消费者欢迎可能会被淘汰?

由上可见,这个超市小票Cube可以由商品、时间、区域、店铺、顾客等业务角度来描述,这些业务角度就是维度。同理,贸易公司的渠道销售Cube可以由时间、渠道、产品、分公司、客户等业务角度所描述,那么它所关联的维度就是时间、渠道、产品、分公司、客户。我们还可以看到,小票Cube和渠道销售Cube都关联了时间这个维度,那么这两个Cube是可以联合起来进行跨行业、跨领域数据分析的。


Ø 概念三:Measure(又称度量)

在Cube中,除了维度所代表的业务角度信息外,还有度量这个能够被精确量化的数值信息。

小票Cube中的商品购买数量、商品单价、消费总额就是度量。


Ø 概念四:Member(又称维度成员或成员)

前文中已经讲过维度的概念了,维度就是业务角度。日期这个业务角度就可以被看做一个维度,日期维度中具体的年份、季度、月份、日就是日期维度成员,如:2018年、2018年3季度、2018年10月份、2018年10月1日都是日期维度成员。对于地区维度来说,其对应的成员是中国、华北地区、北京市、天津市、河北省等。


Ø 概念五:Level(又称成员级别或维度成员级别)

Level表示的是维度成员的级别信息。以日期维度为例,2018年9月份、2018年10月份、2018年11月份表示的都是具体的月份,所以它们的Level是月份。2018年1季度、2018年2季度、2018年3季度表示季度信息,它们的Level是季度。显然月份Level比季度Level具有更细的粒度级别。


Ø 概念六:Hierarchy(又称维度层级或层级)

将日期维度的成员用图形结构表示出来,如下所示:

图片2.png

年-季度-月份-日

一年有365天,大约52周,但是如果将周加入到上图就会造成混乱,因为有些周是跨月份和季度的。如果需要对周信息进行分析,则可以将日期维度成员的关系以另外一种结构表示,如下图所示:

图片3.png

年-周-日

前者以【年-季度-月份-日】结构来表示日期维度成员结构,后者则是以【年-周-日】来表示日期维度成员结构,这就是两个不同的Hierarchy。Hierarchy并不常用。


Ø 概念七:Dimension Role(维度角色)

先看一个数据模型,是一个关于国内人口迁移数据的模型。

图片4.png

人口迁移数据模型

每个度量表示的是某一年户籍迁出省份到户籍迁入省份的人口数量。此数据模型有三个维度:年份、户籍迁出地、户籍迁入地。不难发现,户籍迁出地与户籍迁入地这两个“维度”应该是完全相同的,实际上也是如此,“户籍迁出地”和“户籍迁入地”是地区维度关联到此数据模型时所扮演的不同角色。

图片5.png

维度扮演角色


Ø 概念八:Measure Dimension(度量维)

度量维见名知意,就是表示度量的维度。对于某个具有多个度量值的多维数据模型,可以将其度量信息单独提取出来并作为一个独立的维度。下图示例中是一个二维数据模型,其关联了日期和渠道两个维度,具有三个度量:销售额、销售成本、利润。

图片6.png

二维数据模型

上图中数据模型可以把度量提升为一个单独的维度,如下所示:

图片7.png

度量提升为维度

上图中的数据模型在本质上是完全等同的,它们所包含的信息以及分析能力是一模一样的。一个多维模型可以将度量与普通维度互换,互换后的模型与原形态具有完全相同的分析能力。

图片8.png

度量与维度互换

还可以把一个普通维度变换为度量,将原Cube降维,将维后的Cube同样具有与原形态一样的分析能力。

图片9.png

降维

度量维和其他维度具有一些差别:

l 每个Cube只有一个独享的度量维度,而且度量维只能扮演一个维度角色。

l 度量维只有一个Hierarchy,并且Hierarchy下只能有一个Level。

除以上差异之外,度量维完全可以被视为一个普通维度。


Ø 概念九:Measure Member(度量成员)

度量成员的概念非常简单,就是度量维度下的成员。

图片10.png


Ø 概念十:Hierarchy Role(层级角色)与Level Role(级别角色)

在前文中已经讲过维度关联到Cube时一定带有角色信息,那么维度下的Member、Hierarchy、Level自然会继承这种角色属性。

l Dimension(维度) > Dimension Role(维度角色)

l Member(成员) > Member Role(成员角色)

l Hierarchy(层级) > Hierarchy Role(层级角色)

l Level(级别) > Level Role(级别角色)

 

实际应用

多维分析实战中结合博微易数即可进行自主可视化分析。博微易数涵盖绘制图表、制作看板两大模块。您可以选择打开某个应用,进入图表模块绘制图表,然后进入看板模块制作看板,完成自助式数据可视化分析报告。

多维联动分析:提供多样性图表选择,功能丰富,用户可根据自身需求任意改变维度及数值的组合,同时支持图表联动筛选,多层级数据维度下钻,帮助用户探究到数据更深层次的联系,作出更精准的决策。

1582105347310.gif

自定义拖拽布局:支持灵活的自由式布局,只需点击拖拽组装,即可实现页面自定义布局。可在看板任意位置插入图表等控件,自适应排版、自适应主流分辨率尺寸

1582103154312.gif