从时间的角度讲:简单说粒度就是事实表里测量值的测量‘频率’。比如说,销售库里的销售额,可以是一天一个值,也可以是一个月一个值,甚至一年一个值,这就是相对于时间维度表的力度;可以是一个商品一个值,也可以是一类商品一个值,这就是相对于商品的粒度。
用CSDN上阿泰的说法:
粒度就是同一维度下,数据的粗细程度,
考虑到时间维度在数据仓库中相对比较特殊,另外举个例子。
以“组织结构”为例,比如我们的一个层级结构式:总公司,分公司,部门,科室。
这就是不同的粒度级别。
实际应用中,比如有人问,你的某个报表粒度是怎样的。
我们可以说,组织结构我们的报表呈现是到分公司级别的,但是我们的数据粒度是到科室的(也就是你的事实表中,层级聚合到科室级别)。
所以我们就也能支持到之上的“粗”粒度,如总公司,分公司,及部门
如果我们的数据粒度是到分公司的,那明显我们的报表就不能支持下级粒度的数据展现。
也就是说,粒度不够“细”。
当然,粒度的也不是越细越好,要综合分析。
比如如果我们这一层级的需求,都是针对于分公司级别的,不需要往其下级部门的深化。那么粒度就到分公司即可。
毕竟粒度越细,事实表的数据量也会越大。
总结一下:
可以将数据看成是有粘性的沙粒,粒度小的沙粒比较细,粒度大的沙粒是由粒度小的沙粒粘起来的,即粒度高的数据是由粒度低的数据综合起来的.在数据仓库环境中,粒度是一个重要的设计问题,他影响到数据仓库的数据量和系统能回答的查询类型,粒度越小,细节程度越高,能回答查询就越多,但是存储的东西也就越多.