楼主: CDA网校
830 0

[每天一个数据分析师] 维度表和事实表的含义是什么? [推广有奖]

管理员

已卖:189份资源

泰斗

3%

还不是VIP/贵宾

-

威望
3
论坛币
117882 个
通用积分
10152.1567
学术水平
278 点
热心指数
286 点
信用等级
253 点
经验
228030 点
帖子
6909
精华
19
在线时间
4373 小时
注册时间
2019-9-13
最后登录
2025-12-31

初级热心勋章

楼主
CDA网校 学生认证  发表于 2022-5-31 09:52:17 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

维度表和事实表,在构建企业级数据仓库时经常能见到。维度表被看成是用户用来分析一个事实的窗口,它里面的数据应该是对事实的各个方面描述,简而言之就是基础表,如:时间维度表,它里面的数据就是一些日,周,月,季,年,日期等数据,维度表只能是事实表的一个分析角度。

事实表则是通过各种维度和一些指标值得组合来确定一个事实的,简而言之就是交易表,如:通过时间维度,地域组织维度,指标值可以去确定在某时某地的一些指标值怎么样的事实。事实表的每一条数据都是几条维度表的数据和指标值交汇而得到的。

这两种表都是围绕主题来进行设计,事实表是用来存储主题的主干内容的。以日常的工作量为例,工作量可能具有如下属性:工作日期,人员,上班时长,加班时长,工作性质,是否外勤,工作内容,审核人。

那么什么才是主干内容?很容易看出上班时长,加班时长是主干,也就是工作量主题的基本内容,那么工作日期,人员,工作性质,是否外勤,工作内容是否为主干信息呢?

认真分析特征会发现,日期,人员,性质,是否外勤都是可以被分类的,例如日期有年-月-日的层次,人员也有上下级关系,外勤和正常上班也是两类上班考勤记录,而上班时长和加班时长则不具有此类意义。所以一般把能够分类的属性单独列出来,成为维度表,在事实表中维护事实与维度的引用关系。

维度表的冗余很大,主要是因为相对于事实表而言,维度表一般都不大,而维度表的冗余可以使事实表节省很多空间。事实表一般都很大,如果以普通方式查询的话,得到结果一般发的时间都不是我们可以接受的。所以它一般要进行一些特殊处理。另外,事实表一般是没有主键的,数据的质量完全由业务系统来把握。

总而言之,事实表就是你要关注的内容,维表就是你观察该事务的角度,是从哪个角度去观察这个内容的。例如,某地区商品的销量,是从地区这个角度观察商品销量的。事实表就是销量表,维表就是地区表。

      相关帖子DA内容精选

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据分析 机器学习 工作内容 免费数据 模型方法

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-1 08:56