+-
首页 专栏 hadoop 文章详情
eason 发布于 2 月 23 日
关注作者
关注作者

0
hive建模分析
建模分析
基于访客系统的案例来进行讨论建模分析目的
分析出整个数仓需要哪些层次,哪些表,哪些字段ODS层:源数据层
对接源数据,保持和源数据相同粒度DWD
任务:1.清洗。
不完整数据 过期或者无效数据2.转换
create_time->年月日 或时间戳 3.可以适当维度退化,减少表的关联DWM:中间层
进一步对明细层进行聚合,譬如可以将日的记录先合并,在后期记录月时可以更方便的合并DWS: 业务层
细化聚合统计,APP:应用层
对细化统计结果再次分析 可以省略DIM:维度层
放置维度表数据 hadoop hive
阅读 44 发布于 2 月 23 日
赞
收藏
分享
本作品系原创, 采用《署名-非商业性使用-禁止演绎 4.0 国际》许可协议
eason
每次选择.都是蜕变
62 声望
1 粉丝
0 条评论
得票 时间
提交评论
eason
每次选择.都是蜕变
62 声望
1 粉丝
宣传栏
目录
▲
建模分析
基于访客系统的案例来进行讨论建模分析目的
分析出整个数仓需要哪些层次,哪些表,哪些字段ODS层:源数据层
对接源数据,保持和源数据相同粒度DWD
任务:1.清洗。
不完整数据 过期或者无效数据2.转换
create_time->年月日 或时间戳 3.可以适当维度退化,减少表的关联DWM:中间层
进一步对明细层进行聚合,譬如可以将日的记录先合并,在后期记录月时可以更方便的合并DWS: 业务层
细化聚合统计,APP:应用层
对细化统计结果再次分析 可以省略DIM:维度层
放置维度表数据