大数据基本概念
2026年03月08日0 条评论
大数据基本概念
ETL
ETL,即Extract (抽取)、Transform (清洗转换)、Load (加载) 。
也就是将不同业务不同的类型的数据源进行抽取、整合并加载到存储中。
ETL模式
- 触发器模式
- 增量字段
- 全表同步
- 日志对比
ODS
ODS(Operational Data Store)即数据运营层,是接近数据源的一层,源数据经过ETL流程之后,转入本层,永久存放。
ODS数据基本特征:
- 面向主题的
- 集成的
- 可更新的
- 当前或接近当前的
数据来源:
- 业务库
- 埋点日志
- 消息队列
一般ODS格式是沿用源系统的规则。
DW
DW(Data Warehouse)即数据仓库存储,反映了历史变数据,用于支撑管理决策。
DW数据特征:
- 面向主题的
- 集成
- 不可修改
- 与时间相关的
细分为:
-
DWD (Data Warehouse Detail)
数据明细层
-
DWM (Data Warehouse Middle)
数据中间层
-
DWS (Data Warehouse Service)
数据服务层
DW和ODS的区别
如果把数据仓库系统比作人的大脑,DW是深度记忆区,ODS是浅度记忆区。当人接收外界的信息后,记忆在浅度区,经过温习或者某些深刻的印象,这些信息又都被记录到深度区中。
DIM
DIM (Dimension),即维度层,例如行业分类,地理省市等。
DM
DM (Data Market),即数据集市,没个数据集市面向不同的业务线或业务部门,为不同部门提供定制化需求。
整体流程如下:

References
- 文章:数据架构中的ODS层
评论 (0)
登录后即可发表评论
暂无评论,来发表第一条评论吧!
