数据湖介绍
数据湖简介
数据湖不但能存储传统类型数据,也能存储任意其他类型数据,并且能在它们之上做进一步的处理与分析, 产生最终输出供各类程序消费。
与数据仓库对比
特性 | 数据仓库 | 数据湖 |
数据 | 来自事务系统、运营数据库和业务线应用程序的关系数据 | 来自IOT设备、网站、移动应用程序、社交媒体和企业应用程序的非关系和关系数据 |
Schema | 设计在数据仓库实施之前(写入型Schema) | 写入在分析时(读取型Schema) |
性价比 | 更快查询结果会带来较高的存储成本 | 更快查询结果秩序较低存储成本 |
数据质量 | 可作为重要事实依据的高度监管数据 | 任何可以或无法进行监管的数据(例如原始数据) |
用户 | 业务分析师 | 数据科学家、数据开发人员和业务分析师(使用监管数据) |
分析 | 批处理报告、BI和可视化 | 机器学习、预测分析、数据发现和分析 |
数据湖架构

如果想查看原图,请点击>>原图<<