数据湖介绍

数据湖简介

数据湖不但能存储传统类型数据,也能存储任意其他类型数据,并且能在它们之上做进一步的处理与分析, 产生最终输出供各类程序消费。

与数据仓库对比

特性 数据仓库 数据湖
数据 来自事务系统、运营数据库和业务线应用程序的关系数据 来自IOT设备、网站、移动应用程序、社交媒体和企业应用程序的非关系和关系数据
Schema 设计在数据仓库实施之前(写入型Schema) 写入在分析时(读取型Schema)
性价比 更快查询结果会带来较高的存储成本 更快查询结果秩序较低存储成本
数据质量 可作为重要事实依据的高度监管数据 任何可以或无法进行监管的数据(例如原始数据)
用户 业务分析师 数据科学家、数据开发人员和业务分析师(使用监管数据)
分析 批处理报告、BI和可视化 机器学习、预测分析、数据发现和分析

数据湖架构

如果想查看原图,请点击>>原图<<