数据湖是一种在系统或存储库中以自然格式存储数据的方法,它有助于以各种
模式和结构形式配置数据,通常是对象块或文件。湖中的数据包括结构化数据
从关系数据库(行和列),半结构化数据(CSV、XML、JSON的日志),非
结构化数据(电子邮件,文档,PDF)和二进制数据(图像、音频、视频)从
而形成一个集中式数据存储容纳所有形式的数据。
数据湖是一种在系统或存储库中以自然格式存储数据的方法,它有助于以各种
模式和结构形式配置数据,通常是对象块或文件。湖中的数据包括结构化数据
从关系数据库(行和列),半结构化数据(CSV、XML、JSON的日志),非
结构化数据(电子邮件,文档,PDF)和二进制数据(图像、音频、视频)从
而形成一个集中式数据存储容纳所有形式的数据。