为了更好管理数据,出现数据湖DataLake:用来存储大量的原始数据。
当下最流行数据湖框架Apache Hudi,使用HDFS存储数据,集成Spark、Flink、Hive等分析数据,逐步在大中型公司中使用,构建湖仓一体化架构。
为了让大家更好学习使用Hudi,基于0.9.0版本,推出本套课程,从数据湖概念,到集成Spark和Flink,最后整合实际需求案例,由0到1深入浅出剖析Hudi使用。
还没有评论,快来发表第一个评论!
企业数据,大数据,数据仓库,业务系统,架构,数据基础设施,企业数据分析,数据简史,并行处理,非结构化数据,文本消歧,结构化数据,数据架构简史
1、大数据是什么2、数据的获取3、流式数据的处理4、交互式分析5、Spark的介绍6、Storm的介绍7、存储技术8、大数据的云化
【内容简介】但见诸善自刎,诸恶尽作!卜问天道,谓之人心叵测!或有肉骨煮食,饮鸩止渴!斥于人心,反谓天道失责!饿殍尸山堆作史河!挑捡入字,纂篇续个传说!我献祭人心...
数据库技术:关系型:PostgreSQL,MySQL,键值对:Redis,Geode,宽列:Cassandra,Hbase,文档:MongoDB,CouchDB...