bb平台体育app官网

在 Lakehouse 架构中安卓通用版

发布日期:2024-06-27 16:10    点击次数:87

湖仓架构(Lakehouse)当今在业界已得到越来越多的使用。Lakehouse 是由 Data Warehouse(数仓)和 Data Lake(数据湖)这两种数据架构的交融,同期兼具二者的上风而变成我方独到的优点。基于 Lakehouse,咱们不仅不错对结构化的数据,也不错对非结构化数据或半结构化数据进行长入存储。同期,基于 Lakehouse 盛开的数据架构上风,使 Lakehouse 的数据湖存储可和业界主流的大数据谋略范式(如流谋略、批谋略、OLAP 分析)进行较好的集成和交融,同期也能兼容常见的机器学习和 AI 的谋略模子。

因此,基于Lakehouse 不错杀青大数据和 AI 一体化的分析智商,同期 Lakehouse 也为用户提供极致的性价比和用户体验,越来越多的开拓者和企业用户运转尝试基于 Lakehouse 架构进行数据分析。跟着 Lakehouse 新的数据分析架构的逐渐落地,和在九行八业的提高之后,开拓者和用户对 Lakehouse 也淡薄了越来越多的要乞降更高的诉求。其中一项相配伏击的一个诉求等于如安在 Lakehouse 湖仓的架构上进行实时化大数据分析。如若在数据架构上就行实时数据分析,至少要具备两个要求/基本成分。第一,需要有一套简略进行实时数据分析的谋略引擎。第二,要具备一套简略复古数据实时更新、实时流动的数据结构/数据步调。

赫然,在 Lakehouse 架构中,在实时谋略鸿沟是具备了要求的。因为咱们业界较流行的流谋略 Flink,还有常见 Presto 等实时 OLAP 分析引擎皆可对数据进行实时管制和分析。但反不雅在 Lakehouse 数据湖鸿沟的存储时刻上头是相比穷乏实时更新的智商。当今业界相比主流的三款数据湖步调是 Iceberg 、Hudi、Delta Lake 等,皆是面向批量管制设想的数据湖步调,其数据结构自然关于实时更新智商来说是不及的,是有一些瓶颈的。

开首:阿里云(王峰)

免责声明:咱们尊重学问产权、数据狡饰,只作念本体的相聚、整理及共享,呈报本体开首于相聚,呈报版权归原撰写发布机构总计,通过公开正当渠谈赢得,如波及侵权安卓通用版,请实时干系咱们删除,如对呈报本体存疑,请与撰写、发布机构干系

Hudi湖仓数据架构Lake发布于:广东省声明:该文不雅点仅代表作家本东谈主,搜狐号系信息发布平台,搜狐仅提供信息存储空间作事。

栏目分类



Powered by bb平台体育app官网 @2013-2022 RSS地图 HTML地图