小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

Kylin 新定位:分析型數(shù)據(jù)倉庫

 python_lover 2022-04-05

親愛的各位社區(qū)朋友:

 

Apache Kylin 在 2014 年 10 月開源并加入 Apache 軟件基金會(huì)的孵化器,一年后從孵化器畢業(yè)成為 Apache 頂級(jí)項(xiàng)目。從第一天起,Kylin 的標(biāo)語是「Extreme OLAP Engine for Big Data」。五年來,Kylin 已經(jīng)成為了大數(shù)據(jù)版圖中一個(gè)不可或缺的角色,幫助了全球上千家企業(yè)進(jìn)行高效的大數(shù)據(jù)分析。

 

經(jīng)過五年的發(fā)展,如今回頭看,我們發(fā)現(xiàn) Kylin 已經(jīng)不僅僅是一個(gè) OLAP 分析引擎。它的完整能力已經(jīng)被被廣大社區(qū)用戶證實(shí)超越了「OLAP Engine」的范疇,被廣泛應(yīng)用于不同的場(chǎng)景,扮演更加全面的角色:

  1. 當(dāng)年 eBay 發(fā)起 Kylin 項(xiàng)目時(shí),寄希望它能夠?qū)⒉糠重?fù)載從昂貴的專有商業(yè)數(shù)據(jù)倉庫如 Teradata 遷移到廉價(jià)、開放的大數(shù)據(jù)平臺(tái)上。五年過去了,Kylin 憑借高性能和高可用性在 eBay 內(nèi)部被廣泛使用,而 Teradata 逐步被替換。今天,Kylin 在 eBay 每天服務(wù)數(shù)百萬次查詢,且大多數(shù)查詢?cè)?1 秒鐘內(nèi)完成。
  2. 美團(tuán)、攜程、京東、滴滴、小米、華為、丁香園,OLX 集團(tuán)、汽車之家、Xactly 等許多公司都使用 Kylin 打造了他們的 DaaS(數(shù)據(jù)即服務(wù))平臺(tái),為成千上萬的分析師和租戶提供數(shù)據(jù)服務(wù)。
  3. 一些微軟 SSAS 的用戶也正在逐步遷移到 Kylin 上,以承載更大的數(shù)據(jù)容量和獲得更好的體驗(yàn)。
  4. 中國(guó)銀聯(lián)和某頭部保險(xiǎn)集團(tuán)從 IBM Cognos 架構(gòu)升級(jí)到 Hadoop + Kylin。因?yàn)榉植际郊軜?gòu)的優(yōu)勢(shì),Kylin 對(duì)傳統(tǒng)方案具備降維打擊的能力,在某些場(chǎng)景中,一個(gè) Kylin Cube 取代了數(shù)百個(gè) Cognos Cube,不但管理運(yùn)維的復(fù)雜度大大降低,并且具有更好的構(gòu)建性能和查詢性能。
  5. 建設(shè)銀行、農(nóng)業(yè)銀行等已經(jīng)使用 Kylin + Hadoop 來構(gòu)建下一代大數(shù)據(jù)分析平臺(tái),解決擴(kuò)容難和并發(fā)低的難題。

 

從這些用戶案例可以看出,社區(qū)用戶們不僅僅把 Kylin 當(dāng)作功能單一的引擎使用,而是使用 Kylin 來替換傳統(tǒng)分析型數(shù)據(jù)倉庫的工作。下面我們就來看一下什么是數(shù)據(jù)倉庫吧。

 

數(shù)據(jù)倉庫的定義有很多,下面是一個(gè)廣泛被接納的定義【1】:A data warehouse is a subject-oriented, integrated, time-variant and non-volatile collection of data in support of management’s decision-making process.

 

翻譯一下就是:數(shù)據(jù)倉庫是面向主題的、集成的、體現(xiàn)時(shí)間變化的,以及非易變的一組數(shù)據(jù)集合,以支持管理者做出關(guān)鍵決策。

 

對(duì)照到 Kylin 的能力:

  1. 在 Kylin 中,你可以為每個(gè)分析主題或場(chǎng)景,創(chuàng)建一個(gè)或多個(gè)OLAP Cube;每個(gè) Cube 都是面向特定主題的。
  2. Kylin 與 Hadoop、 Hive、Spark、Kafka 等系統(tǒng)實(shí)現(xiàn)了無縫集成,你可以在大數(shù)據(jù)平臺(tái)上很容易地使用它。這也是為什么 Kylin 很容易被接納的原因之一。
  3. Kylin會(huì)按照時(shí)間來分區(qū)加載數(shù)據(jù),構(gòu)建 Cube,然后保存為片段(也稱分區(qū));對(duì)于維度表,Kylin 每次會(huì)生成快照。這些數(shù)據(jù)在分析過程中是穩(wěn)定的,不會(huì)隨意改變。
  4. 當(dāng)你在分析(上滾、下鉆等)過程中,Kylin 的數(shù)據(jù)是穩(wěn)定一致的,所有層級(jí)的匯總結(jié)果都嚴(yán)格一致。
  5. Kylin 提供了 SQL 查詢接口和 JDBC/ODBC/HTTP API,用戶將其與 BI/可視化工具(如 Tableau 等)輕松連接。

從這里可以看出,Kylin 的實(shí)現(xiàn),與數(shù)據(jù)倉庫的關(guān)鍵特性不謀而合。事實(shí)上,當(dāng)初設(shè)計(jì) Kylin 的時(shí)候,團(tuán)隊(duì)也是受了數(shù)據(jù)倉庫概念非常大的影響。

 

Architecture of Apache Kylin

經(jīng)過社區(qū)開發(fā)者們的不斷努力,如今 Kylin 不再只是一個(gè)加速器,它提供了豐富完整的能力:友好的 Web 界面,向?qū)降脑O(shè)計(jì)器,自動(dòng)化的任務(wù)生成和數(shù)據(jù)加載,高性能的查詢和存儲(chǔ)引擎,完善的 API 接口,完整的用戶權(quán)限和安全控制等,結(jié)合 Hadoop 的分布式存儲(chǔ)和計(jì)算框架,它已經(jīng)足以構(gòu)成一個(gè)完整的分析型數(shù)據(jù)倉庫方案。在開源大數(shù)據(jù)技術(shù)中,Kylin 是獨(dú)一無二的,融合了傳統(tǒng)數(shù)據(jù)倉庫的經(jīng)典理論和大數(shù)據(jù)的前沿技術(shù);它設(shè)計(jì)優(yōu)雅,架構(gòu)可擴(kuò)展可插拔,能夠適應(yīng)從 GB 到 PB 甚至 EB 規(guī)模的數(shù)據(jù)。

 

2020 年 3 月,Kylin 社區(qū)通過討論,決定將 Kylin 的標(biāo)語從「Extreme OLAP Engine for Big Data」更改為 「Analytical Data Warehouse for Big Data」【2】,以更加準(zhǔn)確地描述 Kylin 的能力和定位,也更容易地讓用戶通過搜索引擎檢索到它,將它推介給更多用戶,應(yīng)用于更多場(chǎng)景中。

 

一路走來,感謝各位的貢獻(xiàn)與支持,下一個(gè)五年,期待有更多創(chuàng)新!

 

史少鋒

Apache Kylin PMC Chair 

 

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多