1、引言2021年 Elasticsearch 生態(tài)和技術(shù)峰會(huì)已完美閉幕,本次峰會(huì)可謂大咖云集,精彩紛呈。 本文僅就下午場(chǎng)技術(shù)部分做一下梳理、提煉、總結(jié),希望對(duì)沒有來得及參加線上技術(shù)峰會(huì)的廣大 Elastic 愛好者提供幫助。錯(cuò)過直播,但依然收獲技術(shù)干貨! 2、峰會(huì)技術(shù)關(guān)鍵詞詞云3、技術(shù)會(huì)議主題
4、基于流式計(jì)算平臺(tái)搭建實(shí)時(shí)分析應(yīng)用(吳斌)4.1 為什么要面向開源進(jìn)行架構(gòu)設(shè)計(jì)?
4.2 流式計(jì)算平臺(tái)架構(gòu)剖析如圖所示,流式計(jì)算平臺(tái)主要由分布式消息隊(duì)列、分布式計(jì)算引擎、數(shù)據(jù)引擎三部分構(gòu)成。 4.2.1 分布式消息隊(duì)列
4.2.2 分布式計(jì)算引擎
計(jì)算引擎核心任務(wù):
4.2.3 數(shù)據(jù)引擎
4.2.4 分布式存儲(chǔ)
1)數(shù)據(jù)來源(server Application):服務(wù)器日志、監(jiān)控、業(yè)務(wù)數(shù)據(jù)采集(如用戶行為、購(gòu)買記錄、社交記錄)。
4)拉取RDB業(yè)務(wù)維表與實(shí)時(shí)數(shù)據(jù)Join。 核心Tips: HBase + Elasticsearch 組合使用,以打車場(chǎng)景為例:
4.3 Elasticsearch 在流式平臺(tái)中的角色功能(1)文本檢索
(2)已知數(shù)據(jù)計(jì)算
(3)未知線索探索
4.4 云原生與k8s集群管理經(jīng)驗(yàn)分享(核心)
為 Elasticsearch 量身定制的網(wǎng)關(guān)產(chǎn)品——極限網(wǎng)關(guān) 極限網(wǎng)關(guān)特性:
4.5 相關(guān)資源
https://github.com/elasticsearch-cn/elastic-on-gke/
https://github.com/cloudymoma/raycom
http://gateway./ https://github.com/medcl/infini-gateway 5、Elasticsearch 基于 Pipeline 窗口函數(shù)實(shí)現(xiàn)實(shí)時(shí)聚合計(jì)算(李猛)5.1 Pipeline 實(shí)時(shí)計(jì)算模型pipeline 管道——輸入、處理、輸出。 類似:logstash 中的三個(gè)核心:input、filter、output。 現(xiàn)有流計(jì)算的問題:
現(xiàn)有流計(jì)算架構(gòu)問題總結(jié)如下:
現(xiàn)有產(chǎn)品架構(gòu)體系不夠簡(jiǎn)化,能不能不是三件套,而是單件套? 5.2 ES - Pipeline 實(shí)時(shí)計(jì)算能力
使用 Ingest pipeline 解決數(shù)據(jù)預(yù)處理問題。 前提:業(yè)務(wù)場(chǎng)景不復(fù)雜。 思考:Kafka、Flink 合并到用 Elasticsearch 實(shí)現(xiàn)。
Rollup 核心:基于時(shí)間維度實(shí)現(xiàn)數(shù)據(jù)轉(zhuǎn)換、壓縮、折疊。
Transform:自己定義腳本或者函數(shù)實(shí)現(xiàn)數(shù)據(jù)轉(zhuǎn)換。
聚合 + pipeline 二次聚合,可以將結(jié)果寫回到:索引。
5.3 ES + X實(shí)時(shí)計(jì)算暢想認(rèn)知前提:ES 具備一定的實(shí)時(shí)計(jì)算能力。
ALL in One(大白話意思:“Elasticsearch 一統(tǒng)江湖”)。 6、基于 Elasticsearch 的容器化編排實(shí)踐(白凡)6.1、為什么使用容器?
敏感業(yè)務(wù)數(shù)據(jù):物理機(jī)集群存儲(chǔ)。 6.2、容器化優(yōu)點(diǎn)
6.3、由代碼到上線的可追溯流程
使用了:
6.4、容器化中常見問題及解決方案
7、如何規(guī)劃和執(zhí)行威脅狩獵?(劉征)威脅狩獵本質(zhì):安全分析中高階、頂層威脅情報(bào)集成、管理工作。 7.1 安全問題無處不在
7.2 基于現(xiàn)有模塊構(gòu)建 Elastic 安全體系Elastic 內(nèi)置了監(jiān)測(cè)規(guī)則、監(jiān)測(cè)引擎、監(jiān)測(cè)告警等。
7.3 安全威脅建模四個(gè)步驟組成:
在 kibana SIEM 中創(chuàng)建監(jiān)測(cè)規(guī)則,形成基于 KQL的威脅探測(cè)規(guī)則。 7.4 安全狩獵核心步驟第一步:通過 beats 收集日志。
第二步:通過數(shù)據(jù)豐富提高威脅情報(bào)的質(zhì)量。
第三步:通過 Elastic SIEM 工具實(shí)現(xiàn)安全狩獵。
以上,人為對(duì)已知攻擊的分析、判斷。 可不可以對(duì)未知隱患發(fā)現(xiàn)?可以的,人工 + 機(jī)器學(xué)習(xí)實(shí)現(xiàn)。
7.5 推薦使用:MITRE ATTCK (內(nèi)置于:Elastic SIEM)的全方位防護(hù)。
上面一句話很簡(jiǎn)練,是為總結(jié)。 8、阿里云 Elasticsearch 云原生內(nèi)核建設(shè)之路(魏子珺)8.1 阿里云 Elasticsearch 內(nèi)核概覽8.1.1 阿里云Elasticsearch內(nèi)核優(yōu)勢(shì)阿里云內(nèi)核 VS 開源內(nèi)核:
8.1.2 阿里云 Elasticsearch 內(nèi)核需求
8.1.3 阿里云 Elasticsearch 內(nèi)核成果
8.2、云原生 Elasticsearch 如何定義?
8.3、云原生 Elasticsearch 內(nèi)核如何設(shè)計(jì)?8.3.1 熱節(jié)點(diǎn)計(jì)算存儲(chǔ)分離——分布式文件系統(tǒng)8.3.2 冷熱分離——冷節(jié)點(diǎn)對(duì)象存儲(chǔ)挑戰(zhàn)1:冷節(jié)點(diǎn)使用對(duì)象存儲(chǔ),只有http接口,無 POSIX 接口,需要 Lucene 底層適配。 挑戰(zhàn)2:?jiǎn)未蜪O的延時(shí)非常高。 挑戰(zhàn)3:無法使用操作系統(tǒng) pagecache 和預(yù)讀能力。 8.3.3 Serverless:讓用戶關(guān)心從集群下沉到索引。挑戰(zhàn)1:如何解決多租戶共享和平衡隔離問題。 挑戰(zhàn)2:如何實(shí)現(xiàn)與原生ES一致的體驗(yàn)。 挑戰(zhàn)3:如何評(píng)估索引的使用資源。 8.4 、阿里云云原生 Elasticsearch 實(shí)踐8.4.1 熱節(jié)點(diǎn)計(jì)算存儲(chǔ)分離
核心訴求:徹底彈性。不止是原生的動(dòng)態(tài)添加節(jié)點(diǎn)、動(dòng)態(tài)分片數(shù)據(jù)遷移。 核心需求:
徹底彈性的本質(zhì):分片的搬遷、副本的擴(kuò)充,底層數(shù)據(jù)都是不動(dòng)的,只需要調(diào)整的是 DataNode 到分片的映射。 熱節(jié)點(diǎn)計(jì)算存儲(chǔ)分離的本質(zhì)是:不再需要分片的副本保證數(shù)據(jù)的高可靠性(原生 ES 需要),而是借助:分布式文件系統(tǒng)保障數(shù)據(jù)的可靠性。 核心技術(shù)之一:內(nèi)存物理復(fù)制,實(shí)現(xiàn) replica 的近實(shí)時(shí)訪問。 核心技術(shù)之二:兩階段 io fence,主備切換數(shù)據(jù)一致性保證以及防止網(wǎng)絡(luò)異常時(shí)的數(shù)據(jù)多寫。
計(jì)算存儲(chǔ)分離優(yōu)勢(shì):
8.4.2 Serverless——Indexing service2021 年 2 月上線。
一句話概括Indexing Service 本質(zhì):寫入托管服務(wù),也就是說:針對(duì)時(shí)序、日志場(chǎng)景數(shù)據(jù),用戶無需再關(guān)系寫入細(xì)節(jié)、寫入優(yōu)化、運(yùn)維等操作,全權(quán)由阿里云托管搞定。 9、小結(jié)各位分享大咖的視頻都值得看,建議大家結(jié)合自己的業(yè)務(wù)場(chǎng)景去看。 更多細(xì)節(jié)內(nèi)容,推薦大家看視頻,視頻地址: https://developer.aliyun.com/topic/esanniv3rd?userCode=qzgc9fkf 推薦: 中國(guó)最大的 Elastic 非官方公眾號(hào) |
|
|