久久精品国产精品青草色艺_www.一区_国内精品免费久久久久妲己_免费的性爱视频

猿輔導xDorisDB:構建統一OLAP平臺,全面升級數據分析能力?

猿輔導公司的數據中臺部門為猿輔導、斑馬、猿編程、小猿搜題、猿題庫、南瓜科學等各個業務線的產品、運營、研發提供標準化的數據集(OneData)和統一數據服務(OneService)。OLAP平臺作為數據中臺的核心部分,為各業務線提供統一標準化、可再利用、可靠的數據服務,支持各業務線人員快速靈活的查詢和分析,是連接前臺和后臺的橋梁。

引進性能強的下一代MPP數據庫:DorisDB,構建OLAP平臺。基于DorisDB,統一了實時數據分析和離線數據分析。目前,DorisDB有三個集群,每天百萬級有效查詢請求,p99延遲1s,用于廣告投放渠道轉換、用戶訂單和更新、直播質量監測等多個數據場景,支持各業務線更快、更靈活的查詢和分析

一、平臺選擇的業務背景

1.業務特點和需求

猴子指導作為網絡教育行業課程的領先品牌,每天生成大量的數據,為了實現科技輔助教育,重視數據在公司發展中發揮的作用

在網絡教育數據系統中,不僅要重視用戶的活躍、訂單收入,還要重視渠道的轉換率和用戶的持續率。這些指標有不同的維度和不同的計算口徑和多樣化的業務系統訪問模式,給OneService的基礎設計帶來了挑戰。另一方面,數據的時效性需求逐漸增強,離線top1的數據越來越不能滿足驅動業務的需求,數據的實時化也成為不可逆轉的行業發展趨勢。

在這樣的背景下,我們的OLAP平臺需要支持實時和離線數據的填寫,支持不同時效的查詢需求,支持復雜多樣的數據查詢邏輯,滿足各種業務場景的數據分析需求

2.對OLAP發動機的需求

總結起來,我們對OLAP的需求大致包括以下幾點:

數據查詢延遲到秒級/毫秒級的

同時有效地支持寬度表和多表join查詢,支持復雜的查詢場景

需要支持高并發查詢場景

同時支持流動數據和批準數據的攝入,支持實時/離線數據ETL任務

支持標準化SQ化,大大降低用戶的使用成本。

3.技術選型與優缺點對比

OLAP是基于數據倉庫多維模型實現的各種操作集合,強調數據分析性能和SQL執行時間。

今天,各種OLAP數據引擎可以說是百花齊放,分為MOLAPMulti-dimensionalOLAP)、ROLAPRelationaloLAP)和HOLAP(HybridoLAP)三種。

(1)MOLAP引擎的代表是Druid、Kylin等,本質上是通過空間和預算更換在線查詢時間。在數據寫入時生成預聚合數據,這樣查詢的時候命中的就是預聚合的數據而非明細數據,從而大幅提高查詢效率,在一些固定查詢模式的場景中,這種效率提升可謂非常明顯。但是他的缺點也來自于這種預聚合模型,因為它極大的限制了數據模型的靈活性,比如在數據維度變化時的數據重建成本非常高,而且明細數據也丟失了。

(2)ROLAP發動機的代表Presto、Impala、GreenPlum、Clickhouse等,與MOLAP的不同之處在于,ROLAP在收到查詢請求時,首先將query分析為查詢計劃,執行查詢算子,根據原始數據進行sum、groupby等各種計算該模型的發動機優點是靈活性好,但大查詢/復雜查詢性能不穩定,同時可能引起冗馀的重復計算,消耗更多資源。

(3)HOLAP引擎是MOLAP和ROLAP的融合體,對于聚合數據的查詢要求,使用與MOLAP相似的預算數據模型。在明細數據和未預收集的數據場景中使用ROLAP的計算方式,比較資源和計算能力,即使沒有明確的場景要求,也能實現最佳化的查詢性能,適應性更好。在這方面制作的比較好的系統主要有DorisDB。

在團隊的小伙伴們一系列調研和論證之后,首先排除了無法提供低延遲查詢性能的引擎,比如Presto等,其次我們同時需要兼顧復雜業務場景支持能力,易用性和生產運維成本最低化,因此在這些維度上對比了Druid、ClickHouse、Kylin和DorisDB。

DorisDB作為MPP架構的HOLAP引擎,保證了數據模型的靈活性和查詢性能,Rollup和物化視圖功能使用了MOLAP引擎的預算思想,在一些場景中通過空間交換時間的方式大大提高了數據查詢效率。最終選擇DorisDB是因為DorisDB的查詢性能很強,與MySQL協議的兼容性大幅度降低了用戶的使用閾值,另一方面,在高并發和高吞吐量的不同場表現出良好的適用性,與數據中臺流一體化的OneService的發展構想不一致。

二、應用場景

我們根據DorisDB搭建了實時和線下統一的OLAP平臺,互動查詢和BI報表應用在數據中臺的應用層發揮了巨大作用,為各業務線主管/產品運營同學的運營戰略、廣告投放戰略等提供了可靠的支持。

基于DorisDB,我們構建的新數據結構如下:

以下簡要介紹一些典型的應用場景:

1.實時直播質量監測

我們使用DorisDB在直播質量分析相關系統中提供支持。這部分是直播引擎開發同事關心的指標,直接關系到直播課的服務質量,一般是分級/亞分級的時效性要求。場景包括網絡質量、宏觀丟失率、高峰時段使用率、音頻視頻使用率等。

2.線下數據互動查詢和BI報表

在數據架構升級前,線下top1數據最終落地到MySQL進行互動查詢和BI報表展示,查詢的Query多為單表查詢,維度組合靈活。但隨著業務增長和數據規模的擴大,MySQL的查詢性能逐漸成為瓶頸,不能支持多維數據的查詢場景,同時運輸成本也越來越重。

在結構升級過程中,引進了DorisDB計算引擎作為BI數據的落地層。由于DorisDB兼容MySQL協議,數據應用層可以直接通過JDBC連接,因此在搬移過程中幾乎沒有成本,數據攝入和查詢效率從數倍提高到數百倍,為各業務線主管/產品運營同學提供了可靠的決策支持。

3.準實時用戶訂單和更新數據

我們在訂單/更新等核心數據場景中,TT1的離線數據不能為業務提供最有力的決策支持,需要當天的數據場景和報告需求這里的主要挑戰是

跨隊合作、跨源、跨庫數據場景。

數據有時效性要求,查詢響應快。

對在線業務沒有侵入性,屏蔽影響。

我們的解決辦法是引進Hive歷史庫存數據,通過flinkSQL實時輸入DorisDB,優化不使用的業務需求場景的表結構設計和查詢。

4.實時推進投入戰略

廣告投入類的效果數據需要分級或更高的時效性要求。因為數據的變化可能會直接影響投入效果的評價和投入戰略的變化。

我們同樣用flinkSQL訂閱業務DB的binlog,最終落地到DorisDB,作為BI報表和業務系統的統一數據產出口徑。

三、實踐經驗

集體監視

目前我們關注的核心集體監視指標是

FE節點失去聯系

BE節點失去聯系

BE磁盤壞盤

BE的CPU平均使用率過高

FE電腦存儲水平過高

BE節點失去聯系

BE磁盤壞盤

BE的CPU平均使用率過高

FE電腦存儲水平過高

基于QE電腦存儲水平的監視水平的監視主要是

(1)FlinkConnector

我們現在的實時攝取任務大部分都是通過Flink實現的。我們基于Stream Load實現了flink connector,線上使用性能良好,數據批次的時效性一般控制在分鐘/半分鐘級別。

(2<愛尬聊_頭條百科>)離線數據攝入

對于離線數據的攝入,基本是T 1的時效,在凌晨調度中完成。

我們主要是使用Stream Load和Broker Load兩種方式,我們在倉庫ETL調度框架中對于兩種Load分別進行了封裝,區別是:

數據量不大/需要加工計算的,先落地本地磁盤文件,然后通過Stream Load導入DorisDB

數據量較大的,先寫入Hive臨時表,然后Broker Load導入DorisDB

(3)Presto DorisDB Catalog

我們使用Presto查詢DorisDB的時候主要是針對于一些需要跨源查詢的場景,比如DorisDB中的實時同步數據與Hive中的歷史數據通過一定條件join并最終產出小時級的數據報表。

這里遇到的問題是Presto原生的MySQLCatalog不能讀DorisDB元數據,主要原因是information_schema中元數據的類型和Presto數據的類型需要適應,我們最終通過重新實現的Presto推薦DorisDBCatalog來解決。

(4)DorisDB審計平臺

另外我們也打造了DorisDB DDL工單審計平臺,幫助用戶能夠更好的建立正確的表結構。

審計平臺會監控大查詢和慢查詢,這些對集群性能影響較大的查詢,通過告警機器人的方式通知到用戶,督促大家去做查詢的優化。

3.基于審計日志數據治理

之前常見遇到的一個問題是:BE CPU被吃光了/磁盤IO打滿

不同的case都可能導致這個現象:

某一個大查詢scan數據量太多、耗時較長直接吃掉所有io

表buckets過多導致scan所有盤

大查詢頻繁提交等

這類問題排查起來較為困難,除了手動殺掉查詢,好像沒什么好的處理辦法。另一方面大量的導入操作(compaction)是否也會造成cpu和io的壓力。

目前的解決方案就是通過審計日志和BE服務日志來監控查詢和寫入,對于有問題的請求及時處理避免對集群性能影響的進一步擴大。

我們通過filebeat收集fe.audit.log日志,最終導入ES,根據ES進行query的分析和監視。

現在的監視主要是大的查詢和慢的查詢,這些對集團性能有很大影響的查詢,通過警告機器人通知用戶,促進了查詢的最佳化。并實現了大查詢/慢查詢的告警,監控和明細分析。

四、未來展望和規劃

1.應用場景

后續我們計劃基于DorisDB做更多的場景實踐探索:

基于Bitmap的多維分析/BI自助工具

通用事件分析平臺(支持明細 聚合)

2.運維建設

在組件運維層面的工作包括:自動化運維,建設回歸測試框架、自動化集群擴縮容腳本、自動化集群升級腳本等,降低人工操作成本。

3.平臺的普及

在數據中臺的平臺化建設中,DorisDB的參與也是必不可少的。

技術共享、最佳實踐和用戶培訓

統一元數據平臺,通過不同發動機的DDL、權限/租戶管理等功能

用戶自助BI工具,屏蔽發動機細節,用戶簡單操作的可視化報告平臺。

通過引入DorisDB計算引擎,我們實現了流量數據、批量數據融合的一站式數據存儲和查詢引擎,提供語義一致、易于使用的數據服務。DorisDB為猿輔導數據中臺的標準化數據集和統一數據平臺服務能力奠定了堅實的基礎,支持各業務線更快、更靈活的查詢和分析,全面提高數據分析能力,為未來數據平臺化建設提供了更多可能性。

最后,感謝DorisDB鼎石科技團隊的專業支持服務,希望能一起更好地建設DorisDB。(作者:申陽猿指導數據中臺,大數據開發工程師)

編輯 舉報 2022-11-17 16:42

0個評論

暫無評論...
驗證碼 換一張
久久精品国产精品青草色艺_www.一区_国内精品免费久久久久妲己_免费的性爱视频

      久久久久国产精品免费免费搜索| 99综合电影在线视频| 欧美成人aa大片| 欧美mv和日韩mv国产网站| 色狠狠综合天天综合综合| 成人黄页在线观看| 成人国产免费视频| 岛国精品在线播放| 91视频国产观看| 色素色在线综合| 欧美精品丝袜中出| 欧美军同video69gay| 欧美一区二区三区四区在线观看| 欧美日韩三级视频| 欧美一区二区三区免费在线看| 欧美区在线观看| 欧美xxxxxxxxx| 亚洲国产精品ⅴa在线观看| 国产欧美一区二区精品婷婷 | 亚洲国产精品成人综合色在线婷婷 | 久久不见久久见免费视频7| 日韩专区在线视频| 国产专区综合网| aaa国产一区| 在线电影院国产精品| 欧美精品一区二区三区高清aⅴ| 777a∨成人精品桃花网| 久久夜色精品国产欧美乱极品| 国产视频911| 亚洲香肠在线观看| 精品制服美女丁香| 日本乱人伦aⅴ精品| 日韩精品影音先锋| 亚洲欧美日韩在线不卡| 天天操天天干天天综合网| 国产在线国偷精品免费看| 91麻豆成人久久精品二区三区| 欧美一区二区免费| 1024成人网| 精品一二三四区| 欧美系列一区二区| 国产日韩欧美高清| 日韩国产欧美在线视频| www.亚洲人| 欧美一级日韩一级| 亚洲精品久久7777| 国产成人免费在线观看| 欧美福利视频一区| 亚洲丝袜美腿综合| 国产精品一区二区在线看| 欧美日韩亚洲综合在线| 国产精品久久午夜| 国产综合久久久久久鬼色| 欧美日韩一区中文字幕| 国产精品久久久久久亚洲毛片| 蜜桃免费网站一区二区三区| 色天使久久综合网天天| 国产视频一区二区在线| 日韩高清一区在线| 欧美性猛交一区二区三区精品| 中文字幕巨乱亚洲| 国产伦精一区二区三区| 欧美一三区三区四区免费在线看| 伊人开心综合网| 91在线视频在线| 国产精品伦一区二区三级视频| 激情小说欧美图片| 综合婷婷亚洲小说| 国产精品主播直播| 2020日本不卡一区二区视频| 日韩精彩视频在线观看| 欧美午夜寂寞影院| 亚洲精品高清在线观看| av成人动漫在线观看| 国产色产综合色产在线视频| 国产一区在线观看麻豆| 日韩女优视频免费观看| 蜜桃av一区二区在线观看 | 日韩欧美亚洲国产精品字幕久久久| 亚洲综合久久久久| 色视频欧美一区二区三区| 自拍视频在线观看一区二区| 成人亚洲一区二区一| 欧美激情一区在线观看| 成人sese在线| 一区二区三区视频在线观看| 91精品福利视频| 亚洲成a人片综合在线| 欧美乱妇23p| 青青草国产成人av片免费| 精品剧情v国产在线观看在线| 经典三级视频一区| 中文字幕乱码亚洲精品一区| 成人av在线一区二区| 怡红院av一区二区三区| 欧美情侣在线播放| 精品一二三四在线| 国产精品久久久久久久裸模 | 色婷婷激情一区二区三区| 一区二区三区在线不卡| 欧美精品九九99久久| 秋霞午夜鲁丝一区二区老狼| 2021国产精品久久精品| 成人免费毛片aaaaa**| 亚洲男同性恋视频| 欧美一区二区精品在线| 国产大陆精品国产| 亚洲综合色自拍一区| 欧美一区二区免费观在线| 国产高清精品久久久久| 亚洲免费在线视频| 欧美变态口味重另类| 波多野结衣中文字幕一区| 亚洲一区二区三区自拍| 欧美一区二区成人6969| 国产成人av影院| 偷拍自拍另类欧美| 国产日韩欧美激情| 欧洲亚洲国产日韩| 精品一区二区免费| 亚洲一区二区三区四区中文字幕 | 国产一区二区三区美女| 亚洲婷婷综合久久一本伊一区| 欧美三区在线观看| 国产成人亚洲精品狼色在线| 国产成人三级在线观看| 亚洲五月六月丁香激情| 国产欧美日本一区二区三区| 欧美日韩一区久久| 北条麻妃国产九九精品视频| 日本不卡不码高清免费观看| 亚洲欧洲精品成人久久奇米网| 欧美成人一级视频| 欧美日韩和欧美的一区二区| 福利视频网站一区二区三区| 亚洲成人激情社区| 亚洲人成在线播放网站岛国| 久久中文字幕电影| 欧美一区二区三区视频在线观看| 99精品黄色片免费大全| 国产一区日韩二区欧美三区| 香蕉久久夜色精品国产使用方法 | 亚洲欧美电影一区二区| 精品久久久久香蕉网| 欧美日韩亚洲国产综合| 99国产精品国产精品毛片| 国产一区二区在线影院| 日韩影院在线观看| 亚洲成人av一区| 亚洲伊人色欲综合网| 亚洲欧美日韩在线不卡| 国产精品久久久久aaaa| 国产日韩在线不卡| 久久久久9999亚洲精品| 精品成人佐山爱一区二区| 日韩欧美一级片| 日韩一二三四区| 91精品国产一区二区人妖| 色视频欧美一区二区三区| 99精品视频一区二区| 成人av网址在线观看| 不卡一卡二卡三乱码免费网站| 国产成人一级电影| 成人激情小说网站| 成人短视频下载| 91免费看片在线观看| 99国产欧美另类久久久精品| 成人晚上爱看视频| 99riav一区二区三区| 99久久精品国产导航| 色综合天天天天做夜夜夜夜做| 成人激情午夜影院| 91免费视频网址| 91蜜桃婷婷狠狠久久综合9色| 91蜜桃网址入口| 欧美色图激情小说| 日韩欧美中文一区二区| 久久综合网色—综合色88| 久久久不卡网国产精品二区| 国产日韩欧美麻豆| 亚洲视频在线观看一区| 亚洲图片欧美一区| 日本aⅴ免费视频一区二区三区| 亚洲人妖av一区二区| 国产偷v国产偷v亚洲高清| 久久久久久久一区| 国产欧美一区二区精品秋霞影院| 久久精品网站免费观看| 国产欧美精品在线观看| 国产精品人成在线观看免费| ...中文天堂在线一区| 亚洲激情第一区| 亚洲成人av一区二区| 蜜桃视频一区二区三区在线观看 | 久久99久国产精品黄毛片色诱| 国产伦理精品不卡| 色成人在线视频| 91精品国产综合久久香蕉麻豆| 久久久青草青青国产亚洲免观| 国产午夜精品理论片a级大结局|