精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

WeOLAP:微信 OLAP 湖倉新場景優化實踐

大數據 數據湖
ClickHouse 在微信團隊有著廣泛應用,如實時報表、AB 實驗和實時計算等,通過將 Hadoop 相關生態集成到 ClickHouse 中,性能得到了十倍到百倍的提升,能夠做到萬億級數倉、亞秒級響應和穩定高可用。

 ClickHouse 在微信有著廣泛應用,如何保障其自身查詢性能,并能在新場景中結合應用成為了關鍵問題。基于該背景,開發團隊首先針對ClickHouse 的性能問題,開發了相應的性能觀測工具,并在數據查詢、策略實驗等場景針對性進行了湖倉讀取、bitmap 計算等方面的探索優化,最后將 ClickHouse 在 AI 場景進行落地應用,沉淀了融合 OLAP 能力的成熟數據管線。

一、ClickHouse 在微信的應用

1. ClickHouse 在微信的應用

ClickHouse 在微信團隊有著廣泛應用,如實時報表、AB 實驗和實時計算等,通過將 Hadoop 相關生態集成到 ClickHouse 中,性能得到了十倍到百倍的提升,能夠做到萬億級數倉、亞秒級響應和穩定高可用。

圖片

ClickHouse 在微信的集群規模有數千臺,Top50 響應時長約 0.34 秒,平均響應時長為 4 秒,查詢量級為每天百萬級。當前的主要版本是基于社區的 22.8,少量版本對應社區 23.3。

圖片

2. 新場景應用

過去一年我們探索了 ClickHouse 的一些新的應用場景。在湖倉讀取方面,基于 Iceberg/Hive 進行讀取和湖上數據加工,來緩解數據孤島問題;在實驗新場景上,進行畫像分析、人群圈選,支撐實時可見的在線實驗系統;另外,也與 AI 進行結合,通過成熟的 OLAP 數據管線為近/離線模型推理進行提效。

圖片

二、ClickHouse 的性能觀察工具

作為一個用戶,需要感知查詢的資源消耗;作為一個運維同學,需要知道如何優化集群負載;作為一個開發同學,需要快速定位慢查詢的原因。這些都離不開性能觀察工具。ClickHouse 提供了一系列便捷的性能觀測工具,如 Query Log、Query Thread Log、Sampling Query Profiler 和 Flame Graph 等。

圖片

首先是最常用的 Query Log 和 Query Thread Log,通過查詢的 query id,可以對這條查詢性能進行觀察分析。我們還可以在代碼中增加自定義的 Profile Event,方便定制一些觀測指標。

圖片

第二個是 Sampling Query Profiler 和 ClickHouse Flame Graph,通過可視化的火焰圖能夠直觀地對內存和 CPU 進行分析,在 CH 可以對指定查詢進行 profile,支持的最細粒度為 query 級別。它有一個缺點,會將一個查詢涉及到的多個線程匯聚到一起,導致無法對單個線程的情況進行分析。我們針對這個問題也做了改進優化,使它能支持線程級的單個展示和查詢聚合。

圖片

第三個是 Processors Profile Log,它可以幫助我們清晰地看到每個算子的耗時,判斷算子間是否均衡、是否存在傾斜情況,也可以幫助我們看到算子間的依賴關系。

圖片

WeOLAP 團隊還自研了性能分析工具 Profile Engine,從事前和事后兩個場景進行優化。在事前對用戶提交的 SQL 結合集群信息和表信息進行分析,并基于索引、分區等給出相應可視化改進建議;在事后基于制定的規則對大查詢和慢查詢進行分析,給出優化建議。通過這個工具,既可以給使用者提出優化建議,也可以幫助使用者平衡集群負載。該工具上線后的使用效果很不錯。

圖片

三、湖倉讀取優化

ClickHouse 在湖倉鏈路中既是存儲組件又是計算組件,跨層的存在會導致一些問題:

  • ClickHouse 中的數據有孤島化傾向,不能被 Spark、Presto 等引擎查詢。
  • 數據冗余,Shared-nothing 帶來昂貴的機器成本。
  • 繁瑣的數據 ETL。

我們的改進目標是讓 ClickHouse 作為計算組件,直接讀取湖倉數據。

圖片

其中存在一些挑戰:

  • ClickHouse 目前只支持單機讀取 Hive。
  • ClickHouse 支持讀取 Iceberg,但僅限 S3 存儲。
  • Iceberg 沒有 C++ 的 API。
  • 現在只支持 Hive/Iceberg 外表,一旦表 schema 變化,需要手動同步 DDL 修改。
  • 部分場景的 ORC 讀取性能不佳。

圖片

針對上述問題,我們采取了如下優化措施:

  • 新增外置 HTTP 協議的 Iceberg API server,使用 Java 繞開 C++ 限制,實現外置 server。
  • 通過一致性 hash 分發文件路徑到各節點實現分布式讀取。
  • 對元信息和數據文件進行 cache。
  • 讀取集群和計算集群分離。

圖片

增加外庫實現,避免手動繁瑣的建表和元信息不一致問題。

圖片

ClickHouse 在讀取某些 ORC 文件時會很慢,例如示例的 select * 和 select count(1)。

圖片

通過火焰圖分析,我們發現 Apache Arrow 庫讀取 ORC 有大量的 memcpy,十分影響性能。我們切換到了 Apache ORC 庫進行讀取,整體性能提升了 0.5 到 1 倍。

圖片

在某些場景會出現 IO 浪費,如圖中的 select 一列,在 stripe size 為 4MB 和 64MB 時,對應解壓后的大小相等,但 HDFS 讀取量差異很大。

圖片

ReadBuffer 在讀取時很容易 cache 大量我們不需要的數據,幫我們緩存很多不需要的列,造成大量 IO 浪費。此外,在讀取時會先讀 stripe footer,再讀 row data,導致頻繁地 HDFS seek。以上這兩點是造成 IO 浪費的主要原因。

圖片

我們采用 IO 預讀機制對 ORC 的讀取性能進行優化。首先,ORC 文件可以提前計算文件中哪些 range 是需要被讀取的,基于此,我們將讀取規則改為當讀命中某個 range 時,按照 range 粒度執行預讀,并將臨近 range 進行合并,減少HDFS seek 次數。

圖片

在應用該讀取優化后,性能提升十分明顯,以圖中的讀取 6 列為例,原有的 40 秒查詢縮短至 3.7 秒,提升了 10 倍。

圖片

此外,我們還做了 HDFS 優化、元信息優化和資源并發鏈接限制,基于這些優化,在典型場景性能提升了 5 到 10 倍。

四、實驗場景 Bitmap 優化

在命中分析、畫像圈選中可以使用 bitmap 進行查詢加速,將原有的交并補邏輯轉換為位圖操作,相比明細表的聚合或 join 查詢,通常可以取得數倍的性能提升。

圖片

ClickHouse 數據按行進行拆分運算,在 bitmap 場景中,不用批數據的行數,即使行數相同,其代表的計算工作量也存在很大差異,造成了數據傾斜,其中某個 pipe 的工作量顯著高于別的 pipe,以至拖慢了整個查詢。

圖片

我們的解決方案是在執行引擎新增 repartition 階段,重新進行數據均衡,并將數據分發到所有后續 pipe。在大 bitmap 計算中,數據傾斜場景性能提升約 10%~20%。

圖片

我們通過 ClickHouse Flame Graph 對三個線程的執行過程進行分析,發現有兩個執行線程長時間等待,而另一個執行線程耗時在讀取 bitmap,讀取開銷遠大于計算。

圖片

ClickHouse 在 mark 級以下沒有任何并行化機制,我們針對性優化成支持行級并行讀取,對于大 bitmap 異步進行反序列化讀取,并減少內存拷貝操作。

圖片

另外,我們通過對原有字段編碼進行壓實,既節省了存儲空間,又提升了性能。

圖片

新增內核特性可編碼字典 Encode Dictionary,支持單機字典和副本同步字典,支持所有原生 ClickHouse 字典函數,支持 value to key 反查,以及 bitmap to bitmap 編碼。

圖片

在經過以上優化后,我們在測試數據集上的性能提升很明顯。在 bitmap32 上,求并集和交集有 10 倍的性能提升,在 bitmap64 上,有百倍的提升。

圖片

在實際業務應用上,bitmap64 場景從查不了變為查得快,bitmap32 場景從快到更快,在畫像分析、實驗留存分析和表存儲等方面優化效果都很不錯。

圖片

五、ClickHouse with AI

隨著機器學習的興起,圖片或文本通過 embedding 高維向量的方式表達,求解相似度會轉換為計算向量間的距離。在離線加工場景使用 OLAP 有很多優勢,比如可以基于元數據過濾、做一些聚合操作,以及配合 UDF 進行加工等等。此外,我們也在精確距離運算、ANN 索引等方面做了一些探索性的優化。

圖片

我們基于 ClickHouse 對整套算法鏈路做了重構,融合 OLAP 成熟數據管線,實現了推理、加工和檢索一體化。當有復用需求時,可以直接修改數據管線中的 SQL 配置或 UDF,從而大大降低了使用成本。

圖片

我們還做了向量精確檢索查詢優化,將其封裝為 SQL,對于后續的需求可以方便地進行修改迭代。并且對查詢 SQL 進行了性能優化:

圖片


  • 通過 SQL 改寫,采用 with 代替 join,減少冗余計算;prefilter 提前過濾不必要元素。
  • 使用 ZSTD 壓縮,優化數據結構。
  • 加入 repartition 階段,解決線程間數據傾斜問題。

圖片

另外,我們還優化了 embedding 計算相關函數,在業務場景中取得了 4 倍的性能提升:

  • 我們在內核中新增了一個向量距離計算函數 NormalizedCosineDistance,它可以在歸一化場景下減少整體計算量。
  • 同時我們也根據業務場景定制了 embedding vector distance 函數,通過大幅減少計算的過程中的 memcpy,性能有了很大的提升。

圖片

以上就是本次分享的內容,謝謝大家。

責任編輯:姜華 來源: DataFunTalk
相關推薦

2024-09-11 14:47:00

2023-10-13 07:25:50

2024-03-05 08:21:23

湖倉一體數據湖數據倉庫

2023-10-30 07:25:37

數據湖數據處理

2023-08-30 07:14:27

MaxCompute湖倉一體

2022-07-18 16:02:10

數據庫實踐

2024-12-16 08:34:13

2023-07-12 08:44:46

湖倉存儲系統數據湖

2022-09-15 09:32:42

數據倉處理

2022-12-21 08:32:34

OLAPDruid架構

2023-06-28 07:28:36

湖倉騰訊架構

2023-12-14 13:01:00

Hudivivo

2016-03-04 10:29:51

微信支付源碼

2019-06-21 10:40:25

微信小程序前端

2021-06-07 10:45:16

大數據數據倉庫數據湖

2012-03-13 15:46:44

計世網

2022-05-18 13:24:47

京東調優實踐

2021-06-11 14:01:51

數據倉庫湖倉一體 Flink
點贊
收藏

51CTO技術棧公眾號

性高潮免费视频| 欧美二区在线| 黄色在线观看免费| 亚洲盗摄视频| 欧美美女一区二区三区| 久草视频这里只有精品| 国产在线91| 国产·精品毛片| 国产精品免费久久久久影院| www.av视频| 国内精品久久久久久久影视简单 | 国产精品-区区久久久狼| 在线观看免费黄视频| 不卡一区二区中文字幕| 91精品国产综合久久久久久蜜臀| 国产女同在线观看| 综合久久十次| 中文字幕日韩精品在线观看| 国产精品无码专区| 国产精品成人**免费视频| 日韩欧美成人区| 性高湖久久久久久久久aaaaa| www日韩tube| 91视频在线看| 国产精品高清一区二区三区| 91片黄在线观看喷潮| 另类av一区二区| 国产69精品99久久久久久宅男| 日本黄色免费片| 精品免费av| 亚洲男人天堂网| 中文字幕影片免费在线观看| 1769国产精品视频| 欧美一级片在线观看| 中文字幕国产免费| 精品无人乱码一区二区三区| 欧美日韩中文字幕在线| 日韩中字在线观看| 丁香花在线电影| 夜夜嗨av一区二区三区网页| 久久免费一级片| 羞羞电影在线观看www| 中文字幕亚洲视频| 亚洲精品久久区二区三区蜜桃臀| 激情在线视频| 国产亚洲成aⅴ人片在线观看| 日韩成人精品一区二区| 97精品久久久午夜一区二区三区| 亚洲一区二区在线| 91免费视频播放| 久草这里只有精品视频| 国产美女高潮久久白浆| 国产三级理论片| 青青草91视频| 国产精品亚洲网站| 国产又大又长又粗| 国产乱子伦视频一区二区三区| 91久久精品国产91性色| 国产女人高潮毛片| 国产成人自拍网| 国产精品加勒比| 五月激情丁香婷婷| 国产午夜亚洲精品午夜鲁丝片| 青青成人在线| 第三区美女视频在线| 国产精品女主播av| 国产日产欧美一区二区| heyzo高清在线| 偷窥少妇高潮呻吟av久久免费| 成熟了的熟妇毛茸茸| 欧美人体一区二区三区| 欧美男女性生活在线直播观看| 天堂av手机在线| 国产精品x8x8一区二区| 亚洲欧美日韩精品| 日韩一卡二卡在线观看| 你懂的一区二区| 55夜色66夜色国产精品视频 | 亚洲国产不卡| 韩国v欧美v日本v亚洲| 日韩美一区二区| 激情深爱一区二区| 久久国产主播精品| 中文字幕在线视频区| 亚洲综合一二区| 漂亮人妻被中出中文字幕| 日韩电影免费观看高清完整版在线观看| 日韩一卡二卡三卡四卡| 久久久精品人妻无码专区| 水蜜桃精品av一区二区| 久久人91精品久久久久久不卡| 一级黄色在线视频| 国产精品一区一区三区| 欧美日产一区二区三区在线观看| 9191在线| 午夜精品久久久久久久久久久| 香蕉视频网站入口| www.国产精品一区| 日韩在线视频二区| 中文字幕一区二区三区精品| 久久99久久99精品免视看婷婷| 狠狠色狠狠色综合人人| 欧美jizz18hd性欧美| 狠狠躁天天躁日日躁欧美| 国产无色aaa| 香蕉久久精品| 欧美日本在线视频中文字字幕| 人妻丰满熟妇av无码区| 国产成a人亚洲精品| 日日骚一区二区网站| xxx.xxx欧美| 91精品婷婷国产综合久久性色 | 日批免费在线观看| 中文字幕视频一区| 国产精品无码av无码| 久久男人av| 欧美成年人视频网站| 在线观看日韩一区二区| 91在线观看高清| 亚洲草草视频| 成人自拍av| 日韩电视剧在线观看免费网站| 欧美丰满熟妇bbbbbb| 奇米影视在线99精品| 欧美日韩综合精品| 五月天av在线| 亚洲国产精品国自产拍av秋霞| 侵犯稚嫩小箩莉h文系列小说| 日韩精品久久理论片| 久久一区二区三区av| 丰满诱人av在线播放| 欧美成人午夜电影| 九九视频免费观看| 国产精品一区二区久久精品爱涩 | 国产精品白丝av| 久久久久久亚洲精品不卡4k岛国| 在线看一级片| 国产欧美日韩在线一区二区| 97视频免费在线看| 亚洲第一色视频| 亚洲免费看黄网站| av在线免费看片| 97精品国产福利一区二区三区| 国产高清在线不卡| 国产主播福利在线| 欧美怡红院视频| 国产又粗又猛又爽又黄av| 久久福利毛片| 欧美最大成人综合网| 欧美天堂视频| 国产亚洲精品美女久久久久| 最新国产中文字幕| 国产精品国产a级| 日本一二三区在线| 国产精品v亚洲精品v日韩精品 | 999久久久精品视频| 91蜜臀精品国产自偷在线| 国产专区欧美专区| 在线观看电影av| 亚洲国产精品资源| 91porny九色| 中文字幕亚洲欧美在线不卡| 日本少妇xxx| 亚洲少妇诱惑| 天天好比中文综合网| 4438五月综合| 久久久久国产一区二区三区| 亚州男人的天堂| 欧美性生活影院| 国产97免费视频| 播五月开心婷婷综合| 国产精品欧美激情在线观看| 成人嘿咻视频免费看| 亚洲一区二区三区sesese| 黑人另类精品××××性爽| 国产丝袜一区视频在线观看| 在线视频你懂得| 亚洲国产成人tv| 在线小视频你懂的| 国产精品一区在线| 免费黄色福利视频| 一级欧洲+日本+国产 | 性生活在线视频| 亚洲毛片网站| 亚洲精品自在在线观看| 99久久香蕉| 国产精品一久久香蕉国产线看观看| free性欧美hd另类精品| 亚洲精选在线观看| 国产av精国产传媒| 色呦呦国产精品| 久久久久久欧美精品se一二三四 | 国产极品国产极品| 91视视频在线观看入口直接观看www | 在线女人免费视频| 久久久精品免费| 狠狠狠综合7777久夜色撩人| 欧美一级精品在线| 亚洲视屏在线观看| 午夜精品福利一区二区三区蜜桃| 99在线视频免费| 91最新地址在线播放| 手机av在线网站| 日韩制服丝袜先锋影音| 精品少妇在线视频| 久久久久蜜桃| 日韩女优中文字幕| 欧美91在线| 99电影在线观看| 日韩伦理一区二区| 日本欧美爱爱爱| av手机免费在线观看| 美女福利精品视频| 色的视频在线免费看| 亚洲欧美国产va在线影院| 亚洲精品字幕在线| 制服.丝袜.亚洲.另类.中文| 中文字幕在线网站| 色网站国产精品| 丁香六月婷婷综合| 五月天欧美精品| 精品一级少妇久久久久久久| 亚洲日本一区二区| 在线视频这里只有精品| 国产丝袜美腿一区二区三区| 国产精品无码永久免费不卡| 成人性视频免费网站| 先锋资源在线视频| 国产一级精品在线| 人人爽人人爽av| 国产一区二区在线观看免费| 999这里有精品| 免费高清在线一区| 另类小说第一页| 青青草精品视频| 黄色一级二级三级| 日韩av中文字幕一区二区 | 国产高清精品网站| 人妻体体内射精一区二区| 国产又黄又大久久| 一级做a爱视频| 国产一区二区三区免费播放| 黄色一级片免费播放| 国产九色精品成人porny| 国产精品igao网网址不卡| 国产在线播放一区| 精品国产aⅴ一区二区三区东京热| 国产成人午夜高潮毛片| 黄页网站在线看| 成人黄色国产精品网站大全在线免费观看 | 日韩精品一区二区在线视频| 精品99视频| 香港三级韩国三级日本三级| 西西裸体人体做爰大胆久久久| 日本精品一区在线观看| 日韩二区三区在线观看| 91亚洲免费视频| 国产精品亚洲а∨天堂免在线| 四虎国产精品免费| 菠萝蜜视频在线观看一区| 毛茸茸多毛bbb毛多视频| 国产亚洲女人久久久久毛片| www亚洲色图| 亚洲美女视频在线| 精品午夜福利在线观看| 色婷婷av一区二区三区大白胸| 一区二区乱子伦在线播放| 欧美日韩高清一区二区不卡| www.黄色国产| 精品偷拍各种wc美女嘘嘘| www日韩tube| 欧美激情国产日韩精品一区18| 国产高清中文字幕在线| 国产精品网红直播| 美国十次综合久久| 欧美极品jizzhd欧美| 日韩中文在线电影| 日韩av新片网| 日韩成人一级片| 国产伦理在线观看| 久久久精品国产免大香伊| 日本不卡一二区| 午夜伊人狠狠久久| 在线播放成人av| 亚洲成人黄色在线观看| av在线电影网| 韩国一区二区电影| 久久精品资源| 好吊妞www.84com只有这里才有精品| 日韩国产欧美| 国产美女网站在线观看| 韩国精品在线观看| 亚洲一区二区观看| 亚洲乱码中文字幕综合| 无码人妻av免费一区二区三区| 欧美一级日韩免费不卡| 国产中文字幕在线| 国语自产偷拍精品视频偷 | 久久久久久蜜桃| 欧美色爱综合网| 午夜18视频在线观看| 久久国内精品一国内精品| 中文在线а√天堂| 99影视tv| 婷婷综合五月| 91视频免费版污| 99精品视频在线观看免费| 精品国产视频一区二区三区| 日本大香伊一区二区三区| 成人小说亚洲一区二区三区| 久久精品国产精品亚洲| 亚洲成av在线| 美国av一区二区三区| 在线日韩视频| 秋霞午夜鲁丝一区二区| 国产精品国产三级国产aⅴ无密码 国产精品国产三级国产aⅴ原创 | 国产99在线免费| 午夜免费一区| 在线观看的毛片| 久久久久久久精| 久久免费激情视频| 亚洲国产欧美久久| 色yeye免费人成网站在线观看| 国产日韩精品在线播放| 国产真实有声精品录音| 久久精品网站视频| 久久综合五月天婷婷伊人| 国产午夜精品一区二区理论影院| 日韩一区二区三免费高清| 欧美13一16娇小xxxx| 国产日韩欧美在线看| 日韩黄色大片网站| 黄色永久免费网站| 国产女主播一区| 丰满人妻一区二区三区四区| 亚洲视频一区二区三区| 日韩中文影院| 日韩av一区二区三区美女毛片| 久久久噜噜噜| 国产综合精品在线| 欧美视频在线播放| av影片在线看| 成人妇女免费播放久久久| 天天射天天综合网| 激情文学亚洲色图| 亚洲免费观看高清完整版在线观看 | 久久久久久国产精品三级玉女聊斋| 日韩一区二区三区精品| 欧美视频在线观看视频| 波多野结衣精品在线| 久久99精品波多结衣一区| 亚洲免费一级电影| 韩国成人在线| 黄色高清视频网站| 粉嫩久久99精品久久久久久夜 | 亚洲三级视频| 日韩精品无码一区二区三区久久久| 欧美色图片你懂的| 污污的网站在线免费观看| 国产精品夜夜夜一区二区三区尤| 亚洲免费观看| 免费看黄色的视频| 欧美剧在线免费观看网站| 啪啪免费视频一区| 精品亚洲第一| 男女男精品网站| 免费中文字幕视频| 亚洲男人天堂网站| 亚洲日日夜夜| 国自产拍偷拍精品啪啪一区二区| 国产人成一区二区三区影院| 国产精品视频一区二区三区,| 久久久亚洲影院你懂的| 国产一区二区三区四区五区 | 99久久国产综合色|国产精品| 日日夜夜狠狠操| 操日韩av在线电影| 色综合久久中文| 怡红院亚洲色图| 精品国产乱码久久久久久虫虫漫画| 国产视频网站在线| 99在线观看视频| 日韩精品91亚洲二区在线观看| 成人免费视频网站入口::| 亚洲伦理中文字幕| 精品久久国产一区| 男人揉女人奶房视频60分| 亚洲色欲色欲www在线观看| 亚洲 欧美 激情 小说 另类| 国产日韩欧美成人| 国产精品日韩| 在线观看亚洲大片短视频| 亚洲成色999久久网站| 日韩免费在线电影| 波多野结衣乳巨码无在线| 亚洲三级久久久| 国产伦一区二区三区色一情| 奇米影视一区二区三区| 国产乡下妇女做爰| www.欧美免费|