精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

OPPO 下一代大數據 AI 一體架構實踐

人工智能 大數據
云廠商用存儲吸引用戶,進而提供上層 SaaS 服務。云原生彈性計算架構可提高調度效率,實現資源的自動彈性伸縮,優化資源利用。本文將展示OPPO 下一代大數據 AI 一體架構在功能云上的實踐,希望為大家帶來啟發。

一、技術架構

OPPO 大數據場景豐富,擁有海外的 AWS 功能云,國內自建機房,機器規模超過萬臺,在印度則是使用混合云模式。

首先來介紹一下 AWS 上功能云 EMR 的實踐。

1. 云原生計算架構

圖片

OPPO 早期全部采用 EMR,其存在以下一些問題:

  • 首先,彈性伸縮遲滯。上圖中展示了資源的分配效率(不是真正的資源利用率和機器的物理利用率),以及資源彈性趨勢圖。可以看到,凌晨高峰時資源使用率瞬間變高,回收資源持續了很長時間,效率低,彈性差。
  • 另外,編碼機器選型固化。云上的機器基本都是 Intel 的 x86 機型,無論是 AWS 還是阿里云提出的 ARM 機型從單價上就便宜 20-30%,但是 EMR 產品不兼容 ARM 機型。
  • 最后是調度算法固定。

圖片

為了解決上述問題,OPPO 自研了極致彈性計算架構——Yarn on EKS。EKS 是AWS 提供的托管型 Kubernetes 服務。Kubernetes 難以滿足大規模快速調度的需求,無法做到快速調度、機器可掌控、資源可控制。因此我們選用了 Yarn on EKS。

業界有很多開源的 RSS 解決方案,包括阿里巴巴的 RSS 平臺和騰訊的 Uniform 平臺。OPPO 的云需求較少,因此投入比較低。我們的架構 base 在分布式內存Alluxio 上,在 AWS 上實現彈性的 Alluxio 集群。思路是只做 shuffle 服務,存儲交給性能高的、更合適的存儲系統,開始是 HDFS、Cubefs 分布式文件系統,后面選用了 Alluxio。內部測試系統性能比較高,包括彈性 RSS 服務,可以根據壓力自動調整彈性。

資源調度優化,核心在于計算架構資源。自研架構下,資源利用率彈性效率高,每個小時都有一個波峰波谷,平均物理資源利用率達到 80% 以上,長時間維持在 80-90% 上下。

另外,組件全云化。除了 Yarn 和 Spark,大數據鏈路中還有許多其他關鍵的組件和工具,包括任務調度和工作流管理。調度采用的是 Airflow,并對其進行了一些自定義修改,以適應特定的任務調度需求或環境。Airflow 的 worker 基本是常駐資源,每一個業務來了之后都會申請 2 個 worker,費用昂貴,所以將其改為彈性的資源配置,有任務需要執行時才進行資源配置。

圖片

上圖展示了我們自研架構的資源看板。從右下方的彈性效率圖可以看到,每小時都會有波峰波谷,物理資源的平均利用率可以達到 80% 以上。

圖片

上圖是成本看板。原本 AWS 兩天才會出一次賬單,使用自研架構后,每個小時就會出一個賬單,包括單價花費以及每個機型的使用時間。

2. Data&AI 一體化數據湖架構

圖片

整體架構如上圖所示。主要解決的問題包括:

  • 數據秒級入湖,在公司內部替代了部分資源的使用,達到了降本的效果。
  • 自動化管理,Iceberg 缺少一層服務層,業務需要自己管理。
  • 兼容非結構化數據,我們做了一個 DAA Catalog 來兼容非結構化數據的管理。

采用分布式內存來解決實時性問題,雖然線上集群規模較大,但內存閑置比較多,使用分布式內存可以將內存資源更好地利用起來,在數據湖上用這種方式解決了數據實時入湖的問題。數據實時寫入分布式內存的 block 里面,然后 Dump 服務會定時管理這些 block 何時落到 Iceberg 底層的存儲上。

圖片

DAA Catalog 主要包括兩個模塊:Metastore 和管理模塊。Metastore 類似于 HMS,主要解決元數據生命周期管理的問題。管理模塊的功能主要包括:數據安全和數據血緣、dump 服務和動態聚合、非結構化數據的版本管理,以及非結構化數據的轉換服務。

圖片

實現秒級實時的做法是,在內存里把數據做成 real-data,底層是 base-data。另外很多 dele-data 也是放在內存里,這樣 Dump 的時候自動合并。分布內存管理使用的是 Alluxio,但是對功能進行了魔改,Alluxio2.9 開源版本的通信傳輸效率不好,我們通過修改使性能得到了顯著提升。另外還實現了 Alluxio 流式讀寫,數據可以逐條寫入。

圖片

Data & AI 中,Data 指的是結構化的數據,AI 的數據全是非結構化的數據。

結構化數據的處理最初是基于 Iceberg,目前可兼容多種接口協議。自動化管理包括cluster、dumper、indexer、combiner 等。另外對索引能力也做了增強。

圖片

我們在結構化數據的處理上嘗試了很多優化。因為是分布式內存的緩存,緩存上的性能加速,數據的索引,熱表緩存和數據預熱在內存里。

圖片

上圖展示了一個比較特殊的案例,是搜推業務在實時樣本拼接時遇到的一個問題,HBase 成本較高,且性能也不能滿足需求。提出的解決方案是多數據源主鍵實時 Join。涉及到的樣本數據,單條數據量比較大,平均一兆左右,把數據的索引放到分布式內存中,數據實時過來后在內存里的 hash partition 找到相關的索引去拼接,類似于 MOR 機制。

圖片

非結構化數據的管理,主要問題在于元數據,我們希望非結構化數據能夠像結構化數據那樣方便地使用。另外一個問題是數據格式轉換,有些處理方式還比較原始,落到湖上之后會有 Trans-Service,例如將圖片數據轉換成 h5 或 dataset 格式,dataset 格式參照 Updataset 協議,提供一個統一的上層 API。

圖中元數據轉換使用的是我們自己的 AndesGPT,也可以調用 ChatGPT。元數據embedding 到數據庫里面,方便上層自然語言式的查詢和搜索。

圖片

上圖是一個管理示例,我們可以像 SQL 查詢一樣去查詢圖片、文本數據的詳情。

圖片

DataPrompter,在公司內部的聊天系統中,在對話框里 @機器人可以很方便地查詢各種數據指標。開發過程中遇到的問題是,每輸入一個表格,需要人工編織很多詳細的 prompt,使 GPT 更好地去認識數據,寫更精準的 SQL,海量的數據需要一個一個地制作 prompt,這就會構成瓶頸。入湖之后,根據元數據包括一些普通的信息都自動生成轉換范例 prompt,從而使大模型能夠更好地理解湖倉上的數據。

在此基礎上,還會將歷史查詢的業務含義反饋到 prompt 里,以及業務方的測試反饋。

Databricks 提供 Model Pre-Trainingt 的 TensorBoard 模型,把湖倉上的元數據進行訓練,后期我們也會使用這種模式進行模型微調。

圖片

數據入湖階段,大語言模型為更好地寫出更精準的 SQL,會把 SQL 的規則編寫到prompt 里面。另外,表結構、字段和指標口徑說明打開直接寫進去。模型輸出OutputCommand 關注點和格式要求,輸出 SQL 對應寫法要求和標準。

二、應用落地

1. 實時特征平臺

圖片

實時特征平臺的架構如上圖所示。

圖片

通過主鍵實時 Join,實現了每秒拼接單機 qps-7k,延伸到多臺機器實現了線性的擴展。

2. 機器學習訓練數據加速

圖片

下面介紹機器學習訓練湖倉數據加速的方法。首先是搜推算法訓練數據加速,很多數據是裸的文本數據,txt 格式,上層的 Python 讀取的時候會涉及到序列化性能慢的問題,我們將文本數據轉換為 Parquet 格式,并使用 Arrow 庫來讀取。經過線上測試,性能會有 10 倍的提升。

圖片

大模型的訓練加速,會將裸的圖片數據轉換成分割好的 tar 包的 Dataset 的數據格式,通過緩存加速大模型訓練數據的讀取。訓練時圖片數據加載還是個瓶頸,圖片數據的數據量比較大,如果用比較大的 tar 包性能會比較差。通過轉換為小的 dataset 能得到數倍的性能提升。

3. 混合云場景應用

圖片

混合云在印度業務中有使用,但由于沒有太多算法的業務,機器規模較小。以混合云上數據湖倉數據任務靈活編排。DAA-Catalog 統一管理混合云數據復制遷移。

圖片

通過混合云模式,混合云數據任務遷移中,帶寬是主要的瓶頸,遷移的時候通過找到數據和計算對帶寬依賴最小的子圖的方式去遷移,同時也會考慮底層的數據一致性,使得數據入湖底層路徑透明。

圖片

DataPrompt 落地的情況,Datachart 架構流程如圖,底層是湖倉的數據,先確定是否為數據分析問題然后轉化為 SQL 執行,數據在湖倉上解決不了的話就聯網分析。Glacier 湖倉服務會找到這個表的 Prompt 推給大語言模型,進行自然語言數據分析。

圖片

上圖中展示了內部的使用情況。通過數據對比可以得出,大語言模型在數據分析上是比較有幫助的。

三、展望

圖片

未來仍會注重大數據方面的開發和發展。在公有云架構方面進一步深挖,公有云實施的彈性架構為公司節省了大量財務支出,單任務計算成本相比 EMR 降低了約 80% 左右,后續將嘗試更多手段,繼續深化這塊領域的技術。公有云架構 Spark on GPU 的加速已經實現,進一步要對接 Shuttle Service。Spark on GPU 的收益為,性能提升 4 倍,成本降低約 50%。引擎向量化 Gluten+Velox 的概念,業內比較火熱,各大公司都在嘗試,開發中存在一些問題,所以目前沒有過多的投入,但是未來的一個方向。持續降本增效永遠是底層技術的主題,降本和穩定性是兩條生命線,降本是否可以犧牲一定的穩定性這一問題仍需思考。

另外一個方向是 Data & AI 湖倉架構,很多業界頂尖公司都在推動這一理念。但是元數據管理存在痛點,活躍度低的表仍需解決沖突問題,向上與大模型應用結合。半結構化數據通過統一接口訪問,封裝了 dataset 的接口,向下需與 Paimon 結合,兼容更多底層格式,方便用戶查找和訓練數據。

責任編輯:姜華 來源: DataFunTalk
相關推薦

2015-10-15 10:30:32

2017-03-08 10:56:03

大數據架構數據湖

2013-07-27 21:28:44

2013-08-20 12:26:41

FusionCube融合一體機華為

2018-05-17 11:31:45

大數據IOTA架構數據架構

2025-01-03 09:24:10

模型架構論文

2022-07-06 11:38:40

人工智能AI

2012-11-16 11:31:39

大數據CRM

2013-07-22 09:47:17

大數據IBM技術大會

2021-05-22 23:01:21

人工智能網絡安全

2015-03-09 14:24:59

TeradataAppCenterAster

2013-09-25 15:55:57

WLANWiFi智能

2013-06-27 11:21:17

2024-02-07 09:00:00

2025-11-13 17:35:18

微軟AgenticAI 系統

2025-11-19 08:00:00

AI智能體企業安全人工智能

2015-10-19 17:15:33

網絡架構/華三

2012-06-07 09:06:04

主流云計算產品大數據分析

2016-11-14 18:17:42

Apache Beam大數據

2020-09-27 17:27:58

邊緣計算云計算技術
點贊
收藏

51CTO技術棧公眾號

日韩不卡一二三| 一区二区三区国| 日韩综合在线观看| 97在线精品| 欧美精品一区二区三| 又色又爽又高潮免费视频国产| 国产在线视频卡一卡二| 日韩丝袜视频| 欧美日韩国产综合视频在线观看| 韩国成人av| 日韩乱码一区二区三区| 91成人观看| 亚洲图片制服诱惑| 日本泡妞xxxx免费视频软件| 深夜视频一区二区| 亚洲成av人片在www色猫咪| 日韩免费中文专区| 神马午夜精品95| 精品一区二区久久| 国产成人短视频| 久久精品国产av一区二区三区| 国产精品亚洲欧美日韩一区在线 | 欧美一级大片在线观看| av永久免费观看| 老牛国内精品亚洲成av人片| 91麻豆精品国产自产在线 | 日本aa在线| 久久亚洲欧美国产精品乐播| 国产91aaa| 91福利免费视频| 丝袜亚洲另类丝袜在线| 国内精品小视频在线观看| 污污视频网站在线免费观看| 杨幂一区二区三区免费看视频| 色噜噜狠狠成人网p站| 黄色一级片国产| av网站导航在线观看免费| 亚洲国产高清不卡| 欧美一区二区三区电影在线观看 | 国精产品一区二区三区有限公司 | 69av.com| 久久成人综合| 怡红院精品视频| av黄色免费网站| 天堂99x99es久久精品免费| 精品国产91亚洲一区二区三区婷婷 | 欧美色xxxx| 国产极品尤物在线| mm视频在线视频| 午夜国产精品一区| 亚洲欧美日韩国产综合精品二区| 精品久久久久久久久久ntr影视| 精品国产乱码久久久久软件| 成人黄色在线观看视频| 国产一区在线观看麻豆| 亚洲精品免费一区二区三区| 国产免费高清视频| 国产一区二区不卡在线 | 久草国产在线观看| 91精品啪在线观看国产18| 按摩亚洲人久久| 可以免费看av的网址| 久久国产影院| 久久亚洲私人国产精品va| www青青草原| 国内精品久久久久久久影视蜜臀 | 不卡视频观看| 亚洲va欧美va国产va天堂影院| 亚洲v国产v| 97人人在线| 国产精品盗摄一区二区三区| 综合网五月天| 波多野结衣在线高清| 婷婷开心激情综合| 久久精品免费网站| 国产精品亚洲一区二区在线观看| 一本到一区二区三区| 欧美成人免费高清视频| 亚洲日本免费电影| 精品日韩在线观看| 欧美图片第一页| 91亚洲国产高清| 蜜臀久久99精品久久久无需会员 | 亚洲狠狠丁香婷婷综合久久久| 欧美日韩一区二区三区在线观看免| 国产日韩一级片| 国产福利一区在线观看| 精选一区二区三区四区五区| 成人影视在线播放| 一个色综合av| 欧美激情精品久久久久久小说| 草草在线视频| 欧美三片在线视频观看| 在线成人精品视频| 国产欧美日韩在线观看视频| 欧美精品免费在线观看| 天堂网免费视频| 国产精品正在播放| 久久99精品久久久久久久青青日本| 国产1区在线观看| 国产三级久久久| 久艹在线免费观看| 国产电影一区二区三区爱妃记| 色天使色偷偷av一区二区| 国产成人美女视频| 日韩欧美中文字幕电影| 欧美日韩成人免费| 中文av免费观看| 91啪亚洲精品| 欧洲精品视频在线| 美女视频一区| 亚洲欧美日韩中文视频| 国产一级在线免费观看| 久久国产视频网| 欧美一区二区三区四区五区六区| 国产大学生校花援交在线播放| 国产视频视频一区| 国产又粗又长又爽视频| 国产人妖一区| 国产丝袜一区二区| 妺妺窝人体色www在线下载| 久久精品国产亚洲高清剧情介绍 | 人成网站在线观看| 亚洲国产成人午夜在线一区| 免费无码不卡视频在线观看| 欧美国产亚洲精品| 菠萝蜜影院一区二区免费| 9i精品福利一区二区三区| 成人免费高清视频在线观看| 特级西西444| 99国内精品久久久久| 在线视频欧美日韩精品| 中文字幕免费观看| 久久影院视频免费| 大j8黑人w巨大888a片| 亚洲精品a区| 九九热这里只有在线精品视| 国产精品无码一区二区桃花视频 | 国产亚洲欧美另类一区二区三区| 日本黄色三级视频| 亚洲一区二区五区| 亚洲911精品成人18网站| 亚洲影视一区| 国产日韩欧美在线视频观看| av女优在线| 欧美日韩在线观看一区二区| 一级特黄曰皮片视频| 日韩av中文在线观看| 欧美一区二区三区成人久久片| 国产成人高清精品| 91精品久久久久久久91蜜桃| 国产极品美女在线| 国产麻豆精品在线| 成人国产在线看| 国产精品流白浆在线观看| 国语自产精品视频在免费| 蜜桃视频久久一区免费观看入口| 久久亚洲捆绑美女| 大桥未久av一区二区三区| 97精品国产97久久久久久粉红| v片在线观看| 欧美一区二区二区| 免费网站看av| 懂色av一区二区三区免费观看| 欧美日韩国产一二| 四虎4545www国产精品| 色av中文字幕一区| 国产美女免费视频| 亚洲国产综合色| 国产精品jizz| 美女国产一区二区| 日韩人妻一区二区三区蜜桃视频| 唐人社导航福利精品| 正在播放亚洲1区| 91精品国产乱码久久久久| 亚洲乱码日产精品bd| 涩视频在线观看| 久久久久久色| 激情五月五月婷婷| 亚洲美女久久| 国产在线视频不卡| missav|免费高清av在线看| 亚洲欧美中文在线视频| 国产又色又爽又黄又免费| 亚洲午夜在线视频| 91成人精品一区二区| 国产毛片精品国产一区二区三区| 亚洲欧美电影在线观看| 欧美日韩黄色| 热久久美女精品天天吊色| 91精品专区| 国产麻豆视频精品| 国产精品久久久久久超碰| 久久77777| 亚洲黄色www| 亚洲视频一区二区三区四区| 亚瑟在线精品视频| 丁香激情五月少妇| 成人国产精品免费观看动漫| wwww.国产| 影音先锋久久久| 在线亚洲美日韩| 欧美美女在线直播| 3d动漫精品啪啪一区二区三区免费 | 91丨九色丨蝌蚪丨老版| 99re6在线观看| 午夜一级在线看亚洲| 成人免费看片视频在线观看| 国产伦精品一区二区三区视频| 欧美亚洲视频在线观看| 国产在线观看a视频| 亚洲精品一二区| 亚洲成人黄色片| 欧美日韩精品一区二区在线播放| 亚洲区一区二区三| 久久天天做天天爱综合色| 在线成人精品视频| 国内外成人在线视频| 国产真人无码作爱视频免费| 日韩视频二区| 亚洲精品天堂成人片av在线播放| 亚洲久草在线| 国产精品xxx视频| h片精品在线观看| 欧美日韩国产123| 国产丝袜在线| 中文字幕日韩欧美| 成人在线高清视频| 亚洲欧洲中文天堂| 你懂的在线播放| 亚洲精品国产欧美| 日本激情一区二区三区| 精品av久久707| 国产成人无码www免费视频播放| 精品欧美aⅴ在线网站| 欧美一区二区三区爽爽爽| 国产精品久久久久久久久快鸭| 无码人妻久久一区二区三区蜜桃| 一区二区三区福利| 久久久久久久久久久综合| 中文字幕日韩欧美精品高清在线| 欧美男男青年gay1069videost | 成人豆花视频| 国产福利精品av综合导导航| 黄色在线网站噜噜噜| 97精品国产97久久久久久| 大香伊人中文字幕精品| 欧美激情一级二级| 九色porny视频在线观看| 97在线精品视频| 一区二区三区电影大全| 庆余年2免费日韩剧观看大牛| av在线网址观看| 欧美xxxx14xxxxx性爽| 污污在线观看| 性色av香蕉一区二区| 色偷偷色偷偷色偷偷在线视频| 精品国偷自产在线| 国产在线高清理伦片a| 久久久国产精品亚洲一区| 中文字幕免费高清电视剧网站在线观看| 亚洲国产精品va在线| 囯产精品久久久久久| 日韩福利视频在线观看| 青青青草原在线| 在线看国产精品| 成人区精品一区二区不卡| 欧美日本在线视频中文字字幕| 91官网在线| 久久久精品国产| wwww在线观看免费视频| 欧美专区福利在线| 久久亚洲人体| 51蜜桃传媒精品一区二区| 一本色道69色精品综合久久| 精品视频高清无人区区二区三区| 亚洲综合网狠久久| 欧美精品一区二区三区四区五区 | 精品一区二区三区久久| 永久免费黄色片| 成人精品小蝌蚪| 色欲AV无码精品一区二区久久| 99久久久精品| 亚洲天堂最新地址| 亚洲午夜私人影院| 久久影视中文字幕| 日韩欧美黄色影院| 麻豆av电影在线观看| 不卡av日日日| 欧美电影免费观看网站| 亚洲在线第一页| 免费不卡中文字幕在线| 午夜在线视频免费观看| 妖精视频成人观看www| 成年网站免费在线观看| 成人精品免费视频| 亚洲怡红院在线观看| 一本久久综合亚洲鲁鲁五月天 | 久久午夜精品| 操人视频免费看| 国产亚洲一区字幕| 免费一级肉体全黄毛片| 欧美色欧美亚洲高清在线视频| 免费av网站在线| 欧美一个色资源| 国产精品一区二区婷婷| 亚洲91av视频| 久久久精品区| 深夜福利成人| 国产一区二区精品| 丰满少妇一区二区三区专区| 中文字幕免费在线观看视频一区| 免费看裸体网站| 五月婷婷另类国产| 国产成人毛毛毛片| 视频直播国产精品| 全亚洲第一av番号网站| 国外成人免费视频| 欧美在线资源| 日韩va在线观看| 国产欧美一区二区精品婷婷| 日韩毛片在线播放| 欧美不卡视频一区| 2024最新电影免费在线观看| 国产精品国产福利国产秒拍| 亚洲老女人视频免费| 91黄色在线看| 成人自拍视频在线观看| 欧美日韩在线观看免费| 51久久夜色精品国产麻豆| 成人高清网站| 国产91色在线|免| 中文有码一区| 国产精品97在线| 91麻豆文化传媒在线观看| 激情综合网五月婷婷| 精品国精品国产| 9999精品成人免费毛片在线看| 国产精品av在线| 国产精品一区二区99| 欧美成人xxxxx| 91农村精品一区二区在线| 五月天激情国产综合婷婷婷| 日韩成人中文字幕| 成年人在线网站| 国内精品久久国产| 性欧美xxxx大乳国产app| 男女黄床上色视频| 在线日韩av片| yjizz视频网站在线播放| 国产精品女视频| 欧美电影一区| 丰满饥渴老女人hd| 亚洲一二三区视频在线观看| 日本韩国免费观看| 日本成人黄色片| 欧美中文一区二区| 午夜一区二区视频| 亚洲精品菠萝久久久久久久| 亚洲精品国产精品国| 97视频在线免费观看| 免费看日本一区二区| 天天干天天干天天干天天干天天干| 99re免费视频精品全部| 香蕉影院在线观看| 在线日韩欧美视频| 欧美爱爱视频| 日韩激情视频一区二区| 99久久99久久综合| 亚洲黄网在线观看| www.日韩.com| 成人看片爽爽爽| 欧美aⅴ在线观看| 国产精品高潮呻吟久久| 亚洲精品一区二区口爆| 欧美壮男野外gaytube| 久久要要av| 折磨小男生性器羞耻的故事| 色综合天天综合网国产成人综合天| 性少妇videosexfreexxx片| 亚州欧美日韩中文视频| 日韩免费一区| 国产精品入口麻豆| 欧美专区日韩专区| 韩国成人免费视频| 先锋影音网一区| 国产a级毛片一区| 超碰在线97观看| 欧美激情精品久久久久久大尺度| 日韩欧美专区| 国产精品无码一区二区在线| 国产精品久久久久婷婷二区次| 伊人久久中文字幕| 欧美人与物videos| 欧美肉体xxxx裸体137大胆| 中文在线字幕观看| 欧美三级中文字幕| 女厕盗摄一区二区三区| 男女裸体影院高潮| 欧美激情在线一区二区|