精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

火花思維:從 0 到 1 構建一站式數據開發治理平臺

大數據
火花思維作為在線教育領域的佼佼者,深知數據對于決策和運營的重要性。為進一步釋放數據資源的價值,公司從 0 到 1 構建了一站式數據開發治理平臺,實現了數據集成、數據開發、數據分析、數據服務等全流程整合,為公司的長遠發展奠定了堅實的數據基礎。

一、背景

火花思維是一家專注于青少年思維訓練及綜合素質提升的互聯網教育企業,產品包含邏輯思維、中文素養、火花編程等。累計學員已超 70 萬,遍布全球 100 多個國家和地區。其主要采用直播、真人互動 AI 的方式進行授課,通過將老師的啟發引導和動畫、游戲、趣味教具等多種方式立體結合,將能力、思維、訓練三者互相連接、層層遞進,在互動實踐中培養孩子的觀察思考、邏輯思維以及自主解決問題等核心基礎能力。

圖片

隨著火花思維的業務發展,數據量和數據訴求呈現出爆炸式增長的態勢。然而數據使用與管理模式已逐漸出現捉襟見肘,難以支撐企業高效運營與決策支持的核心需求。具體而言,當時我們面臨著以下幾大突出問題:

  • 數據開放自助程度明顯不足,嚴重制約了數據價值的充分釋放。
  • 系統性故障頻發,對數據資產的可靠性構成了嚴重挑戰。
  • ETL 效率低下已成為制約數據處理能力的關鍵因素。為了解決這些問題,我們需要一個更加高效、智能的數據開發治理平臺,以提升數據價值的挖掘能力、保障數據資產的可靠性、優化數據處理效率,并降低技術成本。

在產品建設初期,我們曾考慮過第三方的現有產品。然而,經過深入調研,我們發現了許多問題,最終決定自主研發。首先,當時我們發現市場上的現有產品雖然在基本 SQL 開發、調度配置、任務運維等方面表現出色,但在異源數據集成、DDL 適配、跨云部署等場景存在局限性。其次,我們對第三方產品的迭代速度和穩定性存在擔憂。我們需要確保產品能夠滿足公司數據生產和消費方對大數據的期望,并在使用過程中不會出現重大問題。如果我們純依賴三方產品的方法論以及售后支持和研發資源,那么會出現“不會用”、“加資源”、“等迭代”等常見矛盾現象。最后,我們認為自主研發將為我們帶來更多的機遇和優勢。通過自主研發,我們可以更好地把控產品的應用場景、功能矩陣和核心技術,以便更好地滿足需求,并根據需求變化及時進行調整和改進。

二、產品簡介

1. 功能介紹

圖片

Athena 數據工廠是火花自研的一站式數據開發治理平臺,主要為運營、BA、產品、研發、財務、技術支持等多樣化角色提供任務開發、任務運維、提數分析、資源管理全方位的產品服務,幫助數據生產者和數據消費者專注于數據價值的挖掘和探索。該平臺核心功能主要包含以下幾個部分:

  • 離線開發模塊:此模塊致力于為數據生產者提供高效的數據處理工具。它支持定時及依賴觸發的離線任務,任務類型豐富,涵蓋 HiveSQL、DorisSQL、Python、Mysql 與 Hive 間的數據交互,以及 Hive 至 ES/MQ、Hive 至 Doris 的數據同步。此外,我們提供了一鍵 API 生成功能,使得數據消費者能夠便捷地通過接口獲取所需數據,極大地提升了數據獲取的效率。
  • 實時開發模塊:基于 Spark 和 Flink 兩大引擎,我們構建了準實時/實時任務開發平臺。目前,該平臺已成功支撐運營分析、指標監控、日志采集、CDC 同步等多元化場景的需求,為用戶提供實時數據處理和分析的能力。
  • 運維中心模塊:在運維方面,我們提供多維度的看板分析,從任務成功率、及時率、成本等多個角度全面展示數據處理的狀況。同時,我們還支持上下游查詢、重跑當前及下游、數據回溯、批量下線、任務監控等基礎功能,確保數據處理流程的順暢與高效。
  • 自助提數模塊:該功能基于 Hive、Spark 和 Presto 三種引擎,為數據分析師提供了強大的 SQL 交互能力,使他們能夠輕松地提取和下載所需數據。此外,我們還特別針對增長業務,提供了用戶三方標簽的提取和下載功能,滿足用戶在增長業務場景下的數據需求。
  • 數據地圖模塊:數據地圖作為平臺的重要組成部分,為用戶提供了詳盡的數據資產信息。用戶可以通過該模塊查看數據目錄、明細信息、血緣關系、調度信息、更新記錄以及生產邏輯等關鍵信息,從而更好地理解和利用數據資源。
  • 控制臺模塊:控制臺作為項目管理員和系統管理員的操作后臺,具備強大的管理功能。管理員可以通過該模塊管理項目成員、數據源、庫表權限、隊列分配以及敏感信息查詢記錄等,確保數據的安全性和合規性。

通過該平臺可以輕松地完成數據的采集、清洗、加工和分析,提高數據的質量和利用率。同時,平臺的可視化操作界面和靈活的配置選項,讓用戶可以快速上手并進行個性化設置。此外,平臺還提供了豐富的數據服務和應用,包括用戶標簽、數據入湖、數據安全等,這些數據服務和應用可以幫助企業更好地利用和管理數據資源,提高數據的價值和效益。

2. 架構設計

圖片

Athena 數據工廠主體架構分為以下幾個模塊:

  • 交互層:采用了主流的 Vue 框架和 Monaco 插件,為用戶提供了簡潔直觀的數據探查和任務發布界面。用戶可以通過簡單的操作,輕松地進行標準化 ETL 流程的定義和執行。此外,用戶交互層還提供了豐富的可視化功能,使用戶能夠直觀地監控和管理任務的執行情況。交互層還支持多語言界面,方便全球用戶使用。
  • 服務層:這些服務包括 SQL 開發套件、集成調試、依賴推薦、元數據管理等。此外,服務層也為各自項目提供了全方位的權限管理和資源管理功能。服務層還提供 API 接口,方便與其他系統進行集成。該層整體采用微服務架構,服務之間的界限和功能清晰,不同模塊不同服務,各自按照需求場景選擇適合的技術棧和擴展應用,同時,獨立部署和運行,這有助于提高開發部署效率以及系統容錯性。
  • 引擎層:通過對接各種生態組件,并封裝存儲計算能力,使得上層應用無需關心過多的技術棧和升級優化。例如,HiveSql 調試在引擎層既支持 Hive On Tez,也支持 SparkSql,并兼容各自的參數優化。這使得用戶可以靈活地選擇適合自己業務需求的引擎進行數據處理。引擎層還提供了豐富的插件和橫向擴展機制,能夠根據用戶的需求進行定制化開發。引擎層還支持多租戶模式,方便多個項目共享數據工廠資源。
  • 組件層:數據工廠的底層組件包括調度引擎所依賴的 Airflow、Python 引擎依賴的騰訊云 SCF 產品 API 等。這些底層組件為數據工廠提供了穩定可靠的運行基礎。底層組件還采用了高可用架構,支持容錯處理和數據備份,確保數據工廠的穩定運行。底層組件還支持分布式架構,方便水平擴展和性能提升。

3. 使用場景

圖片

火花思維大數據計算鏈路經過多年的發展和演變,已經形成了 T/H+x、分鐘級、實時和 AI 四種場景的計算鏈路,支撐了多方面的數據處理和分析場景。

  • T/H+x鏈路:T/H+x 是行業通用的離線計算,主要用于離線數倉、數據報表、應用統計等場景。具體實現方式是通過數據集成組件定時將 Mysql、日志等數據源的數據同步到數倉 ODS 層,其中 80% 的數據會被加工成主題寬表,然后被其他數據生產者利用,按需構建 ADS 應用數據,并最終以數據庫表、消息隊列或者 API 方式提供數據服務。
  • 分鐘級鏈路:分鐘級應用主要針對 OLAP 多維分析場景,通過 FlinkCDC 等方式將數據源數據同步到 OLAP 引擎,然后逐層定時拉寬聚合,最終以 API 方式對外提供數據。早期的 OLAP 引擎主要是 Kudu 和 ClickHouse,現在以 Doris 為主。
  • 實時鏈路:實時計算鏈路主要包括以 Spark Streaming 為核心計算棧的定制化數據服務和以 Flink 和 IceBerg 為核心的實時湖倉。其中,Spark Streaming 主要用于歷史遺留的 ToC 數據場景,如學員學情報告、CRM 運營數據、用戶標簽建設等。而 IceBerg 則主要用于解決實時日志流水鏈路,Flink 則既可以用于構建實時數據報表,也可以用于運營監控統計。
  • AI 鏈路:AI 計算鏈路主要用于訓練和推理模型,包括數據預處理、模型訓練、模型評估和模型部署等環節。

三、關鍵技術與創新點

1. 離線 ETL

圖片

在離線開發集成角度,Athena 數據工廠提供了豐富的功能,旨在滿足用戶在基礎數據 ETL 以及分析挖掘領域的多樣化需求。該模塊的核心能力體現在 Hive、Doris、Python 以及與其他組件的集成上,為用戶提供高效、穩定且靈活的數據 ETL 鏈路。

HiveSQL 作為離線開發任務的重要組成部分,先后經歷從 Hive 1.2 到 Hive 3.1 的版本升級。前期主要依賴 Tez 引擎進行數據處理,其中 Tez 0.10 引擎以其更高效的執行計劃和資源管理能力,為 HiveSQL 提供了強大的性能支持。隨著大數據 ServerLess 技術的演進,在 2023 年完全適配了商業化數據湖計算 DLC SparkSQL,基于存算分離的整體架構使得離線 SQL 在大數據處理上更加靈活和高效。

Doris 計算也是 Athena 數據工廠的一大亮點,其作為一種高性能的分布式 OLAP 引擎,具有快速查詢分析和高并發等特性。通過集成 Doris 計算,能夠支持用戶對海量數據進行分鐘級離線運算分析,借助一鍵 API 功能,滿足 CRM 業務數據時效性的高要求。

Python 作為一種通用編程語言,在數據開發領域也發揮著重要作用。在 AI 大模型“肆孽”的當下,Athena 選擇 Python 3.10 版本支持用戶編寫離線數據處理任務,利用云函數 Python 豐富的庫和 MB 級內存資源管控能力,重點處理 SQL 不易甚至不能解決的場景,實現復雜的數據分析和處理邏輯,使得用戶可以更加靈活地處理數據,提高開發效率。

在與其他組件的集成方面,比如 Mysql<->Hive 的集成任務,Athena 依賴 Sqoop 集成工具進行數據傳輸和同步。我們還通過異步監聽 Mysql 的 DDL 變化,實現了數倉 ODS 層的字段新增、刪除以及 Comment 變化的適配,以及在用戶交互中實現自動建表、字段同名映射等功能。分庫分表合并則利用 CDC 模式實現。對于 Hive 與其他組件的集成,我們則依賴 DataX 這一強大的數據交換平臺。DataX 支持多種數據源之間的數據交換,包括 Hive、ES、MQ 等。目前,為了積極擁抱彈性計算,我們根據火花數據的特有使用場景,通過二次開發改造 Seatunel,計劃在第二季度徹底替換 Sqoop 和 DataX。

2. 調度系統

圖片

Athena 數據工廠的底層調度組件,正是基于業界知名的 Airflow 2.0 構建而成。Airflow 作為一個靈活且可擴展的分布式工作流調度系統,早已在大數據領域贏得了廣泛的應用。它不僅能夠高效地調度各種數據處理任務,還具備豐富的 API 支持,使得開發者能夠輕松集成各種功能,滿足復雜的業務需求。

在我們的調度系統中,除了支持任務啟停、依賴綁定、失敗重試、重跑上下游等基礎功能外,我們還通過深度整合調度系統元數據和 Athena 數據工廠元數據,實現了更為精細化的調度管理。這使得我們能夠實時掌握任務的運行狀態,及時發現并解決問題,確保數據處理的穩定性和準確性。

3. 實時計算

圖片

Athena 數據工廠的實時計算模塊功能主要支持 Spark Jar、Flink Jar 以及 Flink SQL 三種開發任務。

在 Flink SQL 方面,它已經成為非大數據用戶的首選。Flink SQL 以其簡潔易懂的語法和強大的實時處理能力,受到了廣大用戶的青睞。目前,我們的平臺已經支持 Kafka、RocketMQ、Mysql、Doris、Elasticsearch、Hive、Hudi、Iceberg 等眾多 Connector。這些 Connector 的存在,使得 Flink SQL 能夠輕松接入各種數據源,實現數據的實時采集、處理和輸出。

在 Jar 任務方面,無論是 Spark Jar 還是 Flink Jar,它們都以公司 GitLab 的倉庫地址為基準。這意味著,開發人員可以將自己的 Jar 包上傳到公司代碼倉庫,并通過Athena 輕松實現打包、部署和運行。這種集成方式不僅提高了開發效率,還確保了 Jar 包的版本管理和安全性。

今年,我們的實時計算底層也計劃基于 Oceanus 彈性伸縮進行改造。根據業務需求的變化,我們可以自動化調整計算資源,實現動態計算能力的彈性伸縮。通過合理的資源調度和容錯機制,我們能夠確保實時計算任務的穩定性和可靠性。

4. 監控預警

圖片

在任務級別的監控方面,Athena 數據工廠能夠實時監控任務的執行狀態,包括是否成功、失敗或超時。這些監控項是確保任務穩定運行的關鍵指標。一旦任務失敗或超時,平臺會立即觸發預警機制,通過飛書群或飛書個人等方式通知相關人員,以便及時介入處理。

除了任務級別的監控,Athena 數據工廠還提供了表級別的監控功能。這包括主鍵唯一性檢查、雙端對比以及表行數校驗等。主鍵唯一性檢查能夠確保表中數據的唯一性,防止重復數據的出現;雙端對比則能夠對不同數據源之間的數據進行比對,確保數據的一致性;表行數校驗則可以檢查表中數據的數量是否正確,防止數據丟失或異常增多。這些表級別的監控項能夠全面保障數據的質量和準確性。此外,Athena 數據工廠還支持字段級別的監控。這包括空值檢查、異常值監控、求和、均值、極值等??罩禉z查能夠發現數據中的缺失值,確保數據的完整性;異常值監控則可以識別并報警異常數據,防止其對后續分析造成影響;求和、均值和極值等統計指標則能夠幫助我們了解數據的分布情況,為后續的數據處理和分析提供重要參考。

Athena 數據工廠的監控程序與監控任務是緊密綁定的。這種一體化的設計不僅方便了用戶對監控任務的管理和維護,還能夠實現任務與監控的成本核算。通過監控程序,我們可以清晰了解每個監控任務的資源消耗情況,為成本控制和資源優化提供了有力支持。

四、實施與運營

1. 演進歷程

圖片

Athena 數據工廠于 2021 年底正常上線,初期目標就是將以 Azkaban 和 Crontab 上的 HiveSQl 和 Sqoop 腳本全部遷移至數據工廠,讓數據倉庫、數據服務和 BA 自助的腳本能夠在各自項目空間下有序地依賴執行。

  • 2021 年 11 月,Athena 數據工廠邁出了堅實的第一步,v1.0 版本的上線標志著它正式踏入數據開發領域。這個版本以離線開發、調度配置、任務運維三大核心功能為基礎,為用戶提供了穩定可靠的數據開發平臺。
  • 僅僅三個月后,2022 年 2 月,我們成功完成了數據倉庫的 HiveSQL 和 mysql<->hive 相關任務的全量遷移,這標志著 Athena 數據工廠在支撐火花思維基礎數據處理能力上邁出了重要的一步。
  • 同年 4 月,我們又實現了 Hadoop 集群從依賴社區自建到商業化 EMR 的順利遷移,這一變革極大地提升了基礎組件的穩定性和性能。
  • 2022 年 7 月,Athena 數據工廠再次迎來重大更新,新增了 Doris 引擎和 SparkSQL 引擎,為用戶提供了更多樣化的數據處理引擎的選擇。此外,上線一鍵 API 生成功能,方便數據生產者通過 API 通道分享數據。
  • 同年 10 月,我們整合了原《大數據實時開發平臺》至 Athena 數據工廠,構建了獨立的實時開發模塊,以滿足用戶對于實時數據處理的需求。
  • 進入 2023 年,Athena 數據工廠的迭代速度更是加快。3 月實現表級別血緣關系解析以及整合公司 GitLab 實現版本管理,并基于此上線依賴推薦、跨周期依賴、數據回溯、BI 建模血緣跟蹤等輔助開發能力。
  • 6 月,成功實現了離線開發和自主提數的 SQL 引擎對商業化 ServerLess 的適配,進一步提升了數據處理效率。
  • 8 月推出了字段級血緣關系以及數據監控功能,為用戶提供了更加精細化的數據管理和質量保證。同時,基于 HiveMeta 實現表資產生命周期治理能力。
  • 2023 年 11 月,基于騰訊云云函數產品,我們推出了 Python 開發模塊,為 BA、算法、研發等角色提供了解決 SQL 無法實現或較難實現場景的全新功能。
  • 到了 2024 年 1 月,我們再次進行了一次重大的技術革新,適配 Hdfs 遷移至 COS,實現了用戶無感的存算分離,為各項目空間提供了更加靈活和高效的數據存儲和計算服務。

2. 日常運營

圖片

Athena 數據工廠的日常運營在 2023 年 3 月前后經歷了兩個階段,每個階段都有其獨特的運營策略與特點。在 2023 年 3 月之前,我們采用的是項目制的運營模式。每個項目都建立了專門的運營群,并配備了專業的運營人員。這些運營人員不僅具備豐富的數據開發經驗和深厚的技術功底,還擅長與用戶溝通,能夠迅速把握用戶需求并提供相應的解決方案。他們會在群里積極回答用戶的問題,提供細致的解答和培訓,確保用戶能夠順利使用我們的產品。同時,他們還會根據用戶的反饋和需求,不斷優化我們的產品和服務,持續提升用戶體驗。

然而,隨著用戶數量的不斷增加和項目規模的擴大,我們意識到這種項目制的運營模式存在一些問題。比如,不同項目之間的信息交流不暢,導致一些共性問題無法得到及時解決;同時,運營人員的工作負擔也逐漸加重,難以保證服務質量和效率。因此,在 2023 年 3 月之后,我們對產品運營模式進行了調整,建立了《大數據服務中心》千人話題群。該話題群將所有用戶集中在一起,方便他們之間的交流和互動。同時,我們實施了輪崗機制,由 Athena 數據工廠的產品、研發、測試多方人員輪流擔任值班人員,負責解答群內用戶的問題,不僅提高了服務效率,還確保了問題的專業性和準確性。為了確保值班人員能夠準時上線并積極參與群聊,我們還引入了機器人提醒功能。機器人會在每天下午 18 點定時提醒值班人員上線,并在群里積極回答用戶的問題。通過這種方式,我們確保了服務的及時性和連續性。

五、成效與收獲

1. 釋放自助能力

圖片

我們一直秉持著“生產力改變生產關系”的原則,致力于提供便捷、高效的數據開發工具和服務,幫助公司各部門、各角色更加自主地開展數據分析和應用,實現公司數據自助開放的整體策略目標緊密相連。

從數據層面來看,Athena 數據工廠每日承載的離線任務運行實例數量已達到約2 萬個,它表明我們的平臺已經能夠穩定、高效地處理大量的數據任務,為公司的數據分析和應用提供了強有力的支持。同時,內部用戶數量也達到了約 470 人,MAU 約 130,這說明已經得到了廣泛的認可和使用。由 BA、運營、產品、研發等非大數據角色發起的新增任務占比高達 92%。這一數據不僅凸顯了 Athena 數據工廠在跨角色數據開發方面的廣泛應用,更體現了平臺在推動公司內部數據自主開放方面的卓越成效。

具體來說,僅在 2023 年非大數據角色通過 Athena 數據工廠新增的任務數量就達到了 2700+ 個(忽略數據資產生命周期治理)。從更宏觀的視角來看,結合數據需求迭代頻率,Athena 數據工廠實際上在 2023 年支撐了公司內部的 3000+ 個數據需求。這意味著,Athena 數據工廠已改變公司數據訴求供需關系,為增長和變化預留了足夠的空間,更為公司提供了一個穩定、可靠的數據基礎設施,使得公司能夠更加自信地面對未來的數據挑戰,實現數據價值最大化。

2. 提升可靠性

圖片

  • 事前檢查:在任務上線之前,Athena 數據工廠會進行強邏輯的檢查,以確保數據任務的穩定、正確產出。這些檢查規則包括腳本語法、調度配置、資源權限等多方面的檢查,可以避免數據上線后出現錯誤和異常,從根本上降低值班人員起夜率。
  • 事中預警:在數據生產和消費過程中,平臺會進行實時監控,并提供豐富的預警機制。當數據出現異常或達到預警閾值時,平臺會及時發出預警信號,通知相關人員進行處理。這樣就可以及時發現和解決數據異常,避免數據丟失和錯誤,保證數據的可靠性和穩定性。
  • 事后復盤:故障發生后,QA 同學利用 GPT 依據 5why 分析法構建了復盤機器人,帶領故障干洗人對 SLA 問題進行深度引導分析,找到根本解決方法,并預防類似問題的再次發生。

3. 優化 ETL 效率

圖片

自從調度任務遷移至 Athena 數據工廠后,通過分析 ETL 任務的執行數據,從多方面提升了整體運行性能,天調度 SQL 任務 24 年 3 月同比 23 年 3 月增加 107%,單平均任務運行時長降低 48%。這主要得益于三個方面的改進:

  • DAG 優化:首先,通過分析 Airflow 節點資源利用率,結合各類型任務 Client 執行所需的 CPU 和內存資源,合理分配整體 Pool 和 Worker Pool 的閾值,實現執行節點任務吞吐最大化。其次,由于各類型 DAG 運行周期交叉,最典型的就是天調度 DAG 與零散 DAG 的交叉,會發生調度資源、算力資源甚至 IO 資源競搶,通過分析統計各 DAG 任務重要性和影響度,以及任務特征,合理分配各DAG 的 Pool 大小,實現整體資源利用最大化。最后,根據單 DAG 上依賴模型和各任務自身特點,動態調整各 SLA 等級的任務權重,讓重依賴、重保障的任務盡早運行,從而實現更高效的任務執行。
  • 慢任務優化:治理團隊投入最大的精力就是識別優化慢 SQL,而慢 SQL 最常見的場景就是兩種:(1)數據掃描量大,要么忘記加分區限制要么讀取分區太多;(2)通常是嵌套 With as 較多臨時查詢的任務,導致解析計劃中某一個或幾個Reduce 卡住,但寫 SQL 的人員優先滿足計算口徑,而忽略數據傾斜或笛卡爾問題。由于目前底層 SQL 算力引擎已彈性,故在基線保障和成本控制的背景下,優先解決慢任務是效果最佳的治理手段,也是持續保障任務平均執行效率和性能的最佳實踐。
  • 組件優化:無論是 SQL 任務或是集成任務,都會依賴其他組件,而很多時候,隨著數據量或讀寫壓力的增加,組件出現性能瓶頸,而在任務角度觀察是整體運行變慢或夯死,這時候就可以通過多維分析任務運行數據,觀測拐點的任務特征,結合干系組件的性能監控波動,識別并對癥下藥。例如:JournalNode、RDBS 以及磁盤故障等。

4. 降低成本

圖片

Athena 數據工廠通過底層技術的優化進一步降低了綜合技術成本。近兩年,我們將hive 底層引擎先進行了 tez 升級后切換至 Spark,存儲從 HDFS 遷移到 COS,今年3 月天調度單任務計算成本同比去年降低 29%。而這些切換過程中,我們充分利用了 Athena 數據工廠對底層的隔離和封裝能力,降低技術升級對用戶的影響,甚至部分遷移工作對用戶無感。

在 Athena 數據工廠上線前,BA 和研發人員面臨著繁瑣且耗時的數據任務上線發布流程。他們需要通過一套基礎配置工具,歷經八個步驟才能完成整個操作。這包括編寫配置文件和 SQL、上傳代碼、配置依賴、構建任務、部署任務和發布任務等。每一步都需要手動操作,稍有不慎就可能導致錯誤或異常情況,進一步增加了解決問題的難度和時間成本。然而,使用 Athena 數據工廠后,這一切得到了徹底的改變。據調查統計,每個數據任務的上線發布過程至少可以節省 3 小時以上的時間。

六、總結與展望

1. 經驗教訓

在 Athena 數據工廠構建過程中,我們積累了許多寶貴的經驗教訓。以下是一些關鍵的點:

  • 注重目標用戶體驗:我們深刻認識到用戶體驗是平臺成功的關鍵因素。在平臺建設前期,團隊投入了大量的時間與精力,組織數次產品 MVP 功能調研問卷,對目標用戶群體進行了深入的調研,明確了他們的需求和期望。這不僅幫助我們確定了平臺需要實現的核心功能,還讓我們能夠避免在設計過程中添加不必要的功能和復雜性,確保平臺始終保持簡潔、直觀和易于使用的特性。此外,為了進一步優化用戶體驗,產品上線首年每月進行 Top3 用戶測試和反饋收集,傾聽用戶的聲音,并根據他們的反饋對平臺進行了持續改進。
  • 選擇合適的技術棧:選擇合適的技術棧對于平臺的成功同樣至關重要。在選擇技術棧時,我們充分考慮了平臺規模、性能需求、可擴展性以及維護成本等因素。我們進行了深入的技術調研和評估,與業內專家進行了充分的溝通和交流,最終選擇了既符合平臺需求又具有前瞻性的技術組合。
  • 構建可擴展的架構:在構建平臺的過程中,我們還特別注重架構的可擴展性。我們深知,隨著業務的發展和數據的增長,平臺的架構必須能夠輕松應對未來的挑戰。因此,我們采用了分布式系統、微服務架構等技術手段,確保平臺能夠靈活地擴展和適應新的需求。這種可擴展的架構不僅提高了平臺的性能和穩定性,還為我們后續的維護和升級帶來了極大的便利。
  • 學習和不斷改進:產品構建是一個不斷學習和改進的過程。在產品的開發、測試、上線和運營等各個階段,我們都保持高度的敏感性和警覺性,不斷反思和評估平臺的性能、用戶需求反饋。雖然我們暫未建立成熟的“數據飛輪”,但積極收集和分析數據,通過數據驅動的方式發現平臺存在的問題和不足,并制定相應的改進措施。這種持續改進的態度不僅幫助我們不斷優化平臺的功能和用戶體驗,還讓我們能夠緊跟行業發展的步伐,保持平臺的競爭力和創新性。

2. 未來迭代

  • 對于用戶自助開發過程中的代碼調試和報錯任務,提供基于 AI 的分析協助能力。利用大語言模型,我們能夠快速準確地理解用戶的問題,并提供有針對性的解決方案。這種智能化的分析協助能力不僅可以提高用戶的工作效率,還可以減少用戶的焦慮和壓力,提升他們的使用體驗。
  • 優化可觀測能力,解決大任務等對穩定性和性能帶來的系統性負面影響。持續評估和優化計算資源的性能,確保它們在處理大量數據時高效運行。定期進行基準測試和性能評估,以確定計算資源的瓶頸和潛在優化機會。利用性能監控工具和指標來實時監測計算資源的使用情況,并及時采取措施解決性能問題。同時,優化計算資源的配置,例如調整 CPU、內存、存儲等參數,以提高資源利用率和性能。
  • 將核心功能和底層引擎容器化,這樣可以實現資源的動態分配和管理,提高系統的靈活性和可擴展性。同時,可以更輕松地部署和管理應用程序,提高資源利用率和效率,降低成本,并確保系統的穩定性和可靠性。同時,要開始在架構層次思考低成本支持跨平臺和云原生應用,這可以提高系統的靈活性和可擴展性,同時降低開發和維護成本。

結語:通過對一站式數據開發治理平臺的構建與實踐,火花思維成功提升了數據管理效率,優化了數據利用價值,為公司發展注入了新的活力。未來,隨著技術的不斷進步和業務的持續拓展,公司將繼續深化數據治理與開發工作,為在線教育行業數據驅動的創新發展貢獻更多力量。

責任編輯:姜華 來源: DataFunTalk
相關推薦

2021-06-11 13:56:27

大數據DataWorks數據開發

2022-12-23 09:04:33

字節跳動數據治理架構

2022-06-16 11:18:45

實踐構建開發

2023-10-26 06:59:58

FinOps云原生

2021-12-07 10:04:34

Azure Kuber場景應用

2013-10-24 17:35:01

云網絡H3C電子政務

2021-07-27 16:02:40

云原生數據庫阿里云

2021-08-06 09:33:57

數據湖DLF DDI

2023-04-25 16:30:58

設備開發鴻蒙

2014-01-13 09:00:54

PythonDjango

2018-10-17 11:15:02

云交換平臺

2016-11-01 11:54:26

BI大數據

2016-11-02 11:58:06

大數據BI

2022-12-21 18:31:00

游戲開發鴻蒙

2017-02-23 16:07:59

網易

2018-12-15 13:23:44

騰訊云開發者平臺云端

2009-05-13 19:30:20

華碩郵件服務器MASP

2021-03-16 17:51:03

戴爾

2023-07-19 18:58:45

Noodle開源

2023-06-21 08:34:49

點贊
收藏

51CTO技術棧公眾號

久久99久久| 一区二区三区福利视频| 成人污版视频| 亚洲成av人片一区二区三区| 精品在线观看一区二区| 中文字幕一区二区三区人妻四季| 香蕉av一区二区| 亚洲精品国产精品国产自| 中文字幕一区二区三区四区在线视频| 黄色av网站在线播放| 99久久精品久久久久久清纯| 国产欧美日韩中文| 日本中文在线播放| 中文字幕一区二区av| 亚洲精品网站在线播放gif| 国产乱码一区二区三区四区| 中文字幕资源网在线观看免费 | 91在线视频| 不卡视频在线看| 成人网址在线观看| 少妇太紧太爽又黄又硬又爽| 欧美久久成人| 色妞在线综合亚洲欧美| 免费观看av网站| 国产成人一二| 日韩视频一区二区三区| 激情综合网婷婷| av在线理伦电影| 亚洲精品一卡二卡| 一区二区三区|亚洲午夜| 三级在线视频| 99精品视频在线观看免费| 91免费精品国偷自产在线| 亚洲综合成人av| 久久一区国产| 日本高清+成人网在线观看| 91精品国产高潮对白| 亚洲女同另类| 久久综合色88| 国产精品国产三级国产传播| 不卡中文字幕| 在线看日韩欧美| xxx在线播放| 精品精品国产三级a∨在线| 日韩一区二区三区高清免费看看| 午夜精品中文字幕| 成人午夜亚洲| 欧美午夜电影在线播放| 在线视频日韩一区| 日本另类视频| 在线观看国产一区二区| 日韩在线第三页| 色8久久影院午夜场| 欧美性感美女h网站在线观看免费| 精品少妇在线视频| aaa在线播放视频| 午夜av区久久| 色综合久久久久无码专区| 亚洲精品永久免费视频| 欧美日韩中文字幕| 老头吃奶性行交视频| 欧美在线va视频| 欧美日韩一区不卡| 国产福利精品一区二区三区| 日日夜夜综合| 日韩一级视频免费观看在线| 在线观看免费视频国产| 蜜桃tv一区二区三区| 一本色道久久综合狠狠躁篇怎么玩 | 凹凸av导航大全精品| 亚洲国产成人精品女人久久久| 久久国产劲爆∧v内射| 日韩av网址大全| 亚洲片在线资源| 国产日产在线观看| 综合激情婷婷| 欧美亚洲日本黄色| 在线观看国产成人| 国产91精品精华液一区二区三区 | 日韩欧美亚洲另类| 亚洲一区电影| 亚洲精品一区av在线播放| 国产jk精品白丝av在线观看| 成人一级毛片| 欧美激情亚洲激情| 黄色在线免费观看| 极品少妇xxxx精品少妇偷拍| 国产91精品一区二区绿帽| 午夜av免费观看| 亚洲国产成人私人影院tom| av中文字幕av| 黄瓜视频成人app免费| 欧美一区二区在线免费播放| 日本一区二区在线免费观看| 欧洲激情综合| 久久久久久18| 中文无码av一区二区三区| 国产毛片精品视频| 欧美日韩国产综合视频在线| 国产精品一区二区三区视频网站| 精品福利在线看| 婷婷激情小说网| 亚洲日产av中文字幕| 久久久97精品| 欧美一区二区三区不卡视频| 国产精品自拍在线| 日韩免费三级| 白白色在线观看| 欧美精品丝袜久久久中文字幕| 少妇激情一区二区三区视频| 在线观看日韩| 国产精品久久久久国产a级| 丰满少妇高潮在线观看| 国产精品成人免费精品自在线观看| 日本中文字幕网址| 久久国产精品美女| 中文字幕亚洲国产| 天堂网av手机版| 风间由美一区二区三区在线观看| 亚洲精品在线观看免费| 成人香蕉视频| 亚洲国产精品女人久久久| 男人在线观看视频| 日本成人中文字幕在线视频| 免费av一区二区三区| 男人天堂亚洲| 日韩亚洲欧美一区| 永久免费未视频| 美女诱惑一区二区| 日韩福利在线| 国产精品一区二区av影院萌芽| 精品精品欲导航| 久久婷婷国产麻豆91| 国产在线播精品第三| 亚洲精蜜桃久在线| jizz欧美| 中文精品99久久国产香蕉| 日本中文字幕久久| 久久噜噜亚洲综合| 女人和拘做爰正片视频| 日韩欧美影院| 91精品国产高清久久久久久| 黄频网站在线观看| 亚洲国产裸拍裸体视频在线观看乱了| 91蝌蚪视频在线| 欧美激情综合| 99免费在线视频观看| 欧美色图天堂| 亚洲精品在线电影| 日本在线观看中文字幕| 99热99精品| 国产精品333| 久久99国内| 国产精品免费小视频| 91在线网址| 91精品综合久久久久久| 国产女片a归国片aa| 懂色av中文一区二区三区| 男人天堂av片| 欧美性生活一级片| 国产suv精品一区二区| 岛国视频免费在线观看| 欧美日韩在线亚洲一区蜜芽| 欧美xxxooo| 成人深夜福利app| 国产一级爱c视频| 免费精品国产| 国产精品日日摸夜夜添夜夜av| 午夜免费福利在线观看| 欧美一级夜夜爽| 日本天堂在线视频| 国产三级精品三级在线专区| 久久国产激情视频| 欧美破处大片在线视频| 激情小说网站亚洲综合网| 亚洲综合在线电影| 久久艹在线视频| 日韩一级片免费| 欧美性高清videossexo| 国产免费久久久久| a级精品国产片在线观看| 99久久国产宗和精品1上映| 偷偷www综合久久久久久久| 国产精品18毛片一区二区| 三级成人在线| 欧美xxxx做受欧美| 日本国产在线| 欧美一区二区精品| 亚洲不卡视频在线观看| 亚洲欧美中日韩| 中文字字幕码一二三区| 韩日av一区二区| 人妻有码中文字幕| 欧美在线网站| 青青成人在线| 99久久香蕉| 国产精品久久一区主播| 丁香花在线电影小说观看| 在线播放国产一区二区三区| 欧美一级在线免费观看| 欧美日韩免费不卡视频一区二区三区 | 国产精品2018| 高清电影在线免费观看| 日韩在线视频中文字幕| 男同在线观看| 欧美精品一区二区在线观看| 一级片aaaa| 在线精品国精品国产尤物884a| 欧美人与禽zozzo禽性配| 中文成人av在线| 国产精品无码一区二区三区免费 | 黄色片网站在线| 亚洲免费av电影| 亚洲成人77777| 欧美精品久久99久久在免费线 | 精品国产一区二区三区av性色| 国产精品51麻豆cm传媒| 精品久久久久久亚洲精品 | 五月激情综合色| 国产精品久久久久久久精| 国产亚洲欧美一级| 变态另类丨国产精品| 成人天堂资源www在线| 一级黄色高清视频| 久久国内精品自在自线400部| av免费在线播放网站| 亚洲精品色图| 免费一级特黄毛片| 欧美日韩亚洲一区| 日本三级福利片| 亚洲91精品| 婷婷视频在线播放| 久久国产小视频| 一区二区精品免费视频| 成人影院天天5g天天爽无毒影院| 欧洲av一区| 亚洲小说图片| 久中文字幕一区| 九九久久成人| 欧美一进一出视频| 国产亚洲电影| 日韩.欧美.亚洲| 成人激情在线| 亚洲综合首页| 亚洲国产精品久久久天堂| 亚洲自拍偷拍一区二区三区| 婷婷激情图片久久| 粉嫩av一区二区三区天美传媒| 中文字幕免费精品| 国产a级黄色大片| 好看不卡的中文字幕| 日本丰满少妇xxxx| 一区二区国产精品| 日本精品www| 日本亚洲天堂网| 亚洲欧美aaa| 国产伦理精品不卡| 乱码一区二区三区| 99久久er热在这里只有精品66| 国产精品1000部啪视频| 国产女同互慰高潮91漫画| 国产又色又爽又高潮免费| 亚洲女同一区二区| 久久久一二三区| 欧美午夜片在线免费观看| 国产农村妇女aaaaa视频| 91国内精品野花午夜精品| 在线播放成人av| 精品久久久网站| 九色网友自拍视频手机在线| 色久欧美在线视频观看| 污视频网站免费在线观看| 98精品国产高清在线xxxx天堂| 成人做爰视频www网站小优视频| 国产精品日日做人人爱| 一区二区三区视频播放| 欧洲av一区| 一区二区三区四区日韩| 北条麻妃在线视频观看| 日av在线不卡| 蜜桃视频无码区在线观看| 久久久精品tv| 精品99在线观看| 色婷婷香蕉在线一区二区| 91精品国产乱码久久| 精品国产区一区| 在线观看h片| 久久久久久亚洲精品| 美女网站视频一区| http;//www.99re视频| 国产真实有声精品录音| 亚洲理论电影在线观看| 日本三级亚洲精品| 国产精品手机在线观看| 中文字幕 久热精品 视频在线| 亚洲欧美一区二区三区四区五区| 日韩欧美一区视频| 国产福利小视频| 在线精品91av| 咪咪网在线视频| 亚洲综合社区网| 经典一区二区| 免费看国产曰批40分钟| 国产在线精品免费| jizz中文字幕| 亚洲国产成人av| 国产美女自慰在线观看| 亚洲人成自拍网站| 黄色美女视频在线观看| 成人精品视频99在线观看免费| 伊人久久大香线蕉综合网站| 日韩极品视频在线观看 | 大伊人狠狠躁夜夜躁av一区| 国产精品自产拍| 最近中文字幕mv在线一区二区三区四区| 国产夫妻在线| 成人3d动漫一区二区三区91| 久久久久久久久久久妇女| 中文字幕有码av| 久久精品日韩一区二区三区| 99热国产在线观看| 精品国产1区二区| 在线āv视频| 91精品在线观| 不卡一区2区| 韩国日本美国免费毛片| 久久这里只有精品视频网| 四虎永久在线精品| 精品乱码亚洲一区二区不卡| 少女频道在线观看高清| 成人在线中文字幕| 国产精品久久天天影视| www.99r| 国产精品区一区二区三| 国产无遮挡又黄又爽又色视频| 亚洲免费福利视频| 天堂中文在线播放| 免费在线国产精品| 亚洲免费网站| 久久久久久久久久久久久久久| 色综合咪咪久久| 国产剧情在线观看| 国产精品麻豆va在线播放| 精品国产精品| 美女少妇一区二区| 国产精品久久午夜夜伦鲁鲁| 在线免费看av的网站| 丝袜亚洲另类欧美重口| 97久久精品一区二区三区的观看方式 | 青青草成人在线| 欧美色图国产精品| 亚洲天堂2018av| 亚洲天堂福利av| 精品人妻一区二区三区麻豆91| 欧美激情一二区| 欧美黄色网视频| av免费中文字幕| 国产精品天干天干在观线| 91精品国产色综合久久不8| 草民午夜欧美限制a级福利片| 伊人精品综合| 99精品人妻少妇一区二区 | 国产在线播放一区三区四| www.超碰在线观看| 亚洲成av人片在线观看香蕉| 两个人看的在线视频www| 日本不卡在线播放| 久久国产麻豆精品| 九九视频在线观看| 精品视频一区在线视频| 福利一区和二区| 99er在线视频| 久久这里只精品最新地址| 97人妻精品一区二区三区| 欧美人在线视频| 国产日韩视频在线| 亚洲自拍第三页| 日韩欧美中文字幕在线观看| 午夜伦理在线| 国产精品jizz视频| 日本欧美在线看| 精品处破女学生| 亚洲香蕉伊综合在人在线视看| 国产一区二区三区亚洲综合| 天天夜碰日日摸日日澡性色av| 久久久久99精品国产片| 国产人妻精品一区二区三| 91精品国产成人www| 久久久久久久久久久妇女| aaaaa级少妇高潮大片免费看| 欧美老女人第四色| 僵尸再翻生在线观看| 一区二区三区四区欧美日韩| aaa国产一区| 国产又大又黄的视频| 57pao成人永久免费视频| 中文字幕一区二区三三| 91视频免费在观看| 亚洲第一页在线| 欧美高清hd|