精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

機器學習實踐心得:數據平臺設計與搭建

存儲 存儲軟件 機器學習
下文將基于本人所負責的個推大數據平臺搭建工作,與大家分享個推數據平臺架構方面的經驗以及踩過的一些坑。

機器學習作為近幾年的一項熱門技術,不僅憑借眾多“人工智能”產品而為人所熟知,更是從根本上增能了傳統的互聯網產品。下文將基于本人所負責的個推大數據平臺搭建工作,與大家分享個推數據平臺架構方面的經驗以及踩過的一些坑。

一、背景:機器學習在個推業務中的應用場景

作為獨立的智能大數據服務商,個推主要業務包括開發者服務、精準營銷服務和各垂直領域的大數據服務。而機器學習技術在多項業務及產品中均有涉及:

1、個推能夠提供基于精準用戶畫像的智能推送。其中用戶標簽主要是基于機器學習,通過訓練模型后對人群做預測分類;

2、廣告人群定向;

3、商圈景區人流量預測;

4、移動開發領域經常出現虛假設備,機器學習能夠幫助開發者識別新增的用戶的真偽;

5、個性化內容推薦;

6、用戶流失以及留存周期的預測。

[[237115]]

二、具體開展機器學習的過程

機器學習實踐心得:數據平臺設計與搭建

1、原始數據經過數據的ETL處理,入庫到數據倉里。

2、上面藍色部分代表機器學習:首先把樣本數據與我們的自有數據進行匹配,然后洞察這份數據并生成特征,這個過程叫特征工程。接下來基于這些特征,選擇合適的算法訓練后得到模型,最終把模型具體應用到全量的數據中,輸出預測的結果。

標準的機器學習工作流:針對業務上產生的具體問題,我們把它轉化成數據問題,或者評估它能否用數據來解決。將數據導入并過濾后,我們需要將數據與業務問題和目標進行相關性分析,并根據具體情況對數據做二次處理。

下一步我們進行特征工程。從數據里找出跟目標有關的特征變量,從而構建或衍生出一些特征,同時要把無意義的特征剔除掉。我們大概需要花80%的時間在特征工程這個環節。選出特征之后,我們會用邏輯回歸和RNN等算法進行模型的訓練。接下來需要對模型做驗證,判斷其是否符合目標。不符合目標的原因有可能是數據和目標不相關,需要重新采集;也有可能是我們在探索的時候,工作不到位,因而需要對現有的數據重新探索,再進行特征工程這些步驟。如果最終模型符合業務預期,我們會把它應用在業務線上面。

機器學習實踐心得:數據平臺設計與搭建

三、機器學習項目落地的常見問題

雖然上面的流程很清晰,但在具體落地的過程中也會遇到很多問題,這里我就之前的實踐經驗談幾點。

1、現在大部分公司都已經進入大數據的時代,相比于以往的小數據級的階段,在機器學習或者數據挖掘等工作方面,對我們的建模人員、算法專家的技能要求變高,工作難度也大大地提升了。

以往大家自己在單機上就可以完成機器學習的數據預處理、數據分析以及最終機器學習的分析和上線。但在海量數據情況下,可能需要接觸到Hadoop生態圈。

2、做監督學習時,經常需要匹配樣本。數據倉庫里面的數據可能是萬億級別,提取數據周期非常長,大把的時間要用于等待機器把這些數據抽取出來。

3、大多數情況下,很多業務由一兩個算法工程師負責挖掘,因而經常會出現不同小組的建模工具不太統一或實現流程不規范的情況。不統一會造成很多代碼重復率高,建模過程并沒有在團隊里很好地沉淀下來。

4、很多機器學習算法工程師的背景存在專業的局限性,他們可能在代碼工程化意識和經驗上相對會薄弱一些。常見的做法是:算法工程師會在實驗階段把特征生成代碼和訓練代碼寫好,交給做工程開發的同學,但這些代碼無法在全量數據上運行起來。之后工程開發同學會把代碼重新實現一遍,保證它的高可用和高效。但即便如此,也常常出現翻譯不到位的情況,導致溝通成本高,上線應用周期長。

5、機器學習領域的一大難題在于對數據的使用,它的成本非常高,因為我們把大量時間用于探索數據了。

6、個推有多項業務在使用機器學習,但并不統一,會造成重復開發,缺少平臺來沉淀和共享。這就導致已經衍生出來的一些比較好用的特征,沒有得到廣泛的應用。

四、個推針對機器學習問題的解決方案

首先說一下我們這個平臺的目標:

***點,我們希望內部的建模流程規范化。

第二點,我們希望提供一個端到端的解決方案,覆蓋從模型的開發到上線應用整個流程。

第三點,我們希望平臺的數據,特別是開發出的特征數據可以運營起來并在公司內不同團隊間共享使用。

第四點,這個平臺不是面向機器學習零基礎的開發人員,更多的是面向專家和半專家的算法工程師,讓他們提高建模的效率。同時這個平臺要支持多租戶,確保保障數據安全。

以下是我們自己的整體方案,主要分成兩大塊:

機器學習實踐心得:數據平臺設計與搭建

下半部分是建模平臺,也叫實驗平臺,它主要供算法工程師使用,建模平臺包含:

1、對應IDE。在這個平臺上進行數據探索、做數據的實驗,并且它能支持項目的管理和共享。

2、我們希望把已經開發好的特征數據管理起來,方便所有平臺用戶看到數據資產的情況。

3、樣本匹配時候,樣本ID可能與內部ID不統一,這個時候需要做統一的ID匹配服務。

4、幫助算法工程師從萬億級數據里快速地抽取所需數據,這也是非常重要的一點。

5、做機器學習的過程中,除了基本的算法,實際上還有很多代碼是重復或者相似的,我們需要把這些常用代碼進行函數化封裝。

6、支持對模型服務進行打包部署。

7、模型還要支持版本管理。

8、在實際業務中應用模型,需要實時監控起來,跟進模型的可用性、準確性等。

上半部分是生產環境,運行著數據處理pipeline,同時與數據建模平臺對接著。

在生產環境中,模型對應的特征數據分兩類:

一類是實時特征數據,比如數據實時采集,生成一些實時的特征,根據不同的業務需求存儲在不同的集群里。

另一類是離線特征數據,離線數據加工后存到Hive,供模型應用側進行使用。

在生產環境中,我們可以提供在線的預測API或 離線預測好的數據 供業務線使用。

五、方案實踐具體要點

***點,我們講講jupyter這塊:

選擇Jupyter作為主要建模IDE而不是自研可視化拖拽建模工具,這樣的好處是可以做交互式的分析,建模效率也很高,擴展方便,研發成本低。當然類似微軟Azure這樣的可視化拖拽建模平臺,可以非常清晰地看到整個流程,適合入門級同學快速上手。但我們的目標用戶是專家和半專家群體,所以我們選擇了最合適的Jupyter。

使用Jupyter時候,為了支持多租戶,我們采用Jupyterhub。底層機器學習框架我們用了Tensorflow、Pyspark、Sklearn等。數據處理探索時候,結合sparkmagic,可以非常方便地將寫在Jupyter上的Spark代碼運行到Spark集群上。

對于Jupyter沒有現成的版本管理控制和項目管理, 我們結合git來解決。

另外為了提高建模人員在Jupyter上的效率,我們引入了比較多的插件,例如:把一些典型挖掘pipeline做成Jupyter模板,這樣需要再做一個類似業務的時候只需要基于模板再擴展開發,比較好地解決了不規范的問題,避免了很多重復代碼,也為實驗代碼轉化為生產代碼做好了基礎。

第二點,說下工具函數:

我們內部提供了主要機器學習相關的函數庫和工具:

1)標準化的ID Mapping服務API。

2)創建數據抽取的API,無論是哪種存儲,分析人員只要統一調這個API就可。3)可視化做了標準化的函數庫和工具類。

4)Jupyter2AzkabanFlow: 可以把原本在Jupyter上寫好的代碼或者腳本自動轉化成AzkabanFlow,解決了特征工程階段的代碼復用問題。

第三點,關于使用Tensorflow:

使用Tensorflow時,我們的選型是TensorflowOnSpark,原生的Tensorflow的分布式支持不夠好,需要去指定一些節點信息,使用難度較大。

TensorflowOnSpark能夠解決原生Tensorflow Cluster分布式問題,代碼也很容易遷移到TensorflowOnSpark上,基本不用改。

同時利用yarn可以支持GPU和CPU混部集群,資源易復用。

第四點,關于模型交付應用:

在模型交付的問題上,我們把整個預測代碼框架化了,提供了多種標準的框架供分析人員直接選用。對輸出的模型文件有格式進行要求,例如:只能選擇 pmml格式或者tensorflow pb格式。標準化之后,只要使用標準的預測函數庫,就可以把建模人員的工作和系統開發人員的工作解藕出來。

***分享下我們的一些經驗:

***,TensorflowOnSpark上的PS數量有限制,而且Worker和PS節點資源分配不是很靈活,都是等大。

第二,Jupyter在使用的時候,需要自己做一些改造,一些開源庫版本兼容性有問題。

第三,使用PMML有性能瓶頸,一些是java對象反復重建,還有一些是格式轉化損耗,具體大家可以抓取下jvm信息分析優化。

第四,在落地過程使用Spark、Hive的問題上,需要提供易于使用的診斷工具,建模人員并不是Spark、Hive的專家,不一定熟悉如何診斷優化。

第五,要把模型和特征庫當成一個資產來看待,對它的價值定期做評估,要管理好它的生命周期。

第六,一些更偏底層的問題,比如: 硬件的選型可能要注意帶寬、內存、GPU平衡。

***,需要平衡技術棧增加和維護代價,避免引入太多新工具新技術,導致運維困難。

責任編輯:武曉燕 來源: 博客園
相關推薦

2020-11-26 18:30:33

機器學習Kubernetes開發

2021-01-08 13:42:28

愛奇藝機器學習深度學習

2023-10-23 07:13:04

2023-02-20 07:46:45

機器學習AI 技術

2022-10-09 08:08:02

人工智能機器學習平臺

2020-07-10 08:50:37

大數據銀行技術

2023-12-06 07:16:17

2016-04-12 17:12:29

機器學習數據清洗美團

2017-04-11 14:45:22

機器學習學習平臺大數據平臺

2024-12-04 14:52:46

2023-02-15 21:57:39

2018-06-23 13:55:15

Apache SparPython數據

2017-10-09 12:55:29

機器學習KaggleStacking

2024-03-26 07:35:24

日志索引語言

2021-11-18 09:46:24

ServerlessKubeless 阿里云

2017-03-24 10:23:37

Python語法機器學習環境搭建

2017-06-04 10:36:24

數據科學機器學習

2014-08-11 11:19:19

Material De

2016-06-07 10:28:07

大數據機器學習LSTM

2024-01-24 07:36:29

點贊
收藏

51CTO技術棧公眾號

成人线上视频| 国产男男gay体育生网站| 国产精品欧美三级在线观看| 欧美色国产精品| 男人天堂网站在线| 全色精品综合影院| 国产乱淫av一区二区三区| 性欧美在线看片a免费观看| 国产美女永久免费无遮挡| 伊人久久一区| 一本一道综合狠狠老| av不卡在线免费观看| 五月色婷婷综合| 精品亚洲成av人在线观看| 亚洲 日韩 国产第一| avhd101老司机| 黄色av一区二区三区| 亚洲男女自偷自拍| 久久精品人人爽| 国产精品无码永久免费不卡| 成人影院网站ww555久久精品| 欧美日韩裸体免费视频| 特大黑人娇小亚洲女mp4| 黄色网址在线播放| 成人激情文学综合网| 国产色视频一区| 久久久久久成人网| 风间由美一区二区av101| 4438x成人网最大色成网站| 精品一区二区中文字幕| 四虎亚洲精品| 国产精品福利一区二区| 欧美日韩一区二 | 国产精品久久久久久久久婷婷 | 日本中文在线视频| 国精一区二区| 亚洲精品一区中文| yy6080午夜| 成人另类视频| 精品福利av导航| 91精品国产91久久久久麻豆 主演| 欧美成人hd| 国产精品热久久久久夜色精品三区 | 一区二区福利视频| 在线免费看黄视频| 亚洲裸色大胆大尺寸艺术写真| 精品国偷自产国产一区| 亚洲精品乱码久久久久久9色| 日本电影久久久| 欧美三级视频在线| 欧美男女交配视频| 成人福利一区二区| 欧美在线观看视频在线| 青青在线免费观看视频| 免费观看一级欧美片| 午夜精品久久久久久久| 蜜桃臀一区二区三区| 好吊色视频一区二区| 国产91精品入口| 国产高清一区二区三区| 亚洲第一第二区| 成人丝袜视频网| 热99精品只有里视频精品| 国产午夜福利片| 99riav国产精品| 日本中文字幕不卡免费| 五月婷婷激情五月| 免费在线看成人av| 91久久精品国产91久久| 99热这里只有精品3| 国产不卡在线一区| 久久99精品国产一区二区三区| 亚洲 精品 综合 精品 自拍| 久久综合999| 91美女片黄在线观看游戏| 国产又黄又粗又硬| 免费永久网站黄欧美| 欧美在线免费看| 最近日韩免费视频| 亚洲激情二区| 奇米四色中文综合久久| 怡红院男人天堂| 国产一区二区三区久久久 | 亚洲精品乱码久久久久| 久热国产精品视频一区二区三区| 四虎影院在线播放| 中文字幕第一区综合| www.激情网| 在线激情网站| 亚洲伦理在线精品| 欧美精品一区免费| 男人天堂久久| 亚洲电影免费观看高清完整版在线| 日本黄色免费观看| 日韩欧美精品| 97色在线视频观看| 亚洲一级片免费看| 北岛玲一区二区三区四区| 日韩偷拍一区二区| 亚洲色偷精品一区二区三区| 久久久精品国产99久久精品芒果| 手机看片日韩国产| 亚洲永久av| 欧美一级艳片视频免费观看| 国产色视频一区二区三区qq号| 久久久久午夜电影| 国产不卡一区二区在线播放| 国产99视频在线| 亚洲国产精品99久久久久久久久| 800av在线免费观看| bestiality新另类大全| 色婷婷综合久久久久中文一区二区| 超碰91在线播放| 欧美老女人另类| 亚洲欧美制服另类日韩| 日韩在线观看视频一区二区| 久久免费黄色| 国产精品伊人日日| 久久99精品久久久久久野外| 色狠狠色狠狠综合| 岛国av免费观看| 99久精品视频在线观看视频| 欧美在线视频一区二区| 欧美 日韩 中文字幕| av资源网一区| 国产在线无码精品| 麻豆久久久久| 国产一区二区三区在线视频| 日本三级免费看| 国产成人一级电影| 免费成人进口网站| 欧美三级电影网址| 综合国产在线视频| 毛片在线免费播放| 久久理论电影网| 黄色av网址在线播放| 综合久久成人| 欧美大奶子在线| 国产精品久久久久久69| 国产精品毛片无遮挡高清| 国产精品亚洲αv天堂无码| 久久精品国产亚洲blacked| 久久99亚洲精品| a天堂在线观看视频| 亚洲视频中文字幕| 国产精品视频中文字幕| 日韩精品永久网址| 国产一区二区丝袜高跟鞋图片| aaa在线观看| 欧美日韩一区成人| 最新黄色av网址| 狠狠色综合日日| 99热这里只有精品7| 精品视频一二| 欧美激情xxxxx| 欧美少妇bbw| 欧美性xxxx18| 午夜天堂在线视频| 一级毛片免费高清中文字幕久久网| 91丝袜美腿美女视频网站| 黄网站在线免费看| 精品乱码亚洲一区二区不卡| 国产一级aa大片毛片| 成人av资源在线观看| 蜜桃传媒一区二区三区| 久久99蜜桃| 欧美日韩成人黄色| 亚洲第一成人av| 岛国视频午夜一区免费在线观看| 国产偷人妻精品一区| 日韩精品欧美成人高清一区二区| 午夜欧美一区二区三区免费观看| 欧美性生活一级| 九九热视频这里只有精品| 婷婷在线免费观看| 91黄色免费看| 日韩精品123区| 北条麻妃国产九九精品视频| 亚洲成熟丰满熟妇高潮xxxxx| 日韩在线高清| 99在线国产| 午夜免费视频在线国产| 欧美一区二区播放| 国产成人在线免费观看视频| 久久色在线视频| 中文av字幕在线观看| 伊人狠狠色j香婷婷综合| 欧美高清一区二区| 综合欧美精品| 欧美与黑人午夜性猛交久久久| 国产网站在线播放| 精品少妇一区二区三区免费观看| 天天干天天干天天操| 成人欧美一区二区三区黑人麻豆 | 99久久er热在这里只有精品66| www.四虎成人| 韩日精品在线| 涩涩涩999| 国产人妖ts一区二区| 国产精品久久久久久久久免费 | 亚洲一区二区在线观看视频| 91l九色lporny| 成人av午夜电影| av在线网址导航| 国产一区二区你懂的| eeuss中文| 超碰成人久久| 精品91免费| 日韩精品视频一区二区三区| 国产精品久久久久影院日本 | 精品国产精品三级精品av网址| 97在线观看免费视频| 成人免费的视频| 亚洲欧美天堂在线| 日韩电影免费一区| 99热在线这里只有精品| 欧美日韩三级电影在线| 91精品久久久久久久久久另类| 国产传媒在线观看| 久久久国产精品亚洲一区| 黄色片在线播放| 亚洲第一在线视频| 亚洲国产精品国自产拍久久| 欧美日韩国产色站一区二区三区| 在线能看的av| 亚洲一区二区三区四区在线观看| 黄色录像一级片| 欧美国产日产图区| 中文字幕成人动漫| 91免费视频网| 182在线视频| 丁香一区二区三区| 免费黄视频在线观看| 国产在线观看一区二区| 国内国产精品天干天干| 免费成人美女在线观看.| 成人黄色一区二区| 国产精品五区| 成年人免费在线播放| 国产精品婷婷| 无码精品国产一区二区三区免费| 一本色道久久综合亚洲精品不| 欧美日韩视频免费| 亚洲国产精品久久久久蝴蝶传媒| 一区二区三区国| 日韩电影免费在线观看| 亚洲欧洲日韩综合二区| 精品一区二区三区四区五区| 国产精品流白浆视频| 亚洲精品555| 国产精品亚洲精品| 日韩一区二区三区四区五区 | 国产精品免费看片| 超碰97av在线| 国产精品久久久久久久第一福利| 色www亚洲国产阿娇yao| 国产精品欧美一区喷水| 激情五月激情综合| 亚洲精品视频在线看| 校园春色 亚洲| 亚洲v日本v欧美v久久精品| 日韩熟女精品一区二区三区| 欧美视频免费在线| 国产精品露脸视频| 欧美日韩亚洲高清一区二区| 国产乱人乱偷精品视频a人人澡 | 日本免费一区二区三区最新| 国产视频精品免费播放| 成人亚洲综合天堂| 美女福利精品视频| 男人久久天堂| 久久av.com| 国产偷倩在线播放| 3344国产精品免费看| 天天综合网天天| 成人激情电影一区二区| 国产毛片精品| 日韩福利在线| 欧美激情1区| 男女av免费观看| 精品亚洲porn| 欧美性xxxx图片| 中文字幕一区二区三区在线观看| 波多野结衣亚洲色图| 欧美日韩亚洲一区二区| 伊人久久成人网| 亚洲精品一线二线三线| 91精彩视频在线播放| 九九九久久国产免费| 成人线上视频| 99re视频在线播放| 你懂的视频欧美| 永久免费看av| 久久国产精品久久w女人spa| 在线视频日韩欧美| 久久久精品黄色| 九九视频在线观看| 欧美偷拍一区二区| 蜜臀av午夜精品| 最近更新的2019中文字幕| 嗯~啊~轻一点视频日本在线观看| 国产精品电影在线观看| 高清一区二区三区| 一区二区不卡在线| 欧美亚洲一区二区三区| 日本在线视频播放| 国产精品日日摸夜夜摸av| 五月天综合激情网| 日韩欧美国产一区二区三区| 国产三级视频在线看| 97成人超碰免| 91久久国产综合久久91猫猫| 999国内精品视频在线| 黄色不卡一区| 日韩中文字幕三区| 国产91精品一区二区麻豆网站| 99久久99久久精品免费| 狠狠综合久久av一区二区小说| 国产高潮在线观看| 久久久精品一区二区三区| 欧美性猛交xxx高清大费中文| 成人永久免费| **女人18毛片一区二区| 一区二区三区 日韩| 久久久综合网站| 亚洲午夜18毛片在线看| 亚洲国产精品人久久电影| 三级资源在线| 亚洲精品免费av| 91精品国产91久久久久久密臀| 99视频在线免费| 国产欧美一区二区三区鸳鸯浴| 国产免费观看av| 亚洲激情自拍图| 不卡专区在线| 国产一区二区高清视频| 亚洲欧洲一级| 天堂www中文在线资源| 亚洲欧美福利一区二区| 国产精品自拍电影| 久久久国产精品免费| 国产精品一区二区精品视频观看| 一区二区三区欧美在线| 精油按摩中文字幕久久| 国精品人伦一区二区三区蜜桃| 欧美一a一片一级一片| sese在线视频| 国产精品一区二区3区| 久久亚洲国产| 91小视频在线播放| 亚洲另类春色国产| 亚洲国产www| 午夜精品蜜臀一区二区三区免费| 荡女精品导航| 九色在线视频观看| 2024国产精品视频| 免费又黄又爽又猛大片午夜| 夜夜躁日日躁狠狠久久88av| 日韩护士脚交太爽了| 综合色婷婷一区二区亚洲欧美国产| 亚洲性人人天天夜夜摸| 国产+高潮+白浆+无码| 黑丝美女久久久| 国产精品99999| 成人午夜两性视频| 国产主播一区| 亚洲综合网在线观看| 日本电影亚洲天堂一区| 欧美成人二区| 国产精品一区二区欧美| 欧美综合二区| 国产精品无码无卡无需播放器| 91精品黄色片免费大全| 精品国精品国产自在久不卡| 96sao精品免费视频观看| 久久亚洲精品中文字幕冲田杏梨| 欧美伊人亚洲伊人色综合动图| 91视频成人免费| 成人av免费在线播放| а中文在线天堂| 欧美成人激情在线| 欧美深夜视频| 日本高清久久久| 亚洲成av人影院在线观看网| 国产视频在线看| 99久久99久久| 日韩av不卡在线观看| 青娱乐国产盛宴| 亚洲性视频网址| 91欧美极品| 日日摸天天爽天天爽视频| 亚洲男人电影天堂| 四虎影院在线播放| 91精品国产高清久久久久久91裸体| 国产日韩欧美在线播放不卡| 三级影片在线观看| 亚洲奶大毛多的老太婆| 亚洲一二三区视频| 亚洲精品自拍网| 福利精品视频在线|