嘉賓 | 楊洋
撰稿 | 黃顯東
8月6日-7日,??AISummit 全球人工智能技術大會??成功舉辦。本屆大會以“驅動?創新?數智”為主題,覆蓋“計算機視覺、自然語言處理、算法與模型、推薦系統、機器學習、智慧金融”等技術領域。
在《機器學習性能優化之路》專場中,滴滴首席工程師楊洋通過《個性化推薦在數據運營中的創新應用》的主題分享,為開發者分享了機器學習在數據運營中的探索應用。
數據運營的價值與挑戰
數據運營離不開數據體系。在理想的數據體系全景中,預期的主要看數方式包括數據產品、數據服務、數據倉庫,以及基礎性的臨時需求。數據產品主要用來支持運營等非技術人員的看數需求;數據服務是通過API的方式對接各種各樣的業務系統;數據倉庫是通過資產化方式,對有一定技術能力的人員提供SQL的取數方式。

完整的看數過程中,數據運營是貫穿始終的,一方面可以充當溝通渠道,對內指導數據建設;另一方面可以告知用戶我們擁有的數據內容,持續向用戶進行培訓和宣貫。
在理想的情況下,通過產品化的方式來滿足大多數的看數需求,這樣便可以將整體的研發人力從臨時需求中解救出來,投入到資產化的工作當中,從而持續提升數據指標。
不過,理想和現實總是有差距的。在日常工作中,總會遇到各種各樣的數據易用性問題或者數據一致性問題。這些問題的背后也是整個數據體系的熵增定律,任何體系的架構,它在孤立無外力的情況下,都會隨著時間的推移逐步腐壞。
同時,在產業互聯網的發展階段也為數據運營帶來一些新的挑戰。從生產視角上看,多數業務場景正處于線上化探索期的產業互聯網會導致數據迭代頻繁。從消費視角來看,產業互聯網的整個組織架構也更復雜多元。這兩個視角都會造成多樣化和個性化的看數視角。
此外,傳統的數據運營推廣和培訓的方式,也面臨時效性差、延續性差和針對性不足的痛點,這些都會對運營效果產生影響。
個性化推薦的探索落地
那如何基于個性化推薦技術來解決數據運營的挑戰和痛點呢?
要解決這些問題,首先要對數據運營的目標場景做一個特點分析。典型的數據運營場景可以分成三大類:第一類是用戶冷啟動場景,占比大概為20%,例如新人入職、業務變化、組織調整等;第二類是內容冷啟動場景,占比60%,例如數據線上化或者分析功能迭代;然后通過數據運營的手段觸達用戶;第三類場景是常態化的運營場景,通過常態化的運營手段,持續提升業務的數據化運營程度,以及實現一些運營經驗的復用。
通過目標場景的特點分析,可以得出一些典型的特點。從內容方面上來看,數據內容推薦可以使用OneDate的指標體系,實現更高程度的規范性和結構化。從推薦用戶的角度來看,數據內容推薦可以針對性的獲取企業內部用戶比較規范完整的組織架構信息。從推薦目標上來看,數據內容推薦更加關注準確性,同時消費成本也更高。
基于以上分析,可以構建出數據內容推薦算法的設計思路。對于用戶冷啟動場景可以使用組織架構的熱度信息,構建一個的推薦的策略;對與內容冷啟動場景可以基于OneDate+指標血緣的content-based推薦,對內容和用戶實現精準的雙向匹配。對于常態化的推薦可以基于用戶行為策略+業務階段方向,實現高可控和高可解釋性的推薦策略

有了初步的算法設計思路,可以基于此將一個全周期的數據運營系統落地。具體包括三方面:首先根據算法實現一個具備用戶生命周期策略和推薦策略的數據服務推薦引擎;其次是打通觸達渠道,對郵件、辦公軟件等實現智能觸達,并提供手動觸達作為補充;最后是對前面的兩個能力做工具話和產品化的封裝,以服務更多的場景。
機器學習在數據運營領域的未來規劃和展望
未來,機器學習在數據運營領域也會有廣闊的發展空間。短期內產生價值的可以基于業務線、主題等個性化搜索排序,進行數據檢索工具的集成,可以更高效地幫助用戶找到數據。
基于數據推薦反向指導數據建設這個發展方向還需要進一步探索。在數據建設的整體決策階段,可以預先使用推薦來預估潛在的用戶量和潛在的訪問量,為數據建設提供相對數據化的量化參考。此外在內容設計和可視化方面,也可以根據數據化的分析來提供更加科學和數據化決策指導。



























