火山引擎VeCDP: 如何0-1構建與應用標簽體系

標簽作為企業數字化營銷的基石,在企業運營與營銷場景下發揮著重要的作用,通過標簽體系,企業可以更好地了解消費者的需求和行為,豐富用戶畫像特征,幫助企業優化產品設計和營銷策略,提高產品的市場競爭力。因此,企業需要從業務場景出發,構建適用于自身業務模式和邏輯的標簽體系,為企業的精細化運營及精準營銷服務,進而深入挖掘潛在的商業價值。本次分享將介紹標簽及標簽體系的概念和應用,包括對業務對象的特征抽象和服務上層業務場景,以及標簽體系的信息架構和分類設計思路。構建標簽體系時需要兼顧合理性和靈活性,考慮可追溯性、實時性、權限管理等因素。標簽體系的構建是一個完整的閉環,通過活動數據可以進行分析洞察,然后根據洞察結果留存好的標簽,拋棄不相關的標簽,形成企業合適的標簽庫。企業規劃好的整套標簽體系服務于各個業務部門,如果需要使用不同的標簽,可以進行分類和授權標簽,實現動態快速擴展。
一、標簽及標簽體系介紹
首先介紹標簽和標簽體系的基本概念。
火山引擎VeCDP的標簽最終服務于上層的業務場景,例如營銷、分析等場景。而標簽體系是對標簽的一種組織方式,對標簽進行分類,形成一套可以長期穩定使用并且適用性較強的框架。
二、標簽體系的核心設計思路
在建立整體的標簽體系之前,第一步是做好標簽的設計。

標簽設計,需要梳理好整個數據的流程,業務的場景。
在做營銷活動的時候,會用到兩個核心對象,第一是標簽,第二是群組。接下來介紹一下這兩者之間的關聯和區別。

標簽主要是提取客戶特征,對客戶進行一些畫像洞察。群組主要是針對某場營銷活動,圈選某個客群進行營銷和分析。前者是進行特征的抽取,后者是做服務與活動。由于標簽是特征的提取,所以在系統中留存的時間會更長。而群組主要是為了某個活動,服務完該活動,其生命周期理論上就結束了。另外一般對于品牌方或者說企業主而言,標簽是數據分析師或IT人員去構建的。而群組,可能更多的是運營這樣的業務角色去使用。概括而言,標簽更多是面向客戶數據的抽象加工,群組是面向活動進行的精準的人群圈選。
在構建標簽時,通常會用到三類數據:行為數據、屬性數據和業務數據。

- 行為數據:是通過各個業務系統,或者其它第三方應用上的埋點采集得到的線上線下的數據。
- 屬性數據:是用戶的一些基本資料、會員屬性、微信基本屬性等等。
- 業務數據:比如訂單類數據、消費類數據,或是客服的一些工單、咨詢單之類的數據。
基于以上數據,可以通過標簽規則或者模型去構建標簽,基于這些標簽,可以在上層構建分群。

構建標簽體系的時候需要兼顧合理性和靈活性。合理性主要是從業務視角出發,而靈活性主要是工具的視角,需要滿足各類業務場景。下面從四個細化的層面去介紹。
首先是可追溯性,指的是可以對標簽做一些歷史的回溯,通過洞察標簽變化,可以了解到整個客群全生命周期的變化,同時也可以了解整個營銷活動的執行效果。
其次是數據和計算的實時性,標簽可以分為實時標簽和離線標簽。實時標簽能夠支持對營銷要求更高的一些場景,例如金融行業儲值金額達到一定數值的時候,需要實時去做一些營銷,此時標簽的構建是依賴實時數據,實時生產的。
再次是標簽制作的靈活性,上文也提到在構建標簽的一些數據和規則方面,執行頻率都可以靈活配置。
最后是生產和使用流程的強可管理性,會體現在標簽的權限方面,以及服務上下游的相關應用,例如對外提供的一些API,提供數據輸出的能力,Kafka消息訂閱的能力,記錄標簽的增刪改查相關信息,標簽的上下架操作,標簽審批的管理等等。
三、標簽體系建設流程與方法論
大部分客戶在構建標簽時會遵循一個標準流程,如下圖所示。

第一步是明確需求,梳理業務場景和流程。之后就可以知道如何接入何種數據,上文也提到,接入的數據一般是包括屬性行為,以及業務相關單據的數據。接入這些數據之后,接下來就可以構建規則,真正把標簽構建出來,其中包括一些標簽的分組以及層級的構建。標簽構建之后,就可以去圈選目標人群,從而去做一些營銷活動。對這些活動進行洞察,同時結合標簽事件等各種信息就可以更好地去做標簽管理,修改標簽規則,重新上下架一些標簽。其中也可以去做標簽的價值評估,即哪些標簽是更有意義的標簽,標簽后期的建設方向等。最后會產生優化策略,它會體現在新需求的輸入,從而形成一個全流程的循環閉環。在企業內部,整個標簽體系的構建,其實是一個持續構建的過程。
構建標簽時,會遵循5W2H的分析方法論。

首先是What,即針對何種場景,例如客戶生命周期場景或是會員營銷場景。然后是Where,即依賴什么樣的功能模塊,例如是否需要一個算法標簽或是基本的規則標簽,是否需要依賴于群組的一些信息。第三是When,即什么時候需要上線標簽。第四是Why,即構建標簽的原因,例如需要做洞察或者營銷轉化,又或是需要服務于客戶,做一些客戶關懷。第五是Who,即誰構建標簽,如前文所述,可能是業務也可能是IT相關人員,其所用的標簽工具也會不同。第六是How,即如何構建標簽,例如構建RFM標簽、統計標簽,或是普通規則標簽。最后是How much,即構建標簽能夠產生多少業務價值。

從標簽體系的整體設計來看,第一步是最底層的規劃主體。此時需要去梳理各個主體對象,梳理對象主體之間的關聯關系,梳理數據源和具體數據類型。接下來就是探查數據,包括前文講到的基本屬性、行為數據、訂單數據等,數據是實時還是離線,如何去接入。數據梳理清楚之后,接下來是構建標簽類目,這是更偏業務層的設計。數據產生之后,會先做一些探查式分析,從而可以了解客戶群體是何特征,之后再去構建標簽類目,拆分類目,最后需要把標簽內容設計出來。整個設計標簽的過程中,前期規劃,內部對齊,標簽的口徑的對齊以及數據梳理,都是非常重要的。
接下來介紹標簽內容和類目的設計。

上圖中結合具體的業務場景,將客戶按照不同的生命周期進行了分類,例如可以分為沉睡客戶、潛在客戶、活躍用戶以及忠誠用戶。有了這樣的客戶分類之后,就可以去做具體的規則定義。沉睡客戶,可以定義為過去30天其瀏覽次數比較少的客戶;潛在客戶,可以定義為除了沉睡客戶之外的那些沒有互動的客戶;而活躍客戶是有一定互動的客戶;最后忠誠客戶是互動相對來說非常高頻的,并且有邀約一些新的客戶即老帶新的一些行為。
于是就可以去定義清楚整個客戶的生命周期,以及對應的規則。有了這些規則及客戶標簽的定義,就可以針對不同的客戶有相應的處理策略。針對沉睡客戶,需要對其進行激活;針對潛在客戶,需要進行持續的互動;針對活躍客戶,需要促成訂單轉化;最后對于忠誠客戶,需要持續地讓其產生復購。
接下來介紹標簽體系的數據鏈路,具體包括VeCDP系統中數據采集的步驟和標簽構建的方法。

首先要做標簽相關數據的采集,需要連接外部各種各樣的數據源。數據采集完成之后,需要做數據的加工處理,針對這些數據需要做ETL以及表間join操作。接下來是VeCDP系統中的一個核心能力,ID打通。會設計ID的優先級、生存策略以及參考關系,之后把各渠道ID做整體的融通。最后需要把數據落到VeCDP中,成為基礎的屬性數據,行為資料,以及業務訂單的數據,還有一些其它的明細數據和維度數據。
主體又稱實體或對象,針對不同的行業,規劃出來的主體也是不一樣的。例如汽車行業,通常將業務對象梳理成兩個主體,即人和車。圍繞著人的標簽體系,包括基礎屬性信息,在一些媒體點位的互動行為信息,以及留資相關信息等。同時圍繞車,會有一些汽車相關的信息,包括維修保養以及車聯網采集到的信號信息。在其它行業,也是類似地,可以梳理出不同的主體。

接下來基于梳理出來的主體去構建標簽。在火山引擎VeCDP中,提供了十幾種標簽構建的方法。其中規則標簽是基于一些規則去組合,生命周期標簽是圍繞其生命周期去打標簽。首末次標簽是基于用戶首次及末次行為去構建一些標簽。偏好標簽,需要統計用戶行為信息,觀察用戶集中行為聚集在哪些方面,之后做一些排序,就可以得出偏好信息。
標簽的更新頻率,可以設置整體上是實時還是離線,如果是實時計算,理論上就是一個實時標簽。如果是離線計算,可以去配置其更新類型,例如手動更新還是定時更新,執行的頻率可以選擇天級、周級或者月級等等。

離線標簽和實時標簽有著不同的適用場景,在規則和一些限制方面都會存在差異。從更新方式來看,離線標簽會更強調手動更新或者按周期去更新,而實時標簽則是實時計算,一般是由某個行為事件或者某個消息觸發去做實時更新。從參與計算的數據來看,離線標簽基本上是全量的業務數據都可以參與計算,而實時標簽則需要考慮計算的性能,是有限的數據參與,針對一些時間序列數據,像訂單數據和行為數據,可能會限制一定的時間范圍,例如一天或七天內。從復雜性來看,離線標簽復雜性相對會更高,實時標簽相對低一些。從適用場景來看,離線標簽主要用于畫像分析,實時的要求不那么高。但是實時標簽可能會在一些實時營銷,當達到某個標準之后要實時地給用戶發券或者是告警。
接下來介紹標簽價值的評估。

在應用標簽的過程中,可以采集到標簽在系統中的使用信息,進行價值評估。首先是標簽的覆蓋量評估,包括標簽覆蓋數量和覆蓋率。第二是標簽值的分布,包括標簽值隨時間的變化以及趨勢。第三是標簽的使用熱度,哪些標簽是高頻使用的,哪些是相對低頻使用的。第四是標簽穩定性,由于標簽本身依賴于各種各樣的上游數據,不同的上游數據會導致標簽在實際計算的時候,整體穩定性是有差異的。第五是標簽的關注度,主要統計標簽收藏的相關情況。最后是標簽優化率的評估,主要是指標簽在持續應用的過程中,哪些標簽可能會被頻繁變更。通過評估以上維度,可以得知哪些標簽是高頻應用的,哪些標簽是有價值的,哪些標簽是可以持續去做一些優化的,從而指導后期標簽體系的構建。
四、標簽應用的價值與典型案例
接下來介紹標簽應用的一些典型案例。
每個行業都有不同的標簽體系,零售行業會根據用戶畫像和訂單行為構建標簽和畫像;汽車行業關注線索到店、線上互動和市場活動等流程;金融行業主要基于客戶交易、資產和負債情況構建風險評估和客戶價值評估。除此之外,火山引擎VeCDP還會在一些泛互聯網行業中應用,所以整個標簽更體現其工具性。
首先來看一下汽車行業。

會按照消費者生命周期以及使用流程,去構建其標簽體系。包括一些基本信息,還有一些行為的數據。行為數據包括線上行為以及線下行為,另外還有一些消費信息以及相關的售后信息。
由于汽車行業是高客單價的行業,所以會更注重售后的管理。另外,在一套標簽體系下,不同部門關注的點是不一樣的。銷售部門會更關注線索、到店、下訂、試駕這樣的用戶流程;運營部門則更關注線上互動,包括簽到、評論、分享以及精品消費等等;市場部門會更關注整個市場活動的留資、下訂行為。
接下來介紹零售行業。

零售行業相對而言標簽會做得更加精細化。圍繞用戶畫像,通過其訂單互動行為,基礎信息,去構建整體標簽規則和畫像。另外,零售行業除了使用第一方的數據,同時也會去采集第三方的數據做一些補充,然后去構建其完整的畫像。除了用戶畫像還會做商品畫像,商品作為一個獨立的主體,圍繞商品的一些基本信息、價格策略、庫存信息以及售賣情況去構建標簽和畫像。最后還有門店畫像,包括門店地理位置、類型、門店業績以及在售商品等。在零售行業會利用各個主體之間產生的關聯關系來構建一些標簽,例如用戶和門店之間,用戶會有到店的動作,用戶在門店中有消費動作,包括用戶買了何種商品、瀏覽了何種商品,通過這樣的一些關聯關系的組合去做營銷。
接下來介紹金融行業。金融行業標簽大致有如下圖所示的分類。

首先是原始信息,包括客戶交易、客戶資產、客戶負債以及客戶持有的產品情況。基于這些內容,可以去構建客戶風險評估,以及客戶價值評估,從而構建整個的標簽體系。
標簽體系的構建是一個完整的閉環,通過活動數據可以進行分析洞察,然后根據洞察結果留存好的標簽,拋棄不相關的標簽,形成企業合適的標簽庫。

在高客單價營銷場景中,針對一些線索,會圍繞線索做標簽的打分,生成一些數字類型的標簽。會有正向打分機制和負向打分機制。正分機制包括屬性信息、信息完整度、最近的互動行為信息以及留資信息,還有客戶本身跟銷售員的互動信息。而負分機制主要包括客戶在電話中明確拒絕,或者是有戰敗線索,此時會打上負分。最后會得到一個總分作為線索的評分。

精細化營銷更多是體現在一些低價高頻的營銷場景,例如發放優惠券的場景。首先把一些客群批量圈出,圍繞優惠券使用場景,比如最近180天用券次數,最近30天用券次數,近7天用券次數,以及客戶對優惠券的敏感度。有一些客戶可能會更關注低價優惠券,希望打折力度更大。基于優惠券使用的信息,可以給客戶做一些標簽畫像,去服務于上層的營銷場景。

基于標簽可以去做一些分析洞察,比如客戶行為分析、畫像分析、流程分析等等。首先構建好標簽,然后去做活動,之后會產生活動數據,基于活動數據,可以再做一些分析洞察。分析洞察后可以得知哪些標簽可以促成轉化,哪些標簽跟整個活動效果是不相關的。從而可以把好的標簽留存下來,去服務于下一個標簽體系的構建。壞的標簽就可以逐步拋棄掉,最終形成適合企業的標簽庫。
以上就是本次分享的內容,謝謝大家。
五、Q&A
Q1:正向評分是直接加工標簽出分數,還是根據標簽轉化分數?
A1:這個是直接以標簽作為分數,基于一些原始的信息,即前文講到的一些屬性信息,一些行為的統計信息,還有一些訂單信息,去把這個分值打出來。這個分值最終是落在標簽上,這個標簽其實是一個數值類型的標簽。
Q2:標簽形成人群分類如何做觸達,通過什么技術能觸達,效果如何?
A2:先講一下標簽如何做觸達,其實一般來說就是前文講的一個CDP的系統里面更多會去構建標簽和分群。如果實際去做觸達的時候,一般來說會結合一個MA的系統。MA系統里面觸達的時候可能會做一些短信,APP Push,或者微信模板消息等其他的一些方式做觸達。整個CDP加上MA會形成完整的營銷系統的閉環。像火山這邊,是有一個像GMP這樣的一個產品去做MA的工具。
Q3:關于標簽評分,例如滿分40分,打了24分,具體是如何評分的?
A3:很多時候在評分前,如前文所述,圍繞評分這個事情其實是有一點偏主觀,但也是有一定策略的。一般在做標簽規劃的時候,前期是先做分析,圍繞分析,先去把整個客群的洞察做好。然后就可以知道整個客群大概的情況。基于大概的情況,例如先把整體行為的一些統計,一些數字類型進行分析,就可以知道大概的分布情況。從而就可以知道要判斷哪個分值是屬于高價值的,哪個分值應該是屬于低價值,結合第一次判斷好之后,做好這樣的一個規則并且打分,并實際服務于營銷,之后再基于營銷的結果,反過來去倒推之前做的打分是否合理。
Q4:根據手機號做唯一標識會出現誤差,怎么避免類似誤差?
A4:一般來說跨渠道的數據打通主要依賴的是手機號碼。然而手機號碼有可能會存在一定的誤差,但一般來說企業方會去規避這種誤差的方式,就是通過手機號碼去做驗證碼驗證。我們也會基于像微信生態的Union ID,做一些跨渠道的打通,相對來說也會更準確一些。
Q5:跨客服的標簽能復用嗎?
A5:一般來說企業規劃好的整套標簽體系就是服務于各個業務部門的。當然如果說要在不同的部門使用不同的標簽,會做好標簽上層的分類,以及相關的一些授權。
Q6:標簽是否可以實現動態快速擴展,業務在極短的時間,如一天內能否要求生成新的標簽及人群圈選做推送?
A6:這個是可以的。我們的標簽工具是可以讓業務人員在短期內快速去構建,只要配置好規則,點擊保存生成這個標簽,可能在1分鐘之內就會快速給相應的客群打好對應的標簽,之后就可以直接服務于下游的人群圈選和推送。
Q7:如何保證標簽的質量?
A7:主要是從兩個方面,一是業務,二是技術和工具。業務方面就是前期要做好標簽整體的梳理,在技術和工具方面,首先會保證其穩定性和性能以及規則的合理性。另外前文也介紹了標簽價值評估的一套體系。圍繞標簽價值評估,可以持續去迭代整個標簽的質量。
Q8:標簽底層存儲和計算使用的是什么框架和技術,能夠無縫遷移到云環境嗎?
A8:火山引擎VeCDP主要是提供整體系統的一個解決方案的交付。底層用于標簽的存儲和計算,使用的是ClickHouse,我們也提供了一個云環境去服務客戶的。
Q9:業務使用標簽時經常會對標簽的技術口徑進行確認,花費較長時間確認。你們會面臨這樣的情況嗎,一般怎么避免投入大量的時間和問題?
A9:標簽口徑的確認,如前文所述,經常是需要去做好這樣一個整體口徑的對齊,以前我面對的一些客戶,他們有一些比較好的做法,即他們會把標簽做好一些拆解,然后做每個原子的描述的定義。比如說最近七天,他會清晰的界定最近幾天是怎樣的一個定義。如果是訂單,就會定義哪些訂單參與這個標簽計算,例如消費金額為零的要剔除掉,下單時間在某個時間的要剔除掉等等。客戶會做好整體描述溝通的一個文檔。每次跟技術同學去溝通的時候,都是基于這樣的一個中間文檔去做溝通。所以后面在上層去描述其標簽規則時也會非常的順暢。



























