
譯者 | 張哲剛
審校 | 重樓
假如你將迎來這樣的一個同事:從不睡覺,從不拖延,而且就在你去喝了杯咖啡的時候,他已經處理了TB字節為單位的數據,你會因為合作者如此給力而欣喜,還是擔心自己的飯碗不保呢?這個問題直接引發了一個大討論:具有自主性的人工智能會取代傳統數據分析師的角色嗎?在本文中,你將了解到自主智能體如何重塑數據工作,它們會從你的工作中接手哪些具體任務,以及你如何從表格處理者轉變為戰略制定者。
目錄
- 數據工作流中自主智能體的興起
- 數據分析師會過時嗎?
- 當下數據分析師都在做哪些工作
- 代理型人工智能:數據工作流的新時代
- 實踐任務:代理型人工智能自動化
任務 1:自動化數據清理與預處理
任務 2:自動生成報告和儀表板
- 實踐任務:仍需人類數據分析師參與的任務
任務 1:在商業環境中解讀結果
任務 2:提出恰當的問題
- 增強,而非取代
- 結論
- 常見問題解答
數據工作流中自主代理的興起
如今的數據環境令人應接不暇。來自各類網站、應用程序、傳感設備以及社交媒體的信息充斥著企業的各個部門。人工處理所有這些信息是不切實際的。這時,自主智能體就派上了用場。這些由人工智能驅動的工具全天候運行,監控數據、預防問題并確保系統平穩運行。它們不會感到疲倦、不會錯過截止日期,更不會在深夜里因疲倦而犯錯。
它們之所以特別強大,在于能夠管理整個數據處理流程——從收集雜亂無章的原始數據,到清理、分析,甚至生成過去需要人工輸入才能得出的洞察。通過將這些常規任務自動化,分析師得以將精力集中在真正重要的事情上:解讀數據并推動業務決策。
得益于云計算和人工智能技術,過去需要整個團隊完成的工作,如今只需少數幾個智能體程序在后臺默默運行就能搞定。
數據分析師會過時嗎?
簡短回答:暫且不會。但是這種趨向正在現實工作中日益展現。
可以這樣思考:當Excel出現時,會計人員并沒有就此消失——他們不再手工計算,而是開始從事財務策略方面的工作,而數據分析師如今也正經歷著同樣的轉變。
人工智能的核心在于能夠處理大量數據,但卻無法理解這些數據的意義:它無法走進會議室,用首席執行官能理解的方式解釋上個季度銷售額下降的原因。它也無法洞察公司內部的各種關系,也無法意識到營銷團隊和財務團隊所需要的見解是不同的。
人工智能將從你手中接管那些枯燥乏味的工作:數據清理、重復的報告生成以及你每月都要做的標準分析。這將為你節省出寶貴的時間去做那些更為重要的事情,比如解決業務問題、提出更好的問題以及幫助公司做出更明智的決策。
如今的數據分析師具體做哪些工作
在探討正在發生的變化之前,讓我們先來看看如今數據分析師的工作內容。他們大部分時間都花在五個主要方面:

數據收集與整理:這是分析師工作中最耗時的部分。它包括從多個系統中收集數據、修正錯誤、處理缺失部分以及確保數據的一致性。
探索性數據分析:分析師識別模式、發現異常情況,并確定數據能夠解決哪些問題。正是在這個階段,他們開始揭開數字背后反映的本質。
儀表板創建與報告:分析師將洞察轉化為圖表和報告。構建并維護用于日常決策的儀表板。
商業洞察生成:分析師解讀模式以回答關鍵業務問題:例如客戶為何流失?哪些產品表現最佳?應采取何種行動?
利益相關者溝通:分析師必須向非技術人員解釋復雜的現象,包括將數據轉化為業務術語,并回答決策者提出的問題。
代理型人工智能:數據工作流的新紀元
現在我們來談談有意思的部分。代理型人工智能正在改變所有這些工作的完成方式。
在數據分析的背景下,代理型人工智能具體是什么?
你可以把它們想象成極其出色的實習生,從來不需要休息,而且每次犯錯后都能迅速吸取教訓。這些系統能夠理解你的目標,篩選出相關數據,進行分析,并就如何解讀結果提供建議。它們會隨著時間的推移逐漸了解你組織的特殊之處和偏好。它們能夠同時處理多項任務,哪怕是最高水平的人類分析師,也不容易做到這些。需要一邊分析客戶流失情況,一邊預測銷售業績嗎?它們就可以同時完成這兩項任務,甚至同時還能為你做一些市場調研。
智能體如何處理數據?
這些人工智能系統就像是你公司里的數據偵探。它們可以從眾多來源中搜尋數據,自動進行清理和整理,然后根據所發現的內容自行選擇合適的分析技術,并不需要你為它們詳細說明每一步驟。
他們還嚴格遵守規則,確保符合公司政策和法律要求,追蹤數據來源,并詳細記錄所做的一切。就像有一個術業有專攻的實習生專門負責合規事宜。
大型語言模型和自動化工具的作用
這些系統以大語言模型作為其“大腦”。它們能夠解讀和理解人類語言,這意味著你可以向它們提出任何類型的查詢——來提問吧——可以使用任何簡單的英語表述內容,無需將其轉化成復雜的代碼:“上個月的流量為何下降?”直接問就行。
自動化工具充當他們的“手臂”——這些工具與數據庫協同工作,進行計算,然后生成輸出結果。將這些“大腦”與自動化相結合,便能構建起從“我需要了解我們的客戶行為”到“這是你的分析報告,附帶三條可行的建議”這樣的完整系統。
實踐任務:代理型人工智能實現自動化
讓我們來點實際的。下面是展現代理式人工智能大展拳腳的一些真實案例,還附有詳細的步驟分解。
任務 1:自動化數據清理與預處理
這就是人工智能能夠大顯身手的地方。過去,數據清理要耗費分析師80% 的時間。而現在借助n8n工作流,人工智能能夠自動完成其中的絕大部分的工作。
還不知道n8n 是如何工作的?
步驟 1:在n8n中設置數據源連接
- 使用數據庫、API 和電子表格連接器創建n8n工作流。
- 設置從不同來源(MySQL、PostgreSQL、Google Sheets)自動獲取數據。
- 設置Webhook觸發器以實時獲取數據。
- 使用HTTP請求節點來連接外部API并與之交互。

步驟 2:構建數據質量評估工作流
- 添加功能節點以掃描類型、空值和重復項。
- 在“如果”節點中創建條件分支,以處理不同的數據質量情況。
- 使用代碼節點根據你特定業務邏輯的自定義驗證規則檢查數據質量。
- 當數據質量出現異常時,通過電子郵件/Slack向用戶發送提醒。

步驟 3:構建自動化清理流程
- 使用n8n的數據轉換節點來更改格式并填充缺失值。
- 使用“按批次拆分”節點創建循環,以便對大型數據集進行分批處理。
- 使用人工智能節點(OpenAI/Claude)智能填充缺失數據或對模糊條目進行分類。
- 使用“嘗試 - 捕獲”節點實現錯誤處理,以管理運行時可能的故障。

步驟 4:設置輸出和監控
- 進行配置用以將干凈的數據導出到你的目標位置。
- 在n8n中使用cron節點設置計劃工作流,實現定期的數據處理。
- 使用n8n的 Webhook 輸出開發監控儀表板,持續觀察處理狀態。
- 設置日志記錄以對所有轉換進行審計跟蹤。

任務 2:自動生成報告和儀表板
還記得那些每月的報告嗎?你得花上好幾個小時來準備,復制粘貼圖表,修改數據,還要重寫那些段落,也許只是對數據稍作改動?現在這些工作都可以交給人工智能來處理了。
步驟 1:為人工智能設置模板創建流程
首先要做的是創建可由人工智能自動填充的報告模板。這基本上就像設置一個“瘋狂填詞”游戲;你設置好結構,人工智能則用相關數據和見解來填充空白。
你可以使用類似 Google Colab 的工具來創建報告模板,其中包含占位符部分。設置包含主要指標、圖表和敘述性解釋的變量占位符的Markdown模板。創建提示模板,指導人工智能根據你的業務規則提供情境評論。我們可以嘗試構建一種布局,使其具有足夠的靈活性,以適應不同數量的數據和不同的時間段。為不同類型的報告(執行摘要、部門報告)創建不同的模板庫。

步驟 2:將數據源連接到報告生成器
人工智能需要通過其編程接口明確知曉數據的具體位置并理解這些數據。不僅僅是將數據庫連接起來那么簡單。
你需要通過API將你清理過的數據管道直接鏈接到報告生成工作流中,設置數據刷新計劃(每日、每周、每月),并建立錯誤處理流程制定業務規則,教導人工智能如何判斷數字是“良好的”、“有問題的”還是“緊急”的。 添加異常處理機制,以應對數據源不可用或出現錯誤的情況。對數據建立驗證檢查,以確保報告能正確生成。

步驟 3:生成自然語言洞察
現在,事情變得有意思了。人工智能如今能夠撰寫報告中的敘述部分,這部分內容過去要花很長時間才能完成:發生了什么以及為什么很重要。
使用 GPT-4o或Claude并通過自定義提示來生成描述數據趨勢的解釋說明。創建包含行業知識和公司特定術語的業務背景提示。建立比較框架(月度環比、年度同比、與目標對比),以自動生成分析報告。針對幾種不同的情況(增長、下降、平穩)創建條件邏輯,以便為每種情況使用恰當的語言。實施事實核查工作流程,以驗證人工智能生成的見解是否與實際數據相符。

步驟 4:自動更新儀表板并分發
靜態儀表盤正在逐漸被淘汰。如今,人工智能能夠生成動態儀表盤,這些儀表盤能夠根據當前的關鍵信息自行更新。
使用Tableau、Power BI或自定義網絡儀表板進行連接和可視化展示。設置一個自動刷新機制,使其能夠不斷獲取最新數據并重新生成可視化圖表——全程無需人工干預——同時在關鍵指標出現重大變化時向相關管理者發出警報。創建一種自適應布局,突出顯示當前與業務優先級相關的方面。自動創建分發列表,并提供多種版本的儀表板以滿足不同層次或部門管理者的需求。

來源: Data Dashboard
實踐任務:仍需人類數據分析師參與的任務
任務 1:在商業環境和背景下解讀結果
人工智能可以告訴你上個月銷售額下降了15%,但它無法理解銷售額下降的原因:也許是最大的競爭對手推出了新產品,也許是營銷活動處于空檔期,又或許是供應鏈出了問題導致庫存不足。這種情境理解只有人類才能做到。
這在實際工作中具體怎么辦呢?
理解數字背后的緣由:如果人工智能報告客戶獲取成本上升了 23%,人類分析師會調查原因,比如營銷策略的變化、平臺算法的調整或目標定位的改變。人工智能報告數據,分析師挖掘原因。
將數據與業務戰略相連接:如果用戶參與度下降10%,則可能會引發疑問:是因為新產品的推出嗎?還是用戶的購買行為發生了變化?這種情況是否在預料之中?分析師會將數據趨勢與業務背景相聯系。
識別行業特定因素:人類分析師會明白,1月份銷售額下降可能是季節性因素所致,而 11月出現類似降幅則可能意味著存在問題。在SaaS行業,夏季使用量降低并不總是意味著客戶流失,這可能只是因為這不過是常態。人工智能就缺乏這種領域直覺。
將技術發現轉化為商業術語:人工智能可能會報告折扣與客戶價值之間存在負相關關系。分析師重新表述:打折會吸引對價格敏感的客戶,而這類客戶不會長期留存。
理解組織背景:當業績下滑時,分析師會考慮到內部因素,比如預算削減、團隊變動或戰略調整,這些因素可能能夠解釋相關數據出現的原因。他們會結合公司動態來解讀數據。

任務2:提出正確的問題
你可以把人工智能視為非常擅長模式識別,但它永遠無法理解哪些問題對你的企業是有用的。人類分析師會問:“為什么客戶流失?”而人工智能系統可能只會報告客戶流失正在發生。
這在實際工作中,具體怎么辦呢?
確定關鍵指標:人工智能可以追蹤一切,但分析師知道什么才是關鍵。在訂閱業務中,功能采用率可能比月活躍用戶數更重要。如果獲客成本不可持續,僅靠收入也意義不大。
何時深挖:如果流量激增30%,可能引發更深入思考:流量從何而來?是否會帶來轉化?會不會是機器人?分析師們深知,表面的增長可能掩蓋了潛在的問題。
關注決策驅動型問題:分析師的工作與業務需求保持一致,滿足領導規劃所需、產品優先級排序所需以及銷售達成目標所需。他們專注于影響推動業務向前發展的問題。
糾正偏離方向的分析:當分析偏離正軌時,優秀的分析師能夠察覺。他們會停止探究無關的數據,重新定義問題以重回正軌。
質疑假設:人工智能會原封不動地接受輸入。分析師則會對輸入內容提出質疑:這些細分市場是否恰當?這些指標是否有意義?數據是否存在偏差?他們會質疑分析本身的基礎是否合理。
展望未來需求:人工智能回顧過去。分析師展望未來:為了擴張我們需要哪些數據?哪些見解能夠指導我們的下一條產品線?他們今天就為明天的問題做準備。
串聯商業脈絡:分析師能察覺到人工智能可能忽略的模式,比如某些營銷活動之后投訴量激增,或者銷售推介如何影響產品使用情況。他們能夠將分散的事件串聯起來,進而揭示其中的因果關系。

增強,而非取代
人工智能與人類攜手合作比各自為戰更有效。人工智能擅長快速、一致的數據處理;人類分析師則能提供業務背景、創造力和溝通能力。就像計算器能增強數學家的能力一樣,人工智能也能提升分析師的水平。
從手動任務到戰略思考:人工智能減少了清理數據或生成報告所花費的時間,使分析師能夠專注于業務問題、創新解決方案以及跨團隊協作,從而讓他們變得更有價值,而非相反。
技能提升機會:隨著人工智能的發展,分析師的角色也在不斷演變。分析師將學會管理人工智能工具、提取洞察信息并運用戰略思維。那些能夠設計人工智能工作流程并將機器輸出與人類判斷相結合的人將會脫穎而出。
分析師作為業務與技術的橋梁:優秀的分析師能夠將技術型人工智能能力與業務需求相連接,此類人才需求日益增長。咨詢、項目管理和戰略規劃等技能將至關重要。
結論
毫無疑問,代理型人工智能正在為數據分析師創造新的機遇,而非終結這一行業。未來屬于那些與能夠人工智能系統公平合理地合作而不是對抗的數據分析師。最成功的公司將擁有僅靠人類或人工智能都無法企及的分析能力。
數據分析師有一條出路,那就是擁抱新工具,同時培養能與人工智能能力相輔相成的技能。這意味著要擅長戰略規劃、向相關管理者匯報創新思維以及創造性地解決問題,同時學會與人工智能互動。那些將人工智能視為伙伴而非敵人的分析師肯定會取得成功。通過與人工智能協同工作,數據分析師為所在的組織,從決策制定和目標實現這些方面都能夠提供源源不斷的支持。
常見問題解答
Q1. 代理型人工智能什么時候會取代我數據分析師的工作?
A. 它不會取代你的工作,但在接下來的2到3年內會顯著改變你的工作。諸如數據清理和基礎報告之類的常規任務將會實現自動化,但戰略思考、業務背景理解和與利益相關者的溝通仍將是人類的責任。要想到的是工作內容的演變,而非職業的消亡。
Q2. 使用代理式人工智能系統工作需要學習編程嗎?
A. 并非如此。許多代理型人工智能工具被設計為能夠響應自然語言指令。不過,掌握基本的編程概念和數據結構有助于你更高效地使用這些系統,并在出現問題時進行故障排查。
Q3. 代理型人工智能會降低數據分析的準確性嗎?
A. 它通常通過消除常規任務中的人為錯誤使分析更加準確。不過,你需要驗證輸出結果,并清楚人工智能的局限性。關鍵之處在于要知道什么時候相信人工智能,什么時候依靠人類的判斷進行更深入的探究。
Q4:我現在應該著重培養哪些技能?
A. 應注重商業頭腦、溝通技巧和批判性思維。學會提出更好的問題,理解行業背景,并將技術發現轉化為商業語言。隨著人工智能承擔起技術方面的繁重工作,這些技能將變得愈發重要。
Q5. 對于小型企業來說,實施代理型人工智能的成本是多少?
成本正在迅速下降。許多基于云的解決方案每月基本自動化服務的費用從50美元到200 美元不等。通過節省時間和提高準確性,投資回報率通常很快就能體現出來。要從小規模的特定應用開始,不要試圖一次性實現全面自動化。
譯者介紹
張哲剛,51CTO社區編輯,系統運維工程師,國內較早一批硬件評測及互聯網從業者,曾入職阿里巴巴。
原文標題:Will Agentic AI Replace Traditional Data Analyst Roles?,作者:Riya Bansal





























