免費開源!Hugging Face 推出 AI Sheets,讓你像用 Excel 一樣用大模型處理數據 原創
過去幾年里,AI 模型已經成為數據處理和分析的「標配工具」。無論是構建訓練數據集、清理臟數據,還是批量生成合成數據,研究人員和企業團隊幾乎都繞不開大語言模型(LLM)。然而,問題也擺在眼前:想真正用好這些模型,需要代碼能力、模型部署經驗,甚至還要懂不少機器學習框架。這直接把大多數非技術人員擋在了門外。
Hugging Face 顯然注意到了這一點。近日,它推出了一款名為 AI Sheets 的工具——一個免費、開源、本地優先的「無代碼數據處理平臺」。顧名思義,它像電子表格一樣直觀,但背后卻連接著 Hugging Face Hub 上的海量開源模型,以及本地私有部署的定制模型。
換句話說,AI Sheets 試圖讓數據處理像填表一樣簡單,卻又能隨時借助大模型的力量。
一、什么是 AI Sheets?

從名字就能看出,AI Sheets 與 Excel、Google Sheets 這樣的電子表格工具有幾分相似。用戶依舊看到一個表格界面,但區別在于:
- 傳統表格依賴公式,而 AI Sheets 的列與單元格可以直接由自然語言 Prompt 驅動;
- 你輸入的不是復雜函數,而是一句話指令,比如“把這段文本翻譯成英文”或“提取摘要”。
于是,AI Sheets 成為了一個專為數據而生的「AI 加持版表格系統」。它可以用來:
- 構建、清理、轉換、豐富數據集—— 無論是處理 CSV 文件還是快速生成樣例數據;
- 無縫調用 Hugging Face Hub 上的模型,也支持本地部署,比如 Ollama 搭載的 Llama 3;
- 協作與快速原型—— 團隊成員可以一起編輯、驗證、修正數據,快速形成可用的數據流水線;
- 大規模數據生成—— 支持批處理,哪怕是成千上萬條記錄。
一句話總結:它把大模型“裝進了表格”,讓人們不用寫一行代碼,就能玩轉 AI 數據處理。
二、核心功能拆解

從 Hugging Face 官方介紹來看,AI Sheets 的設計理念可以用四個關鍵詞概括:直觀、開放、本地優先、可擴展。
1. 無代碼工作流
傳統上,想清理一批文本數據,可能需要寫幾十行 Python 腳本,調用 OpenAI API 或 Hugging Face Transformers 庫。而在 AI Sheets 中,你只需要在新列里輸入一句話:
Remove extra punctuation marks from the following text: {{text}}AI 就會自動對這一列文本執行清理。
無需 Python,無需命令行,操作門檻大大降低。
2. 模型即插即用
AI Sheets 支持 Hugging Face Hub 上的 數千個開源模型,包括 Qwen、Kimi、Llama 3,甚至 OpenAI 的 gpt-oss。如果你有自己的定制模型,只要兼容 OpenAI API 規范,也能直接接入。
這意味著企業和個人可以根據任務靈活選擇:
- 快速測試新模型:比如把同一列數據分別交給 Qwen 和 Llama 3,比較結果;
- 用領域模型:金融、醫療、法律等專用模型,可直接應用在自有數據上。
3. 本地部署,重視隱私
AI Sheets 支持完全本地運行,數據不需要上傳云端。這對于很多行業來說至關重要——比如金融機構或醫療機構,數據安全和合規是第一位的。
通過設置環境變量(MODEL_ENDPOINT_URL、MODEL_ENDPOINT_NAME),用戶可以輕松將本地推理服務(如 Ollama)接入。
4. 免費且開源
工具完全免費,代碼托管在 Hugging Face GitHub 倉庫,社區可自由二次開發。這一舉動與 Hugging Face 一貫的「開放 AI」理念保持一致。
三、它能做什么?場景舉例
AI Sheets 不只是一個“AI Excel”,它更像是一個數據實驗工坊。以下是 Hugging Face 提供的典型場景:
1. 數據清洗與分類
- 清理數據:去掉多余標點、規范大小寫。
- 分類數據:比如一列用戶評論,可以用 Prompt 分類為「正面 / 中性 / 負面」。
2. 文本生成與增強
- 摘要提取:對一段文本生成核心要點;
- 翻譯轉換:快速批量翻譯多語言內容;
- 內容擴寫:生成更加詳細的說明或解釋。
3. 合成數據生成
當真實數據缺乏或存在隱私風險時,AI Sheets 能幫你合成高質量的「偽數據」。 例如:
Write a short description of a professional in the field of pharma companies and name the column person_bio.再進一步生成:
Write a realistic professional email as it was written by the following person: {{person_bio}}這樣,就能生成一整套真實感極強的虛擬數據集。
4. 模型比較與評測
一個亮點功能是 多模型對比。 你可以在表格里同時創建多個模型列(比如 Qwen、Kimi、Llama 3),讓它們回答同一問題,然后再通過另一列「LLM 評審」來判定哪個模型表現更好。
這讓 AI Sheets 變成了 模型測試臺,幫助研究人員直觀評估不同模型的效果。
四、如何使用 AI Sheets?
Hugging Face 給出了兩種入門方式:
方式一:直接在瀏覽器體驗
無需安裝,訪問 Hugging Face Spaces 即可使用 AI Sheets。適合新手快速上手。
方式二:本地部署
如果對隱私和性能有要求,可以從 GitHub 克隆代碼,在本地搭建推理服務。這種方式尤其適合企業團隊,可以避免數據外泄風險。
使用步驟:
- 導入數據:支持 CSV、XLS、TSV、Parquet 文件,最多 1000 行。
- 添加 AI 列:點擊“+”,輸入 Prompt,選擇模型。
- 手動修正與反饋:可以編輯單元格,AI 會記住你的偏好。
- 擴展數據:下拉生成更多行,快速擴展數據規模。
- 導出數據集:支持上傳至 Hugging Face Hub,生成可復用的配置文件。
五、影響與價值
AI Sheets 的出現,有幾個重要意義:
- 降低門檻:非技術人員也能利用大模型處理數據,讓 AI 普惠化真正落地。
- 提高效率:數據科學家和分析師可以快速迭代實驗,不再受限于腳本和 API 調用。
- 增強隱私控制:本地運行解決了企業對數據合規的擔憂。
- 開放生態:作為免費開源項目,它可能會催生更多基于 AI Sheets 的二次開發與插件。
一句話總結:AI Sheets 讓“數據+AI”的結合變得像拖動表格那樣自然。
六、未來展望
從趨勢上看,AI Sheets 可能會在三個方向持續演化:
- 插件生態:社區開發更多任務模版,比如電商數據清洗、醫療記錄分析等。
- 更強的協作能力:與 Notion、Airtable 甚至傳統 BI 工具的深度整合。
- 邊緣計算與本地化:在個人電腦甚至手機上運行大模型,進一步縮小門檻。
當下,AI Sheets 已經可以直接在瀏覽器免費使用(傳送門),也可以在本地部署(GitHub 項目)。
或許幾年后,我們再談起「用 AI 處理數據」,第一反應不再是 Python 代碼,而是一個更直觀、更友好的「智能表格」。
本文轉載自??Halo咯咯?? 作者:基咯咯

















