什么是AI PaaS?一文讀懂AI開發新未來
AI應用部署面臨復雜挑戰。AI PaaS作為平臺級解決方案,抽象AI基礎設施和功能,簡化AI應用構建、部署與運行,加速生產級AI開發。Heroku提供此類服務。
譯自:What Is an AI PaaS? A Guide to the Future of AI Development[1]
作者:Doug Sillars
部署AI驅動的應用程序不僅僅是調用模型。開發者必須處理推理基礎設施、版本化數據管道并集成外部工具,同時還要找到方法來監控或管理更可能出現幻覺的輸出。當團隊試圖超越基本原型時,他們突然被迫在編排、合規性和AI架構方面發展專業知識。
隨著AI能力在各種模態(例如:文本到圖像到音頻)中爆發式增長,開發者體驗卻未能跟上步伐。團隊正在將跨云提供商、大型語言模型 (LLM)[2] API、向量數據庫和脆弱的控制循環的解決方案拼湊在一起。即使是擁有強大工程實力的公司也難以保持開發速度。
缺少的是一種平臺級解決方案,它能像傳統平臺即服務 (PaaS)[3] 抽象基礎設施一樣,抽象這些AI相關的關注點。
這正是AI平臺即服務[4] (AI PaaS) 旨在填補的空白。它將PaaS的簡潔性、可擴展性和開發者優先工具的核心原則帶入現代AI構建模塊。
讓我們探討一下什么是AI PaaS,以及它如何讓您無需重新發明整個技術棧即可交付生產級的AI應用程序。
什么是AI PaaS以及為何它是必需的?
AI PaaS正如其名:它是一個平臺,幫助開發者在云端構建、部署和運行AI驅動的應用程序,而無需自行管理模型、編排、管道或基礎設施。它建立在傳統PaaS的基礎上,但通過模型訪問、檢索管道、代理編排和評估工具等AI原生功能對其進行了擴展。
這些平臺填補了一個關鍵空白,因為許多AI項目從未投入生產。Gartner預測,到2027年,多達40%的代理AI計劃將失敗[5],這通常是由于集成成本、缺乏可觀測性或部署復雜性。AI PaaS通過提供有主見且可擴展的默認設置來應對這些挑戰。
那么AI PaaS由什么構成?你從PaaS的基礎開始,然后添加AI特定的功能。
現代PaaS的核心基礎
無論是構建CRUD應用還是對話代理,每個PaaS都需要做好幾件核心事情。它們是:
? 可擴展性:基礎設施可以輕松擴展,以處理計算密集型AI工作負載的變化。
? 安全性:所有租戶都通過適當的訪問控制進行隔離,以確保模型、數據和代理保持安全。密鑰都遵循最小權限原則并得到安全管理。
? 容器化: 代理和工具都在容器中,以實現一致的部署。
? 編排: 無需手動配置基礎設施。代碼自動構建和部署。
? 數據:數據庫自動配置、可擴展并提供安全訪問。這可能意味著向量數據庫、客戶數據或AI所需的任何其他內容。
? 可觀測性:延遲、使用模式和錯誤管理通過OpenTelemetry或類似工具可見。AI工作流也需要在提示流和結果中具有可觀測性,以便調試LLM結果。
這些是基本要求。但使用AI進行構建會引入一層新的復雜性。讓我們看看AI PaaS所需的特定功能。
最小可行AI PaaS的基本功能
要開始構建AI PaaS,所需的最少工具包括模型推理、檢索管道和模型上下文協議 (MCP)[6] 腳手架。
AI模型和推理選項
AI驅動的功能以LLM為中心。LLM提供對話式生成AI,自2022年ChatGPT發布以來已變得普遍。AI PaaS應提供對各種機器學習 (ML) 模型的無縫訪問。所有模型都有不同的優缺點,因此訪問多個模型為構建AI代理的團隊提供了最大的靈活性。
這種多樣性還可以用于降低成本,其中一些服務需要復雜(且昂貴)的模型,而復雜度較低的服務可以使用更小、更便宜的模型。
AI質量和可靠性的控制循環
當LLM提供響應時,應建立一個控制循環來監控響應并驗證其質量。開發者可以創建客戶定義的啟發式和規則,用于評估響應。這可能涉及硬編碼的防護措施,或者比較多個LLM的結果以達成共識。
如果響應不符合質量標準,查詢可能會被重新表述并再次查詢。如果響應通過評估,控制循環將把響應傳遞給模型的下一步。
一個閉環通過將輸入發送到循環中以產生輸出,然后將輸出作為輸入返回,從而監控響應。
閉環如何監控響應。
連接數據和工具的模型上下文協議
LLM是強大的工具,可以與用戶就許多不同的話題進行對話。為了支持對組織有用的生成式AI,必須不斷提供額外數據,以確保及時準確的響應。
MCP是一種標準化方法,用于將外部工具連接到AI系統,以提供額外的數據或知識。MCP服務器使得安全地連接現有數據工具(內部和外部)以整合新數據變得容易。
MCP可以提供與API的連接,用于頻繁變化的數據(“紐約皇后區目前的交通狀況如何?”),或與包含企業數據的數據庫的連接(“2021年第二季度簽署了多少筆交易?”)。這些數據存儲支持并增強了模型的輸出。
此外,MCP還充當服務目錄。當查詢發送到AI時,它會根據了解數據位于何處以及如何檢索并格式化為響應來構建其響應。這允許現有應用程序和代理連接到MCP。
MCP處理來自應用程序和LLM的請求,然后從外部源饋送數據。
MCP處理來自應用程序和大型語言模型的請求,然后從外部源饋送數據。(來源:Heroku[9])
MCP還可以用于將AI應用程序作為工具暴露給其他代理系統[10]使用,允許其他代理使用AI系統完成任務。
例如,Audata[11]構建了Aura(一個AI支持代理),利用Heroku Postgres的實時數據和來自Salesforce Agentforce[12]的企業數據來回答日常問題。如果案件升級到支持團隊,則會向代表提供現有聊天的概要,從而加快工單解決速度。
企業級AI PaaS的期望
一個可靠的AI PaaS不僅僅是推理。它幫助團隊負責任地構建、快速迭代并自信地擴展。以下是您可以從支持長期、生產級AI使用的平臺中期望的功能:
檢索增強生成
一種常用的外部知識數據存儲工具是檢索增強生成 (RAG)[13]。RAG數據庫通常是一個向量數據庫,包含專門編碼用于快速與LLM交互的企業數據。例如,Heroku的Postgres pgvector[14]提供了無縫的向量數據庫支持,無需額外的數據庫工具。
當向AI模型發出查詢時,LLM會提供數據庫中的相關數據來構建響應。RAG架構允許組織插入定制數據來影響LLM的響應。
例如,1West[15]的貸款處理和審批是一個緩慢的手動過程。在使用Heroku的AI PaaS訓練一個機器學習模型以處理大量數據源后,貸款處理時間從幾天縮短到幾分鐘。
簡化的RAG架構,包括用于上下文數據的數據管道。
簡化的RAG架構,包括用于上下文數據的數據管道。
用于更新RAG數據庫的RAG數據管道
正如LLM本身可能很快過時并提供不正確或陳舊的響應一樣,RAG數據庫中的數據也可能發生同樣的情況。為了保持AI應用程序的準確性,RAG數據庫必須不斷刷新以反映新的或變化的數據。這需要自動化文檔處理工作流。這些工作流應與現有系統無縫集成,并高效處理所有處理步驟。
例如,在Heroku生態系統中,Heroku Scheduler[17]可以定期運行工作流以訪問文檔并將處理后的數據插入到pgvector數據庫中。所有處理都在安全環境中進行,保護企業數據。
Heroku如何提供全面的AI PaaS
隨著公司將AI驅動的工具集成到其技術棧中,許多開發團隊缺乏在生產環境中部署AI所需的MLOps、治理和編排技能。使用Heroku的AI PaaS可以啟動構建、部署、操作和擴展AI驅動應用程序的過程。
借鑒Heroku在構建云架構方面的經驗和開發者優先方法意味著企業團隊可以專注于構建服務,而不是管理服務器、網絡、安全和構建編排工具。
Heroku 氛圍編程[18]AI代碼生成允許您使用自然語言創建并部署到Heroku。Heroku的托管推理和代理[19]提供了精選的AI模型供您構建。Heroku的MCP服務器[20]使得代理能夠輕松訪問Heroku資源,如日志、配置附加組件和擴展應用程序。部署在Heroku上的自定義MCP服務器可以為您的AI服務提供對現有系統的訪問權限。
? LLM支持由Heroku托管推理和代理[21]提供,可訪問多個LLM推理模型。
? Heroku AppLink[22]提供與Agentforce(Salesforce[23]平臺的代理層)的安全連接,并與Salesforce Flows、Apex和Data Cloud[24]連接。
? Heroku的AI原生工具[25]集成使開發者能夠構建新應用、增強現有應用并使用AI生成的代碼創建新的AI代理。這意味著運行在Heroku上的AI代理可以安全地與敏感企業數據交互,利用最先進的AI同時確保您的數據安全。
賦能下一代AI開發者
部署AI應用應該像推送Web應用一樣簡單。憑借有主見的默認設置和托管服務,Heroku持續與開發者共同發展,提供流線型、集成的平臺體驗。
Heroku正將其數十年的云端應用部署專業知識[26]帶入,以幫助開發者快速推出AI技術。要了解更多關于Heroku和AI PaaS的信息,請在YouTube[27]上觀看演示或在LinkedIn[28]上關注更新。
引用鏈接
[1] What Is an AI PaaS? A Guide to the Future of AI Development:https://thenewstack.io/what-is-an-ai-paas-a-guide-to-the-future-of-ai-development/[2]大型語言模型 (LLM):https://thenewstack.io/introduction-to-llms[3]平臺即服務 (PaaS):https://thenewstack.io/return-to-paas-building-the-platform-of-our-dreams/[4]AI平臺即服務:https://www.heroku.com/blog/introducing-the-heroku-ai-platform-as-a-service/[5]40%的代理AI計劃將失敗:https://www.gartner.com/en/newsroom/press-releases/2025-06-25-gartner-predicts-over-40-percent-of-agentic-ai-projects-will-be-canceled-by-end-of-2027[6]模型上下文協議 (MCP):https://thenewstack.io/mcp-a-practical-security-blueprint-for-developers[7]:https://cdn.thenewstack.io/media/2025/10/147e489f-closed-loop.png[8]:https://cdn.thenewstack.io/media/2025/10/b194fdaa-mcp-request-processing.png[9]Heroku:https://www.heroku.com/ai/mcp-on-heroku/[10]代理系統:https://thenewstack.io/beyond-ai-models-data-platform-requirements-for-agentic-ai[11]Audata:https://www.heroku.com/customers/audata/[12]Salesforce Agentforce:https://thenewstack.io/avoiding-the-ai-agent-reliability-tax-a-developers-guide/[13]檢索增強生成 (RAG):https://thenewstack.io/no-mcp-hasnt-killed-rag-in-fact-theyre-complementary[14]Postgres pgvector:https://www.heroku.com/ai/pgvector-for-heroku-postgres/[15]1West:https://www.heroku.com/customers/1west/[16]:https://cdn.thenewstack.io/media/2025/10/8658946b-rag-architecture-model-heroku.png[17]Heroku Scheduler:https://devcenter.heroku.com/articles/scheduler[18]Heroku 氛圍編程:https://vibes.heroku.com/new[19]托管推理和代理:https://elements.heroku.com/addons/heroku-inference[20]MCP服務器:https://www.heroku.com/blog/introducing-official-heroku-mcp-server/[21]Heroku托管推理和代理:https://elements.heroku.com/addons/heroku-inference[22]Heroku AppLink:https://devcenter.heroku.com/articles/heroku-applink[23]Salesforce:https://www.salesforce.com/?utm_cnotallow=inline+mention[24]Data Cloud:https://www.salesforce.com/data/?utm_cnotallow=inline+mention[25]AI原生工具:https://devcenter.heroku.com/articles/heroku-inference-tools[26]云端應用部署專業知識:https://www.heroku.com/heroku-gartner-magic-quadrant/[27]YouTube:https://www.google.com/url?q=https://www.youtube.com/watch?v%3DQIwuBKysmxA&sa=D&source=docs&ust=1761762691618176&usg=AOvVaw2O8xHRsw-78JPt9j5a0FRo[28]LinkedIn:https://www.linkedin.com/company/heroku/posts/?feedView=all




































