撰稿 | 云昭
出品 | 51CTO技術棧(微信號:blog51cto)
太猛了!甲骨文已經按捺不住,就像找了某種魔法鑰匙一般,準備在2024年大干一場!
近日,甲骨文宣布正在將生成式AI功能集成到該公司的整個云服務OCI(Oracle Cloud Infrastructure)的技術堆棧中。
從硬件到基礎平臺、再到模型和應用,都將全面跟生成式AI深度融合,當然,數據庫和Java也在其中。
1、Oracle全生態集成GenAI
在過去一年里,甲骨文一直在多種產品中推出其三層生成人工智能戰略。該公司于9月發布了OCI Generative AI Service的測試版預覽版。
如今,Oracle突然放出了一些列動作,可謂一改保守的姿態,主要有:宣布新模型入駐(Cohere和Meta新模型Llama 2)、新的AI Agents、用于管理開源LLM的新的低代碼框架,并使該服務普遍可用。
在一次采訪中,Oracle Cloud Infrastructure副總裁兼Generative AI Services總經理Vinod Mamtani,透露了一項甲骨文的計劃,其中包括全面提供生成式AI服務、推出生成式 AI Agent以及引入數據科學人工智能快速行動。
IDC集團副總裁Ritu Jyoti表示:“通過在整個Oracle生態系統中集成生成人工智能的通用架構,該公司正在將生成式AI帶到云數據中心和內部環境中已有EB級客戶數據的地方。”
值得注意的是,這家企業友好型云服務提供商去年在Oracle應用程序套件中的幾個應用程序中添加了生成式AI服務,其中包括HCM、SCM、CX、ERP、NetSuite和一系列其他行業垂直模型。
2、寶藏模型Llama 2入駐甲骨文
新模型包括Meta的Llama2-70B,這是一種針對聊天用例優化的文本生成模型,以及最新版本的Cohere模型,如Command、Summary和Embed。Oracle在一份聲明中表示,這些模型將在可通過API調用使用的托管服務中提供,并補充說,這些模型也可以通過更新的服務進行微調。
此外,除了托管Llama 2,OCI現在還將托管Cohere的520億嵌入式模型。Mamatani說:“如果你看看排行榜,Cohere的嵌入式模型排名很高。它同時支持英語和多語言嵌入。”他解釋說,無論使用何種語言,生成的嵌入都將在同一空間中。
此前,Cohere一直被視為甲骨文的AI大模型寵兒,當時被視為其“構成嵌入Oracle SaaS套件和行業應用程序的GenAI功能的基礎”。
最近Llama 2的受歡迎程度飆升,甲骨文當然不會放過這個寶藏模型。有趣的是,這是OCI首次托管Cohere以外的模型。當被問及是什么促使OCI轉向Llama 2時,Mamtani說:“關于Llama,我們注意到了它在開發者之間的興趣和受歡迎程度,這就是為什么我們認為它對我們的客戶非常有用。”
OCI Generative AI服務還提供靈活的微調,可通過vanilla和TPU微調用于Cohere的Command 52/6B型號。此外,為了讓客戶更容易構建他們的人工智能應用程序,Oracle還集成了流行甚廣的LangChain。
總的來說,OCI 托管 Llama 2 的決定是一個明智的舉措,這有助于他們在競爭激烈的云服務市場中保持領先地位,并吸引更多的客戶。
畢竟,托管多個不同類型的模型也可以增加云服務提供商的靈活性和多樣性。通過托管這些模型,云服務提供商可以吸引更多的開發者和研究者使用他們的服務,進而推動其云業務的增長。
3、押注AI Agents:RAG、數據庫、Java,一個都不能少
在測試版中,甲骨文引入的第一個AI代理是RAG代理。Mamtani表示,該代理的工作原理與LangChain類似,它結合了LLM和建立在OCI OpenSearch上的企業搜索的力量,提供了通過企業數據增強的情境化結果。
當企業用戶通過業務應用程序向RAG代理輸入自然語言查詢時,該查詢將傳遞給OCI OpenSearch,這是一種矢量或語義搜索形式。OCI OpenSearch反過來從企業的數據存儲庫中讀取和收集相關信息。然后,ReRanker LLM對搜索結果進行排名,該LLM將排名傳遞給文本生成LLM,文本生成LLM以自然語言回答查詢。
由于LLM是在公共數據集上訓練的,并沒有囊括這些龐大的企業私有數據。為了解決這一問題,OCI在其OpenSearch中引入了檢索增強生成Agents。用戶現在可以簡單地將自己的文檔附加到它上,并開始用自然語言與它聊天。
甲骨文 OpenSearch用例
Mamtani解釋道:“它將提供有根據的響應,減少幻覺。我們正在插入對OpenSearch的支持。用戶現在可以通過自然語言透明地訪問各種企業數據集,而不需要專業技能,也不需要知道數據的格式或存儲位置。”
除了RAG Agent,Oracle還計劃引入新的Agent。即將發布的版本將支持更廣泛的數據搜索和聚合工具,并提供使用AI Vector search訪問Oracle數據庫23c和使用Vector Store訪問MySQL Heatwave的功能。
圖片
甲骨文表示,這些AI Agents是在普林斯頓大學和谷歌研究人員發表的ReAct論文的幫助下創建的。Agents通過使用ReAct框架根據一系列想法、行動和觀察進行推理、行動和計劃。
Mamtani說,這些功能將允許Agents超越信息檢索任務,代表用戶調用API,并自動化其他任務。Oracle還計劃向服務中添加多回合代理,這些代理可以被要求保留過去交互的記憶,以進一步豐富模型上下文及其響應。
至于用途,據該公司稱,這些代理及其操作中的大多數都可以添加到其SaaS應用程序套件中,包括Oracle Fusion Cloud applications suite、Oracle NetSuite和Oracle Cerner等行業應用程序。
Oracle還將在其SaaS應用程序套件中提供預構建的代理操作,包括Oracle Fusion Cloud applications suite、Oracle NetSuite和Oracle Health等行業應用程序。Mamtani說:“我們的SaaS應用套件中存在這些復雜的工作流程。因此,我們希望實現自動化和簡化。我們會考慮構建專門用于這些應用程序的代理。”
此外,Mamtani表示,Oracle還計劃為Java應用程序引入Code Gen Agent。“Oracle收購了Sun Microsystems,所以我們最適合擁有Java語言的Agent,”他補充道。
4、AI Quick Actions低代碼部署開源庫
此外,為了幫助企業使用和管理具有開源庫的LLM,Oracle正在其OCI數據科學產品中添加一項新功能,稱為AI快速操作(AI Quick Actions)功能。這項功能將于下個月進行測試,它允許對各種開源LLM進行無代碼訪問。
AI Quick Actions從根本上為部署和微調提供了無代碼、低代碼的解決方案。為了幫助客戶使用開源庫(如Hugging Face的Transformers或PyTorch)構建、訓練、部署和管理LLM,Oracle還擴展了OCI Data Science的功能。
圖片
Mamtani總結道:“我們希望迎合全方位的數據科學家和機器學習從業者。其中,有相當一類開發人員希望嘗試并使用其他的開源模型。”
5、后發者的勝算:成本優化
相較于AWS、谷歌、IBM而言,甲骨文的動作在去年顯得有些緩慢,但正因如此,現在大家看到的激進措施,不得不讓人聯想到甲骨文是否看到了決勝GenAI賽道的那把破局的鑰匙。
有分析人士指出,甲骨文正試圖將其生成式AI的基本要素集成到其基本產品中,特別是數據庫中,以優化計算資源并降低成本。“許多數據庫廠商,例如MongoDB,采用數據庫內機器學習功能并在最近在相同數據庫中構建、存儲和檢索向量嵌入(其中被向量化的數據存在),這并不令人意外。這一切都是為了最小化復雜性并最大化支出。”
然而企業很難保證只用同一種數據庫,至少需要兩個:一個用于向量,一個用于源數據。這將很昂貴,因為他們將不得不為管理兩個數據庫之間的數據集成和延遲付出代價。
而Oracle的機會或正在于此,該公司已經尋求從數據庫處理到芯片網絡和數據檢索的整個過程中優化其云基礎設施。通過降低復雜性并提高性能,能夠為其客戶和用戶提供與眾不同的價值。
參考鏈接:
https://analyticsindiamag.com/oracles-generative-ai-madness-begins/




















