Next ’24 - 踏上云端新旅程?
作者 | Google Cloud CEO, Thomas Kurian

去年,全世界才開始想象生成式 AI 將為企業帶來怎樣的轉變,如今這些轉變正在逐步展開。 而 Google 一直遵循著相同的原則:打造人人都能受益的 AI 技術,盡力為更多人帶來更美好的生活。
一個連接云端、由 AI 驅動的 Agent 世界
借助我們豐富多樣的 AI 產品組合,比如基礎架構、Gemini、多種模型與 Vertex AI 等,客戶與合作伙伴可以打造日漸精密的 AI Agent,用來服務客戶、支持員工和創造內容等。
出色的客服 Agent 可以協助您的客戶通過包含web、移動設備、呼叫中心及銷售點在內的多種渠道,靈活運用文本、語音等方式,讓您的企業與用戶的互動更為順暢。
- 洲際酒店集團將推出由生成式 AI 驅動的旅行規劃功能,協助客戶輕松規劃下一趟度假行程。
- Target 正在優化其 Target 應用程序和 Target.com 上的優惠和路邊取貨(curbside pickup)功能。
員工 Agent 可幫助所有員工提高工作效率,更好地協同工作。例如:
- Etsy 使用 Vertex AI 訓練技術來優化搜索建議與廣告模型,為買家提供更好的商品推薦,并提升銷售額。
- 巴西企業 Dasa 協助醫生更快地偵測出檢測結果的相關發現。
創意 Agent 能成為您強大的設計師與制作團隊,與您一同進行圖片與幻燈片的瀏覽和創作,并探索各種創意想法。我們提供強大的平臺與技術棧協助您打造創意 Agent。 例如:
- Canva 采用 Vertex AI 為其產品 Magic Design for Video 提供動力,協助使用者在短短幾秒鐘內制作出引人入勝的視頻。
- 家樂福使用 Vertex AI 開創營銷新方法,使他們能夠在數周而不是數月內在不同社交網絡上創建動態活動。
以下是我們在 Cloud Next ’24 大會上宣布的一系列產品創新,協助各種規模的組織在 AI 時代向前邁進。
利用 AI 優化的基礎架構實現規?;?/span>
生成式 AI 需要強大的基礎架構來加以支持,才可迅速推動轉型。為了能支持各種技術需求層次的客戶,我們進行了多項重要更新:

- A3 mega:我們與 NVIDIA 合作,使用 H100 GPU 開發的全新 GPU 實例現已正式推出,其帶寬為 A3 實例的兩倍,能支持要求最嚴苛的工作負載。此外,我們也同步推出 Confidential A3,客戶能夠在訓練和推理過程中更進一步保護敏感數據,并確保 AI 工作負載的機密性和完整性。
- NVIDIA HGX B200 與 NVIDIA GB200 NVL72:Google Cloud 將于 2025 年初采用最新的 NVIDIA Blackwell 平臺晶片,并提供 HGX B200 和 GB200 兩種選項。 B200 專為主流模型的訓練與服務而設計,而 GB200 NVL72 則可為萬億參數規模的模型提供實時大語言模型推理和大規模訓練。
- TPU v5p:我們宣布正式推出 TPU v5p,這是我們最強大、可拓展且最靈活的 AI 加速器,可用于訓練和推理,且每個 Pod 的計算能力是上一代的 4 倍。我們還宣布為 TPU v5p 提供 Google Kubernetes Engine (GKE) 支持;過去一年,在 GKE 上運行的 GPU 和 TPU 使用量增長了 900% 以上。
- AI 優化的存儲選項:我們通過 Cloud Storage FUSE 和 Parallelstore 全新的緩存功能提升訓練速度,這些功能可以將數據存儲更接近客戶的 TPU 或 GPU 。 我們也推出 Hyperdisk ML(預覽版),這是新一代塊儲存服務,與常見的替代方案相比,其模型加載時間加速了 3.7 倍。
- 動態負載調度(Dynamic Workload Scheduler):日歷模式可以協助并確保工作負載在指定時間開始執行,而彈性啟動模式可提供最佳的經濟效益,協助客戶為復雜的訓練與推理任務有效管理資源。
我們正致力于將 AI 帶到更接近數據生成與運用的位置,包括邊緣、實體隔離(air-gapped)環境、Google 主權云和跨云環境。通過 Google Distributed Cloud(GDC),我們可以在任何地方啟用 AI,讓您可以選擇最符合組織特定需求的環境、配置與控制選項。
我們也宣布多項 GDC 的新功能,包括:
- 在 GDC 上提供 NVIDIA GPUs:我們將為采用網絡互聯與物理隔離配置的兩種 GDC 提供 NVIDIA GPU,這兩種配置都將支持新的 GPU 實例,以高效運行 AI 模型。
- 在 GDC 上提供 GKE 服務:領先的 AI 公司在 Google Cloud 使用的 GKE 服務 ,也將在 GDC 上提供。
- 支持 AI 模型:我們在 GDC 中支持多種開放 AI 模型,包含 Gemma、Llama 等,為這些模型提供可在物理隔離與網絡互聯的環境中執行。
- 在 GDC 上提供 Vector Search:我們也將在 GDC 引入 Vector Search 的強大功能,您可以在 GDC 上以極低的延遲對您的私人和敏感數據進行搜索和信息檢索。
- 主權云(Sovereign Cloud):為符合最嚴格的監管要求,我們提供采用完全物理隔離配置的 GDC。 這個產品能在本地操作并具備完整的存續能力(survivability),可由 Google 或您選擇的合作伙伴代管,您擁有完全的控制權,并且在法規變更時,我們也可以靈活反應,協助您快速應對。
雖然并非所有工作負載都屬于 AI 工作負載,但您在云中運行的每個工作負載都需要進行優化,且每個應用都有獨特的技術需求。因此,我們推出全新的通用計算服務,協助客戶獲得最佳性能、確保應用程序之間的互通性,滿足可持續發展目標,同時降低成本。
- Google Axion:是我們專為數據中心設計的首個 ARM? 架構 CPU,與當前基于 x86 的同類實例相比,性能最多可提升 50%,能效最多可提升 60%。
- 我們的通用 VM 系列也將推出兩個全新的機器系列:N4 與 C4。C3 機器系列將推出原生裸機機器類型。 此外,我們也將正式推出 Hyperdisk Advanced Storage Pools,以及更多新的產品。我們也將 Vertex AI 上的生成式 AI 靜態存儲數據的數據駐留(data residency)服務范圍擴展到 11 個新的國家和地區,包擴澳洲、巴西、芬蘭、香港、印度、以色列、意大利、波蘭 、西班牙、瑞士和臺灣。
- 此外,客戶現在使用 Gemini 1.0 Pro 和 Imagen 時,可以將機器學習的操作限制在美國或歐盟境內。
- 與去年我們宣布開始服務的其他 10 個國家和地區一樣,我們協助這些新開放的國家和地區的客戶控制其數據的存儲位置和訪問方式,讓客戶更能符合世界各地的監管及安全要求。
利用 Vertex AI 創建 Agents
Google Cloud 在 Vertex AI 上提供超過 130 種第一方與第三方模型,我們正在擴大對各種模型的訪問,為客戶提供更豐富的模型選擇:
- Gemini 1.5 Pro:Gemini 1.5 Pro 提供兩種大小的上下文窗口:128K token 與一百萬 token,目前在公開預覽版階段。 客戶現可以在單個數據流中處理大量信息,包含 1 小時的視頻、11 小時的音頻、超過 30,000 行的代碼,或 700,000 個以上的字詞。
- Claude 3:Anthropic 全新系列的先進模型,現已在 Vertex AI 上向客戶開放使用。
- CodeGemma:Gemma 是先進的輕量級開放模型系列,采用與創建 Gemini 模型相同的研究和技術而構建。而 CodeGemma,一款 Gemma 全新微調、針對代碼生成與代碼輔助等編碼使用場景而設計的模型,現已在 Vertex AI 開放使用。
- Imagen 2:這是我們最先進的文生圖技術,具備多種圖像生成功能,協助企業打造符合品牌需求的定制化圖像。全新的文生圖功能讓營銷與創意團隊能輕松生成例如 GIF 等動圖,并且配備安全篩選與數字水印。 此外,我們也宣布推出高級照片編輯功能,包含圖像修復、圖像擴展,以及其他更多功能。
- 數字水印:由 Google DeepMind 的 SynthID 技術提供支持,此功能現在起正式應用于 Imagen 2 生成的 AI 圖像中。
當客戶利用企業數據對模型進行增強和Grounding時,可以發揮模型最大功效并獲取更多價值。今天,我們用兩種方式加強 Vertex AI 的Grounding能力,使其功能更加完善:
- Google 搜索:以 Google 搜索作為模型的信息來源,能結合 Google 最新基礎模型的強大功能,以及訪問最新、高質量信息的能力,從而顯著提高響應的完整性與準確性。
- 你的數據:運用企業應用程序,如 Workday 或 Salesforce 中的數據作為模型基礎,并輕松連接 AlloyDB 和 BigQuery 等 Google 數據庫。
當您選擇了合適的模型、加以 finetune 并 Grounding 后,Vertex 還可以協助您部署、管理和監控模型。今天,我們宣布推出更多 MLOps 功能:
- Prompt 管理工具:這些工具讓您可以在內置 Prompt 上進行協作,附上備注和狀態、追蹤變更紀錄,以及比較不同 Prompt 的響應質量。
- 自動并排比對:Auto SxS 功能現已正式推出,它可以說明為何某個響應優于另一個,并提供確定性分數,有助于使用者了解評估的準確性。
- 快速評估功能:此功能現已推出預覽版,可協助客戶在迭代 Prompt 設計時,運用較小的數據集來快速評估模型。
最后,Vertex AI Agent Builder 集成了基礎模型、Google 搜索和其他開發者工具,使您可以輕松建構和部署 Agent。 它提供了無代碼 Agent 生成器控制臺的便利性,以及強大的聯結、編排與增強功能,使用 Vertex AI Agent Builder,您現在可以利用 Google 搜索和您組織的數據快速創建一系列生成式 AI Agent。
縮短開發時間
Gemini Code Assist 是 Google 專為企業打造的 AI 代碼輔助解決方案。 為支持開發人員,我們宣布推出以下項目:
- Gemini 1.5 Pro in Gemini Code Assist:此次升級帶來了高達 1 百萬 token 的上下文窗口,甚至可為最大型的項目帶來革命性編碼方式。Gemini Code Assist 現在可以提供更準確的代碼建議、更深入的洞察,以及精簡的工作流程。
- Gemini Cloud Assist:此功能可在應用程序生命周期各階段提供 AI 輔助功能,讓使用者更輕松地設計、保護、操作、故障排除,以及優化應用的性能與成本效益。

我們為 Google 內部的一組開發人員部署了 Gemini Code Assist,發現完成一般開發任務所需的時間縮短了 40% 以上,編寫新代碼的時間縮短了 55%。事實上,Gemini Code Assist 支持位于任何位置的私人代碼集,無論是本地部署、GitHub、GitLab、Bitbucket,甚至是多個位置。
結合數據,釋放龐大 AI 潛能
Google Cloud 可讓您將 AI 技術與您的企業數據相結合,同時維持數據的隱私性和安全性。我們現在宣布推出全新增強功能,協助組織構建出色的數據 Agent:
- Gemini in BigQuery:Gemini in BigQuery 運用 AI 技術來協助數據團隊準備、發現、分析和治理數據。 此外,您將能通過新的 BigQuery Data Canvas 構建與執行數據管道,它結合自然語言與嵌入式可視化功能,提供了與Notebook類似的全新使用體驗,兩種目前皆提供預覽版。
- Gemini in Database:您可輕松安全地將數據從舊系統中遷出,例如將數據庫轉成 AlloyDB 等現代云數據庫。
- Gemini in Looker:我們將推出數項預覽版的新功能,這些功能可輕松地將您的數據 Agent 集成到您的工作流中。 我們還新增與 Google Workspace 集成的全新生成式 AI 功能,可讓您與業務數據進行對話。
運用 AI 技術提升網絡安全
安全 Agent 可在安全生命周期的每個階段提供幫助,因此生成式 AI 有潛力扭轉局勢,讓抵御攻擊的一方占上風。Google Cloud 安全產品組合中的創新功能可以提供更強大的安全成果,并使每個組織都能讓 Google Cloud 成為他們安全團隊的一部分,這些功能包括:
- Gemini in Threat Intelligence:使用自然語言技術,可以針對威脅發動者的行為提供深入的洞察。通過 Gemini,我們能夠分析數量龐大的潛在威脅惡意代碼樣本。Gemini 擁有更大的上下文窗口,能分析模塊之間的交互,針對代碼的真正意圖提供全新洞察。
- Gemini in Security Operations:全新輔助調查功能可以將自然語言轉換為啟動檢測、總結事件數據、建議應采取的行動,并通過對話式聊天引導使用者在平臺上操作。
利用 Google Workspace 提升工作效率
通過Gemini for Workspace,企業可直接在 Gmail、文檔和表格等產品中,使用內置的 AI Agent。 今天,我們宣布推出 Gemini for Workspace 的下一波創新與增強功能,包含:

- Google Vids:這個由 AI 驅動的視頻創作應用程序,結合視頻創作、制作及編輯助理于一身,它可以自動生成一個分鏡圖(storyboard)讓您輕松編輯,當您選擇好風格后,它會將您的草稿與素材庫中的視頻片段、圖片和背景音樂拼湊在一起。 它還可以幫助您找到合適的旁白來傳遞信息,可以選擇我們預設的旁白或是使用您自己的錄音。 Vids 將加入我們其他的生產力工具的行列,例如:文檔、表格和幻燈片等。它擁有簡單易用的界面,讓您能安全地通過瀏覽器協作和共享工作項目。 Vids 將于六月于 Workspace Labs 發布。
- AI Meetings and Messaging 插件:這款協作工具提供 “幫我記錄”(Take notes for me)與聊天摘要功能,支持 69 種語言(相當于 4,600 種語言組合)的實時翻譯功能。
- 全新的 AI Security 插件:Workspace 管理員現在可以使用專為其組織訓練、可保護隱私的 AI 模型與數據外泄防護控件,來自動分類與保護機密檔案與數據。
回顧過去這一年,看到我們的使用者從最初抱著熱衷嘗試和實驗的心態,一路進展到實際運用 AI 工具并推出早期產品,這確實令人驚嘆,也使我們更加期待他們未來更廣泛的應用。























