推動生成式 AI 技術的普惠化 亞馬遜云科技發布四大創新
原創如今,AIGC 無疑是最火熱的話題之一。國內外各大科技企業紛紛追隨,推出自家的大模型以及相關應用產品。近日,亞馬遜云科技推出了生成式 AI 領域的四大創新,致力于推動技術的普惠化,希望將AIGC技術從研究和試驗領域釋放,讓更多公司都可以從中受益。
亞馬遜云科技大中華區產品部總經理陳曉建在采訪中表示,“我們的使命是讓各種技能水平的開發人員和各種規模的組織都有機會使用生成式 AI 進行創新。亞馬遜云科技提供的四大能力,希望可以降低各行各業的客戶使用生成式 AI 的技術門檻和資金門檻,能夠讓更多的人更容易地、更有性價比地使用生成式 AI。”

Amazon Bedrock:降低模型使用門檻
一般情況下,企業在使用大模型時,需要找到最適合企業業務場景的大模型,并且可以和企業的業務程序無縫集成。然而,很多企業不具備能力和時間來搭建一個全新環境來訓練自己的大模型。為此,亞馬遜云科技推出全新的生成式AI全托管服務 Amazon Bedrock,用戶通過API 調用方式即可訪問亞馬遜云科技和第三方基礎模型提供商的預訓練基礎模型(Foundation model),從而降低用戶在大規模訓練和部署方面的使用門檻。
據了解,Amazon Bedrock 具有四大優勢。第一,Amazon Bedrock 是全托管的服務,用戶無需擔心后端所使用的各種基礎資源的申請、管理和各種運營的服務,這些工作都是由亞馬遜云科技來執行。
其次,Amazon Bedrock 預設了五大模型,包括亞馬遜云科技所開發的兩大基礎模型Amazon Titan Text 和 Amazon Titan Embeddings,以及三個第三方合作伙伴的模型,用戶可以為其場景選擇最適合自己應用場景的模型。由于現在市場變化很快,各家都有大模型,客戶希望找到更加適用于他們行業和業務的模型。為此,亞馬遜云科技根據客戶的需求幫助客戶挑選行業領先的模型,包括 Stability AI、Anthropic 和 AI21 Labs 三個外部模型。Stability AI 模型更偏向于多模態的文生圖或者自然語言能生成圖片;Anthropic Claude 則更多地關注對話文字生成;AI21 Labs 模型在多語言支持上表現比較好,包括小語種以及文章的文本摘要等方面。
第三,Amazon Bedrock 可以幫助用戶定制模型。每個用戶的場景需求和業務邏輯都不同,用戶也需要通過自身積累的業務數據來訓練一個最適合的場景模型。亞馬遜云科技在 Amazon Bedrock 中特意加強了數據訓練的隱私和安全性,確保數據安全和隱私保護的前提下,用戶可以使用自身的數據來對模型進行定制。
第四,在安全加密方面,所有用戶的環境都基于自身的 VPC(私有網絡環境),與其他客戶完全隔離,同時所有數據都進行加密。這意味著用戶不僅可以使用 Amazon Bedrock,還可以方便且安全地使用亞馬遜云科技的各種類型云服務,對整個業務進行定制化改造。
亞馬遜云科技大中華區數據技術專家團隊總監王曉野表示,Amazon Bedrock 是亞馬遜云科技主導和運營的模型平臺,也向業內領先的其他模型提供商開放,未來也有可能加入更多領先模型。但是需要強調的是,Amazon Bedrock 并不是一個開放的模型市場,亞馬遜云科技不會將其規模無限擴大。
Titan 模型:基礎模型普惠化
此次亞馬遜云科技推出的 Titan 模型,包括 Titan Text 和 Titan Embeddings 兩種模型。Titan Text 是基于總結文本生成、分類、開放式回答和信息提取等任務的生成式大語言模型。Titan Embeddings 是一個文本嵌入式的大語言模型,能夠把文本的輸入翻譯成包含語義的數字表達。雖然該大模型不生成文本,但是它對于個性化推薦和搜索等等應用程序非常有幫助的。相比于文字,編碼可以幫助模型反饋更加相關、更符合情境的結果。
為了實現負責任的 AI 的實踐,Titan 基礎模型已經預設了很多功能,用于識別和刪除用戶提交的數據中的一些有害的內容,拒絕用戶輸入不當的內容,過濾模型中包括不當內容的輸入結果,比如說仇恨、臟話和語言暴力等等。目前,已經有客戶預覽了亞馬遜云科技全新的 Titan 基礎模型,未來幾個月,亞馬遜云科技會進一步擴展其使用范圍。王曉野強調,Titan 模型只有通過 Amazon Bedrock 才能使用。
自研芯片:降低訓練和推理成本
日前,亞馬遜云科技宣布了 Amazon EC2 Trn1n 和 Inferentia2 兩個實例的正式可用。Trn1 是亞馬遜云科技自研的訓練芯片 Trainium 所支持的計算實例,這次推出的 Trn1n 是一個網絡增強型的新實例,相比于 Trn1 網絡帶寬提升了 1 倍,達到 1.6 TB,旨在為大型的網絡密集型的模型訓練來使用。
在推理芯片方面,亞馬遜云科技推出了 Inferentia2 實例,相比第一代芯片不僅吞吐量提升了 4倍、延遲降低了 10 倍,還實現了加速器之間的超高速網絡連接,并且將云中推理成本降到最低。
眾所周知,訓練大模型需要花費高額成本,那么亞馬遜云科技是如何提升性價比呢?陳曉建舉例道,BERT 是眾多訓練環境中常用的一種。一個簡單的 BERT 環境,如果基于英偉達的 GPU 實例并使用 16 個節點,簡單的模型訓練可能需要 13 個小時。在亞馬遜云科技內部測試中,基于亞馬遜云科技自研的 Trainium 訓練芯片,同樣使用 16 個節點,只要 5 個小時就可以完成模型訓練。因此,自研芯片可以幫助用戶實現數倍的性價比提升。
同樣,針對大模型部署方面,例如基于 NLP 流行的模型,如果把同樣模型部署到基于 GPU的環境之中,需要有 8 個 GPU 卡才能完成。但是如果使用 Inferentia2,同樣的負載只需要 4 個 Inferentia2 芯片就可以完成。在整個硬件部署的環境、復雜性和成本資金等方面都有效降低,大大幫助用戶降低成本和復雜性,以更好地提升業務的性能。
Amazon CodeWhispere:AI編程助手
Amazon CodeWhisperer 可以實時生成代碼的建議,是目前唯一一個具備安全掃描的 AI編程助手,可以用于發現一些非常難以查找的漏洞,并且提出補救建議。目前,Amazon CodeWhisperer 針對個人開發者完全免費。此外,Amazon CodeWhisperer 可以過濾掉一些可能認為有偏見或者不公平的代碼,并且還是唯一一個可以對可疑的開源代碼進行過濾和標記的編程助手。
王曉野介紹了 Amazon CodeWhisperer 的使用方法。Amazon CodeWhisperer 相當于一款插件,可以直接安裝在現有的開發環境中,就可以享有 Amazon CodeWhisperer 的幫助。“在使用的時候,開發者可以通過注釋的方式與 Amazon CodeWhisperer 交互。一般寫代碼的時候我們都會給自代碼加注釋,在注釋寫 “請幫我生成一段上傳圖片到云端的代碼”,它就會給出這一段代碼的建議,如果我們都接受的話,就只需要按一下Tab鍵,就相當于接受了建議。這樣的交互體驗使得 Amazon CodeWhisperer 更像是開發者的智能助手。同時,它也提供一些安全的掃描功能,例如檢查開源授權等。”
大模型的未來格局
自成立之日起,人工智能一直是亞馬遜關注的焦點,在未來將更加如此。亞馬遜云科技已經幫助超過 10 萬個不同規模和行業的客戶,利用行業領先的能力進行機器學習和人工智能創新。我們現在將見證機器學習的下一波廣泛應用,無論客戶體驗還是應用程序都有機會通過使用生成式 AI 進行重塑。
陳曉建認為,多模態的大模型肯定是未來的熱點。“最后大模型能夠活下來,能夠成為真正可以為大家所使用,可能取決于市場化的情況。通過這些通用的模型,用戶在此基礎上發展適合自己場景的細分行業模型,最終可能會成為常態。”






























