Forrester公布全球十大AI基礎語言模型:谷歌、Nvidia、OpenAI領跑

Forrester對全球頂級AI大語言模型進行了審查、評分和排名,包括Amazon Bedrock、Google Gemini、OpenAI GPT-4和Anthropic Claude等。
在Forrester最新發布的報告《2024年第二季度用于語言的AI基礎模型》中,Cohere和Mistral AI等AI初創公司與IBM、微軟和Nvidia等全球科技巨頭展開了正面交鋒。
Forrester在這份報告中表示:“生成式AI時代把用于語言的AI基礎模型推向了技術和商業領袖的前沿,由于創新速度驚人,熱門初創公司和科技巨頭之間的選擇也很多,AI基礎模型市場可能是買家最難以捉摸的市場之一?!?/p>
Forrester評選出了全球最重要的十大AI基礎模型語言提供商,并列出了比較情況。
Forrester的AI基礎模型排名體系
Forrester從三個類別評估了10家廠商的基礎模型產品:AI基礎模型產品本身、公司戰略和整體市場存在。
對于這三個類別中的每一項,Forrester都以1到5的等級對廠商AI基礎模型產品進行評分,1表示“弱”,5表示“強”。分數越高,基礎模型產品和公司戰略越好。
每家廠商的AI模型產品都根據不同因素進行了排名,包括核心功能、代碼生成、治理和安全、模型管理、彈性和可擴展性、上下文窗口和總體范圍,戰略得分是基于愿景、合作伙伴生態系統和定價靈活性等多方面的,而市場存在則是基于收入和客戶數量進行評分的。
以下是Forrester在這份名為《Forrester Wave:2024年第二季度用于語言的AI基礎模型》報告中,排名前十的模型和廠商:
- AWS Amazon Titan
- Anthropic Claude
- Cohere Command
- Databricks DBRX
- Google Gemini
- IBM Granite
- Microsoft Phi
- Mistral AI
- Nvidia Nemotron
- OpenAI GPT-4
我們還分析了Forrester關于用于語言的全球十大最佳AI基礎模型的歷史報告。
領導者:谷歌
AI模型產品得分:4.82
戰略得分:4.66
市場存在感得分:2
谷歌Gemini在Forrester的報告中獲得了最高分4.82,這要歸功于谷歌在多模態性、上下文長度和與Google Cloud服務互聯互通方面體現出的市場差異化。
Gemini擁有所有受評估廠商中最大的上下文窗口:目前有100萬個token,最近宣布是有200萬個token,也是為數不多的商用多模態大型語言模型之一,具有37種語言的頂級多語言能力,高于任何其他廠商。
在“戰略”類別中,谷歌在創新、路線圖、定價靈活性和透明度以及合作伙伴生態系統方面綜合得分5分。谷歌的最低得分來自市場存在類別,收入得分為1分,與競爭對手相當。
Forrester表示:“谷歌擁有引領AI市場的一切條件——龐大的AI基礎設施容量、深厚的AI研究人員隊伍、以及Google Cloud中越來越多的企業客戶?!?/p>
領導者:Databricks DBRX
AI模型提供得分:3.38
戰略得分:4.34
市場存在感得分:3
Databricks的DBRX產品獲得了3.38分,這要歸功于它既提供了自己預訓練的DBRX模型,而且也為預訓練或調整自己模型的客戶提供了支持。
Databricks的平臺在應用開發、治理安全、管理訓練和部署模型方面具有強大的能力。
在“戰略”類別中,Databricks在愿景、路線圖、合作伙伴生態系統和支持服務方面獲得了5分,最低得分是互動方式和多語言能力,僅得1分。
Forrester表示:“Databricks的產品是企業客戶的理想選擇,后者希望擁有一個功能強大的模型,其中包括了各種企業工具,不僅可以構建解決方案和微調模型,還可以使用經過自己數據預先訓練的模型。”
領導者:Nvidia Nemotron
AI模型產品得分:3.38
戰略得分:3.68
市場存在感得分:3
Nvidia最近發布的Nemotron產品獲得3.38分,該產品讓企業客戶可以開箱即用地使用Nvidia模型,并激勵現有和新技術合作伙伴推動前沿發展。
Nvidia的產品具有非常強大的多語言功能,通過Megatron模型提供多模式交互性,NeMo框架使其能夠更快速、更高效地在Nvidia平臺上構建AI基礎語言模型。
在“戰略”類別中,Nvidia在創新和合作伙伴生態系統方面獲得5分。整個評估中,Nvidia沒有任何1分或2分的低分。
Forrester表示:“有些合作伙伴企業希望能夠為訓練和推理模型硬件和軟件需求提供一個最佳橋梁,對他們來說,Nvidia是一個不錯的選擇?!?/p>
表現強勁者:IBM Granite
AI模型產品得分:3.68
戰略得分:3.32
市場存在感得分:1
IBM的Granite產品獲得了3.68分,這要歸功于IBM為客戶提供了一些最強大的、最透明的底層訓練數據洞察,并保護企業免受訓練數據中任何未經授權的內容帶來的風險。
IBM Granite具有強大的能力,可以將其模型與企業需求相結合,而且具有治理結構,以實現對模型的監控和管理。
在“戰略”類別中,IBM在支持服務和產品方面獲得了5分,在收入和客戶數量、上下文窗口和核心功能方面均獲得了較低的1分。
Forrester表示:“IBM非常適合那些希望從模型訓練數據和AI平臺功能中獲得100%廠商保障的客戶,這些功能可以幫助AI團隊構建AI解決方案?!?/p>
表現強勁者:OpenAI GPT-4
AI模型產品得分:3.28
戰略得分:3.70
市場存在感得分:5
OpenAI的GPT-4產品獲得了3.28分,這要歸功于OpenAI的模型是市場上最強大的模型之一,也是提供多模態大型語言模型的少數提供商之一。
OpenAI的GPT-4優勢在于其核心模型功能,例如代碼生成、多語言功能、上下文窗口和訓練數據范圍。
在“戰略”類別中,OpenAI在愿景、創新和路線圖方面獲得了5分,還在市場存在感方面獲得了最高分5分,在模型管理部署和支持產品方面得分較低。
Forrester表示:“對于那些希望利用模型本身的原始功能構建更復雜的應用架構,同時開始構建多模式生成式AI應用的開發人員來說,OpenAI是一個不錯的選擇?!?/p>
表現強勁者:AWS Amazon Bedrock
AI模型產品得分:2.90
戰略得分:3.30
市場存在感得分:1
AWS的Amazon Bedrock憑借Titan模型獲得了2.90分,而且AWS允許任何提供商在Bedrock中提供他們的模型。
AWS Bedrock服務提供周邊支持工具方面具有強大的功能,包括模型對齊、治理和安全以及應用開發。
在“戰略”類別中,AWS在路線圖、定價靈活性和透明度、支持服務和產品方面獲得了5分,在愿景、創新和Bedrock客戶數量方面獲得了較低的1分。
Forrester表示:“Amazon的AI基礎語言模型產品將以其市場方法而非核心的Titan模型本身吸引AWS客戶?!?/p>
表現強勁者:微軟Phi
AI模型產品得分:2.82
戰略得分:3.34
市場存在感得分:1
微軟Phi獲得了3.34分,這要歸功于Phi模型除了真實內容外還利用了大量合成內容,從而可以使用更嚴格管理的、較小型的數據集進行訓練。
微軟Phi的能力尚不如市場中的其他很多產品,但其小規模和嚴格管理的訓練數據集是一個核心亮點,圍繞Phi系列的微軟Azure AI服務提供了強大的功能,可以將模型行為與企業需求保持一致。
在“戰略”類別中,微軟在合作伙伴生態系統和支持服務和產品方面獲得了5分,在定價靈活性和透明度、Phi收入和客戶數量方面獲得了較低的1分。
Forrester表示:“微軟對OpenAI的投資和合作非常獨特,特別是其獨家性,微軟幾乎可以充當OpenAI核心模型以及微軟自己的AI基礎語言模型提供商?!?/p>
競爭者:Cohere Command
AI模型產品得分:2.72
戰略得分:2.34
市場存在感得分:2
Cohere Command獲得了2.72分,這要歸功于它打造了業務友好型的模型,而且支持基于檢索增強生成(RAG)的知識檢索架構所需的數據管道。
Cohere的Command模型在語言和推理的核心模型功能方面具有優勢,并且具有顯著的多語言功能,可以對來自各種語言的數據進行預訓練,例如對常見業務語言進行特定優化。
在“戰略”類別中,Cohere沒有獲得任何4分或5分的高分,在合作伙伴生態系統方面也只獲得了1分,不過Cohere Command在客戶數量方面獲得了3分,這比許多大型技術提供商都要高。
Forrester表示:“對于想要一個能夠為他們提供RAG和其他知識檢索用例強大支持的AI基礎語言模型提供商的客戶來說,Cohere是一個不錯的選擇?!?/p>
競爭者:Anthropic Claude
AI模型產品得分:2.46
戰略得分:2.68
市場存在感得分:3
Anthropic Claude獲得了2.46分,這要歸功于它將模型與企業需求相結合的“Constitutional AI”原則,以及模型規模更大、復雜度更高的重要性。
Anthropic的核心模型具有非常強大的語言能力,擁有目前市場上最長的上下文窗口。
在“戰略”類別中,Anthropic在愿景方面獲得5分,在收入方面獲得3分,在合作伙伴生態系統和支持服務及產品方面獲得了較低的1分。
Forrester表示:“雖然Anthropic在預訓練期間已經做了大量工作來使其模型與Constitutional AI方法保持一致,但它需要為企業提供更重要的功能來構建應用并在其中管理模型?!?/p>
挑戰者:Mistral AI
AI模型產品得分:1.78
戰略得分:1.32
市場存在感得分:1
Mistral AI在Forrester的報告中獲得了最低分1.78,它的基礎語言模型得分為1.78,在開放權重模型方面表現出色。
Mistral模型具有強大的核心語言功能,采用混合式的專家方法,使其能夠在推理時使用較少的計算資源,同時實現更高的準確性。
在“戰略”和“市場存在感”類別中,Mistral AI的得分大多為1分。
Forrester表示:“過去一年中,Mistral憑借在模型性能排行榜上表現優異的開放式模型聲名鵲起,使其在市場上脫穎而出。然而,Mistral必須迅速強化銷售、營銷、平臺工具開發和合作伙伴運營,才能與這個市場上越來越多的參與者展開競爭。”






























