精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

6.4萬star的開源智能體框架全面重構!OpenHands重大升級,叫板OpenAI和谷歌

人工智能 新聞
這些元素使得 OpenHands Software Agent SDK 能夠為原型設計、解鎖新型自定義應用以及大規模可靠部署智能體提供一個實用的基礎。

剛剛,OpenHands 開發團隊發布了一篇新論文,正式宣布廣受歡迎的軟件開發智能體框架 OpenHands (GitHub star 已超 6.4 萬)中的智能體組件完成了架構重構,即 OpenHands Software Agent SDK。

這一輪重新設計改進巨大,也讓 OpenHands 從 V0 進化到了 V1。包括:

  • 靈活性方面,他們設計了一個簡潔的接口,在默認情況下僅需幾行代碼即可實現智能體,但又易于擴展為具有自定義工具、內存管理等功能的、功能齊全的復雜智能體。
  • 在安全性和可靠性方面,它提供了無縫的本地到遠程執行可移植性、集成的 REST/WebSocket 服務。
  • 為了與人類用戶交互,它可以直接連接到各種界面,如可視化工作區(VS Code、VNC、瀏覽器)、命令行界面和 API。
  • 與現有的 OpenAI、Claude 和 Google 的 SDK 相比,OpenHands 獨特地集成了原生沙盒化執行、生命周期控制、模型無關 (model-agnostic) 的多 LLM 路由以及內置的安全分析。

該團隊表示:「這些元素使得 OpenHands Software Agent SDK 能夠為原型設計、解鎖新型自定義應用以及大規模可靠部署智能體提供一個實用的基礎。」

  • 論文標題:The OpenHands Software Agent SDK: A Composable and Extensible Foundation for Production Agents 
  • Software Agent SDK: https://github.com/OpenHands/software-agent-sdk 
  • 基準:https://github.com/OpenHands/benchmarks

OpenHands V1 的四項設計原則

OpenHands 團隊表示,OpenHands V0 最初設計為單體架構,即將智能體邏輯、評估和應用組合在同一個代碼庫中;這樣做目的是為了實現快速原型設計和迭代,但這種設計在項目的發展中暴露出了許多短板,包括沙盒僵化、可變配置龐雜,以及研究與生產之間過度耦合。因此,全面的重構勢在必行。

汲取了這些教訓,OpenHands V1 引入了一個基于四項設計原則的新架構,這些原則直接解決了 V0 的局限性。具體來說,這些原則包括:

1、沙盒化應該是可選的,而非普遍適用的

V1 默認設置是在單個進程中統一智能體和工具的執行,這與 MCP 的假設一致。當需要隔離時,同一個棧可以被透明地容器化。沙盒化變成了可選的,從而在不犧牲安全性的前提下保持了靈活性。

2、默認無狀態,狀態的真值來源單一

V1 將所有智能體及其組件(工具、LLM 等)視作在構建時即被驗證的、不可變的且可序列化的 Pydantic 模型。唯一可變的實體是會話狀態,它是一個單一的、明確定義的真值來源(source of truth),用于跟蹤正在進行的執行。這種設計將變化隔離在一個地方,實現了確定性重放、強一致性和穩定的長期恢復。

3、保持嚴格的相關項分離

V1 將智能體核心隔離成了「軟件工程 SDK」。應用通過 SDK API 進行集成,使得研究可以獨立于應用進行演進。

4、一切都應是可組合且可安全擴展的

V1 將可組合性作為兩個層面上的首要設計目標。

在部署層面,其四個模塊化包(SDK, Tools、Workspace 和 Agent Server)可以靈活組合,以支持本地、托管或容器化執行。

在能力層面,該 SDK 會暴露一個類型化的組件模型(工具、LLM、上下文等),讓開發人員可以聲明式地擴展或重新配置智能體,而無需觸及核心。

OpenHands V1:一個完整的軟件智能體生態系統

OpenHands V1 便是基于這些原則而生的,這是一個完整的軟件智能體生態系統,包括 CLI 和 GUI 應用。它們構建在一個共享的基礎上:OpenHands Software Agent SDK (圖 1b)。

下圖展示了一個極簡示例:

該 SDK 定義了一個具有確定性重放 (deterministic replay) 功能的事件溯源 (event-sourced) 狀態模型、一個用于智能體的不可變配置,以及一個集成了 MCP 的類型化工具系統。

其工作區抽象使得同一個智能體能夠在本地運行以進行原型設計,或者在安全、容器化的環境中遠程運行,而只需最少的代碼更改。

與之前僅提供庫的 SDK 不同,OpenHands 包含一個用于遠程執行的內置 REST/WebSocket 服務器,以及一套用于人工審查和控制的交互式工作區界面 —— 一個基于瀏覽器的 VSCode IDE、VNC 桌面和持久化的 Chromium 瀏覽器。

該團隊還系統地比較了其 SDK 與 OpenAI Agents SDK、Claude Agent SDK 和 Google ADK 的 31 個特性,發現盡管有 15 個特性與它們中的至少一個共享,但 OpenHands 的 SDK 獨特地結合了 16 個額外特性,包括原生遠程執行、帶沙盒功能的生產服務器,以及跨越 100+ 供應商的模型無關的多 LLM 路由。

該 SDK 還增加了一個用于智能體操作的安全分析器、靈活的生命周期控制(暫停 / 恢復、子智能體委托、歷史恢復等),以及用于保障生產可靠性的內置 QA (質量保證) 插樁(單元測試、基于 LLM 的集成測試和評估基準)。

OpenHands Software Agent SDK 已在 MIT 許可下完全開源。

可靠性與評估

該團隊通過兩個互補的過程評估了 OpenHands Agent SDK 的可靠性和性能:持續測試和基準評估。

持續測試流程結合了程序化測試和基于 LLM 的測試,并在每個拉取請求 (pull request) 上自動運行,且每天運行一次。它檢查的是 SDK 在多種語言模型下是否表現一致,及早發現推理、工具使用和狀態管理方面的回歸問題。這些自動化測試每次完整運行的成本僅為 0.5–3 美元,并能在 5 分鐘內完成。

而基準評估則是在標準化的智能體任務上衡量 SDK 的整體能力,從而幫助了解模型質量和系統性能。

持續質量保證

該 SDK 采用了三層測試策略來平衡覆蓋范圍、成本和深度:

  • 程序化測試:在每次提交 (commit) 時運行。這些測試模擬 llm 調用,并在幾秒鐘內驗證核心邏輯、數據流和 API 協定。模擬可以實現更快的反饋,確保在進行任何外部 API 調用之前捕獲到大多數回歸問題。
  • 基于 LLM 的測試:包括集成測試和示例測試 (見下文)。每天執行,并可按需為拉取請求執行。這些測試使用真實模型 (Claude Sonnet 4.5, GPT-5 Mini, DeepSeek Chat) 來驗證推理、工具調用和環境穩定性。每次運行成本為 0.5–3 美元,并在 5 分鐘內完成。
  • 基準評估:按需進行的高成本評估(每次運行 100–1000 美元,耗時數小時),用于衡量學術數據集上的綜合智能體能力。

集成測試覆蓋多種基于場景的工作流(例如,文件操作、命令執行、git 操作和瀏覽),而示例測試(example tests)則會定期運行所有 SDK 示例(自定義工具、MCP 集成、持久化、異步執行、路由等),以確保端到端的可靠性。該測試套件會隨著新智能體行為和故障模式的發現而不斷擴展,從而提高覆蓋范圍和回歸敏感性。

該團隊還針對這些基于 LLM 的測試的按需執行進一步優化了 CI/CD 成本:集成測試針對高風險變更,示例測試覆蓋面向用戶的模塊,而每日運行則跟蹤整個代碼庫更新中的回歸問題。

基準測試

該 SDK 為評估智能體能力的各種學術基準提供了內置支持。

如表 2 所示,該 SDK 在軟件工程和通用智能體基準測試中表現得很有競爭力。

在衡量智能體在軟件工程任務中能力的 SWE-Bench Verified 上,該 SDK 使用 Claude Sonnet 4.5 配合擴展思維實現了 72% 的解決率;在衡量智能體通用計算機任務解決能力的 GAIA 上,SDK 使用 Claude Sonnet 4.5 實現了 67.9% 的準確率,展現了有效的多步推理和工具使用能力。

此外,強大的開源編碼模型 Qwen3 Coder 480B 實現了 41.21% 的分數。這些結果略優于 OpenHands-Versa 的結果,表明該 SDK 的架構并未犧牲智能體能力,并實現了與研究專精系統相媲美的性能。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-10-15 17:28:05

2025-04-09 11:01:19

2024-10-12 12:30:18

2015-07-15 14:27:04

Eddystone通信蘋果

2025-06-20 14:38:43

OpenAI客服智能體人工智能

2024-10-22 20:00:00

2025-07-28 01:33:00

2025-03-12 11:34:35

2021-01-24 11:59:48

開源技術 工具

2023-04-25 11:31:33

智能AI

2025-08-12 08:58:03

2021-04-14 15:15:46

開源技術 工具

2025-01-09 09:00:00

訓練數據AI

2011-03-08 09:26:10

Chrome OS

2025-02-24 09:20:00

Pinia3.0Vue開發

2024-04-01 11:26:10

Nuejs前端

2023-02-08 11:05:38

2020-11-05 14:12:16

Vue開源項目js框架

2023-05-12 12:43:49

開源人工智能

2025-05-15 03:25:00

點贊
收藏

51CTO技術棧公眾號

97人人模人人爽人人澡| 国产精品美女久久久免费| 樱花草www在线| 中文在线免费| 丁香婷婷综合色啪| 2020国产精品视频| 伦伦影院午夜理论片| 国产色婷婷在线| 91免费在线播放| 国产精品久久久久久av福利| 国精产品久拍自产在线网站| 日韩中文字幕在线一区| 性做久久久久久久久| 久久精品一二三区| 日韩av在线播| 日本午夜一区| 精品国产乱码久久| 国产精品乱码久久久久| 国产精品久久久久一区二区国产| 另类综合日韩欧美亚洲| 欧美理论电影在线观看| 91精品人妻一区二区三区蜜桃欧美| abab456成人免费网址| 亚洲美女视频在线| 欧美乱偷一区二区三区在线| 96亚洲精品久久久蜜桃| 欧美 日韩 国产 一区| 亚洲加勒比久久88色综合| 色国产在线视频| 波多野在线观看| 国产精品久久久久久久裸模| 免费一区二区三区| 黄频网站在线观看| 国产一区二区三区久久悠悠色av| 国产97在线视频| 波多野结衣国产| 1024成人| 欧美精品18videos性欧美| 亚洲一二三四五六区| 少妇精品久久久一区二区三区| 欧美v日韩v国产v| 中文字幕66页| 国产综合色激情| 在线免费亚洲电影| 日本免费黄视频| 女厕盗摄一区二区三区| 亚洲国产一区二区视频| 777久久精品一区二区三区无码| 一广人看www在线观看免费视频| 久久久影视传媒| 欧美在线播放一区| 九色网友自拍视频手机在线| 久久久久久久久久久99999| 久久久久久欧美精品色一二三四| 日韩永久免费视频| 波多野结衣中文字幕一区二区三区 | 欧美日韩人人澡狠狠躁视频| 99热这里只有精品免费| 91精选在线| 亚洲成人免费影院| 免费看日本毛片| 日本综合字幕| 欧美天堂一区二区三区| 亚洲综合激情视频| 91蝌蚪精品视频| 亚洲精品97久久| www.久久国产| 日韩成人三级| 欧美不卡视频一区发布| 久久综合久久鬼| 中文亚洲免费| 国产精品亚洲欧美导航| 99久久久无码国产精品免费| 国产成人啪午夜精品网站男同| 国产chinese精品一区二区| 亚洲人妻一区二区| 国产精品美女久久久久久 | 99re国产精品| 国产精品盗摄久久久| 91中文字幕在线视频| 成人精品国产一区二区4080| 麻豆亚洲一区| 日本暖暖在线视频| 午夜不卡av免费| 999精品视频在线| 欧美经典一区| 国产丝袜一区二区| 亚洲二区在线播放| 国产农村妇女精品一二区| 国产久一一精品| 狠狠躁夜夜躁av无码中文幕| 国产欧美精品一区二区色综合朱莉| 三年中文高清在线观看第6集| 福利小视频在线| 在线欧美小视频| 亚洲少妇一区二区三区| 狠狠做六月爱婷婷综合aⅴ| 欧美一区一区| 在线观看免费亚洲| 91亚洲一区二区| 羞羞答答一区二区| 亚洲日本中文字幕免费在线不卡| 国产精品99久久久久久成人| 宅男噜噜噜66国产日韩在线观看| 国产日本欧美一区二区三区在线| 色婷婷综合视频| 亚洲欧洲日韩综合一区二区| 久久9精品区-无套内射无码| 九九九九九九精品任你躁 | 国产一二三区在线视频| 亚洲免费观看高清完整版在线观看熊| 欧美 日韩 激情| 玖玖精品一区| 最近2019中文字幕大全第二页| 国产精品不卡av| 国产一区二区久久| 亚洲精品久久区二区三区蜜桃臀 | 国产精品视频最多的网站| 丰满大乳国产精品| 亚洲欧洲av在线| 欧美亚洲日本在线观看| 日韩极品在线| 久久久视频免费观看| 一级片视频免费| 国产日韩精品一区| 国产三区在线视频| 林ゆな中文字幕一区二区| 欧美精品在线观看| 国产情侣一区二区| 国产精品美女久久久久久久网站| 大肉大捧一进一出好爽视频| 免费观看亚洲视频大全| 在线观看视频亚洲| 中文字幕第四页| 成人av网站在线| 欧美 日韩 国产精品| 日韩深夜福利网站| 一区二区三区四区在线观看视频| 日韩伦人妻无码| 成人免费的视频| 亚洲乱码日产精品bd在线观看| 欧美日韩卡一| 久久精品国产91精品亚洲| 亚洲精品无码久久久久| 91麻豆123| www.浪潮av.com| 亚洲婷婷伊人| 欧美孕妇性xx| 亚洲欧美日韩综合在线| 欧美日韩国产综合新一区 | 中文成人av在线| 老头吃奶性行交视频| 综合综合综合综合综合网| 久久久这里只有精品视频| 亚洲精品国产精| 亚洲午夜激情网站| 五月天激情小说| 国产精品毛片| 麻豆久久久9性大片| 欧美magnet| 在线日韩日本国产亚洲| 一卡二卡在线观看| 亚洲日本va午夜在线影院| 欧洲美女亚洲激情| 91精品人妻一区二区三区蜜桃2| 国产午夜一区| 国产精品福利无圣光在线一区| 午夜免费播放观看在线视频| 3d成人动漫网站| 精品一级少妇久久久久久久| 91啪九色porn原创视频在线观看| 日韩精品无码一区二区三区免费| 欧美少妇xxxx| 91成人免费看| 中文字幕在线看片| 色偷偷综合社区| 亚洲av无码乱码国产麻豆| 欧美日韩免费网站| 小泽玛利亚一区| av影院午夜一区| 777精品久无码人妻蜜桃| 欧美一区二区三| 91久久久一线二线三线品牌| 狠狠躁少妇一区二区三区| 国产一区二区日韩精品欧美精品| 一本久道久久综合无码中文| 亚洲国产一区二区在线播放| 在线国产视频一区| 久88久久88久久久| 丰满爆乳一区二区三区| 精品久久一区| 国产精品18毛片一区二区| 人人鲁人人莫人人爱精品| 久久国产精品首页| 牛牛热在线视频| 日韩丝袜情趣美女图片| 国产伦精品一区二区三区视频网站| 国产精品久久久久久妇女6080| 黄页网站在线看| 男女激情视频一区| 欧日韩免费视频| av亚洲免费| 国产久一道中文一区| 久久er热在这里只有精品66| 97国产成人精品视频| 免费在线观看av| 精品无人国产偷自产在线| 国产视频第二页| 在线一区二区三区四区五区| 欧美成人综合色| 中文字幕国产一区| 国产人妻黑人一区二区三区| 国产在线国偷精品产拍免费yy| 国产原创中文在线观看| 999久久久国产精品| 久久久久久久久久久久久久久久av | 日韩资源在线| 欧美va天堂va视频va在线| 中文字幕一区二区免费| 狠狠干狠狠久久| 久久婷婷一区二区| 亚洲人成小说网站色在线| 国产精品久久不卡| 国产综合色在线视频区| 狠狠操精品视频| 国产日韩视频| 国产av人人夜夜澡人人爽麻豆| 亚洲精品一二三区区别| 亚洲在线视频一区二区| 一本色道久久综合亚洲精品酒店| 国产欧美日韩伦理| 成人影院中文字幕| 超碰国产精品久久国产精品99| 亚洲爽爆av| 国产中文日韩欧美| 狠狠久久伊人中文字幕| 国产欧美婷婷中文| 国产精品无码久久久久| 国产精品自拍网| 国产精品原创视频| 成人免费高清完整版在线观看| 国产人妖一区| 91久久精品国产| 国产精品一区二区三区www| 成人字幕网zmw| 高清一区二区中文字幕| 91系列在线观看| 日本精品在线观看| αv一区二区三区| 精品国产午夜肉伦伦影院| 好吊色欧美一区二区三区视频| 国产一级成人av| 精品国产综合| 久久爱www成人| 一区二区冒白浆视频| 66国产精品| 欧美一级爱爱视频| 国产欧美大片| 美女黄色片视频| 另类的小说在线视频另类成人小视频在线 | 奇米四色…亚洲| 日韩av加勒比| av亚洲精华国产精华| 女尊高h男高潮呻吟| 国产亚洲精久久久久久| 羞羞在线观看视频| 精品88久久久久88久久久 | 日韩av在线播| 精品久久久视频| 欧美日韩一级黄色片| 在线观看91视频| 国产又粗又长又黄| 欧美tickling网站挠脚心| 少妇精品视频一区二区| 亚洲女人天堂网| 男人天堂手机在线| 久久久久免费视频| 日日夜夜天天综合| 成人美女av在线直播| 久久久久高潮毛片免费全部播放| 欧美理论一区二区| 欧美一区综合| 日韩精品一区二区三区不卡| 久久99精品久久久久久| 美女流白浆视频| 国产亚洲成aⅴ人片在线观看| 日本精品在线免费观看| 性久久久久久久久久久久| 国产黄色免费视频| 日韩欧美国产午夜精品| 欧美少妇另类| 九九精品在线播放| 成人在线爆射| 91九色在线免费视频| 精品国产一区探花在线观看 | 日韩一区二区三区电影在线观看| 视频一区二区免费| 国产一区二区三区日韩欧美| 性xxxfreexxxx性欧美| 国产成人一区二区三区小说| 亚洲超碰在线观看| 神马影院午夜我不卡影院| 一区精品久久| 国产成人美女视频| 99精品视频一区二区三区| 疯狂撞击丝袜人妻| 日韩欧美亚洲国产一区| 亚洲av色香蕉一区二区三区| 在线观看视频99| 中文字幕一区久| 国产免费一区二区三区| 国产精品久久久久久| 成年人网站大全| jlzzjlzz亚洲日本少妇| 青青草原免费观看| 欧美精品一二三区| 国产乱视频在线观看| 97在线视频免费播放| 日韩精品一级| 日本黄色a视频| 奇米亚洲午夜久久精品| 国产精品一级黄片| 亚洲一区在线视频观看| 国产尤物视频在线观看| 亚洲新声在线观看| 中文字幕21页在线看| 国产综合色一区二区三区| 欧美久久一区| 国产精品久久久久久久av福利| 久久久91精品国产一区二区精品| 亚洲一区二区91| 91精品国产欧美一区二区| 日韩电影在线观看完整版| 欧美激情久久久| 日韩精品久久久久久久软件91| 日韩欧美一区二区三区四区五区| 男女精品视频| 一本色道综合久久欧美日韩精品 | 亚洲欧美综合自拍| 亚洲国产成人精品一区二区| 色在线视频网| 国产精品污www一区二区三区| 国模 一区 二区 三区| 一个人看的视频www| 一区二区三区免费看视频| 国产xxxx孕妇| 久久久久久久久久久91| 无码国模国产在线观看| 黄色三级中文字幕| eeuss鲁片一区二区三区在线观看| 国产第一页第二页| 精品国产免费一区二区三区四区| 超黄网站在线观看| 久热国产精品视频一区二区三区| 亚洲女优在线| 内射毛片内射国产夫妻| 欧美人与性动xxxx| 影音先锋在线播放| 国产另类第一区| 久久午夜电影| 久久一级免费视频| 欧美一区二区视频免费观看| 免费污视频在线观看| 国产伦精品一区二区三区照片 | 91po在线观看91精品国产性色| 欧美一区 二区| 看欧美ab黄色大片视频免费| 国产精品女人毛片| 精品黑人一区二区三区在线观看| 欧美精品激情在线| 日韩影视高清在线观看| 亚洲欧美激情网| 亚洲精品国产品国语在线app| 噜噜噜久久,亚洲精品国产品| 78m国产成人精品视频| 日韩欧美二区| 中文字幕人妻熟女在线| 色老汉av一区二区三区| 黄色网在线免费看| 国产自产精品| 美女视频一区二区三区| 九九视频在线免费观看| 亚洲毛片在线看| 国产aa精品| 免费黄色福利视频| 自拍偷拍亚洲欧美日韩| 午夜视频福利在线| 国产日韩欧美一二三区| 亚洲国产裸拍裸体视频在线观看乱了中文| 国产ts丝袜人妖系列视频 | 亚洲精品永久视频| 亚洲成人激情综合网| 国产免费av在线| www.成人av| 美国av一区二区| 国产无遮挡又黄又爽| 最近2019中文字幕一页二页 | 精品一区二区三区三区| 国产精品亚洲综合在线观看| 免费无码av片在线观看|