精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

?哪個模型擅長調用工具?這個7B模型躋身工具調用綜合榜單第一

人工智能 新聞
Hammer 模型通過函數掩碼技術和不相關性檢測數據增強,在多個評測基準中取得了良好的效果,表現出強大的泛化能力和穩定性,為輕量化工具調用模型在終端應用向前邁了一步。

工具調用是 AI 智能體的關鍵功能之一,AI 智能體根據場景變化動態地選擇和調用合適的工具,從而實現對復雜任務的自動化處理。例如,在智能辦公場景中,模型可同時調用文檔編輯工具、數據處理工具和通信工具,完成文檔撰寫、數據統計和信息溝通等多項任務。

業界已發布的工具調用模型,在特定評測基準上有接近甚至超越閉源 SOTA 模型(比如 GPT-4)的表現,但在其他評測基準上下降明顯,難以泛化到新工具和新場景。為應對這一挑戰,來自 OPPO 研究院上海交通大學的研究團隊提出函數掩碼(Function Masking) 方法,構建了具備強大泛化能力的輕量化工具調用系列模型:Hammer,并開源了完整的技術棧,旨在幫助開發者構建個性化的終端智能應用。

在工具調用典型評測基準上,包括 Berkeley Function-Calling Leaderboard(BFCL)、API-Bank、Seal-Tools 等,Hammer 系列模型展現了出色的總體性能,特別是 Hammer-7B 模型,綜合效果僅次于 GPT-4 等閉源大模型,在工具調用模型中綜合排名第一,具備強大的新場景和新工具泛化能力。

圖片

  • 模型地址:https://huggingface.co/MadeAgents
  • 論文地址:https://arxiv.org/abs/2410.04587
  • 代碼地址:https://github.com/MadeAgents/Hammer

工具調用任務說明

工具調用作為 AI 智能體執行復雜任務所必備的核心能力,要求模型不僅能夠識別正確的函數,還要準確填寫函數的輸入參數;如果給定函數列表無法滿足用戶的意圖,模型也應具備拒絕任務的能力。下圖是工具調用模型輸入輸出的一個樣例:

圖片

Hammer 訓練方法

研究團隊在 Hammer 的訓練過程中引入了一項關鍵技術:函數掩碼(Function Masking) 和一個增強數據集:不相關性檢測增強數據集(Irrelevance-Augmented Dataset)

  • 函數掩碼旨在減少模型對函數名稱和參數名稱的依賴,核心是通過哈?;瘮得Q和參數名稱,使模型在執行工具調用任務時不得不依賴更完備且可靠的功能描述信息,而不是對名稱的記憶或匹配。這種方式有助于減少因命名差異導致的誤判問題,提升模型在多樣化命名風格和應用場景中的穩定性和適應性。
  • 不相關性檢測增強數據集旨在幫助模型在給定用戶意圖而當前無適用函數的情況下,能夠正確判斷并給出「不相關」信號。該數據集包含了 7,500 個增強樣本,設計時平衡了工具調用任務和不相關性檢測任務的比例,以達到最佳的綜合效果。(已開源至:https://huggingface.co/datasets/MadeAgents/xlam-irrelevance-7.5k

圖片

Hammer 總體表現

Hammer 系列模型在工具調用典型評測基準上均展現了出色的性能,具體表現如下面的兩張表格所示??梢钥吹剑?BFCL 榜單上,Hammer-7B 模型的總體準確率達到 83.92%,接近閉源 SOTA 模型 GPT-4 的 95.79%,優于其他工具調用模型。同時,在其他評測基準上,Hammer-7B 模型的平均 F1 達到 76.21%,接近閉源模型 GPT-4 的 78.79%,大幅領先其他工具調用模型。Hammer-7B 能夠在參數規模較小的情況下,在不同評測基準上與閉源 SOTA 大模型競爭,充分展示了 Hammer 模型在各種工具調用任務中的準確性和穩定性。

圖片

圖片

函數掩碼技術的通用性

研究團隊還將函數掩碼和數據增強技術應用于不同的基礎模型,以驗證其通用性。實驗選擇了 Qwen 系列和 Deepseek-Coder 系列模型作為基準,并在相同的訓練和測試條件下進行比較。下表中的結果顯示,經過函數掩碼技術調優后的 Hammer 版本顯著提升了基礎模型的工具調用準確性,遠高于未調優版本,證明了函數掩碼和不相關性數據增強對不同模型架構均有顯著的優化效果。同時,在使用相同的基座模型和基礎數據的情況下,與 xLAM(同樣基于 Deepseek 微調而來的工具調用模型)的對比,也體現了函數掩碼及不相關性數據增強的作用。

圖片

不相關性數據增強比例的權衡

在設計不相關性數據增強時,研究團隊測試了不同比例的不相關性數據樣本對模型表現的影響。下圖實驗結果表明,合理比例的不相關性增強數據(約占總數據的 10%)能夠在提升工具調用準確性的同時,顯著增強模型在不相關檢測場景中的識別能力,降低錯誤調用的風險。實驗結果還顯示,進一步增加不相關性數據會略微降低功能調用的準確性,因此找到適當的平衡點至關重要。

圖片

總結

Hammer 模型通過函數掩碼技術和不相關性檢測數據增強,在多個評測基準中取得了良好的效果,表現出強大的泛化能力和穩定性,為輕量化工具調用模型在終端應用向前邁了一步。

Hammer 系列目前已更新至 2.0 版本,歡迎感興趣的讀者通過 huggingface 進行體驗!

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-03-25 08:00:00

2024-07-15 08:58:00

2024-06-03 10:43:34

2024-03-08 10:05:09

SpringHTTP接口

2023-06-28 21:47:54

2024-05-15 09:17:30

模型AI

2024-02-04 08:00:00

Zephyr 7B大語言模型算法

2025-03-17 12:13:26

AI模型生成

2024-04-02 09:17:50

AI數據開源

2024-09-05 14:25:00

訓練代碼

2025-11-10 08:48:00

AI模型自動駕駛

2023-10-13 19:58:33

Mistral7B模型

2025-08-01 14:32:35

AI模型訓練

2010-06-04 17:56:22

Linux 常用工具

2024-08-13 15:40:00

2025-11-17 09:15:37

2025-04-27 07:57:50

大模型工具JSON

2025-08-08 01:45:00

UTCPAI適配器

2025-02-17 08:00:00

DeepSeek模型AI
點贊
收藏

51CTO技術棧公眾號

国产精品永久免费| 日韩有码在线电影| 美女黄色片视频| 免费av在线网址| 夫妻av一区二区| 日韩av片电影专区| a在线视频播放观看免费观看| 一区二区三区高清在线观看| 欧美午夜片在线免费观看| 亚洲精品中文综合第一页| www.五月天激情| 久久精品一区二区三区中文字幕| 久久亚洲电影天堂| 日韩精品无码一区二区三区久久久| 欧美视频第一| 日韩欧亚中文在线| 老子影院午夜伦不卡大全| 91吃瓜网在线观看| 91麻豆国产福利精品| 91免费在线视频网站| 亚洲婷婷综合网| 欧美日韩精品| 最新亚洲国产精品| 精品人妻一区二区三区视频| 亚洲超碰在线观看| 欧美剧在线免费观看网站| 日韩在线综合网| 三级资源在线| 亚洲女同女同女同女同女同69| 日本不卡高清视频一区| 午夜免费福利视频| 极品少妇xxxx精品少妇偷拍| 国产精品福利久久久| 日韩精品成人在线| 欧美三级乱码| 九九久久精品一区| 欧美三级小视频| 国产高清一区二区| 伊人一区二区三区久久精品 | 久久精品一区二区三区四区五区| 亚洲大片精品免费| 亚洲精品电影在线观看| 手机在线观看日韩av| 97久久中文字幕| 91精品久久久久久蜜臀| 五月天开心婷婷| 四虎精品永久免费| 在线播放视频一区| 手机精品视频在线| 国产精选久久| 日韩欧美一区二区三区在线| 九色91porny| 伊人久久大香线蕉av超碰| 日韩美女天天操| 波多野结衣三级视频| 五月亚洲婷婷| 日韩高清不卡av| 人妻少妇精品视频一区二区三区| 女同久久另类99精品国产| 亚洲娇小xxxx欧美娇小| 99re久久精品国产| 亚洲精品国模| 最近2019中文免费高清视频观看www99 | 久久久www成人免费毛片| 午夜日本精品| 羞羞色国产精品| 成年人视频在线免费看| 可以免费看不卡的av网站| 国产精品永久在线| 国产成人精品无码高潮| 成人国产电影网| 欧美大香线蕉线伊人久久| 嫩草研究院在线观看| 精品国产乱码久久久久久久久| 国产福利久久| 五十路在线观看| 久久久99久久| 亚洲午夜精品一区二区| av网站大全在线| 精品久久中文字幕久久av| www.亚洲天堂网| 深夜日韩欧美| 亚洲国语精品自产拍在线观看| 精品人妻一区二区三区视频| 色一区二区三区四区| 欧美另类精品xxxx孕妇| 亚洲欧美综合另类| 开心九九激情九九欧美日韩精美视频电影| 91精品国产综合久久香蕉的用户体验| 亚洲国产精品久久久久久6q| 久久奇米777| 精品国产无码在线| 国内激情视频在线观看| 欧美视频在线观看一区二区| 成年人看片网站| 国产精品一区二区三区av麻| 美女av一区二区| 五月天综合激情网| 国产乱人伦精品一区二区在线观看| 国产免费一区二区| 日本黄色片在线观看| 天天影视网天天综合色在线播放 | 国产老头老太做爰视频| 一本色道久久精品| 亚洲自拍偷拍视频| 国产裸舞福利在线视频合集| 亚洲一区二区精品久久av| 91热这里只有精品| 麻豆成人入口| 九九久久精品一区| 国产一区二区在线播放视频| 99久久99久久精品国产片果冻| 异国色恋浪漫潭| 自拍偷自拍亚洲精品被多人伦好爽 | 亚欧日韩另类中文欧美| 欧美成人在线免费| 亚洲午夜激情视频| 2021国产精品久久精品| 久久久久久www| 日韩精品免费视频一区二区三区 | 奇米色777欧美一区二区| 国产亚洲精品自在久久| 怡红院在线观看| 欧美精品三级在线观看| 日韩女同一区二区三区| 国产精品久久久久久久免费软件| 99国精产品一二二线| 国产精品一区二区三区视频网站| 欧美专区日韩专区| 欧美图片第一页| 欧美综合国产| 欧美日韩一区在线播放| 色在线视频观看| 亚洲国产精品999| 国产一级一片免费播放| 国产精品中文字幕日韩精品| 自拍偷拍一区二区三区| 另类一区二区| 最近免费中文字幕视频2019| 美女黄页在线观看| 国产女人aaa级久久久级| 日韩 欧美 高清| 亚洲妇女av| 国产99久久精品一区二区永久免费| 性猛交xxxx| 日韩欧美一区二区在线| 9.1成人看片免费版| 国产日韩欧美一区| 噜噜噜噜噜久久久久久91| 成年女人在线看片| 日韩精品免费在线观看| 日本熟伦人妇xxxx| 91在线精品一区二区| 黄色国产精品视频| 精品国产美女| 国产日本欧美一区| 免费大片黄在线| 欧美精品精品一区| 美女的奶胸大爽爽大片| 粉嫩av一区二区三区在线播放| 国产精品自拍合集| 青草久久视频| 国产精品久久久亚洲| 97在线观看免费观看高清| 欧美色综合久久| 日本少妇高清视频| caoporm超碰国产精品| 国产亚洲欧美在线视频| 欧美精选一区二区三区| 91免费在线视频网站| 女子免费在线观看视频www| 精品国产一二三区| 成人午夜视频在线播放| 国产日产欧美精品一区二区三区| 亚洲综合av在线播放| 亚洲欧美一级二级三级| 九色视频成人porny| 亚洲成av在线| 久久大大胆人体| 成人午夜福利视频| 一本久道中文字幕精品亚洲嫩| 国精品人伦一区二区三区蜜桃| 国产尤物一区二区| 欧美日本视频在线观看| 欧美xxav| 国产三级精品在线不卡| 四虎4545www国产精品| 欧美成人精品一区二区| 日韩亚洲视频在线观看| 欧美日本在线视频| 在线观看免费国产视频| 国产精品麻豆欧美日韩ww| 国产精品91av| 美女在线观看视频一区二区| 91免费黄视频| 国产精品久久久久久久免费观看| 国产精品亚洲一区| 黄色欧美视频| 2019中文字幕免费视频| 日本中文字幕伦在线观看| 欧美精品一区二区在线播放| 国产乡下妇女三片| 亚洲国产日韩a在线播放性色| 欧美丰满老妇熟乱xxxxyyy| 东方欧美亚洲色图在线| 男女男精品视频站| 日韩一级不卡| 4444在线观看| 日韩精品2区| 久久精品日产第一区二区三区乱码| 日韩三级成人| 国产91九色视频| 成人高潮aa毛片免费| 精品国产一区二区三区四区在线观看| 五月婷婷丁香网| 日韩一级欧美一级| 91高潮大合集爽到抽搐| 日韩欧美一区二区在线| 日韩精品――中文字幕| 一区二区三区四区亚洲| 小嫩苞一区二区三区| 国产日韩欧美精品在线| aaaaaav| 国产91丝袜在线播放九色| 女人高潮一级片| 日韩精品一卡二卡三卡四卡无卡| 久久久久久久午夜| 很黄很黄激情成人| 久久国产精品免费观看| 成人无号精品一区二区三区| 茄子视频成人在线观看 | 国产激情视频一区二区在线观看| 亚洲色图久久久| 天堂久久久久va久久久久| 日韩a在线播放| 亚洲精品女人| 我的公把我弄高潮了视频| 欧美精品1区| 成人av在线播放观看| 亚洲国产精品成人| 在线播放 亚洲| 国产精品久久久乱弄| 一区二区三区四区视频在线观看| 欧美精品一区二区三区中文字幕| 色姑娘综合av| 日韩成人影院| 在线看视频不卡| 午夜影院欧美| 久久久成人精品一区二区三区| 午夜精品一区二区三区国产| 中文字幕一区二区三区有限公司 | 综合欧美亚洲日本| 婷婷国产成人精品视频| 国产精品成人一区二区三区夜夜夜| 五月天免费网站| 亚洲特级片在线| 爱爱视频免费在线观看| 亚洲精品日韩综合观看成人91| 欧美日韩黄色网| 亚洲成人动漫精品| 黄色一级片免费在线观看| 色婷婷精品久久二区二区蜜臂av| 国产91精品看黄网站在线观看| 色先锋aa成人| 在线观看免费黄色小视频| 欧美一区二区三区视频免费 | 国产性天天综合网| 亚洲ⅴ国产v天堂a无码二区| 国产精品三级av在线播放| 国产高清视频免费在线观看| 亚洲一区影音先锋| 国产污污视频在线观看| 91成人在线精品| 国产精品久久久久精| 精品剧情在线观看| 男人的天堂在线| 精品精品国产国产自在线| 韩国成人免费视频| 国产精品久久999| 日韩视频一区二区三区四区| 久久精品aaaaaa毛片| re久久精品视频| 国产精品国三级国产av| 久久最新视频| 日本黄色一级网站| www日韩大片| 登山的目的在线| 午夜av区久久| 国产又黄又大又粗的视频| 亚洲精品国产拍免费91在线| 你懂的在线观看视频网站| 欧美精品一区二区三区国产精品| av免费不卡国产观看| 国产色婷婷国产综合在线理论片a| 国产在线播放精品| 亚洲精美视频| 中文亚洲免费| 天堂网成人在线| 久久久久久久久97黄色工厂| 2018天天弄| 欧美日韩在线亚洲一区蜜芽| 黄色av小说在线观看| 久久精品2019中文字幕| 中文av在线全新| 国产精成人品localhost| 大胆日韩av| 18禁男女爽爽爽午夜网站免费 | 亚洲av成人无码一二三在线观看| 国产精品久久久久久久久久免费看| 黄色片视频网站| 精品国一区二区三区| 欧美激情黑人| 国产精品扒开腿做爽爽爽的视频| 另类尿喷潮videofree| 强开小嫩苞一区二区三区网站 | 国产精品精品视频一区二区三区| 91精品国产自产精品男人的天堂| 亚洲乱码国产乱码精品天美传媒| 黄色www在线观看| 久久久久国产精品一区二区| 欧美做受高潮中文字幕| 亚洲欧美偷拍三级| 中文字幕无码乱码人妻日韩精品| 日韩av网址在线| 高清电影在线免费观看| 亚洲一区二区免费在线| 四季av一区二区凹凸精品| 欧美日韩大尺度| 久久亚洲二区三区| 毛片视频网站在线观看| 亚洲第一精品夜夜躁人人爽| 国产写真视频在线观看| 国产精品视频不卡| 凹凸成人精品亚洲精品密奴| 国产精品无码av无码| 久久青草欧美一区二区三区| 9i看片成人免费看片| 亚洲国内精品在线| 在线中文字幕播放| 欧美成ee人免费视频| 欧美一级网站| 伊人网在线视频观看| 色综合久久九月婷婷色综合| 欧美美女搞黄| 国产成人精品午夜| 久久视频国产| 成人av毛片在线观看| 综合电影一区二区三区| 国产视频在线免费观看| 精品视频9999| 粉嫩久久久久久久极品| www.av片| 久久这里只有精品视频网| 亚洲av无码不卡| 夜夜嗨av一区二区三区免费区| 成人一区视频| 国产一区一区三区| 从欧美一区二区三区| 日韩精品人妻中文字幕| 精品在线观看国产| 欧美影视资讯| 超碰免费在线公开| 国产精品资源在线| 久久久国产精品成人免费| 日韩精品电影网| jizz免费一区二区三区| eeuss中文| 99精品在线观看视频| 久久久蜜桃一区二区| 久久精品国产91精品亚洲| 91九色鹿精品国产综合久久香蕉| 国产在线无码精品| 91免费视频网| 国产又爽又黄又嫩又猛又粗| 欧美人与性动交| 综合伊思人在钱三区| 中文字幕资源在线观看| 亚洲最新视频在线观看| 青春草在线观看| 亚洲精品日韩av| 久久久亚洲一区| 最新一区二区三区| 亚洲精品国产精品乱码不99按摩 | 午夜av不卡| 伊人情人网综合| av亚洲精华国产精华| 亚洲中文一区二区三区| 久久久久亚洲精品| jiujiure精品视频播放| 少妇献身老头系列| 欧美综合色免费| caoporn视频在线观看| 视频一区二区三| 成人国产精品免费观看视频| 中文在线免费看视频| 久久久久久亚洲精品| 欧美日韩伦理| 国产精品边吃奶边做爽| 91精品视频网| 国产精品66|