精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

網(wǎng)絡(luò)安全大模型評測平臺SecBench發(fā)布

安全
2024年1月19日,網(wǎng)絡(luò)安全大模型評測平臺SecBenc正式發(fā)布,該平臺由騰訊朱雀實驗室和騰訊安全科恩實驗室,聯(lián)合騰訊混元大模型、清華大學(xué)江勇教授/夏樹濤教授團(tuán)隊、香港理工大學(xué)羅夏樸教授研究團(tuán)隊、上海人工智能實驗室OpenCompass團(tuán)隊共同建設(shè),主要解決開源大模型在網(wǎng)絡(luò)安全應(yīng)用中安全能力的評估難題,旨在為大模型在安全領(lǐng)域的落地應(yīng)用選擇基座模型提供參考,加速大模型落地進(jìn)程。

2024年1月19日,網(wǎng)絡(luò)安全大模型評測平臺SecBenc正式發(fā)布,該平臺由騰訊朱雀實驗室和騰訊安全科恩實驗室,聯(lián)合騰訊混元大模型、清華大學(xué)江勇教授/夏樹濤教授團(tuán)隊、香港理工大學(xué)羅夏樸教授研究團(tuán)隊、上海人工智能實驗室OpenCompass團(tuán)隊共同建設(shè),主要解決開源大模型在網(wǎng)絡(luò)安全應(yīng)用中安全能力的評估難題,旨在為大模型在安全領(lǐng)域的落地應(yīng)用選擇基座模型提供參考,加速大模型落地進(jìn)程。同時,通過建設(shè)安全大模型評測基準(zhǔn),為安全大模型研發(fā)提供公平、公正、客觀、全面的評測能力,推動安全大模型建設(shè)。

行業(yè)首發(fā),彌補(bǔ)大模型在網(wǎng)絡(luò)安全垂類領(lǐng)域評測空白

202211月ChatGPT發(fā)布以來,AI大模型在全球范圍內(nèi)掀起了有史以來規(guī)模最大的人工智能浪潮,大模型的落地進(jìn)程也隨之加速。然而,在網(wǎng)絡(luò)安全應(yīng)用中,大模型研發(fā)人員如何選擇合適的基座模型,當(dāng)前大模型的安全能力是否已經(jīng)達(dá)到業(yè)務(wù)應(yīng)用需求,都成為亟待解決的問題。

SecBench網(wǎng)絡(luò)安全大模型評測平臺,將重點(diǎn)從能力、語言、領(lǐng)域、安全證書考試四個維度對大模型在網(wǎng)絡(luò)安全領(lǐng)域的各方面能力進(jìn)行評估,為大模型研發(fā)人員、學(xué)術(shù)研究者提供高效、公正的基座模型選型工具和研究參考。

圖 1. SecBench網(wǎng)絡(luò)安全大模型評測整體設(shè)計架構(gòu)


圖 2. GPT-4在能力維度、語言維度以及安全領(lǐng)域能力的評估結(jié)果



圖 3. GPT-4在各類安全證書考試中的評估結(jié)果(綠色為通過考試)

SecBench設(shè)計架構(gòu)

圖1. 為SecBench網(wǎng)絡(luò)安全大模型評測初期規(guī)劃的架構(gòu),主要圍繞三個維度進(jìn)行構(gòu)建:

一是積累行業(yè)獨(dú)有的網(wǎng)絡(luò)安全評測數(shù)據(jù)集。評測數(shù)據(jù)是評測基準(zhǔn)建設(shè)的基礎(chǔ),也是大模型能力評測最關(guān)鍵的部分。目前行業(yè)內(nèi)還沒有專門針對大模型在網(wǎng)絡(luò)安全垂類領(lǐng)域的評測基準(zhǔn)/框架,主要原因也是由于評測收據(jù)缺失的問題。因此,構(gòu)建網(wǎng)絡(luò)安全大模型評測基準(zhǔn)的首要目標(biāo)是積累行業(yè)內(nèi)獨(dú)有的網(wǎng)絡(luò)安全評測數(shù)據(jù)集,覆蓋多語言、多題型、多能力、多領(lǐng)域,以全面地評測大模型安全能力。

二是搭建方便快捷的網(wǎng)絡(luò)安全大模型評測框架。“百模大戰(zhàn)”下,大模型的形態(tài)各異,有HuggingFace上不斷涌現(xiàn)的開源大模型,有類似GPT-4、騰訊混元、文心一言等大模型API服務(wù),以及自研本地部署的大模型。評測框架如何支持各類大模型的快速接入、快速評測也很關(guān)鍵。此外,評測數(shù)據(jù)的多樣性也挑戰(zhàn)著評測框架的靈活性,例如,選擇題和問答題往往需要不同的prompt和評估指標(biāo),如何快速對比few shot和zero shot的差異。因此,需要搭建方便快捷的網(wǎng)絡(luò)安全大模型評測框架,以支持不同模型、不同數(shù)據(jù)、不同評測指標(biāo)的靈活接入、快速評測。

三是輸出全面、清晰的評測結(jié)果。網(wǎng)絡(luò)安全大模型研發(fā)的不同階段其實對評測的需求不同。例如,在研發(fā)初期進(jìn)行基座模型選型階段,通常只需要了解各類基座模型的能力排名、對比不同模型能力差異;而在網(wǎng)絡(luò)安全大模型研發(fā)階段,就需要了解每次迭代模型能力的變化,仔細(xì)分析評估結(jié)果等。因此,網(wǎng)絡(luò)大模型評測需要輸出全面、清晰的評測結(jié)果,如評測榜單、能力對比、中間結(jié)果等,以支持不同研發(fā)階段的需求。

SecBench除了圍繞上述三個目標(biāo)進(jìn)行建設(shè)外,還設(shè)計了兩個網(wǎng)絡(luò)安全特色能力:安全領(lǐng)域評測安全證書考試評估。安全領(lǐng)域評測從垂類安全視角,評測大模型在九個安全領(lǐng)域的能力;安全證書考試評估支持經(jīng)典證書考試評估,評測大模型通過安全證書考試的能力。

SecBench評測框架

SecBench網(wǎng)絡(luò)安全評測框架可以分為數(shù)據(jù)接入模型接入模型評測結(jié)果輸出四個部分,通過配置文件配置數(shù)據(jù)源、評測模型、評估指標(biāo),即可快速輸出模型評測結(jié)果。

  • 數(shù)據(jù)接入:在數(shù)據(jù)接入上,SecBench支持多類型數(shù)據(jù)接入,如選擇題、判斷題、問答題等,同時支持自定義數(shù)據(jù)接入及評測prompt模板定制化。
  • 模型接入:在模型接入上,SecBench同時支持HuggingFace開源模型、大模型API服務(wù)、本地部署大模型自由接入,還支持用戶自定義模型。
  • 模型評測:在模型評測上,SecBench支持多任務(wù)并行,加快評測速度。此外,SecBench已內(nèi)置多個評估指標(biāo)以支持常規(guī)任務(wù)結(jié)果評估,也支持自定義評估指標(biāo)滿足特殊需求。
  • 結(jié)果輸出:在結(jié)果輸出上,SecBench不僅可以將評測結(jié)果進(jìn)行前端頁面展示,還可以輸出模型評測中間結(jié)果,如配置文件、輸入輸出、評測結(jié)果文件等,支持網(wǎng)絡(luò)安全大模型研發(fā)人員數(shù)據(jù)分析需求。

圖 4. SecBench網(wǎng)絡(luò)安全大模型評測框架

SecBench評測數(shù)據(jù)

網(wǎng)絡(luò)安全大模型的能力難以評測,主要原因之一還是網(wǎng)絡(luò)安全垂類數(shù)據(jù)的缺失。為了解決這一問題,SecBench目前已經(jīng)收集整理了12個安全評測數(shù)據(jù)集,累計數(shù)據(jù)10000條。

  • 語言維度:覆蓋中文、英文兩類常見語言的評測。
  • 能力維度:從安全視角,支持大模型對安全知識的知識記憶能力、邏輯推理能力、理解表達(dá)能力的評估。
  • 領(lǐng)域維度:支持大模型在不同安全領(lǐng)域能力的評測,包括數(shù)據(jù)安全、應(yīng)用安全、端點(diǎn)與主機(jī)安全、網(wǎng)絡(luò)與基礎(chǔ)架構(gòu)安全、身份與訪問控制、基礎(chǔ)軟硬件與技術(shù)、安全管理等。
  • 證書考試:SecBench還積累了各類安全證書模擬試題支持大模型安全證書等級考試評估。


圖 5. SecBench網(wǎng)絡(luò)安全大模型評測數(shù)據(jù)分布

當(dāng)前SecBench評測數(shù)據(jù)仍然存在多樣性不足、分布不均勻等問題,當(dāng)前正在持續(xù)補(bǔ)充建設(shè)多題型、多能力、多維度的評測數(shù)據(jù)。

SecBench評測結(jié)果

SecBench正在逐步接入大模型進(jìn)行網(wǎng)絡(luò)安全能力評測,目前主要針對經(jīng)典GPT模型以及小規(guī)模開源模型進(jìn)行評測榜單輸出。展示模型在能力、語言、安全領(lǐng)域不同能力維度的結(jié)果,同時支持安全等級證書考試結(jié)果輸出。后續(xù)將持續(xù)接入商用大模型、安全大模型,支持模型能力對比等能力。

圖 6. SecBench網(wǎng)絡(luò)安全大模型評測榜單

隨著大模型在網(wǎng)絡(luò)安全領(lǐng)域的落地應(yīng)用加速,網(wǎng)絡(luò)安全大模型的評測變得尤為關(guān)鍵。SecBecnch初步建立起圍繞網(wǎng)絡(luò)安全垂類領(lǐng)域的評測能力以更好地支持網(wǎng)絡(luò)安全大模型的研發(fā)及落地應(yīng)用。此外為評估大模型在Prompt安全方面的表現(xiàn),騰訊朱雀實驗室已聯(lián)合清華大學(xué)深圳國際研究生院,發(fā)布了《大語言模型(LLM) 安全性測評基準(zhǔn)》

未來展望

SecBecnch初步建立起圍繞網(wǎng)絡(luò)安全垂類領(lǐng)域的評測能力,然而還有許多需要優(yōu)化迭代的地方:一是仍需持續(xù)補(bǔ)充構(gòu)建高質(zhì)量的網(wǎng)絡(luò)安全評測數(shù)據(jù),覆蓋多領(lǐng)域、多題型,以更好地支持模型在網(wǎng)絡(luò)安全領(lǐng)域的全面評測;二是快速跟進(jìn)大模型評測,對于新發(fā)布的大模型,能夠及時輸出評測結(jié)果;三是豐富模型結(jié)果呈現(xiàn)方式,支持模型對比、結(jié)果分析等功能,以滿足不同用戶的使用需求。SecBench也希望能夠引入更多的合作伙伴,包括學(xué)術(shù)界、工業(yè)界相關(guān)從業(yè)者,共創(chuàng)共贏,共同推動網(wǎng)絡(luò)安全大模型的發(fā)展。


責(zé)任編輯:鳶瑋 來源: 騰訊
相關(guān)推薦

2024-04-17 12:51:49

2024-02-26 12:30:17

2012-03-13 13:44:01

Hillstone網(wǎng)絡(luò)安全

2012-04-24 18:39:10

HillstoneHSA

2023-09-03 16:20:30

2023-10-07 00:23:34

2023-11-20 14:34:09

2021-11-12 06:05:38

網(wǎng)絡(luò)安全安全預(yù)測網(wǎng)絡(luò)攻擊

2023-11-06 13:56:20

2011-03-17 13:32:45

2023-11-09 14:38:28

2021-05-12 11:12:06

智慧城市網(wǎng)絡(luò)安全

2020-07-30 09:29:19

網(wǎng)絡(luò)安全漏洞技術(shù)

2025-07-03 07:40:00

網(wǎng)絡(luò)安全大語言模型網(wǎng)絡(luò)攻擊

2009-03-11 14:14:47

2022-09-02 14:34:34

網(wǎng)絡(luò)安全勒索軟件攻擊

2021-11-19 11:51:27

CISA網(wǎng)絡(luò)安全美國

2023-06-08 00:16:58

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

亚洲va中文在线播放免费| 性一交一乱一透一a级| 日本久久精品| 日韩欧美在线网站| 久草热视频在线观看| 精品视频三区| 国产激情视频一区二区三区欧美 | 国产一级久久| 日韩在线视频免费观看| 亚洲视频在线播放免费| 草莓视频成人appios| 亚洲国产欧美在线| 亚洲精品视频一二三| 好吊色视频一区二区| 首页国产欧美久久| 欧美精品久久久久久久免费观看| 久久久久无码精品国产sm果冻 | 久久五月精品中文字幕| 久久一日本道色综合| 亚洲xxxx做受欧美| 在线免费观看av片| 国产欧美综合一区二区三区| 俺去啦;欧美日韩| 欧美一区二区三区成人精品| 久久视频社区| 欧美三级乱人伦电影| 欧美黑人经典片免费观看| 成人影欧美片| 国产欧美日韩三区| 精品国产综合久久| 精品国产亚洲av麻豆| 久久国产婷婷国产香蕉| 国产极品精品在线观看| 日韩欧美中文字幕一区二区| 欧美成人亚洲| 久热国产精品视频| 亚洲综合第一区| 精品产国自在拍| 亚洲精品动漫久久久久| 国产成人av片| 日韩欧美中文字幕一区二区三区| 欧美日韩成人综合天天影院| 逼特逼视频在线| 成年男女免费视频网站不卡| 亚洲自拍偷拍综合| 人妻互换免费中文字幕| h片在线免费观看| 日韩理论片一区二区| 四虎影院一区二区三区 | 色视频www在线播放国产成人 | 亚洲色图20p| 在线丝袜欧美日韩制服| av在线免费观看网| 国产精品欧美一级免费| 三级三级久久三级久久18| 国产在线一在线二| 中文字幕av一区二区三区免费看| 日本福利一区二区三区| 国产在线观看免费| 欧美国产日韩亚洲一区| 视频一区二区精品| 午夜免费视频在线国产| 国产精品国产自产拍在线| 一区二区成人国产精品 | 午夜精品一区二区三区av| 麻豆疯狂做受xxxx高潮视频| 伊人精品在线| 1769国内精品视频在线播放| 在线观看日本网站| 日韩电影免费在线看| 国产欧洲精品视频| 国产不卡av在线播放| 成人午夜大片免费观看| 久久精品综合一区| 国产露出视频在线观看| 国产精品护士白丝一区av| 可以免费看的黄色网址| 日本高清在线观看| 天天影视网天天综合色在线播放| 黄在线观看网站| 视频精品导航| 欧美一区二区三区不卡| 久久久久久久无码| 欧美理论在线播放| 欧美裸体男粗大视频在线观看| 久久久久亚洲av无码专区| 99视频一区| 国产精品久久久久久婷婷天堂| 国产女人18毛片水18精| av在线一区二区三区| 日本一区二区在线| www视频在线免费观看| 精品国产31久久久久久| 性刺激的欧美三级视频| 97色成人综合网站| 一本色道久久综合狠狠躁篇怎么玩| 老司机成人免费视频| 在线欧美视频| 国产精品自产拍高潮在线观看| 午夜精品无码一区二区三区| 国产婷婷色一区二区三区在线| 男女啪啪的视频| 川上优av中文字幕一区二区| 一本大道久久精品懂色aⅴ| 制服丝袜中文字幕第一页| 91精品日本| 一区二区三区视频免费| 99免费在线观看| 青青国产91久久久久久| av资源站久久亚洲| 永久免费av在线| 精品动漫一区二区| 91精品国产三级| 精品国产网站| 性色av一区二区三区在线观看| 一级α片免费看刺激高潮视频| av一区二区久久| 视色,视色影院,视色影库,视色网| 日本黄色免费在线| 欧美成人精品3d动漫h| 国产精品麻豆一区| 男人的天堂亚洲在线| 99精品国产高清一区二区| av在线二区| 欧美色欧美亚洲高清在线视频| 91福利视频免费观看| 日韩电影免费网站| 日韩美女视频中文字幕| 天堂在线中文网| 一区二区三区欧美视频| 一区二区三区四区毛片| 日韩黄色大片网站| 国产精品91免费在线| 四虎影视精品成人| 亚洲成人综合在线| 韩国三级hd两男一女| 欧美在线资源| 92看片淫黄大片欧美看国产片| av电影在线观看一区二区三区| 精品久久久久久久久久久久| 国产精品成人无码专区| 国产精品分类| 99r国产精品视频| 成年人网站在线| 欧美日韩国产精品成人| 99久久99久久精品免费| 日av在线不卡| 一本色道婷婷久久欧美| 久久三级毛片| 久久久精品在线观看| 国产精品主播一区二区| 亚洲人吸女人奶水| 在线一区二区不卡| 91精品国产视频| 亚洲综合视频1区| 色在线视频网| 亚洲福利视频专区| 日韩在线视频免费播放| 久久这里只有精品首页| 粉嫩虎白女毛片人体| 久久久免费毛片| 欧美亚洲激情视频| 久蕉在线视频| 欧美日韩一区二区三区四区| 四虎影视一区二区| 国产精品自在在线| www污在线观看| 亚洲精品aaaaa| 国产精品久久久久久久午夜| 日本高清在线观看wwwww色| 一本到高清视频免费精品| 亚欧精品视频一区二区三区| 精品一区二区三区欧美| 欧美性受黑人性爽| 高清一区二区三区| 国产福利视频一区二区| 欧美jizz18性欧美| 精品粉嫩超白一线天av| 亚洲熟妇无码乱子av电影| 亚洲国产成人午夜在线一区| 亚洲成人手机在线观看| 在线一区免费观看| 深田咏美在线x99av| 精品国产亚洲一区二区三区| 久久青草福利网站| yourporn在线观看中文站| 欧美一区二区国产| 欧美日韩综合在线观看| 国产精品国产三级国产有无不卡 | 亚洲亚洲免费| 国产欧美日韩亚洲精品| av中文在线资源库| 中文字幕在线精品| 色一情一乱一区二区三区| 在线观看免费成人| 欧美成人综合色| 久久综合九色综合97_久久久| 日av中文字幕| 亚洲午夜黄色| 一区二区三区国| 欧美影院天天5g天天爽| 91精品视频大全| 网友自拍亚洲| 欧美激情国产精品| 3d成人动漫在线| 亚洲黄页网在线观看| 一道本无吗一区| 黑人巨大精品欧美一区二区三区 | 国产污视频在线| 日韩久久免费av| 又污又黄的网站| 精品动漫一区二区三区| 欧美成人国产精品高潮| 国产女人18毛片水真多成人如厕| 天堂va欧美va亚洲va老司机| 久久99这里只有精品| 久久久久久久中文| 欧美日韩蜜桃| 五月天亚洲综合情| 亚洲天堂日韩在线| 黑人巨大精品欧美一区二区小视频 | 国产成人免费av电影| 搞黄网站在线看| 久久久www成人免费精品| 国产小视频免费在线网址| 精品对白一区国产伦| 国产91视频在线| 3d动漫精品啪啪| 一级黄色片在线看| 色8久久精品久久久久久蜜| 日本中文字幕免费| 亚洲综合成人网| 激情综合五月网| 亚洲日本在线a| 国产尤物在线播放| 综合久久国产九一剧情麻豆| 粉嫩精品久久99综合一区| 久久麻豆一区二区| 在线免费观看日韩av| 99九九99九九九视频精品| 岛国大片在线免费观看| 国产一区二区毛片| 中文字幕资源在线观看| 美国一区二区三区在线播放| 久久婷婷国产91天堂综合精品| 性欧美精品高清| 成人在线免费观看av| 99亚洲精品| 欧美日韩在线中文| 国产一区二区高清| 无码播放一区二区三区| 99精品国产一区二区青青牛奶| 97在线国产视频| 亚洲美女黄色| 日韩av高清在线看片| 亚洲乱亚洲高清| av天堂永久资源网| 日韩高清欧美激情| 日本肉体xxxx裸体xxx免费| 日本在线播放一区二区三区| 久久国产激情视频| 国产精品性做久久久久久| 免费看三级黄色片| av午夜一区麻豆| av电影网站在线观看| 国产精品久久久久久久久免费樱桃| 青青青视频在线播放| 亚洲情趣在线观看| 国产精品变态另类虐交| 欧美午夜久久久| 精品乱码一区内射人妻无码| 欧美日本免费一区二区三区| 99产精品成人啪免费网站| 精品国产一区二区精华| 亚洲色图另类小说| 一区二区国产精品视频| 久久久久久国产精品免费无遮挡| 欧美肥臀大乳一区二区免费视频| 91资源在线观看| 国产精彩精品视频| 激情综合五月| 蜜桃网站成人| 在线中文字幕亚洲| 国产免费黄视频| 激情欧美一区二区| 亚洲 欧美 日韩在线| 国产亚洲精品超碰| 亚洲欧美一区二区三区四区五区| 五月综合激情婷婷六月色窝| 中文字幕+乱码+中文乱码91| 日韩欧美电影一二三| 日韩大胆人体| 欧美噜噜久久久xxx| 欧美成人资源| 97久久人人超碰caoprom欧美| 神马久久影院| 天天做天天爱天天高潮| 久久经典综合| 拔插拔插华人永久免费| 久久网站热最新地址| 日韩女优一区二区| 日本乱人伦aⅴ精品| 国产草草影院ccyycom| 亚洲少妇激情视频| 免费在线看污片| 成人动漫网站在线观看| 亚洲69av| 丝袜人妻一区二区三区| 久久99精品国产麻豆婷婷洗澡| 97人妻天天摸天天爽天天| 综合欧美一区二区三区| 少妇一级淫片日本| 亚洲精品99久久久久中文字幕| 免费av在线| 国产精品美女免费看| 日韩av系列| 男人天堂a在线| 国产综合色视频| 欧美激情久久久久久久| 欧美日韩在线第一页| 国产自产一区二区| 欧美精品一区二区三区国产精品| 外国电影一区二区| 农村寡妇一区二区三区| 亚洲高清自拍| 中文字幕 欧美 日韩| 亚洲欧美日韩精品久久久久| 自拍偷拍福利视频| 亚洲视频免费一区| 国产精品粉嫩| 精品一区二区不卡| 日韩视频一区二区三区在线播放免费观看| xxx中文字幕| 亚洲欧美日本韩国| 国产精品福利电影| www高清在线视频日韩欧美| 97久久网站| 日韩欧美视频一区二区三区四区 | 国产精品视频中文字幕| 国产丝袜在线精品| www.日韩一区| 亚洲日本aⅴ片在线观看香蕉| 极品视频在线| 久久久久久久久久久一区| 国产欧美丝祙| 欧美狂猛xxxxx乱大交3| 色视频成人在线观看免| 黄色毛片在线观看| 国产精品久久久久久超碰| 国产一区二区观看| 欧美性猛交xxx乱久交| 国产欧美日韩精品在线| 91丨九色丨海角社区| 一区二区三区视频免费在线观看| 久久精品超碰| 色涩成人影视在线播放| 青娱乐精品视频| 黄视频网站免费看| 欧美va在线播放| 岛国av在线播放| 欧美日韩国产综合视频在线| 日日嗨av一区二区三区四区| jizzjizzjizz国产| 欧美一区二区三区在线观看| 超碰在线网站| 免费成人看片网址| 六月丁香婷婷色狠狠久久| 粉嫩av性色av蜜臀av网站| 精品久久免费看| 二区三区不卡| 一道精品一区二区三区| 国产成人免费在线观看不卡| 久久久久久久久影院| 中文字幕欧美日韩精品| 日韩有吗在线观看| 大陆极品少妇内射aaaaa| 欧美国产精品一区二区三区| 国产精品久久久久久免费播放| 欧美精品福利在线| 蜜桃a∨噜噜一区二区三区| 午夜一区二区视频| 亚洲第一福利视频在线| 国产黄色免费在线观看| 亚洲精品日韩激情在线电影| 99亚洲视频| 国产又粗又长免费视频| 精品国产免费久久| 91精品国产66| 久青草视频在线播放| 久久精品视频一区二区| 国产同性人妖ts口直男| 日本视频久久久| 欧美精品三级| 欧美三级视频网站| 精品久久国产老人久久综合| 91p九色成人| 精品无码国产一区二区三区av| 国产日产欧美一区| 人妻少妇一区二区三区| 国产在线日韩在线|