精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

OpenAI 開源了推理安全模型-gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b

發布于 2025-10-31 07:46

瀏覽

0收藏

OpenAI 開源了兩款用于危害分類的開源權重推理安全模型：gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b；這些模型接收開發者的策略文本和內容作為輸入，返回分類標簽和解釋說明，讓你可以用可審計的推理過程來執行自己的規則。

核心創新：這些模型將內容審核從固定分類器轉變為基于策略的推理。修改規則就像編輯策略文本一樣簡單，無需重新訓練、無需新數據集、無需新檢查點。

OpenAI 開源了推理安全模型-gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b-AI.x社區

因為策略是輸入參數，你可以為不同產品、地區或年齡段切換不同策略，同一個模型就能遵循每一套規則。你還能獲得解釋說明，展示策略文本如何引導決策，這讓審計和申訴變得更容易。

輸出包含簡短的推理依據，說明策略文本如何得出決策結論，大大簡化了審查和申訴流程。

適用場景：這種方法在以下情況下表現出色:

風險是新出現的
訓練數據稀缺
領域內容復雜微妙
需要高質量可解釋的標簽而非最低延遲

例如，論壇可以使用自己的定義來標記作弊言論，評論網站可以用自己的標準篩查虛假評價，只需編輯策略文本，無需收集數千個標注樣本。

內部應用：在 OpenAI 內部，他們使用類似的工具叫 Safety Reasoner，通過強化學習微調來獎勵符合策略的判斷，讓模型學會從策略文本進行推理。

這種策略讓他們能快速更新生產環境中的安全規則，先從嚴格開始，然后根據實際情況放松或收緊，這個過程稱為迭代部署。

他們還報告稱，安全推理有時確實需要大量算力，在某些發布中，謹慎應用策略消耗了總算力的 16%。

實用架構模式：OpenAI 描述了他們內部技術棧的一個實用模式:先運行一個輕量廉價的分類器過濾明顯安全的內容，只將少量棘手的項目發送給重量級推理模型。

Safety Reasoner 現已成為圖像生成和 Sora 2 核心安全技術棧的一部分，逐步評估輸出并實時攔截不安全的生成內容。

同樣的分層檢查機制在 GPT-5 和 ChatGPT Agent 等系統中根據詳細分類法對輸出進行分類，讓平臺能針對特定風險類別定制響應。

OpenAI 開源了推理安全模型-gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b-AI.x社區圖片

性能表現：多策略準確率測試(單個輸入必須同時符合多個策略):

gpt-oss-safeguard-120b: 46.3%
gpt-oss-safeguard-20b: 43.6%
內部 Safety Reasoner: 52.2%
gpt-5-thinking: 43.2%

這個指標很嚴格，只有模型在所有策略上都匹配黃金標簽才算準確，是一個強調一致性的高標準。

OpenAI 開源了推理安全模型-gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b-AI.x社區圖片

OpenAI 2022 審核數據集:

兩款 gpt-oss-safeguard 模型: F1 分數 82.9
內部 Safety Reasoner: F1 分數 82.8 開源權重模型表現相當。

ToxicChat 基準測試:

gpt-oss-safeguard-120b 和 20b: F1 分數 79.3 和 79.9
內部 Safety Reasoner 和 gpt-5-thinking: F1 分數 81.3 和 81.0 緊湊的開源模型有競爭力，但在這個特定測試中不是頂尖。

技術特點與局限：這些模型是 OpenAI 開源模型的微調版本，可以融入現有的開源權重技術棧，適用于有數據駐留或離線控制需求的場景。

明確的局限性:

在困難類別上，使用數萬高質量標簽訓練的專用分類器仍可能優于基于策略的推理
存在成本權衡:推理比小型分類器需要更多時間和算力，因此分層管道是高流量平臺的實用模式

使用建議：對于開發者來說，選擇很直接:

使用 gpt-oss-safeguard: 當策略經常變化、需要解釋說明、標注數據稀缺時
使用專用分類器: 當你能承擔大規模標注工作并需要最后幾個百分點的準確率時

核心價值：總的來說，這里最強大的理念是策略即提示詞(policy-as-prompt)配合可見推理，它將安全規則與模型權重解耦，縮短了從策略變更到生產環境行為改變的周期。

如何使用 gpt-oss-safeguard：與 gpt-oss 系列模型一樣，這是一個開源模型，具有開放權重，你可以在本地運行或集成到自己的基礎設施中。它設計為與 harmony 響應格式配合使用。Harmony 是一種結構化提示詞接口，為 gpt-oss-safeguard 提供完整推理棧的訪問權限，并確保輸出一致且格式規范。

運行環境：gpt-oss 系列模型(包括 gpt-oss-safeguard)可以在以下服務器環境中運行:

vLLM(適用于專用 GPU，如 NVIDIA H100)：gpt-oss vLLM Usage Guide；https://docs.vllm.ai/projects/recipes/en/latest/OpenAI/GPT-OSS.html
HuggingFace Transformers(適用于消費級 GPU)：How to run gpt-oss locally with LM Studio；https://cookbook.openai.com/articles/gpt-oss/run-locally-lmstudio
Google Colab：How to run gpt-oss-20b on Google Colab；

??https://cookbook.openai.com/articles/gpt-oss/run-colab??

也可以在本地運行:

LM Studio：How to run gpt-oss locally with LM Studio；https://cookbook.openai.com/articles/gpt-oss/run-locally-lmstudio
Ollama：How to run gpt-oss locally with Ollama；

??https://cookbook.openai.com/articles/gpt-oss/run-locally-ollama??

目標用戶：gpt-oss-safeguard 專為需要大規模實時上下文和自動化的用戶設計，包括:

機器學習/AI 工程師 - 從事信任與安全系統工作，需要靈活的內容審核
信任與安全工程師- 構建或改進審核、信任與安全或平臺完整性管道
技術項目經理- 監督內容安全計劃
開發者- 構建需要基于上下文和策略的內容審核的項目/應用
策略制定者- 定義組織可接受內容標準，希望測試策略界限、生成示例并評估內容

模型地址：https://huggingface.co/collections/openai/gpt-oss-safeguard

本文轉載自??AI帝國??，作者：無影寺

標簽

已于2025-10-31 07:46:52修改

贊

收藏

回復

舉報

回復

相關推薦

2萬億訓練數據，120億參數！開源大模型Stable LM 2-12B

Aceryt ? 5164瀏覽 ? 0回復
Mistral開源8X22B大模型，OpenAI更新GPT-4 Turbo視覺，都在欺負谷歌

輕薄滴假象 ? 3879瀏覽 ? 0回復
Llama 3來了！首批開源 8B 和 70B兩個版本，未來有望開源400B大模型！

AIGC最前線 ? 1.4w瀏覽 ? 0回復
OpenAI神秘gpt2正在A/B測試，奧特曼搶先劇透，網友已玩嗨

Crystalcxt ? 3414瀏覽 ? 0回復
AutoCoder：性能超越GPT-4o的模型，居然只有33B，還是開源！

大語言模型論文跟蹤 ? 1.1w瀏覽 ? 0回復
Llama3.2開源：Meta發布1B和3B端側模型、11B和90B多模態模型

NLP工作站 ? 6465瀏覽 ? 0回復
不只是更快：Ministral 3B和8B如何保障您的數據安全與隱私？

Halo咯咯 ? 3223瀏覽 ? 0回復
Qwen2-VL (2B、7B、72B)：迄今為止最好的開源視覺模型?。。〒魯?Claude 和 GPT-4o）

老蛀蟲 ? 7704瀏覽 ? 0回復
清華團隊靠強化學習讓 7B 模型打敗 GPT-4o 數學推理

Aceryt ? 4065瀏覽 ? 0回復
OpenAI GPT-OSS 120B/20B 詳解：性能追平專有模型，開發者可本地微調

柏企閱文 ? 1.7w瀏覽 ? 0回復
OpenAI終于開源了！gpt-oss-120B對飆o4-mini，20B可手機運行

Halo咯咯 ? 3829瀏覽 ? 0回復
全球最佳開放模型！OpenAI開源GPT-OSS，AI界迎來巨變！

墨風如雪小站 ? 3244瀏覽 ? 0回復
OpenAI“補課”式發布兩個開放權重模型GPT-OSS | 5個技術看點 | 時隔六年多，再次擁抱開源

后向傳播 ? 2620瀏覽 ? 0回復
如何在你的計算機上運行OpenAI新的gpt-oss-20b LLM？

51CTO內容精選 ? 2393瀏覽 ? 0回復
GPT-OSS 20B挑戰Qwen3 30B-A3B，誰更適合你？

Halo咯咯 ? 1.1w瀏覽 ? 0回復
OpenAI回歸開源：gpt-oss-120b和gpt-oss-20b完整指南

51CTO內容精選 ? 2459瀏覽 ? 0回復
開源大模型如何選擇？GPT-OSS綜合評估與一些結論

大模型自然語言處理 ? 4455瀏覽 ? 0回復
OpenAI 開源模型 gpt-oss 是在合成數據上訓練的嗎？一些合理推測

Baihai_IDP ? 1384瀏覽 ? 0回復
圖解GPT-OSS：架構、消息格式與推理機制等

Syrupup ? 2045瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

The Station：AI驅動科學發現的開放世界環境 4天前發布
PAN：通用、可交互、長時程的世界模型 4天前發布

熱門推薦

用 Cognee 構建端到端知識圖譜，實現當前效果最好的AI Agent記憶層 0回復

Spring AI Alibaba：Java 后端接入大模型，終于不用羨慕 Python 了！ 0回復

小模型，大能量：阿里巴巴 Qwen3-VL 4B/8B，重新定義多模態輕量化邊界 0回復

2025 年最強 OCR 大比拼：從識別文本到文檔智能，誰才是終極解法？ 0回復

8%價格，2倍速度！國產MiniMax M2暴打Claude Sonnet 4.5？我們實測后發現堪稱性價比之王！ 0回復

上一篇： HedgeSpec：比EAGLE3推理速度快2倍的LLM推測解碼

下一篇：逆向搜索知識"暗物質"：300萬個推理鏈重構科學百科全書

社區精華內容

目錄

美女网站色免费| 精品国产免费一区二区三区| 久草手机视频在线观看| 成人免费91| 亚洲图片一区二区| 欧洲在线视频一区| 一区二区美女视频| 一区二区三区四区日韩| 亚洲国产精品久久91精品| 超碰网在线观看| 成人直播在线| 久久亚洲一级片| 成人做爽爽免费视频| 国产一级特黄aaa大片| 精品欧美激情在线观看| 欧美sm美女调教| 亚洲黄色av网址| 91在线三级| 国产欧美一区二区三区在线看蜜臀| 亚洲自拍小视频| 少妇久久久久久久| 精品二区久久| 久久综合久久88| x88av在线| 久久久久久久久久久久久久久久久久久久| 在线视频国内一区二区| 免费网站永久免费观看| 91福利在线视频| www国产精品av| 99re视频在线| 一区二区三区免费观看视频| 亚洲男女自偷自拍| 欧美另类极品videosbest最新版本 | 欧美xxx黑人xxx水蜜桃| 亚洲国产成人午夜在线一区| 国产精品日韩一区二区免费视频| 在线视频播放大全| 久久久久久一区二区| 久久久久久久激情视频| av最新在线观看| 精品免费视频| 国产香蕉一区二区三区在线视频| www.啪啪.com| 欧美日韩午夜电影网| 欧美日韩久久不卡| 在线免费观看视频黄| 都市激情亚洲一区| 亚洲成av人片在www色猫咪| 国产日产欧美一区二区| 免费网站看v片在线a| 欧美激情中文字幕一区二区| 欧美xxxx黑人又粗又长密月| 天天色综合久久| 成人免费福利片| 国产精品9999久久久久仙踪林 | 热三久草你在线| 亚洲成人福利片| 国产二区视频在线| 成年女人在线看片| 午夜精品久久久久| 黄色国产一级视频| 精品极品在线| 日韩欧美亚洲国产一区| av观看免费在线| 欧美大胆性生话| 色老汉av一区二区三区| 亚洲色精品三区二区一区| av免费在线一区| 欧美色成人综合| 超碰人人草人人| 精品国产伦一区二区三区观看说明| 这里只有精品视频在线观看| 三级av免费看| 国产精品毛片视频| 日韩电影在线观看中文字幕| 三级网站在线免费观看| 精品视频99| xvideos成人免费中文版| 国产十六处破外女视频| 国模大胆一区二区三区| 欧美亚洲国产成人精品| 中文字幕在线日本| 精品一区二区三区在线播放视频| 亚洲一区二区三区四区视频| 亚洲精品一区二区三区蜜桃| 91在线视频18| 亚洲精品国产精品国自产观看| 免费av在线网址| 亚洲成人动漫在线观看| 国产理论在线播放| 久久久91麻豆精品国产一区| 亚洲国模精品一区| 2019男人天堂| 欧美午夜精品| 国产精品美女av| 亚洲国产精品久久久久久久| 久久这里只精品最新地址| 亚洲视频在线观看日本a| 午夜伦理在线视频| 在线一区二区三区做爰视频网站| 亚洲综合20p| 蜜桃一区av| 中文字幕在线观看日韩| 日本三级2019| 极品美女销魂一区二区三区 | 一卡二卡三卡日韩欧美| 亚洲午夜精品久久久久久人妖| 999国产精品亚洲77777| 亚洲国产欧美一区二区三区同亚洲 | 波多野结衣xxxx| 国产精品调教视频| 啊v视频在线一区二区三区 | 奇米影视首页狠狠色丁香婷婷久久综合 | 久久综合九色综合欧美98| 国产高清免费在线| 国产日韩电影| 精品国产一区二区三区久久影院| 人妻互换一区二区激情偷拍| 国产毛片一区| 99三级在线| 免费高清完整在线观看| 欧美性猛交xxxx免费看| 成人做爰69片免费| jizzjizz欧美69巨大| 91国产美女视频| 精品久久人妻av中文字幕| 中文在线资源观看网站视频免费不卡| 无码制服丝袜国产另类| 欧美91在线|欧美| 亚洲欧美国产精品专区久久| 久久一区二区三| 国产呦萝稀缺另类资源| 亚洲精品第一区二区三区| 亚洲天堂资源| 亚洲国产精品一区二区久| 久久久久久久久久久久国产| 久久99国产精品免费网站| 日本视频一区二区不卡| 小h片在线观看| 亚洲高清福利视频| 国产主播在线观看| 国产高清不卡一区二区| 性做爰过程免费播放| 老司机精品视频网| 中文字幕精品一区久久久久| 最新中文字幕在线观看视频| 久久综合资源网| 国模吧无码一区二区三区| 日韩高清成人在线| 欧美一性一乱一交一视频| 天天干天天做天天操| 精品女厕一区二区三区| 亚洲天堂美女视频| 一区二区日本视频| 久久免费视频1| 欧美调教sm| 亚洲性日韩精品一区二区| 日本久久综合网| 国产免费成人在线视频| 美女黄色片视频| 成人vr资源| 国产剧情日韩欧美| 国产精品久久久久久福利| 91精品午夜视频| 欧美人妻精品一区二区免费看| 国产精品77777竹菊影视小说| 在线观看17c| 91精品入口| 91精品国产99久久久久久| 午夜成人鲁丝片午夜精品| 色哟哟国产精品免费观看| 六月婷婷七月丁香| 九色|91porny| 男人添女人荫蒂免费视频| 久久久亚洲欧洲日产| 国产成人在线视频| 在线观看a视频| 欧美成人午夜电影| 中国一级免费毛片| 国产欧美一二三区| 手机在线免费毛片| 国产精品一国产精品k频道56| 欧美中文娱乐网| 国产精品亚洲欧美一级在线| 久久久久久久久网站| 久蕉在线视频| 欧美一区二区三区电影| 中文字幕一区二区三区精品 | 午夜欧美激情| 色婷婷久久av| 欧美综合视频在线| 91国产免费看| 久久国产露脸精品国产| 久久久久久久久久看片| 精品人妻一区二区乱码| 亚洲在线黄色| 经典三级在线视频| 亚洲精品国产setv| 91久久精品国产91性色| 亚洲精品国产精品国产| 久久精品夜夜夜夜夜久久| 亚洲色欧美另类| 91麻豆精品国产91久久久久久久久 | 狠狠色噜噜狠狠狠狠色吗综合| 四虎4545www精品视频| 欧美高清无遮挡| 草碰在线视频| 亚洲国产精品推荐| 国产孕妇孕交大片孕| 狠狠色狠色综合曰曰| 9999热视频| 日本一区二区三区dvd视频在线| 亚洲欧美日韩中文字幕在线观看| 日韩精品亚洲一区| 日本十八禁视频无遮挡| 正在播放日韩欧美一页 | xxxx黄色片| 韩国毛片一区二区三区| 青青在线视频免费| 亚洲美女一区| www.夜夜爱| 久久久久久久久久久久久久久久久久 | 夜色77av精品影院| 国产欧美一区二区三区另类精品 | 欧美日韩亚洲在线| 98视频精品全部国产| 91久久在线观看| 久久亚洲人体| 国产精品久久久久久av| 在线看的毛片| 午夜精品福利视频| 欧洲精品二区| 欧美激情免费看| av免费网站在线| 久久精品这里热有精品| 在线观看免费版| 中文字幕精品网| 亚洲乱亚洲乱妇| 色狠狠av一区二区三区香蕉蜜桃| 国产小视频在线观看| 亚洲精品一区二区在线| 亚洲色图另类小说| 日韩毛片在线观看| 日av在线播放| 亚洲欧美日韩在线高清直播| 香蕉国产在线视频| 精品亚洲va在线va天堂资源站| 天堂网在线观看视频| 日韩av资源在线播放| 无码精品一区二区三区在线| 亚洲精品电影在线观看| 亚洲欧美激情另类| 精品视频www| 黄色网址在线播放| 一区二区三区四区视频| 中文字幕在线播放| 久久久精品一区二区| av网站在线看| 欧美激情一二三| 国内精彩免费自拍视频在线观看网址| 97精品免费视频| videos性欧美另类高清| 国产不卡视频在线| 国产精品传媒麻豆hd| 成人免费午夜电影| 亚洲国产欧美在线观看| 国产精品中出一区二区三区| 欧美在线导航| 先锋影音一区二区三区| 99久久www免费| 99热这里只有精品免费| 99视频在线精品国自产拍免费观看| 国产免费观看高清视频| 久热re这里精品视频在线6| 精品亚洲一区二区三区四区| 国产一区二区三区日韩| 国产免费一区二区三区最新6| 91丨九色porny丨蝌蚪| 毛片久久久久久| 亚洲最快最全在线视频| 人人爽人人爽人人片av| 欧美人与禽zozo性伦| 蜜桃av中文字幕| 一区国产精品视频| 一区二区三区伦理| 日韩av电影中文字幕| 国产精品久久久久久久久久久久久久久 | 亚洲男同1069视频| 日韩不卡视频在线| 欧美另类一区二区三区| 搡老岳熟女国产熟妇| 中文字幕亚洲无线码a| 丝袜美腿av在线| 国产成人激情小视频| 日韩一区网站| 日韩啊v在线| 精品动漫3d一区二区三区免费| 爱情岛论坛成人| 成人精品国产免费网站| 91社区视频在线观看| 亚洲国产美女搞黄色| 亚洲视频久久久| 亚洲精品电影在线| 97caopron在线视频| 国产成人精品亚洲精品| 国产欧美啪啪| 中日韩在线视频| 亚洲永久免费精品| 中文字幕一二三| 国产精品理伦片| 一区二区三区在线观看av| 欧美电影免费提供在线观看| 成人在线免费观看| 欧美性在线观看| 久久男人av| 黄色a级片免费看| 久久99热国产| 国产免费无遮挡吸奶头视频| 亚洲电影激情视频网站| 国产熟女一区二区丰满| 永久免费毛片在线播放不卡| 三级在线看中文字幕完整版| 国产成人亚洲欧美| 亚洲91精品| 九九九九九伊人| 国产精品三级在线观看| jizz国产在线观看| 亚洲男人天堂久| 日本在线播放一二三区| 国产精品视频免费一区| 欧美精品一线| 午夜性福利视频| 亚洲乱码中文字幕| 国产欧美综合视频| 日韩在线观看成人| 久久xxx视频| 亚洲精品视频一区二区三区| 首页国产欧美久久| 国产三级视频网站| 欧美日韩亚洲视频| 你懂的视频在线观看| 全亚洲最色的网站在线观看| 日韩福利视频一区| 欧美一级黄色片视频| 久久奇米777| 丰满人妻老熟妇伦人精品| 亚洲精品一区二区在线| 日韩欧美看国产| 日韩av大全| 日韩av一二三| 99re6热在线精品视频| 欧美体内she精视频| 日本a级在线| 成人a在线观看| 欧美激情五月| av电影在线播放| 欧美特黄级在线| 国内精品在线视频| 国产精品一区二区三区久久| 久久精品国产大片免费观看| wwwwwxxxx日本| 亚洲精品老司机| 日本黄色不卡视频| 琪琪第一精品导航| 欧美精选视频在线观看| www.se五月| 亚洲综合久久av| 外国精品视频在线观看 | 波多野结衣不卡| zzjj国产精品一区二区| 麻豆视频久久| 91成人在线观看喷潮教学| 久久久久久久电影| 91国产精品一区| 久久久久久久999精品视频| 色天下一区二区三区| 亚洲欧美在线精品| 夜色激情一区二区| 男操女在线观看| 亚洲va久久久噜噜噜久久天堂| 在线高清一区| 国产熟女一区二区| 日韩一级精品视频在线观看| 国产伦久视频在线观看| 婷婷四房综合激情五月| 国产精品77777竹菊影视小说| 性无码专区无码| www.色综合| 欧洲亚洲成人| 三级一区二区三区| 精品久久久久久久中文字幕| av在线电影播放| 国产精品一区在线播放| 久久精品国产在热久久| 日韩乱码人妻无码中文字幕| 中文字幕亚洲欧美在线| 久久黄色影视| av在线免费看片| 色系网站成人免费| 欧美人与动牲性行为|