精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ChemBench:大語言模型化學能力評測數據集

發布于 2024-5-28 10:25
瀏覽
0收藏

ChemBench 是上海人工智能實驗室 AI for Science 團隊自建的化學語言模型評測數據集,實現了大模型能力在化學領域的全面評估。

研究團隊從互聯網公開資源中采集并設計構建了 4100 多道多項選擇題,每個選擇題只有一個正確答案。覆蓋了 基于文本的分子生成、名稱轉換、性質預測、溫度預測、分子描述、產率預測、溶劑預測、逆合成分析、產物預測 九大化學任務。

ChemBench 評測任務介紹

隨著大語言模型的飛速發展,一系列特定領域的垂類模型也不斷涌現,這其中就包含化學大模型。但是如何全面的評估一個大模型的化學能力仍然是一個比較棘手的問題。

目前對化學領域大語言模型的能力評估會存在以下問題:

1. 目前很多已有的化學任務評測基準,往往只是針對某個具體的化學任務進行評測,或是為了特定領域模型所設計,并不適用于測試大語言模型。

2. 現有的對化學大語言模型的評測基準大多采用問答形式,使用 BLEU 或者 ROUGE 等指標進行評測,這些類型的評估指標會受到語言模型輸出風格的顯著影響,不適合科學事實正確性的評測,在這種情況下,如果模型輸出了更好的語言風格,但是包含事實性錯誤,可能會獲得更高的評估分數。

為了解決這些問題,上海 AI Lab 化學大模型團隊提出了 ChemBench,由多項選擇題構建,用來評估大語言模型的化學能力。

評測的任務以及每個任務題目數量分布如下圖:

ChemBench:大語言模型化學能力評測數據集-AI.x社區



Name Conversion:名稱轉換任務,指分子的 IUPAC chemical name 和 smiles 互相的轉換,測試了模型對分子不同描述的認知

Property Prediction:性質預測任務,針對分子預測其不同有用的化學性質

Mol2Caption:分子描述任務,針對特定分子進行多樣的描述表征?

Caption2mol:基于文本的分子生成,用戶給定特定對分子的描述,模型預測出相應的分子的結構式?

Product Prediction:產物預測任務,預測化學反應能得到的產物

Yield Prediction:產量預測任務,預測特定化學反應能得到的產量

Retrosynthesis:逆合成分析任務,根據成品分子預測其合成的路徑

Solvent Prediction:溶劑預測任務,預測化學反應中所需要的溶劑

Temperature Prediction:溫度預測任務,預測特定化學反應需要的溫度條件

在多項選擇題的構建中,團隊還借助 ChatGPT,通過對每個任務設計專用的提示工程,構建每個題目的錯誤選項,使得模型的錯誤選項有足夠難度的混淆,保證了選項的辨別難度。

數據集題目展示

下面將選取 ChemBench 中不同任務的題目進行展示。

Name Conversion 名稱轉換任務的題目展示如下:

```
{
        "question": "\nHow would you express this IUPAC name in SMILES format? CC1(C2=C(N=C1C=CC=C3C(C4=C(N3CCCS(=O)(=O)O)N=CC=C4)(C)C)[N+](=CC=C2)CCCCCC(=O)O)C",
        "answer": "D",
        "D": "6-[2-[3-[3,3-dimethyl-1-(3-sulfopropyl)pyrrolo[2,3-b]pyridin-2-ylidene]prop-1-enyl]-3,3-dimethyl-pyrrolo[2,3-b]pyridin-7-ium-7-yl]hexanoic acid",
        "A": "6-[2-[3-[3,3-dimethyl-1-(3-phosphonopropyl)pyrrolo[2,3-c]pyridin-2-ylidene]ethylidene]-3,3-dimethyl-pyrrolo[2,3-a]pyridin-7-ium-7-yl]hexanoic acid",
        "B": "6-[2-[3-[1-(3-carboxypropyl)-3,3-dimethylindolizin-2-ylidene]prop-1-enyl]-3,3-dimethyl-1H-pyrrolo[3,2-b]pyridin-7-yl]hexanoic acid",
        "C": "6-[2-[3-[3,3-dimethyl-1-(3-sulfopropyl)pyridin-2(1H)-one]-prop-1-enyl]-3,3-dimethyl-pyrrolo[2,3-b]pyridin-7-ium-7-yl]hexanoic acid"
    },
```

Retrosynthesis 逆合成分析任務的題目展示如下:

```
  {
        "question": "Which ingredients are commonly selected for creating Cc1oc(-c2ccccc2)nc1COc1ccc2cc(CC3SC(=O)NC3=O)cnc2c1 ?\n",
        "answer": "A",
        "A": "Chemicals employed in the creation of Cc1oc(-c2ccccc2)nc1COc1ccc2cc(CC3SC(=O)NC3=O)cnc2c1  can be chosen from CCO and Cc1oc(-c2ccccc2)nc1COc1ccc2cc(CC3SC(=N)NC3=O)cnc2c1. There's a chance that reactions will emerge, with Cc1oc(-c2ccccc2)nc1COc1ccc2cc(CC3SC(=N)NC3=O)cnc2c1.CCO>Cl>Cc1oc(-c2ccccc2)nc1COc1ccc2cc(CC3SC(=O)NC3=O)cnc2c1. potentially representing the reaction equations.",
        "C": "The possibility of reactions exists, and CCOC(=O)c1c(C(F)(F)F)cc(-c2ccc(OC(F)(F)F)cc2)nc1CC1CC1.[H].[H][Al+3].[Li+].[H].[H].>>redients are commonly selected for creating Cc1oc(-c2ccccc2)nc1COc1ccc2cc(CC3SC(=O)NC3=O)cnc2c1. could portray the reaction equations. Chemicals used in the formulation of redients are commonly selected for creating Cc1oc(-c2ccccc2)nc1COc1ccc2cc(CC3SC(=O)NC3=O)cnc2c1  can be chosen from CCOC(=O)c1c(C(F)(F)F)cc(-c2ccc(OC(F)(F)F)cc2)nc1CC1CC1.",
        "B": "It's possible for reactions to manifest, with CC(F)(F)c1cc(B2OC(C)(C)C(C)(C)O2)ccc1Cl.Cc1nccn1Cc1cc(Cl)cnn1>>redients are commonly selected for creating Cc1oc(-c2ccccc2)nc1COc1ccc2cc(CC3SC(=O)NC3=O)cnc2c1. potentially representing reaction equations. Materials used in the composition of Cc1nccn1Cc1cc(-c2ccc(Cl)c(C(C)(F)F)c2)cnn1 and Cl  can be selected from CC(F)(F)c1cc(B2OC(C)(C)C(C)(C)O2)ccc1Cl and Cc1nccn1Cc1cc(Cl)cnn1.",
        "D": "Materials used for manufacturing redients are commonly selected for creating Cc1oc(-c2ccccc2)nc1COc1ccc2cc(CC3SC(=O)NC3=O)cnc2c1  can be chosen from COc1cccc2c1ccc1c(C(=O)O)cc3c(c12)OCO3. Reactions could potentially emerge, with COc1cccc2c1ccc1c(C(=O)O)cc3c(c12)OCO3.Cl.c1ccncc1>Cl>redients are commonly selected for creating Cc1oc(-c2ccccc2)nc1COc1ccc2cc(CC3SC(=O)NC3=O)cnc2c1. possibly serving as indicators of reaction equations."
    },
```

Mol2Caption 分子描述任務的題目展示如下:

```
 {
        "question": "Describe this molecule.\nO=C(NCc1ccco1)c1cc2ccccc2o1",
        "answer": "B",
        "B": "The molecule is a benzofuran derivative.",
        "A": "The molecule is a member of steroids.",
        "C": "The molecule is a member of carboxylic acids.",
        "D": "The molecule is a member of flavonoids."
    },
```


同時,7B開源模型、GPT-3.5、GPT-4 在 ChemBench 上的化學能力由弱變強,符合人們對于這些模型使用上能力的認知,也進一步反映了ChemBench測評的有效性和客觀性。

ChemBench:大語言模型化學能力評測數據集-AI.x社區

本文轉載自 ??司南評測體系??,作者: 司南 OpenCompass

收藏
回復
舉報
回復
相關推薦
超碰人人人人人人| 免费一级做a爰片久久毛片潮| 四虎亚洲成人| 99riav久久精品riav| 日本精品一区二区三区在线| 国产精品久久久免费看| 7777精品| 欧美主播一区二区三区美女| 影音先锋男人的网站| 亚洲精品无amm毛片| 国产亚洲毛片| 久久久99久久精品女同性| 中文字幕人妻一区| 精品美女一区| 亚洲成人在线网站| 亚洲人成网站在线播放2019| 国产综合在线播放| 奇米影视7777精品一区二区| 欧美激情乱人伦| 日韩免费成人av| 久久综合五月婷婷| 欧美福利一区二区| 无码人妻丰满熟妇区毛片| 三级网站视频在在线播放| 国产精品私房写真福利视频| 国产精品三区在线| 国产精品久久久久久久免费看| 久久高清国产| 亚州精品天堂中文字幕| 性生交大片免费全黄| 综合国产视频| 亚洲精品国产精品自产a区红杏吧 亚洲精品国产精品乱码不99按摩 亚洲精品国产精品久久清纯直播 亚洲精品国产精品国自产在线 | 欧美男男gaygay1069| 亚洲成人av电影| 天堂av在线中文| 在线免费观看黄| 国产日韩欧美一区二区三区综合| 国内精品**久久毛片app| 国产美女裸体无遮挡免费视频| 久久黄色网页| 热99久久精品| 日本高清www免费视频| 在线成人直播| 久久精品久久久久| 欧美88888| 欧美理论视频| 亚洲男女性事视频| 男男做爰猛烈叫床爽爽小说| 伊人精品久久| 精品久久久久久久久久久久包黑料 | 日韩专区欧美专区| 欧美在线一级va免费观看| 日韩黄色精品视频| 国产亚洲精品v| 38少妇精品导航| 午夜影院在线看| 99热免费精品在线观看| 欧美激情免费观看| 久久高清免费视频| 黄色工厂这里只有精品| 欧美激情性做爰免费视频| 欧美激情精品久久| 亚洲午夜av| 午夜精品久久久久久久男人的天堂 | 日韩精品一区二区三区高清免费| 豆花视频一区二区| 亚洲国产天堂久久综合| 台湾佬美性中文| 国产亚洲成av人片在线观黄桃| 精品奇米国产一区二区三区| 国产精品成人无码专区| 日韩精品a在线观看91| 亚洲精品视频二区| 免费网站在线高清观看| 久久在线视频| 欧美激情2020午夜免费观看| 精品无码av在线| 亚洲欧美久久久| 国产精品va在线播放| 国产一区二区三区四区视频| 国产福利精品一区二区| 久久久久久九九九九| 毛片网站在线| 1024成人网色www| 性高湖久久久久久久久aaaaa| 夜鲁夜鲁夜鲁视频在线播放| 欧美性感一区二区三区| 日本高清免费观看| 你懂的在线观看一区二区| 亚洲美女性生活视频| 岛国片在线免费观看| 亚洲特色特黄| 国模极品一区二区三区| 羞羞色院91蜜桃| 国产精品1024| 日本一区美女| 天堂8中文在线| 欧美日韩在线一区| 亚洲a级黄色片| 先锋影音国产精品| 久久天天躁狠狠躁夜夜av| 精品美女久久久久| 激情欧美一区二区三区在线观看| 国产伦精品一区二区三区高清版 | 久久这里只有精品首页| 亚洲最大色综合成人av| gogo久久| 欧美一级高清大全免费观看| 国产美女免费无遮挡| 久久久久久久久丰满| 欧美中文字幕在线| 国模私拍视频在线| 中文字幕一区二区三区四区不卡| 少妇高潮喷水在线观看| 亚洲精品黑牛一区二区三区| 中文字幕在线日韩| 亚洲不卡视频在线观看| 成人久久18免费网站麻豆| 美国av在线播放| 在线观看精品| 亚洲精品久久久久久久久久久久| www.xxxx日本| 另类小说欧美激情| 欧美成熟毛茸茸复古| 亚洲色图美国十次| 777精品伊人久久久久大香线蕉| 国产精品亚洲无码| 国产情侣一区| 国产91免费视频| av香蕉成人| 欧美日韩不卡一区| 精品无码一区二区三区| 91久久夜色精品国产九色| 亚洲一区中文字幕| 蜜芽在线免费观看| 欧美日韩国产小视频在线观看| 亚洲一级中文字幕| 欧美亚洲一级| 久久www免费人成精品| 日韩伦理电影网站| 欧美一区二区三区在线视频 | www.国产毛片| 成人午夜电影久久影院| av动漫免费观看| 欧美大片1688| 国产一区二区三区在线看| www日韩精品| 成人小视频在线观看| 天天综合五月天| 日韩黄色三级| 久久不射电影网| 中文字幕第三页| 国产丝袜欧美中文另类| 成 年 人 黄 色 大 片大 全| 香蕉免费一区二区三区在线观看| 欧美www在线| 国产精品天天操| 国产精品久久久久久久午夜片| 色综合av综合无码综合网站| 欧美精品国产白浆久久久久| 久久成人av网站| 亚洲精品国产精品国| 亚洲欧美另类久久久精品| 国产探花在线看| 久久综合av| 91嫩草在线视频| 亚洲奶水xxxx哺乳期| 日韩一级片网站| 蜜臀久久精品久久久用户群体| 久久国产麻豆精品| 天堂精品一区二区三区| 成人激情久久| 色综合男人天堂| 亚洲黄色一级大片| 亚洲一区在线观看免费 | 欧美一级特黄视频| 99视频一区二区三区| 91专区在线观看| 欧美日韩国产高清电影| 国产精品福利在线| 在线免费黄色| 日韩情涩欧美日韩视频| 国产三级国产精品国产国在线观看| 国产成人aaa| 无码粉嫩虎白一线天在线观看| 白嫩白嫩国产精品| 57pao成人永久免费视频| 欧美成人综合在线| 狠狠躁夜夜躁久久躁别揉| 毛片网站免费观看| 免费黄网站欧美| 亚洲精品无人区| 国产毛片久久久| 国产精国产精品| 欧美96在线| 精品国产91亚洲一区二区三区婷婷| 久草免费新视频| 91老司机福利 在线| 天天操天天爱天天爽| 午夜亚洲福利| 美女精品国产| 亚洲综合伊人| 午夜精品久久久久久久99黑人| 精品福利视频导航大全| 欧美另类久久久品| 日本网站免费观看| 国产女人18毛片水真多成人如厕| 九一精品久久久| 一区二区毛片| 亚洲欧美久久久久一区二区三区| 9999精品| 国产精品私拍pans大尺度在线| 在线观看操人| 亚洲丝袜一区在线| 国 产 黄 色 大 片| 在线国产亚洲欧美| 亚洲 欧美 日韩 综合| 日韩美女精品在线| wwwxx日本| 久久精品伊人| 成人在线免费高清视频| 黑人操亚洲人| 精品乱色一区二区中文字幕| 日韩黄色三级| 欧美综合国产精品久久丁香| free性欧美hd另类精品| 中文字幕亚洲无线码a| 免费看av毛片| 337p亚洲精品色噜噜| 国产精品久久久久久久久久久久久久久久久 | 欧美国产日韩a欧美在线观看| 欧美在线一级片| 国产一区二区三区免费播放| 久久久免费视频网站| 国内精品久久久久久久97牛牛 | 亚洲福利一区二区三区| 91制片厂在线| 久久久影院官网| 国产xxxxxxxxx| 国产精品99久久不卡二区| 免费涩涩18网站入口| 香蕉成人久久| 午夜啪啪免费视频| 亚洲精品tv久久久久久久久久| 五月天色一区| 欧美美乳视频| 久久久综合香蕉尹人综合网| 三级小说欧洲区亚洲区| 国产精品午夜av在线| 欧美a级大片在线| 成人a在线视频| 韩国精品主播一区二区在线观看| 国产91亚洲精品| 中国字幕a在线看韩国电影| 美日韩精品免费视频| 国产在线更新| 一本一道久久a久久精品逆3p| 午夜小视频免费| 日韩精品中文字幕视频在线| 日本一区视频| 亚洲精品一区中文| 四虎影视精品成人| 精品亚洲国产成av人片传媒| 亚洲欧洲成人在线| 精品亚洲aⅴ在线观看| 精品欧美不卡一区二区在线观看 | 91在线高清| 国产亚洲精品高潮| 婷婷激情在线| 欧美大片va欧美在线播放| av毛片在线免费看| 色综合久综合久久综合久鬼88| 国产精品论坛| 91国内产香蕉| 成人做爰视频www网站小优视频| 欧美一级淫片播放口| 欧美成人免费全部网站| 91在线免费看网站| 伊人久久亚洲| 国语精品中文字幕| 成人精品久久| 日本xxx免费| 影音先锋久久精品| 少妇av一区二区三区无码| 老司机精品视频在线| 午夜天堂在线视频| 成人免费电影视频| 99久久久久久久久久| 日韩毛片高清在线播放| 日韩一区二区三区四区在线| 亚洲五月六月丁香激情| 五月婷婷开心网| 欧美性猛交xxxx乱大交3| 国产一区二区在线播放视频| 精品久久久三级丝袜| 亚洲av成人精品一区二区三区在线播放| 国产丝袜精品视频| 超碰电影在线播放| 国内精品久久久久久久久| 亚洲国产福利| 成人在线视频福利| 亚洲69av| japanese在线播放| 久久aⅴ国产紧身牛仔裤| 韩国中文字幕av| 麻豆精品视频在线观看视频| 亚洲激情 欧美| 国产精品久久久久久亚洲毛片| 国产无遮挡又黄又爽| 欧美在线色视频| 艳母动漫在线看| 久久精品福利视频| 欧美13videosex性极品| 成人欧美一区二区三区黑人孕妇| 香蕉久久99| 9191国产视频| 丝袜国产日韩另类美女| 亚洲一区二区中文字幕在线观看| 久久精品免费在线观看| 九九九免费视频| 欧美性猛交xxxxxxxx| 后入内射欧美99二区视频| 久久视频在线观看免费| 在线观看涩涩| 国产高清不卡av| 欧美日韩免费观看一区=区三区| 手机看片福利盒子久久| 成人激情视频网站| 国产又粗又硬又长又爽| 欧美日韩国产电影| 免费国产在线视频| 久久久久久亚洲精品| 日韩三区四区| 一区二区三视频| 视频一区二区欧美| 亚洲国产精品自拍视频| 午夜精品视频一区| 国产白浆在线观看| 色噜噜国产精品视频一区二区| 福利写真视频网站在线| 国产传媒一区二区三区| 伊人久久大香线蕉综合四虎小说| 超碰在线97免费| 国产日韩欧美综合一区| 久草视频一区二区| 日韩国产欧美精品在线 | 国产精品不卡在线观看| aaaaaa毛片| 亚洲韩国欧洲国产日产av | 三级精品视频| 国产精品999视频| 91一区二区在线| 国产精品99无码一区二区| 日韩三级视频中文字幕| 1区2区3区在线观看| 国产精品视频自在线| 成人激情诱惑| 可以看污的网站| 一区二区三区免费在线观看| 国产日韩欧美一区二区东京热 | 99久久无色码| 一区二区三区午夜视频| 国产3p在线播放| 亚洲一线二线三线久久久| 亚洲国产精品二区| 欧美多人乱p欧美4p久久| 色综合天天色| 精品国产三级a∨在线| 精品写真视频在线观看| 国产精品1区2区3区4区| 欧美亚洲一区三区| 欧美私人网站| 国产美女精品视频| 91一区二区三区四区| 免费精品99久久国产综合精品应用| 亚洲精品国产第一综合99久久| 99热这里只有精品在线观看| 麻豆国产精品va在线观看不卡| 涩涩涩久久久成人精品| 人人妻人人澡人人爽欧美一区| 国产成人精品一区二区三区四区| 麻豆国产尤物av尤物在线观看| 亚洲美女av黄| 国产成人久久精品麻豆二区| 中文字幕日韩精品久久| 国产精品一区一区三区| 久久黄色小视频| 亚洲精品mp4| 51av在线| 日本三级福利片| 成人午夜看片网址| 日本a级c片免费看三区| 欧美xxxx18性欧美| 精品成人自拍视频| 国产v亚洲v天堂无码久久久| 一区二区三区精品视频| 免费在线一级视频| 国产日本欧美在线观看| 欧美亚洲一区二区三区| 青青操在线视频观看|