精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

4000萬蛋白結構訓練,西湖大學開發基于結構詞表的蛋白質通用大模型,已開源

人工智能 開源
本文利用Foldseek將蛋白質進行編碼,生成了一維的3Di結構序列(使用了Foldseek的結構詞表,每種3Di token代表不同的局部結構),這樣的結構序列與氨基酸序列是等長的。

蛋白質結構相比于序列往往被認為更加具有信息量,因為其直接決定了蛋白質的功能。而隨著AlphaFold2帶來的巨大突破,大量的預測結構被發布出來供人研究使用。如何利用這些蛋白質結構來訓練強大且通用的表征模型是一個值得研究的方向。

西湖大學的研究人員利用Foldseek來處理蛋白質結構,將其編碼成一維的離散token,并與傳統的氨基酸進行結合,形成了結構感知詞表(Structure-aware Vocabulary),以此將結構信息嵌入到模型輸入中,增強模型的表征能力。

圖片

在預訓練上,論文使用了目前最多的蛋白質結構(identity過濾后4000萬),在64張A100上訓練了3個月,最終開源了具備650M參數量的模型SaProt(同時包括了35M的版本)。實驗結果表明SaProt各種蛋白質任務上都要好于之前的序列和結構模型。

研究《SaProt: Protein Language Modeling with Structure-aware Vocabulary》的預印版本,于 2024 年 3 月 21 日發布在 bioRxiv 預印平臺。

圖片

論文鏈接:https://www.biorxiv.org/content/10.1101/2023.10.01.560349v4

github鏈接:https://github.com/westlake-repl/SaProt

方法

本文利用Foldseek將蛋白質進行編碼,生成了一維的3Di結構序列(使用了Foldseek的結構詞表,每種3Di token代表不同的局部結構),這樣的結構序列與氨基酸序列是等長的。

因此本文使用了一種簡單而有效的結構嵌入方式:將結構詞表和氨基酸詞表計算笛卡爾積(即兩兩組合),形成新的結構感知詞表。這樣對于蛋白質的每個位點,其氨基酸類型和對應的局部結構都能組合成新詞表中的某個元素,從而讓模型同時考慮到蛋白質的序列與結構信息。

本文使用Bert架構進行掩碼語言建模(Masked Language Modeling )預訓練(關于訓練的更多細節可參考原論文)。

圖片

圖:結構感知詞表

實驗

方法對比

一個可能令人疑惑的問題就是為什么需要這樣編碼結構?論文展示了使用不同的結構編碼方式進行預訓練的結果圖:

圖片

圖:不同結構模型訓練的loss曲線圖

圖左和圖中是兩種經典的蛋白質結構建模方式,即將結構信息編碼成bias后添加到transformer的attention map中(如Evoformer,Uni-Mol),或者使用圖神經網絡的方式建模蛋白質的空間關系(如MIF,GearNet等)。

然而從loss圖中可以發現,當上述兩種建模方式在AF2結構上使用MLM的訓練目標進行預訓練時,模型會非常迅速地過擬合(表現為在AF2預測結構上預測loss非常低,但在PDB真實結構上loss停滯甚至上升)。

作者推測這是由于AF2預測出來的蛋白質結構帶有一些隱藏的模式(patterns),由于前兩種方式是直接對蛋白質的三維坐標進行建模,這些隱藏的pattern可能很輕易地就被模型識別出來,從而造成了信息泄露的問題,讓模型無需真正學習到蛋白質的進化信息就能輕松地完成訓練目標。

而結構感知詞表通過將蛋白質結構編碼成一維的結構序列,在盡可能保留結構模式的情況下忽略了精細的坐標數值,因此模型能夠有效地利用結構信息而不受到隱藏pattern的影響。

Zero-shot測試

作者在蛋白質突變數據集(ProteinGym)上和真實人類臨床疾病數據集(ClinVar)上測試了SaProt的zero-shot能力,結果如下:

圖片

圖:Zero-shot實驗結果

SaProt在兩個數據集上都超越了以往的所有結構和序列模型,證明了其在zero-shot預測突變上具備優異的能力。

監督微調測試

本文還涵蓋了各種下游任務來測試模型表現,結果如下:

圖片

圖:下游任務fine-tune結果

SaProt在各個下游任務上都超越了以往的序列和結構模型,展示出了其強大且通用的表征能力。

結構信息測試

SaProt在4000萬的蛋白質結構上進行訓練,獲得了強大的表征能力。一個可能的疑問是如何確定SaProt學到了更多的結構信息而不是模型被訓練得更好?

論文對SaProt和ESM-2在殘基接觸預測任務(Contact Prediction Task)上進行了測試。作者凍住了模型的backbone,只訓練一個線性分類層。實驗結果如下:

圖片

圖:Contact Prediction Task的結果

從結果可以看到,由于結構token的嵌入,SaProt的表現大大超越了ESM-2,這表明SaProt蘊含了非常豐富的結構信息,使其能夠在結構預測任務上獲得十分優異的結果。同時,論文在SCOPe數據庫上對alpha蛋白質和beta蛋白質進行了可視化,結果如下:

圖片

圖:在SCOPe數據庫上的Embedding可視化

SaProt的可視化結果非常清晰地將alpha蛋白質和beta蛋白質區分開來,而ESM-2的可視化結果卻將兩種蛋白質混雜在一起,這說明了SaProt對結構的變化有很強的感知能力。

不同結構預測方法的比較

除了AF2,目前還存在許多其他的單序列結構預測方法(如ESMFold),因此本文額外測試了其他方法預測出來的結構對SaProt性能的作用。結果如下:

圖片

圖:不同結構預測方法的fine-tune結果

從測試結果可以看出,雖然SaProt在AF2結構上的表現最好(模型本身也是基于AF2結構進行訓練的),但其他的結構預測方法也能讓SaProt與ESM-2等模型性能相當。這意味著考慮到計算與時間成本,單序列結構預測模型也能作為替代方法輸入到SaProt中。

局限

雖然SaProt經過訓練展示出了優異的性能,但依然還有一些可以改進的地方,例如:

Foldseek默認的結構詞表大小只有20,如果有更加精準的結構編碼模型,擴大結構表征的詞表大小,是不是能進一步提升模型利用結構的能力?

由于計算能力的限制,SaProt只在650M上完成了訓練。如果能夠繼續擴大模型規模,是否可以進一步地提升模型表現?

論文雖然已經測試了很多的蛋白質任務,但還有一些其他任務可以應用探索,例如蛋白質序列設計(給定backbone預測氨基酸序列)等。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-05-23 09:28:23

模型蛋白質

2021-07-24 10:21:46

模型人工智能深度學習

2022-10-08 12:38:23

模型開源

2023-03-03 14:00:00

模型深度學習

2022-11-02 13:41:46

2023-09-20 12:44:00

AI訓練

2025-07-14 16:59:06

AI蛋白質模型

2023-07-06 16:59:56

英特爾

2023-07-06 13:23:49

2022-02-14 00:04:24

AI蛋白質結構

2022-03-07 14:45:21

昇思MindSpore開源

2025-09-28 09:12:00

2021-12-20 10:07:35

AI 數據人工智能

2023-10-04 09:23:21

微軟開發

2023-07-13 12:53:02

FrameDiffAI

2022-07-28 19:31:39

AlphabetDeepMind擴展數據庫

2022-12-25 13:36:47

論文

2023-01-13 21:13:31

AI人工智能醫療

2025-02-04 11:11:07

2024-08-26 12:43:46

點贊
收藏

51CTO技術棧公眾號

日韩中文字幕av在线| 操日韩av在线电影| 91网址在线播放| av片在线免费看| 久久国产精品免费一区二区三区| 2020国产精品自拍| 成人久久一区二区三区| 五月婷婷亚洲综合| 99re6这里只有精品| 亚洲精品一区二区三区99| 玩弄japan白嫩少妇hd| 影音先锋男人资源在线| 久久久久99精品一区| 91精品天堂| 中文字幕在线播出| 国产日韩欧美高清免费| 伦理中文字幕亚洲| av手机在线播放| 精品亚洲自拍| 日韩欧美一区二区久久婷婷| 性欧美videossex精品| 黄色羞羞视频在线观看| 国产精品久久久久久久久晋中 | 九色成人搞黄网站| 亚洲一区二区三区在线播放| 亚洲图片在线观看| 天堂网www中文在线| 国产成人免费在线视频| 国产一区二区丝袜高跟鞋图片| 日本熟妇成熟毛茸茸| 亚洲自拍偷拍网| 日韩在线播放一区| 欧美色图17p| 国产欧美日韩精品一区二区三区| 欧美成人一区二区| 天天操夜夜操很很操| 亚洲wwww| 在线观看日韩毛片| 精品免费国产一区二区| 中国色在线日|韩| 亚洲国产综合视频在线观看| 热这里只有精品| 日韩欧美小视频| 国产精品丝袜在线| 性欧美精品一区二区三区在线播放| 天天干视频在线观看| www.日韩精品| 精品欧美一区二区三区久久久| 国产手机视频在线| 国产麻豆日韩欧美久久| 亚洲aⅴ男人的天堂在线观看| 天堂中文在线网| 国产视频一区欧美| 日韩女优人人人人射在线视频| 国产稀缺真实呦乱在线| 亚洲人成毛片在线播放女女| 国内精品一区二区三区| 国产精品老女人| 国产精品试看| 国产精品久久久久久av福利软件| 欧美三级韩国三级日本三斤在线观看| 97精品国产福利一区二区三区| 中文字幕欧美国内| 亚洲女人久久久| 黄色网址在线视频| 亚洲伊人精品酒店| 欧美日韩免费视频| 图片区乱熟图片区亚洲| 亚洲性视频在线| 日韩av在线直播| b站大片免费直播| 日本一区二区高清不卡| 久久精品国产亚洲精品2020| a级片在线观看免费| 国产专区一区| 日本国产高清不卡| 国产一区二区女内射| 国产ts人妖一区二区| 国产亚洲欧美另类一区二区三区| 免费观看黄色av| 久久影院午夜论| 亚洲一区二区三区在线观看视频| 精品国产白色丝袜高跟鞋| 一区二区三区四区在线免费观看| 亚洲精品国产suv一区88| caoporn视频在线| 在线国产亚洲欧美| av天堂一区二区| 精品国产乱码久久久久久蜜坠欲下| 亚洲午夜精品久久久久久久久久久久| 亚洲a v网站| 综合激情在线| 国产成人一区二区三区小说| 国产剧情久久久| 99re这里只有精品首页| 一本久道久久综合狠狠爱亚洲精品| 成人无遮挡免费网站视频在线观看| 亚洲国产一二三| 三级在线免费看| 亚洲精品18| 中文字幕欧美日韩在线| 日本a在线观看| 美女www一区二区| 激情小说综合区| 超碰在线网址| 91九色02白丝porn| 久久久男人的天堂| 午夜精品一区二区三区国产| 欧美在线视频免费播放| 亚洲成人中文字幕在线| 中文字幕乱码一区二区免费| 免费一级特黄毛片| 国产亚洲久久| 一区二区三区亚洲| 欧美日韩一二三四区| 国产精品1区二区.| 一区二区三区四区视频在线观看| 理论不卡电影大全神| 日韩欧美综合一区| 麻豆精品国产免费| 日韩电影在线免费| 久久精品一二三区| av电影免费在线看| 精品国产欧美一区二区| 国产美女福利视频| 麻豆国产精品官网| 日本午夜一区二区三区| 天堂在线中文网官网| 亚洲精品一区二区三区在线观看| 欧美一级片在线视频| 蜜臀a∨国产成人精品| 日韩免费三级| 日韩成人影音| 亚洲色图美腿丝袜| 在线永久看片免费的视频| 99精品偷自拍| 欧美视频在线观看网站 | 国产日韩在线观看av| 九九热视频在线观看| 午夜av电影一区| 国产不卡一二三| 亚洲精品黄色| 久久99精品久久久久久秒播放器| 日韩另类在线| 精品成人一区二区三区| 国产污视频在线观看| www.性欧美| www.四虎成人| 精品日韩在线| 国产一区二区色| 国产黄色小视频在线| 欧美一区二区三区成人| 青娱乐在线视频免费观看| 国产a视频精品免费观看| 国产又粗又猛又爽又黄的网站| 电影中文字幕一区二区| 欧美日韩高清区| 全部免费毛片在线播放一个| 亚洲成av人片| 短视频在线观看| 日本vs亚洲vs韩国一区三区 | 无人码人妻一区二区三区免费| 日韩精品免费一区二区在线观看| 国产精品久久久久高潮| 毛片在线不卡| 日韩亚洲欧美中文三级| 久久精品女人毛片国产| 91视频国产观看| 精品久久久噜噜噜噜久久图片| 精品国产一区二区三区| 成人有码在线播放| www在线观看黄色| 亚洲人成在线免费观看| 国产精品人人妻人人爽| 亚洲午夜免费福利视频| 伊人网伊人影院| 国内精品伊人久久久久av一坑 | 国产欧美一区二区三区不卡高清| a√中文在线观看| 一区二区三区四区在线观看视频| 亚洲一区二区影视| 亚洲无人区一区| 国产av自拍一区| 狠狠色丁香久久婷婷综合_中| 在线观看成人免费| 欧美调教视频| 91久久中文字幕| 污污的网站在线看| 亚洲人av在线影院| 国产chinasex对白videos麻豆| 亚洲国产精品一区二区www在线 | 欧美在线观看网站| 黄网站app在线观看| 亚洲激情中文字幕| 一本色道久久综合精品婷婷| 亚洲不卡一区二区三区| 男女全黄做爰文章| 国产黄大片在线观看| 欧美mv日韩mv国产网站app| 日批视频免费在线观看| 亚洲精品亚洲人成人网| 精品人妻互换一区二区三区| 国产成人精品综合在线观看 | 精品国产亚洲一区二区三区在线观看| 国产一级理论片| 国产精品国产成人国产三级| 国产精品嫩草av| 国内国产精品久久| 国产激情在线观看视频| 亚洲国产高清视频| 异国色恋浪漫潭| 欧美手机视频| 久久国产精品电影| 欧美日韩国产综合视频| 日韩欧美成人激情| 91久久精品国产91性色69| 狠狠操狠狠色综合网| 免费一级黄色大片| 亚洲人成精品久久久久| 黄色正能量网站| 成人一区二区视频| 中文字幕av一区二区三区人妻少妇 | 日本一区免费观看| 999精品嫩草久久久久久99| 98精品国产高清在线xxxx天堂| 在线播放麻豆| 亚洲图片欧洲图片av| 日韩porn| 亚洲国产精品电影| 日本免费一区视频| 精品久久久久一区| 亚洲成人777777| 欧美一级日韩不卡播放免费| 一本到在线视频| 欧美三级电影在线看| 老熟妇一区二区三区| 色综合天天综合网天天狠天天 | 二区三区在线播放| 亚洲另类欧美自拍| 国产在线一二三| 亚洲网站在线看| 北岛玲日韩精品一区二区三区| 日韩电视剧免费观看网站| 四虎免费在线观看| 日韩av在线高清| 欧美一区二区视频| 亚洲性视频网址| 成人在线观看黄色| 久久精品色欧美aⅴ一区二区| av在线播放免费| 中文字幕日韩欧美在线| 五月婷婷在线观看| 久久亚洲精品一区二区| 污污的网站在线看| 韩日精品中文字幕| 伊人久久综合一区二区| 国产suv精品一区二区三区88区| 亚洲精品福利电影| 国产精品色婷婷视频| 57pao成人永久免费| 99高清视频有精品视频| 美日韩黄色大片| 天堂社区 天堂综合网 天堂资源最新版 | 国产无套精品一区二区三区| 国产乱码精品一区二区三 | 免费的毛片视频| 欧美午夜宅男影院| 国产视频在线观看视频| 亚洲精品一区二区精华| 男操女在线观看| www.久久久久| 国产高清在线a视频大全 | 国产亚洲欧美日韩美女| 在线观看黄色av| 欧美大片网站在线观看| 天天综合av| 国产精品自产拍高潮在线观看| 日韩黄色碟片| 国产精品日韩欧美一区二区三区| 欧美午夜寂寞| 椎名由奈jux491在线播放 | 欧美福利视频网站| 伊人网在线播放| 成人h视频在线| 青青草原在线亚洲| 在线视频91| 国产日韩一区| 亚洲精品性视频| 337p粉嫩大胆色噜噜噜噜亚洲| 免费人成又黄又爽又色| 亚洲精品高清视频在线观看| 日本免费在线观看视频| 91精品国产黑色紧身裤美女| 日韩a在线观看| 免费97视频在线精品国自产拍| 麻豆视频在线看| 91精品国产一区二区三区动漫| 欧美一性一交| 最近免费观看高清韩国日本大全| 国产九九精品| 国产又黄又嫩又滑又白| 国产精品免费看片| 日本在线视频免费观看| 91精品国产91综合久久蜜臀| 国产黄色片在线播放| 久久露脸国产精品| 清纯唯美激情亚洲| 亚洲7777| 水蜜桃久久夜色精品一区的特点| 激情成人在线观看| 国产欧美精品一区| 国产成人精品网| 欧美大片在线观看一区| 国产午夜精品久久久久免费视| 秋霞午夜一区二区| 欧美成人午夜77777| 狠狠干视频网站| 久久av中文字幕片| 中国特黄一级片| 在线一区二区观看| 天堂√在线中文官网在线| 欧美激情伊人电影| 国产精品久久久久久久久久久久久久久| 国产一区二区无遮挡| 99热在线成人| 久久国产精品国产精品| 国产亚洲短视频| 99久久久久久久久| 亚洲国产精品网站| 免费高潮视频95在线观看网站| 91色p视频在线| 国产精品99久久精品| 欧美成人三级在线播放| 国产精品乱人伦一区二区| 国产99免费视频| 亚洲图中文字幕| 国产私拍福利精品视频二区| 日韩av一级大片| 日本不卡视频一二三区| 国产传媒视频在线 | 国产一区二区波多野结衣| 色999日韩欧美国产| 成人黄色在线| 在线视频福利一区| 寂寞少妇一区二区三区| 手机在线免费看片| 精品美女一区二区三区| 超碰在线中文字幕| 久久手机视频| 日韩高清在线一区| 成年人视频软件| 91精品久久久久久蜜臀| 91亚洲天堂| 成人免费视频网站| 亚洲精品婷婷| 2019男人天堂| 91精品国产91综合久久蜜臀| 中文av资源在线| 国产一区福利视频| 美女网站久久| 四虎地址8848| 欧美成人三级电影在线| 欧美调教sm| 亚洲 国产 日韩 综合一区| 韩国v欧美v日本v亚洲v| 久草视频手机在线观看| 精品一区电影国产| 51一区二区三区| 一二三四中文字幕| caoporen国产精品视频| 中文字幕 亚洲视频| 欧美第一黄网免费网站| 夜色77av精品影院| 最新av免费在线观看| 午夜电影一区二区| 最新97超碰在线| 国产日韩欧美精品| 蜜臀av性久久久久蜜臀aⅴ流畅| 国产一二三区精品| 亚洲精品第一页| 人人精品久久| 黄色www网站| 最近中文字幕一区二区三区| 天天综合天天综合| 国产玖玖精品视频| 亚洲国产免费看| 日本伦理一区二区三区| 亚洲丁香久久久| 九七影院97影院理论片久久| 亚洲精品偷拍视频| 久久综合九色综合97婷婷女人 | 可以免费看av的网址| 亚洲电影第1页| 欧美高清xxx| 欧美精品色婷婷五月综合| 中文字幕字幕中文在线中不卡视频| 亚洲欧美黄色片| 国产欧美精品va在线观看| 国产精品毛片| 国产高清在线免费观看|