精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

谷歌高級研究員Nature發文:避開機器學習三大「坑」

開發 開發工具 機器學習
本文將介紹谷歌 Accelerated Science 團隊在使用機器學習分析時所面臨并解決了的三個問題,以說明展示這種做法。

算法分析已經成為科學研究的重要方法,生物學家、高能物理學家、病理學家等許多領域的研究者都正在廣泛采用機器學習算法來發現新配方和新方法,但是谷歌 Accelerated Science 團隊高級研究員 Patrick Riley 近日在 Nature 上發表的文章認為,科研工作者對機器學習的預期普遍過高,這可能會導致研究者將資源浪費在錯誤的研究方向上。他在文中列出了科研工作者在使用機器學習時可能遇到的一些陷阱和應對思路。

機器學習正在推動各個科學領域的研究進展,其強大的模式發現和預測工具正在助力所有領域的科學家——從尋找合成分子到提升醫學診斷效果再到揭示基本粒子,可謂應有盡有。

但是,機器學習工具也可能做出一些徒勞無功的探索——得到假陽性結果、不可行的方法和錯誤結果。而且很多算法還過于復雜,以至于我們不可能檢查其所有參數或推斷其處理輸入的確切方式。隨著這些算法的應用日益廣泛,理解錯誤、得出錯誤結論以及浪費科研工作資源的風險將會急劇上升。

這些都不是新問題。機器學習領域幾十年來一直備受「坦克問題(tank problem)」之苦。最初的研究似乎出現在 1960 年代(據信參考文獻 1 是這一研究方向上最早的文獻;這是軟件工程師 Jeff Kaufman 的功績),但被埋沒在了時間長河里。這樣的故事總是層出不窮。

那時候,研究者編寫了一個用于識別軍方提供的照片中的坦克的算法。得到的模型成功地找到了測試圖像中的坦克,但卻無法成功識別之后的真實照片的坦克。原因為何?這個故事已被復述太多次了,細節已經無法考證——但其訓練所用的圖片包含其它模式——出現在晨光之中或云朵之下的坦克。因此,驅動這一算法的是類似這樣的其它因素,而不是坦克的存在本身。

類似的迷思帶來了今天的反省。很多機器學習論文都沒能完成足夠的實驗集。用于評議的標準也不一致。而且現在競爭很激烈,某些研究者在得到想要的答案后就抄近道、跳過檢查步驟。

我們無法預測每次分析中的所有難題,但至少,正將機器學習引入自己領域的研究者應當熟悉常見的陷阱以及用于檢測和避開這些陷阱的實踐方法。

本文將介紹谷歌 Accelerated Science 團隊在使用機器學習分析時所面臨并解決了的三個問題,以說明展示這種做法。

三個問題

1. 不恰當地分割數據

在構建模型時,機器學習實踐者通常會將數據劃分為訓練集和測試集。訓練集用于模型學習,測試集則用于評估模型在未知數據上的表現。研究者通常以隨機方式分割數據,但現實生活中的數據很少是隨機的。它們可能包含隨時間變化的趨勢——比如數據收集方式的變化趨勢或所要收集信息的變化。

舉個例子,分子數據集中就埋藏著這樣的歷史模式,它在經過機器學習算法的虛擬篩選后可用于發現候選藥物。這個問題的難點在于預測假想分子被人體吸收或減緩炎癥的效果。篩選是從有/無所需效果的分子的數據開始的,但數據的收集場景卻可能不同于機器學習模型的使用方式。

舉個例子,一個模型可能是基于一組公開可用的分子數據集構建的,但卻被用在了一個不同的專有數據集上。并且當化學家檢查到或丟棄了有潛在希望的線索時,他們的研究重心往往會從特定的分子分組轉向其它分組。因此,研究者在實踐中往往高估模型的表現。這可能導致預期過高,從而在選擇不佳的分子上浪費時間和資金。很多模型構建者(包括我本人)都曾掉入過這個陷阱。

也就是說,你想要解答的問題應當會影響你分割數據的方式。為了使模型預測向一個在分子中分子中添加幾個原子的效果,測試集中的每個分子都應在訓練集中有僅有幾個原子不同的對應分子。如果你希望很好地預測化學上不同的分子,那么測試集中的每個分子應該任訓練集中的任何分子。分割數據的「正確」做法可能并不顯而易見,但審慎考慮和嘗試多種方法能為你提供更多見解。

2. 隱變量

在一個理想的實驗中,研究者只需要改變感興趣的變量,其他都是固定不變的。這種水平的變量控制在現實中往往是不可能實現的。設備的準確性會隨著時間的推移而發生變化,試劑的批次也會發生變化,一種實驗條件先于另一種執行,實驗結果甚至可能被天氣影響。這些不可控變量在機器學習模型中可能是有害的。

例如,我在谷歌的團隊一直在與加州的一家核聚變創業公司 TAE Technologies 合作,致力于優化生產高能等離子體的實驗。我們建立模型,試圖了解等離子體機的最佳設備設置。機器中有數百個控制參數,從什么時候給電極通電到在磁鐵上設置什么電壓。我們記錄了一系列測量結果,包括溫度和光譜。

[[272409]]

加州的 TAE Technologies 和谷歌的研究者正使用機器學習優化產生高能等離子體的設備。

在幾個月的時間里,我們從運行數千次的等離子體機中獲取數據。設置會隨著設備的調整和修改、組件的磨損以及多個想法的付諸實踐而發生變化。我們最終得到了一個令人欣慰的模型,它能很好地預測在給定環境下,等離子體的能量是否會很高。但很快我們發現,我們的預測和想法不一致。

當再次訓練模型的時候,我們將實驗時間作為唯一的輸入,而沒有選擇所有的機器設置,我們獲得了類似的預測能力。為什么呢?我們認為第一代模型鎖定在了時間趨勢,而不是物理現象。隨著實驗的推進,機器在一段時間內運行良好,而在另一段時間內運行不佳。所以,實驗完成的時間會為你提供一些信息,以判斷生成的等離子體是否具有高能量。此外,實驗的完成時間也可以通過控制參數的設置來進行粗略地預測——這些參數的變化也存在時間趨勢。

隱變量也源于實驗布局。例如,我們正與很多合作者共同解讀顯微圖像,包括紐約干細胞基金會研究所(New York Stem Cell Foundation Research Institute)。這些圖像包括滴定板上的生物實驗陣列——通常是包含細胞和液體的網格。目的是發現具有某些特征的阱,如化療后細胞外觀的變化。但是,生物變異意味著每個滴定板常常看起來截然不同。同時,單個滴定板也可能出現變化。例如,如果邊緣井中蒸發掉了更多液體或者滴定板出現了傾斜,則邊緣常常看起來與中心不同。

機器學習算法可以輕松地捕捉到這些無意的變化。例如,模型或許只是識別出了哪些阱位于滴定板的邊緣。檢查這種情況是否已經發生的一種簡單方式是令模型預測其他情況,如滴定板的位置、這是哪個滴定板以及圖像來自哪一批次。如果模型可以做到這一點,則應該對結果提出疑問。

經驗教訓:使用多個機器學習模型來檢測意料之外和隱藏的變量。一個模型集中于你關心的問題——等離子體高能耗還是低能耗;細胞健康還是處于病態?其他模型則排除這些混雜因子。如果后者的效果非常好,則對數據進行標準化處理,做進一步的實驗或調整結論。

3. 定錯訓練目標

機器學習算法要求研究者指定一個「損失函數」,以確定各種誤差的嚴重程度。從業者傾向于使用一小組函數,這組函數可能無法捕獲到他們真正關心的東西。

例如,我們利用深度學習來幫助求解偏微分方程。這些公式在各個領域都很常見,如流體力學、電磁學、材料科學等。通常,必須利用數值解法來求解問題,我們訓練模型在有限的解中提供更高的準確率。

我們從描述水波在一維中的傳播開始。算法的任務是反復預測當前步驟的下一個時間步長。我們在兩個存在細微差別的公式上訓練模型。根據我們的損失函數,兩個模型的表現旗鼓相當。然而,雖然其中一個模型的結果接近預期,另一個模型卻產生了無意義的結果。

為什么會出現這種情況呢?原因在于,控制學習的損失函數只考慮了下一步的誤差,而沒有考慮多步求解的有效性,后者才是我們真正想要的。

我們在構建糖尿病性視網膜病變篩查機器時也遇到了目標不一致的情況。如果能及早地從眼底圖像中檢測出這種病變,患者就能得到有效的治療。在我們收集數據并讓眼科醫生基于圖像進行診斷時,我們令機器學習工具預測醫生接下來會說什么。這個時候就出現了兩個問題。

首先,眼科醫生們經常在診斷時存在分歧。因此,我們意識到,我們的模型不能只有單一的預測,也不能采用少數服從多數的策略,因為在醫療準確度方面,有時候少數派的意見才是對的。

其次,單一疾病的診斷實際上并不是真正的目標。醫療領域真正面臨的問題是:「這個病人是否需要看醫生?」因此,我們將目標從單病種診斷擴展到多病種。

[[272410]]

糖尿病性視網膜病變篩查。

機器學習從業者很容易受限于一個「顯而易見」的目標,該目標所需的數據和標簽都很清楚。但是,他們設計的算法可能無法解決真正的問題。我們必須牢記整體目標,否則就會開發出不實用的精確系統。

如何解決這些問題?

第一點,機器學習專家自身及其同事需要保持更高的標準。當收到新的實驗室設備時,我們希望實驗室伙伴可以了解它的功能、如何校正、如何檢測誤差以及設備的功能限制。機器學習也是如此,使用相關工具的人必須充分了解它們的功能。

第二點,不同的學科需要在各自領域就如何執行和衡量機器學習制定明確的標準。適當的控制、穩定性檢查和誤差測量將因領域而異,并且需要清楚地闡明,這樣研究人員、評審者和編輯才可以鼓勵良好的行為。

第三點,科學家在機器學習領域的教育內容需要涵蓋這些更廣泛的問題。我們雖然可以參考現有的一些資源(如 Google AI),但依然需要做更多的事情。我們通常會教給學生算法和工具,但他們需要更多地學習如何應用這些算法,并適當地提出問題。

我們正處在一個神奇的時代——在機器學習的幫助下,計算能力、數據和算法緊密結合,從而有更多的機會發現一些新事物。作為學術界的一份子,我們有責任確保自身能夠好好抓住并利用這些機會。

原文地址:https://www.nature.com/articles/d41586-019-02307-y

【本文是51CTO專欄機構“機器之心”的原創譯文,微信公眾號“機器之心( id: almosthuman2014)”】 

戳這里,看該作者更多好文

責任編輯:趙寧寧 來源: 51CTO專欄
相關推薦

2022-06-15 18:57:43

人工智能

2020-12-23 17:50:46

AI語言模型AI倫理

2019-08-21 19:49:21

機器學習人工智能

2022-02-07 15:05:07

模型AI訓練

2021-05-31 13:19:55

人臉識別人工智能數據

2022-06-06 10:58:52

訓練DeepMind研究

2021-06-29 15:33:28

谷歌Transformer模型

2023-04-05 14:25:58

LLM谷歌OpenAI

2016-12-26 15:14:48

2019-08-07 06:16:28

物聯網IOT技術

2022-07-15 10:37:22

AI研究數據

2019-09-25 09:26:21

量子計算芯片技術

2020-09-21 14:25:26

Google 開源技術

2021-02-21 00:18:47

惡意軟件研究職業技術

2016-11-13 23:11:15

2020-12-10 10:38:56

谷歌Android開發者

2023-01-11 14:38:15

谷歌GPT

2015-12-09 14:32:51

人工智能

2011-07-30 13:22:49

2010-09-09 08:41:34

點贊
收藏

51CTO技術棧公眾號

久久av少妇| 日韩av综合在线| 粉嫩av国产一区二区三区| 亚洲视频一区二区免费在线观看| av资源站久久亚洲| 国产综合精品视频| 91精品国产调教在线观看| 精品久久久久久综合日本欧美| av免费观看网| 国产激情在线视频| 久久久精品免费免费| 91欧美日韩一区| 久久久久女人精品毛片九一 | 欧美日韩黄色影视| 国产人妻777人伦精品hd| 色三级在线观看| 99久久久国产精品| 91久久久国产精品| 日韩在线视频不卡| 亚洲私人影院| 日韩在线视频导航| 人妻在线日韩免费视频| www.久久99| 欧美在线三级电影| 黄色免费视频大全| 神马午夜伦理不卡| 一区在线播放视频| 日韩欧美一区二区视频在线播放| 91精品国产乱码久久久| 亚洲国产专区校园欧美| 欧美成人亚洲成人| 亚洲不卡的av| 久久91精品| 日韩精品在线视频美女| 日本一级大毛片a一| 国产日韩欧美中文在线| 欧美性猛片xxxx免费看久爱| 欧美黄色免费影院| aa级大片免费在线观看| 一区二区三区在线播放| 黄色一级视频播放| 欧美极品视频| 国产精品久久久久婷婷| 日本一区二区三不卡| 三级在线视频| www久久精品| 精品久久久久亚洲| 无码精品黑人一区二区三区| 成人中文字幕电影| 国产成人精品一区二区三区福利 | 色一情一乱一伦一区二区三欧美 | 一区中文字幕| 日韩欧美一区二区视频| 交换做爰国语对白| 欧洲一区在线| 日韩你懂的在线播放| 亚洲丝袜在线观看| 日本一区影院| 亚洲成人网在线观看| 久久久老熟女一区二区三区91| 911亚洲精品| 亚洲国产精久久久久久久| 超碰caoprom| 清纯唯美亚洲经典中文字幕| 精品亚洲夜色av98在线观看 | 亚洲国产精品视频在线| 国产91精品一区二区麻豆亚洲| 99re6热在线精品视频播放速度| av天堂一区二区三区| 国产精品一区在线| 国产精品国产三级欧美二区| 特级丰满少妇一级aaaa爱毛片| 97精品国产97久久久久久久久久久久| 牛人盗摄一区二区三区视频| 国产日本在线视频| 综合av第一页| 精品无码国模私拍视频| 欧美黑人巨大xxxxx| 欧美日韩国产经典色站一区二区三区| 五月天视频在线观看| 美女久久精品| 日韩精品一区二区视频| 性猛交娇小69hd| 婷婷亚洲图片| 91av国产在线| 一级特黄特色的免费大片视频| 国产在线一区二区| 久久久久久久久久久久久久一区 | 亚洲天堂久久久久| 国产成人综合在线| 奇米888一区二区三区| 日韩在线观看www| 亚洲国产日韩精品| 性欧美videossex精品| 日韩精品免费视频一区二区三区| 亚洲精品狠狠操| 中文国语毛片高清视频| 亚洲精品社区| 成人免费自拍视频| 欧美男男激情freegay| 国产精品盗摄一区二区三区| 免费一级特黄毛片| 天天综合在线观看| 日韩毛片在线看| 一区二区在线观看免费视频| 久久久久国产精品一区三寸| 亚洲最大福利视频网| 国产在线观看黄| 亚洲一区在线视频观看| 日本人视频jizz页码69| 欧美重口另类| 欧美福利在线观看| 亚洲综合精品在线| 91免费在线看| 国产一区二区四区| 欧美网站免费| 亚洲色图综合网| 国产污视频在线看| 国产成人免费在线视频| 亚洲欧洲日本国产| 欧美日韩大片| 精品视频久久久久久| 久久综合激情网| 韩国毛片一区二区三区| 日韩三级在线播放| 小早川怜子影音先锋在线观看| 91精品国产入口| 一级性生活免费视频| 石原莉奈在线亚洲二区| 精品乱子伦一区二区三区| 综合久久2019| 91精品国产综合久久久蜜臀图片| 阿v天堂2014| 久久亚洲不卡| 免费久久一级欧美特大黄| 国产理论电影在线| 日韩欧美视频在线 | 动漫精品一区二区| 在线观看一区二区三区四区| 亚洲欧美偷拍自拍| 91久久精品美女高潮| 黄网站app在线观看| 欧美日本在线一区| 韩国一级黄色录像| 久久国产精品色婷婷| 色综合电影网| 久久人体av| 日韩有码片在线观看| 中文字幕无码乱码人妻日韩精品| 国产精品私房写真福利视频| 青青草精品视频在线观看| 国产精品入口久久| 国产精品高清在线观看| 国产裸舞福利在线视频合集| 91激情在线视频| 国产午夜精品久久久久久久久| 蜜桃精品在线观看| 三级三级久久三级久久18| 日韩欧美一区二区三区免费观看| 夜夜嗨av色综合久久久综合网| 99成人精品视频| 国产精品不卡在线| 亚洲成人av免费观看| 欧美激情五月| 国产三级精品在线不卡| 裤袜国产欧美精品一区| 在线观看欧美日韩| 国产免费的av| 亚洲777理论| 国产又大又粗又爽的毛片| 日本 国产 欧美色综合| 国产精品一区在线免费观看| 哺乳一区二区三区中文视频 | 国产成人在线小视频| 久久资源综合| 国产精品美女呻吟| 欧美日韩色网| 亚洲女人被黑人巨大进入al| 伊人网中文字幕| 夜夜嗨av一区二区三区中文字幕| avtt香蕉久久| 蜜臀av亚洲一区中文字幕| 三年中文高清在线观看第6集| 给我免费播放日韩视频| 热草久综合在线| 超碰在线免费公开| 精品欧美黑人一区二区三区| 成人免费毛片男人用品| 中文字幕一区二区三区在线不卡| 国产视频精品视频| 日韩精品成人一区二区在线| 水蜜桃在线免费观看| 亚洲午夜久久| 99视频日韩| av在线不卡精品| 国外视频精品毛片| 免费的黄网站在线观看| 亚洲黄色片网站| 国产在成人精品线拍偷自揄拍| 午夜精品一区在线观看| 国产精品久久久免费看| 91在线视频官网| 激情成人在线观看| 日日摸夜夜添夜夜添亚洲女人| 国产一二三四区在线观看| 精品72久久久久中文字幕| 91精品国产一区二区三区动漫 | 丰满少妇一区二区| 国产美女一区二区三区| 日本成年人网址| 欧美精品九九| 在线精品日韩| 久久不见久久见免费视频7| 99久久一区三区四区免费| 国产经典一区| 日产日韩在线亚洲欧美| 成人性生交大片免费看网站| 久久精品夜夜夜夜夜久久| 可以在线观看的黄色| 亚洲国产精品va在线看黑人动漫| 91久久精品无码一区二区| 色婷婷综合久久| 亚洲欧美在线观看视频| 亚洲黄色录像片| 欧美视频www| 综合色中文字幕| av在线播放中文字幕| 国产日韩欧美一区二区三区乱码| 免费黄色三级网站| 丁香激情综合国产| 丰满少妇中文字幕| 国产一区二区网址| 尤物网站在线看| 久久激五月天综合精品| 日本va中文字幕| 日韩av一区二区在线影视| 亚洲中文字幕久久精品无码喷水| 一区二区三区国产盗摄| 青草青青在线视频| 亚洲日韩成人| 777av视频| 99热精品在线| 浮妇高潮喷白浆视频| 99精品国产在热久久婷婷| a级黄色一级片| 国产一级一区二区| 黄色片视频在线播放| 欧美亚洲三级| 精品久久久久久久无码| 老牛嫩草一区二区三区日本 | 日本系列第一页| 亚洲国产精品久久人人爱| 日本少妇在线观看| 欧美午夜视频在线观看| jizz国产在线观看| 欧美中文字幕久久| 国产免费黄色片| 日韩视频在线永久播放| va婷婷在线免费观看| 精品国产乱码久久久久久久| 日韩在线一区二区三区四区| 亚洲激情在线观看| 青青草视频在线观看| 国产一区二区三区在线视频 | 午夜剧场高清版免费观看| 老司机精品视频在线| 午夜免费视频网站| 成人福利视频在线| 亚洲av无码国产精品麻豆天美| 国产精品免费aⅴ片在线观看| 26uuu成人网| 亚洲午夜国产一区99re久久| 亚洲男人的天堂在线视频| 欧美中文字幕一二三区视频| 国产情侣一区二区| 亚洲国产成人精品女人久久久| 欧美少妇另类| 久久久久北条麻妃免费看| 久久久123| 国产精品 欧美在线| 国产精品久久久久久久久久久久久久久 | 亚洲国内精品在线| wwwww在线观看免费视频| 欧美老女人性生活| 欧美电影免费观看网站| 18成人在线| 欧美热在线视频精品999| 黄色污污在线观看| 久久国产66| 中文字幕第六页| 久久精品一区二区三区不卡 | 偷拍与自拍一区| 亚洲天堂久久久久| 日韩精品免费视频| 菠萝菠萝蜜在线观看| 日韩av片免费在线观看| 精品视频一二| 视频一区二区三区在线观看 | 欧美综合在线观看视频| 国产乱子伦视频一区二区三区| 国产成人无码一区二区在线观看| 成人欧美一区二区三区黑人麻豆 | 国产精品久久久久久模特 | 99免费精品在线观看| 国产又黄又粗又猛又爽的| 欧美日韩一二三四五区| www.av网站| 中文字幕成人在线| 在线手机中文字幕| 不卡的av一区| 欧美h版在线| 91av在线免费播放| 337p粉嫩大胆噜噜噜噜噜91av| 欧美另类视频在线观看| 欧美日韩精品三区| 国产乱视频在线观看| 性欧美xxxx视频在线观看| 成人免费91| 亚洲一区二区三区免费看| 亚洲自拍另类| 国产精品无码毛片| 亚洲18色成人| 蜜桃视频久久一区免费观看入口| 久久亚洲精品毛片| 久久国产三级| 亚洲国产精品久久久久婷婷老年| 99国产精品久久久久久久成人热| 亚洲午夜精品在线观看| 亚洲精品视频免费观看| 91麻豆成人精品国产| 在线播放国产一区二区三区| 黄色成人免费网| 欧美精品亚洲精品| 亚洲永久免费精品| 国产精品久久不卡| 欧美日韩亚洲天堂| 免费在线看v| 国产精品扒开腿做爽爽爽的视频| 亚洲视频分类| www日韩视频| 欧美激情一区二区三区四区| 伊人久久中文字幕| 中文日韩在线观看| 久久精品资源| 五月天综合婷婷| 国产一区二区调教| 久久无码精品丰满人妻| 欧美岛国在线观看| av免费不卡| 免费精品视频一区二区三区| 久久精品日产第一区二区| 一级片视频免费看| 欧美私人免费视频| 国产91在线视频蝌蚪| 亚洲综合成人婷婷小说| 欧美另类亚洲| 双性尿奴穿贞c带憋尿| 色婷婷香蕉在线一区二区| 国产乱理伦片a级在线观看| 国产欧美韩国高清| 午夜久久久久| 人妻在线日韩免费视频| 欧美亚洲动漫制服丝袜| а√资源新版在线天堂| 国产一区视频观看| 久久久久久亚洲精品杨幂换脸| 亚洲天堂最新地址| 欧美一区二区日韩一区二区| 人交獸av完整版在线观看| 狠狠色噜噜狠狠色综合久| 丝袜诱惑制服诱惑色一区在线观看| 人妻精品久久久久中文| 欧美一区二区三区免费观看视频| 91福利在线免费| 午夜视频久久久| 国产精品77777竹菊影视小说| 日本少妇性高潮| 在线视频国产日韩| 日韩一级淫片| 国产精品动漫网站| 亚洲黄色av一区| 黄色在线免费观看大全| 92裸体在线视频网站| 亚洲最黄网站| 日本福利片在线观看| 亚洲欧美日韩网| 蜜桃精品视频| 热久久精品免费视频| 一区二区三区欧美在线观看| 撸视在线观看免费视频| 97se在线视频| 日本午夜一本久久久综合| 国产一级一片免费播放| 中文字幕日韩欧美精品在线观看| 97成人在线| 日本77777| 色999日韩国产欧美一区二区| 在线免费观看a视频| 人偷久久久久久久偷女厕| 国产成人免费视频网站高清观看视频|