在識別細胞結構上,AI做到了人類不能做的事情
利用人工智能(AI)標記和識別細胞的 3D 結構是一個非常有趣的研究課題,需要用到生物學中的熒光顯微鏡技術和深度學習等 AI 技術。艾倫細胞科學研究所(Allen Institute for Cell Science)專注于相關領域的研究,并取得了一些成果。
細胞的 3D 動態影像。
Susanne Rafelski 是該研究所的定量細胞生物學家和副主任,她和她的同事希望為細胞中各種不同的結構打上相應的標簽,并做成 3D 動態影像。不過,這個愿望實現起來并不容易。
Susanne Rafelski。
熒光顯微技術(fluorescence microscopy)雖然很常用,但在這里遇到了麻煩。首先,可供使用的顏色很少,無法完整地標記細胞結構;其次,試劑成本很高且使用起來麻煩;最后,染色劑以及成像過程對活細胞有害。
在這種情況下,投射白光(明視野顯微鏡技術)就派上了用場,利用該技術的細胞成像不依賴標記,也就不會遇到熒光顯微技術帶來的一些問題。
據介紹,Rafelski 團隊將熒光顯微技術和投射白光技術結合了起來,從而利用人工智能(AI)在明視野圖像上預測熒光標記的形狀。該團隊的研究已經持續了數年。
深度學習發揮重要作用
在識別細胞結構的過程中,深度學習發揮了重要作用。2017 年,該團隊提出利用深度學習來識別未標記細胞明視野圖像中難以發現的結構,并證實了這種方法的可行性。
具體而言,通過在未標記細胞實驗中使用一種深度學習算法,團隊創建了一個展示細胞核中 DNA 和子結構、細胞膜和線粒體的 3D 影像。
基于不同細胞類型的透射光顯微鏡(明視野)圖像輸入的 3D 熒光圖像預測。圖源:https://www.nature.com/articles/s41592-018-0111-2#Sec19
分別使用全 3D 和 2D 模型時,基于透射光(明視野)圖像的 3D DNA 預測。圖源:https://www.nature.com/articles/s41592-018-0111-2
這種直接從透射圖像中預測 3D 熒光的無標記方法可以用于生成多結構、組合式圖像,也能根據電子顯微(EM)輸入來預測免疫熒光(IF),從而擴展了潛在的應用范圍。
更多研究細節可以參考論文《Label-free prediction of three-dimensional fluorescence images from transmitted-light microscopy》。
論文鏈接:https://www.biorxiv.org/content/10.1101/289504v4
AI 識別細胞的發展歷程
在過去的幾年里,從事人工智能研究的科學家們設計了幾個系統來識別這些模式。使用來自相同細胞的成對圖像訓練模型、圖像分為一個明視野和一個熒光標記。但這些模型在細節上有所不同:有些用于 2D 圖像、有些用于 3D 圖像、有些是用于近似細胞結構,而另一些則是用來制作可能被誤認為是真實顯微照片的圖像。
來自加州大學舊金山分校和舊金山格萊斯頓研究所的神經科學家 Steven Finkbeiner 使用機器人顯微鏡跟蹤細胞長達一年。在研究中 Finkbeiner 發現,使用深度學習可以發現看不見的細胞特征。
Finkbeiner 團隊用訓練系統來識別 2D 圖像中的神經元,然后挑出細胞核,確定給定的細胞是否活著。他表示說,自己研究的主要目的是向科學家表明,圖像數據中的信息可能比人類意識到的還要多。該小組稱其技術為「in silico labeling(ISL)」。ISL 能直接從未標記的固定樣本或活體樣本的透射光影像中預測多種熒光標記。
圖源:https://ai.googleblog.com/2018/04/seeing-more-with-in-silico-labeling-of.html
然而,這種方法無法識別運動神經元。這些預測只有在 AI 能夠使用一些可見線索的情況下才會起作用。
Collman、Johnson 以及在艾倫研究所的同事使用了一種不同的神經網絡來解決 Rafelski 的問題,建立了一個叫做 U-Net 的系統,這個系統為生物圖像而開發。與 Finkbeiner 的方法不同,Allen 模型可處理 3D 顯微照片,研究人員可以常規使用該技術,例如,在染色質組織研究中識別核標記。
透射光顯微鏡三維熒光圖像的無標記預測。圖源:https://github.com/AllenCellModeling/pytorch_fnet/tree/release_1
來自伊利諾伊大學厄巴納-尚佩恩分校的物理學家 Gabriel Popescu 正在利用深度學習來回答一個最基本的顯微鏡問題:細胞是活的還是死的?這是比較難的,因為測試需要有毒的化學物質。并表示說:這就像用刀測量病人的脈搏。
Gabriel Popescu。
Popescu 和同事將他們的方法稱為 PICS:具有計算特異性的相位成像。Popescu 在活細胞中使用該技術來識別細胞核和細胞質,然后計算它們在數天內的質量。并表明,這些信號準確地表明了細胞的生長和生存能力。
PICS 包含了基于 U-Net 軟件和顯微鏡硬件技術,因此,PICS 不是先獲取圖像并訓練機器,之后在進行進一步的處理,PICS 是無縫地進行。一旦用戶捕捉到白光圖像,模型只需 65 毫秒就能傳遞出預測的熒光對應物。
除此以外,還有其他研究小組使用機器學習來識別細胞。例如,華盛頓特區美國天主教大學的一個研究小組使用了一種稱為 GAN 的神經網絡來識別相襯光學顯微鏡圖像中的細胞核。






























