未來五年AI如何改變各學科?從LLM到AI蛋白設計、醫療保健......
五年前(2019 年 1 月),《Nature Machine Intelligence》創刊。當然,就人工智能(AI)而言,五年前似乎是一個不同的時代。
1 月 24 日,Nature Machine Intelligence 雜志在《Anniversary AI reflections》(周年人工智能反思)專題中,再次聯系并采訪了近期在期刊發表評論和觀點文章的作者,請他們從各自所在領域中舉例說明人工智能如何改變科學過程。
想知道,他們對人工智能領域的哪些其他主題感到興奮、驚訝或擔憂,以及他們對 2024 年以及未來五年的人工智能的希望和期望是什么。一個反復出現的主題是大型語言模型和生成人工智能的持續發展、它們對科學過程的變革性影響以及對倫理影響的擔憂。
引人注目的是,這些作者強調了人工智能如何徹底改變了各個學科;例如,正如西班牙赫羅納大學(University of Girona)Noelia Ferruz 提到的,蛋白質設計和工程領域。但他們也討論了 LLM 的最新發展,例如 ChatGPT 和生成人工智能,如何改變了整個研究工作流程,包括科學寫作過程、編碼和頭腦風暴。
此外,他們預測,鑒于 LLM 和生成式人工智能的持續發展,未來五年將帶來進一步的實質性變化,例如連接到物理世界的個性化模型和人工智能代理框架。正如有作者強調的那樣,這些變化無疑會帶來進一步的道德挑戰。
赫羅納大學 Noelia Ferruz:專注于 AI 蛋白設計

你的觀點是關于什么的?
我們的文章回顧了大語言模型(LLM)在蛋白質研究領域的應用,特別關注 Transformer 架構及其各種訓練技術。我們密切關注生成 LLM 在蛋白質設計中的實施和使用,并討論了它們在未來幾年的潛力。

論文鏈接:https://www.nature.com/articles/s42256-022-00499-z
該領域是如何發展的?
人工智能正在快速發展,在過去的一年里我們見證了令人難以置信的進步。擴散模型在生成圖像方面取得了前所未有的成功,2022 年末,OpenAI 發布了 ChatGPT,展示了在文本生成方面的卓越性能。
這些進步也影響了蛋白質設計領域,近幾個月發布了幾種蛋白質擴散模型,促進了對傳統上具有挑戰性的設計案例的重新思考。
人工智能的哪些發展最令您驚訝或興奮?
我發現生成基礎模型的功能非常令人驚訝,例如能夠生成文本(ChatGPT、Bard)和圖像(DALL·E 2、Stable Diffusion)的模型。最近,結合多種數據類型來訓練多模態 LLM(MLLM)引發了新一輪的興奮浪潮,一些 MLLM 已經集成了文本和圖像,例如 GPT-4、Kosmos-1 或 GATO,其他一些甚至已經嵌入到機器人框架中,例如 PaLM-E。這些智能體的初步表現暗示它們可能是邁向通用智能的第一步。
盡管這些進展仍需要應用于蛋白質設計領域,但蛋白質固有的多模態和可用于自監督學習的未標記數據量表明這一應用是可行的,它可能使我們更接近實現具有可控特性的蛋白質設計。
您能舉出人工智能如何改變科學過程的例子嗎?
ChatGPT 等生成模型徹底改變了科學寫作,引發了人們的疑問:如何將這些工具整合到我們的教育系統中,以及我們如何檢測科學評論和出版中的不當行為。在蛋白質的特定背景下,研究領域在過去三年中經歷了徹底的轉變,從基于物理的方法轉向人工智能引導的工具。
現在,我們不僅可以解決傳統的蛋白質設計問題,而且我們也有豐富的方法來生成結構或序列,或者圍繞給定的支架定義兩者。這些人工智能模型在實驗室環境中表現出顯著提高的性能,減少了時間要求并提高了傳統上具有挑戰性的蛋白質設計任務的成功率。我們現在可以設計幾年前超乎想象的蛋白質系統。
您對 2024 年以及未來 5 年的人工智能有何希望或期望?
我對各個人工智能領域的快速進步感到樂觀,包括文本和圖像生成、機器人技術和多任務自主代理。這些進展將很快擴大對蛋白質設計領域的影響。
在接下來的五年中,大型智能代理將會出現,無縫集成到機器人平臺中。這些代理將有能力半自主地設計序列、分析序列并不斷完善其設計,同時根據反饋提高其能力。這有望顯著縮短工程周期并創建高效的設計。我相信,這項變革性技術將通過功能性蛋白質的定制開發來徹底改變眾多行業,從而降低各種生物技術過程的成本,并為新的環保方法鋪平道路。
更多作者信息
Yiyu Shi,圣母大學
醫療保健領域的人工智能和機器學習存在可持續性問題,并討論了有助于解決這些問題的當前和未來的各種算法和系統創新。
論文鏈接:https://www.nature.com/articles/s42256-023-00670-0
Diana Mincu,Google Research
研究了研究管道中各部分的改進——數據集、工具和實踐、問題制定、結果,一直到臨床部署。
論文鏈接:https://www.nature.com/articles/s42256-022-00559-4
Marinka Zitnik,哈佛醫學院
探討了使用圖來融合不同的數據模態,并以靈活和通用的方式利用跨模態依賴關系。
論文鏈接:https://www.nature.com/articles/s42256-023-00624-6
Nandana Sengupta,印度理工學院
探討了人工智能技術與國家在 Global South 背景下交叉的一些具體方式。評論了立法行動的緩慢步伐與公共行政中算法的不斷結合,以及迫切需要對這些地區的算法偏見和公眾態度進行更多的量化實證研究。
論文鏈接:https://www.nature.com/articles/s42256-023-00621-9
Sebastian Porsdam Mann,牛津大學
討論了與生成式人工智能的使用有關的各種倫理問題,突出了對其產出的道德責任的不對稱。
論文鏈接:https://www.nature.com/articles/s42256-023-00653-1
Payel Das,IBM Research
強調了將「數據工作」作為人工智能研究的主流和不可或缺的組成部分進行實踐缺乏激勵和認可。通過提供示例并分享我們自己作為人工智能研究人員的經驗,討論了當前過度強調建模和算法工作的文化和務實因素。提出了改變現狀的建議,將數據工作重新定義為技術上嚴格的,并將其整合到模型創新中。
論文鏈接:https://www.nature.com/articles/s42256-023-00673-x
Francesco Stella,代爾夫特理工大學
我們證明了像 GPT-4 這樣的 LLM 可以在概念和技術層面上指導機器人的設計過程,并提出了人類與人工智能的協同設計策略。然后討論了社會影響,強調了跨學科研究的機會,同時注意有關社區偏見、知識產權和認知任務自動化的問題。
論文鏈接:https://www.nature.com/articles/s42256-023-00669-7






























