精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

召喚100多位學(xué)者打分,斯坦福新研究:「AI科學(xué)家」創(chuàng)新確實強(qiáng)

人工智能 新聞
我們都知道通過調(diào)節(jié) LLM 的溫度值確實可以調(diào)整它們的隨機(jī)性和創(chuàng)造性,但在科學(xué)研究方面比人類還懂創(chuàng)新?

近日,一篇關(guān)于自動化 AI 研究的論文引爆了社交網(wǎng)絡(luò),原因是該論文得出了一個讓很多人都倍感驚訝的結(jié)論:LLM 生成的想法比專家級人類研究者給出的想法更加新穎!

我們都知道通過調(diào)節(jié) LLM 的溫度值確實可以調(diào)整它們的隨機(jī)性和創(chuàng)造性,但在科學(xué)研究方面比人類還懂創(chuàng)新?這還是超乎了很多人的想象 —— 至少很多人沒想到這會來得這么快。難道 AI 科學(xué)家真的要來了?

那么,這項來自斯坦福大學(xué)的研究究竟得出了什么樣的結(jié)論呢?

圖片

  • 論文地址:https://arxiv.org/abs/2409.04109
  • 調(diào)查鏈接:https://tinyurl.com/execution-study
  • 項目地址:https://github.com/NoviScl/AI-Researcher

LLM 能生成新穎的研究思路嗎?

為了準(zhǔn)確地對比 LLM 與人類在科研思路創(chuàng)新方面的能力,斯坦福大學(xué)的這個研究團(tuán)隊招募了 104 位 NLP 研究者,讓其中 49 位寫下創(chuàng)新研究想法,然后再讓 79 位專家對 LLM 和人類給出的思路進(jìn)行盲測。請注意,其中有 24 位人類專家既寫了想法,也參與了盲測,當(dāng)然他們并不評估自己寫的內(nèi)容。

模型(或者按該團(tuán)隊的說法:思路生成智能體)方面,該團(tuán)隊使用了 claude-3-5-sonnet-20240620 作為骨干模型。具體來說,給定一個研究主題(比如:可以提升 LLM 事實性并降低其幻覺的提示方法),讓 LLM 生成一系列對  Semantic Scholar API 的函數(shù)調(diào)用。這個論文檢索動作空間包括  {KeywordQuery (keywords), PaperQuery (paperId), GetReferences (paperId)} 。每個動作生成都基于之前的動作和已執(zhí)行的結(jié)果。

該研究使用的研究主題有 7 個:偏見、編程、安全性、多語言、事實性、數(shù)學(xué)和不確定性。下表是各個主題的想法數(shù)量:

圖片

研究過程如下圖所示:

圖片

這里我們不細(xì)說其詳細(xì)的設(shè)置和評估過程,詳見原論文。總結(jié)起來就是比較人類專家與 AI 智能體生成的科研思路的新穎程度。我們直接來看結(jié)論。

根據(jù)該團(tuán)隊思路評分(Idea Ranking)規(guī)則,他們對人類和 AI 提出科研思路進(jìn)行了打分,見圖 2 和表 7:

其中 Human Ideas 是指招募的專家研究者提出的思路,而 AI Ideas 則是 LLM 智能體給出的排名第一的思路。AI Ideas + Human Rerank 是指由 AI 生成思路但由本研究一作 Chenglei Si 手動從排名靠前的思路中選擇他認(rèn)為最好的一個。

可以看到,在新穎度方面,不管是 AI Ideas 還是 AI+Rerank,都顯著優(yōu)于 Human Ideas(p < 0.01)。在激動人心(excitement)分?jǐn)?shù)上,AI 生成的思路的優(yōu)勢更是明顯(p<0.05)。并且  AI Ideas + Human Rerank 的整體分?jǐn)?shù)也優(yōu)于人類(p<0.05)。不過 AI 生成的思路在另外兩方面(可行性和有效性)與人類的差別不大。

當(dāng)然,我們也能看出,這項調(diào)查研究有一些明顯的局限,比如其調(diào)查范圍較小,樣本量太少了,評價很主觀。另外作者也指出人類研究者可能會「藏私」,可能并不會分享自己的最佳想法。

不管怎樣,這項研究證明了一點:讓 AI 參與到科學(xué)研究中多半是有利的。尤其是當(dāng)你靈感枯竭、思維阻塞時,問一問 LLM 或許就能有意想不到的收獲。

生成創(chuàng)新想法的 AI 工具,正在不斷涌現(xiàn)

實際上,已經(jīng)有研究團(tuán)隊在打造專用于此類任務(wù)的 AI 工具了。比如近日一位專注于開發(fā) LLM 應(yīng)用的研究者 Shubham Saboo 就在社交網(wǎng)絡(luò)分享了使用 Cursor 構(gòu)建一個多智能體 AI 研究者的過程。他表示整個過程用時不到 5 分鐘!參見如下視頻:

也有人分享了自己的一項相關(guān)研究,表示可以使用 LLM 和因果圖譜自動生成心理學(xué)假設(shè),并生成比 GPT-4 和博士生表現(xiàn)都好:

近日,印度科學(xué)學(xué)院(Indian Institute of Science,IISc)的研究者發(fā)現(xiàn),AI 在設(shè)計創(chuàng)意方面也比人類更有想法。具體來說,AI 可通過一種新的人工智能會話式「主動構(gòu)思」(Active Ideation)界面來生成新創(chuàng)意。作為一種創(chuàng)意構(gòu)思生成工具,它可幫助新手設(shè)計師緩解一部分的初始延遲和構(gòu)思瓶頸。

  • 論文標(biāo)題:A Novel Idea Generation Tool using a Structured Conversational AI (CAI) System
  • 論文地址:https://arxiv.org/pdf/2409.05747

具體來說,這是一種動態(tài)、交互、上下文響應(yīng)式方法,通過大型語言模型(LLM)主動參與,為不同的設(shè)計問題生成多個潛在創(chuàng)意陳述。論文稱之為「主動構(gòu)思場景」,它有助于促進(jìn)基于對話的持續(xù)互動、對上下文敏感的對話以及多產(chǎn)的構(gòu)思生成。

在當(dāng)前的很多研究設(shè)計中,從書面信息到基于關(guān)鍵詞的在線資源檢索的轉(zhuǎn)變至關(guān)重要。這強(qiáng)調(diào)了文本在轉(zhuǎn)變思維模式和通過發(fā)展高級設(shè)計語言促進(jìn)系統(tǒng)化構(gòu)思方面的重要性。下表 1 總結(jié)了最常用的傳統(tǒng)構(gòu)思技術(shù)、其過程、局限性、涉及的認(rèn)知原則以及在產(chǎn)生創(chuàng)意方面的預(yù)期結(jié)果。

雖然這些傳統(tǒng)方法已被廣泛使用,但它們往往無法為新手設(shè)計師提供積極的支持。在產(chǎn)生新穎想法的過程中,原創(chuàng)性和多樣性主要依賴于設(shè)計者。這一空白標(biāo)志著將人工智能與構(gòu)思相結(jié)合的潛力。

這篇論文就深入探討了對話式人工智能(CAI)系統(tǒng)的設(shè)計、開發(fā)和潛在使用案例,重點是比較基于 CAI 的構(gòu)思工具與傳統(tǒng)方法的效率。

有兩個有趣的特點使 CAI 系統(tǒng)看起來很智能:(a) 能夠就給定主題生成智力上可接受的文章,(b) 能夠在先前交互的基礎(chǔ)上生成對后續(xù)詢問的回復(fù)。這使得交互成為關(guān)于特定主題的連貫對話。因此,如果特征(a)是對一個觀點的描述,那么特征(b)就可以被構(gòu)建為對該觀點的闡述和澄清。

如圖 3 所示,這項研究設(shè)計并開發(fā)了一個主動構(gòu)思界面,使用了生成式預(yù)訓(xùn)練 Transformer(GPT)對話式人工智能系統(tǒng),該系統(tǒng)嵌入了一個交互式情緒板(moodboard)。GPT 為自然語言交互提供了基礎(chǔ),使其能夠根據(jù)用戶輸入做出響應(yīng)并生成創(chuàng)意陳述,情緒板提供了一種快速記錄這些想法的手段。因此,該界面為設(shè)計師提供了一個對話式的直觀平臺,由 GPT 驅(qū)動創(chuàng)意生成。

由于本研究調(diào)查的是建議的基于 CAI 的構(gòu)思界面對新手設(shè)計師的潛在益處,因此招募了 30 名產(chǎn)品設(shè)計研究生(下圖),分為 A 和 B 兩組。

圖片

論文對這 30 名新手設(shè)計師進(jìn)行了試點研究,讓他們使用傳統(tǒng)方法和基于 CAI 的新界面,針對給定問題產(chǎn)生創(chuàng)意。然后,讓專家小組使用流暢性、新穎性和多樣性等關(guān)鍵參數(shù)對結(jié)果進(jìn)行了定性比較。

研究結(jié)果表明,本文所提出的 AI 工具在生成多產(chǎn)、多樣和新穎的想法方面非常有效。通過在每個構(gòu)思階段加入提示設(shè)計的結(jié)構(gòu)化對話風(fēng)格,使界面更加統(tǒng)一,更方便設(shè)計者使用。結(jié)果發(fā)現(xiàn),這種結(jié)構(gòu)化 CAI 界面所產(chǎn)生的反應(yīng)更加簡潔,并與隨后的設(shè)計階段(即構(gòu)思階段)保持一致。

圖片

從圖 5(a)中可以看出,68% 的專家認(rèn)為 GPT 產(chǎn)生的想法更有意義。此外,圖 5 (b) 顯示,GPT 生成的語句的得票率始終高于設(shè)計者生成的想法。

下表是 A 和 B 兩組的想法陳述對比:

以下是不同維度下,人類與 GPT 構(gòu)思的評估結(jié)果對比:

圖片

圖片

更多研究細(xì)節(jié),可查看原論文。

結(jié)語

創(chuàng)新,長久以來被視為人類不可被機(jī)器觸及的領(lǐng)地,然而,LLM 所展現(xiàn)的「幻覺」現(xiàn)象卻悄然打開了這扇門,揭示了創(chuàng)新機(jī)制可能并非我們想象中那般高不可攀。

近期在 AI 創(chuàng)造性研究領(lǐng)域的突破,預(yù)示著 AI 在創(chuàng)意之路上或?qū)⒂瓉砬八从械膹V闊天地。展望未來,或許在不遠(yuǎn)的將來,我們將見證 AI 科學(xué)家、AI 導(dǎo)演、AI 設(shè)計師們紛紛揮灑創(chuàng)意,它們的作品將點亮 AI 應(yīng)用的嶄新篇章。


責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2025-09-01 02:00:00

AI署名論文推理

2025-04-27 08:40:00

OpenAI谷歌AI

2020-07-27 10:30:41

人工智能機(jī)器學(xué)習(xí)技術(shù)

2018-06-28 09:07:58

2017-11-28 14:18:29

2025-01-24 09:30:00

2025-09-28 09:08:00

2019-12-16 14:33:01

AI人工智能斯坦福

2012-12-06 15:36:55

CIO

2025-08-18 08:58:00

2023-05-23 09:34:16

科學(xué)家AI

2023-02-14 09:45:11

模型測試

2017-08-04 15:53:10

大數(shù)據(jù)真?zhèn)螖?shù)據(jù)科學(xué)家

2023-07-18 13:56:23

福坦斯

2020-09-14 09:48:27

AI 數(shù)據(jù)人工智能

2021-08-24 14:49:00

計算開發(fā) 技術(shù)

2017-04-12 19:49:43

連尚網(wǎng)絡(luò)國際萬維網(wǎng)大會WWW2017

2014-11-03 09:15:34

阿里云IDST

2024-11-26 10:44:18

點贊
收藏

51CTO技術(shù)棧公眾號

日本激情视频网站| 国产高清视频网站| 天堂网2014av| 日韩高清不卡一区二区| 欧美另类极品videosbest最新版本 | 欧美日韩国产高清| 亚洲乱码国产乱码精品精| 精品久久久久久久无码| 天天色天天射天天综合网| 91视频在线看| 亚洲永久在线观看| 最近免费中文字幕大全免费版视频| 日韩国产一区二区三区| 精品国产伦一区二区三区观看体验| 免费大片在线观看| 日本高清在线观看视频| 国产欧美日韩精品a在线观看| 99porn视频在线| 亚洲天堂2021av| 免费日韩av片| 97在线免费视频| 亚洲国产成人精品综合99| 国产成人ay| 亚洲国产精品小视频| 日韩va亚洲va欧洲va国产| 欧美亚洲另类激情另类| 日韩女优一区二区| 日韩黄色大片网站| 亚洲人成77777在线观看网| 在线播放第一页| 中文字幕成人| 欧美日韩一区不卡| 国内外免费激情视频| 91资源在线观看| 亚洲精品美国一| 久久久国产精华液999999| 国产小视频在线观看| 99re这里只有精品6| www.成人av| www.99视频| 国产一区二区三区免费看| 国产精品爽黄69| 乱子伦一区二区三区| 久久久蜜桃一区二区人| 91地址最新发布| 日本一区二区免费在线观看| 国内精品久久久久久久影视麻豆| 理论片在线不卡免费观看| 激情五月激情综合| 99国产精品一区二区| 日韩在线免费视频| 国产人与禽zoz0性伦| 日韩精品免费| 亚洲一区二区电影| 色菇凉天天综合网| 欧美激情在线一区| 免费国产一区二区| 日本精品一二区| www.亚洲在线| 精品日本一区二区三区| 色网站免费观看| 91在线视频官网| 欧美大香线蕉线伊人久久国产精品| 无码精品黑人一区二区三区| 99re在线精品| 日韩精品一区二区三区色偷偷| 国产视频网站在线| 中文字幕成人av| 波多野结衣三级在线| 很黄的网站在线观看| 一区二区三区中文在线观看| 国产日韩欧美精品在线观看| 黄视频网站在线观看| 色哟哟欧美精品| 欧美男女交配视频| 日韩欧美高清一区二区三区| 精品99999| 亚洲人成人无码网www国产 | 亚洲精品在线91| 欧洲美一区二区三区亚洲| 欧美一区三区| 欧美成年人在线观看| 亚洲国产精一区二区三区性色| 亚洲在线成人| 成人激情视频在线观看| 亚洲精品无码专区| 久久久久久久性| 亚洲图色在线| 国产在线精彩视频| 欧美色图免费看| 又大又长粗又爽又黄少妇视频| 日韩精品丝袜美腿| 色先锋资源久久综合5566| 91精品国产高清一区二区三蜜臀| 99精品欧美| 国产精品视频自拍| 视频一区 中文字幕| 欧美国产欧美综合| 99在线观看视频免费| 欧洲精品一区二区三区| 日韩免费高清av| 能直接看的av| 亚洲狼人精品一区二区三区| 国产美女精品免费电影| 天堂成人在线视频| 亚洲人成影院在线观看| 久久久噜噜噜www成人网| 国产精品xnxxcom| 亚洲日本中文字幕| 福利一区二区三区四区| 激情五月婷婷综合网| 久久国产精品-国产精品| 黄色av电影在线播放| 色综合中文字幕国产| 国产ts在线观看| 日韩理论电影大全| 8x拔播拔播x8国产精品| 国产一区二区在线视频聊天| 久久综合国产精品| 国产精品igao激情视频| 久久久免费人体| 亚洲欧美精品一区二区| 久一视频在线观看| 精品亚洲欧美一区| 香蕉久久免费影视| 亚洲天堂资源| 亚洲国产精品福利| 妺妺窝人体色www婷婷| 久久99国产精品免费网站| 欧美精品七区| 免费观看久久久久| 国产成人av一区二区| 日韩免费一区二区三区| 性xxxxfjsxxxxx欧美| 欧美久久久久久久久久| 91视频免费在观看| 久久成人免费| 精品国产日本| 涩涩av在线| 亚洲另类图片色| 国产又黄又爽又色| av激情亚洲男人天堂| 无码熟妇人妻av在线电影| 91大神在线网站| 北岛玲精品视频在线观看| 日韩精品免费一线在线观看| 欧美久久久久久久久久久久| 国产一区二区三区四区五区美女 | 国产欧美日韩在线一区二区| 97国产精品视频| 色综合视频在线| 精品欧美一区二区三区| 美女高潮在线观看| 精品日韩在线观看| 亚洲av鲁丝一区二区三区| 九色|91porny| 午夜成人免费影院| 麻豆成人av在线| 亚洲国产欧美不卡在线观看| 另类中文字幕国产精品| 色yeye香蕉凹凸一区二区av| 精品国产www| 国产精品久久三| 天堂在线精品视频| 国产专区一区| 狠狠色综合欧美激情| 自拍偷拍亚洲视频| 中文字幕亚洲综合久久| 91精东传媒理伦片在线观看| 亚洲精品综合在线| 五十路六十路七十路熟婆| 久久国产免费| 在线不卡日本| 久久久伦理片| 国产精品女视频| 亚洲图区一区| 亚洲精品自产拍| 中文字幕 自拍偷拍| 亚洲日本在线天堂| 伦理片一区二区| 久久久久久久尹人综合网亚洲| 亚洲在线观看一区| 一区二区三区高清在线观看| 2023亚洲男人天堂| 在线观看av的网站| 精品欧美久久久| 黄色av一区二区| 一区二区在线观看不卡| 粉嫩av蜜桃av蜜臀av| 久久99精品久久久久久国产越南| 轻点好疼好大好爽视频| 欧美大奶一区二区| 国产欧美一区二区三区久久| 青草在线视频| 国产亚洲精品美女久久久久| 国产aⅴ一区二区三区| 欧美色道久久88综合亚洲精品| www.xx日本| 91麻豆福利精品推荐| 中文字幕一二三| 日韩精品乱码av一区二区| 免费cad大片在线观看| 一道本一区二区三区| 亚洲自拍在线观看| 2019年精品视频自拍| 国a精品视频大全| 欧美精品videos另类| 亚洲免费高清视频| www黄色网址| 欧美日韩黄色影视| 久久久久久91亚洲精品中文字幕| 亚洲欧美激情一区二区| 亚洲v国产v欧美v久久久久久| 国产激情一区二区三区桃花岛亚洲| 韩国一区二区av| 尹人成人综合网| 干日本少妇视频| 91欧美国产| 亚洲高清乱码| 国产成人av| 裸体丰满少妇做受久久99精品| 日韩激情精品| 91久久国产综合久久91精品网站 | 国产中文字幕在线视频| 精品国产不卡一区二区三区| 91丨九色丨丰满| 欧美一a一片一级一片| 久草手机在线观看| 亚洲mv大片欧洲mv大片精品| 麻豆视频在线免费看| 中文字幕在线不卡一区二区三区| 色欲狠狠躁天天躁无码中文字幕 | 中文字幕欧美日韩| 国产女主播在线直播| 精品网站999www| 亚州男人的天堂| 日韩电视剧在线观看免费网站| 好吊色视频一区二区| 欧美一级爆毛片| av片免费播放| 日韩一区二区三区免费观看| 国产露脸91国语对白| 欧美精品 国产精品| 亚洲专区第一页| 欧美日韩另类一区| 一区二区久久精品66国产精品 | 一区二区三区日韩欧美| 麻豆明星ai换脸视频| 亚洲三级在线免费观看| 国产探花在线视频| 亚洲欧美电影一区二区| 欧美性猛交xxxxx少妇| 亚洲一区二区在线观看视频| 久久久久久福利| 亚洲观看高清完整版在线观看| 久久精品人妻一区二区三区| 午夜精品福利视频网站| 亚洲精品国产精品乱码| 色视频成人在线观看免| 中文字幕免费视频观看| 欧美日韩1区2区| 国产成人毛毛毛片| 亚洲国产精品va| 看电影就来5566av视频在线播放| 国产亚洲激情在线| 欧美被日视频| 欧美激情乱人伦| 欧美大片高清| 国产欧美一区二区三区在线| 久久视频免费| 精品国产一区二区三区麻豆小说 | www.亚洲资源| 欧美超级免费视 在线| 国产盗摄一区二区| 日本亚洲精品在线观看| 欧美高清影院| 国产精品日韩二区| 欧美偷窥清纯综合图区| 亚洲国产精品日韩| 欧美视频一区| 久久久久久香蕉| 国产盗摄女厕一区二区三区| 女同性恋一区二区三区| 中文字幕免费不卡在线| 久久久久亚洲av无码专区 | 九九热爱视频精品视频| 在线观看成人av| 99亚洲伊人久久精品影院红桃| 奇米影音第四色| 成人免费视频国产在线观看| 免费黄在线观看| 亚洲国产日日夜夜| 最新在线中文字幕| 亚洲电影第1页| 日本电影在线观看网站| 午夜精品99久久免费| 成人国产一区| 久久综合九色综合网站| 中文字幕日韩一区二区不卡| 成人在线看视频| 国产999精品久久| 五月激情四射婷婷| 丁香五六月婷婷久久激情| 国产一区二区小视频| 亚洲美女av在线播放| 中文字幕资源网在线观看| 国产精品吹潮在线观看| 国产三级精品三级在线观看国产| 一区二区三区av| 久久精品观看| 国产xxxxxxxxx| 亚洲黄色免费网站| 一本一道人人妻人人妻αv| 日韩精品亚洲视频| 欧美videosex性欧美黑吊| 国产精品一区二区久久久久| 少妇高潮一区二区三区| 欧美高清中文字幕| 国产美女精品人人做人人爽| 影音先锋制服丝袜| 日韩欧美中文第一页| 日韩在线视频免费| 久久久久久av| 51vv免费精品视频一区二区| 国产精品美女在线播放| 日韩电影在线一区| 久久久久久久久久久久久久久| 午夜精品福利一区二区三区蜜桃| 午夜精品无码一区二区三区| www.日韩欧美| 日本亚洲欧洲无免费码在线| 午夜精品亚洲一区二区三区嫩草 | 国语自产精品视频在线看8查询8| 亚洲av无日韩毛片久久| 国产精品久久久久久久久免费桃花| 日韩精品一区不卡| 亚洲男人7777| 免费成人直播| 日韩av电影免费在线| 日韩成人精品在线| 干b视频在线观看| 在线看不卡av| av网站在线播放| 成人精品在线视频| 国产精品伦理久久久久久| 亚洲久久中文字幕| 国产精品伦理一区二区| 一本色道久久综合熟妇| 久久久国产精品亚洲一区| www.成人在线.com| 久久久久久久久久久综合| 国产91对白在线观看九色| 国产亚洲欧美久久久久| 亚洲第一天堂av| 亚洲啊v在线| 日本不卡二区高清三区| 蜜乳av一区二区三区| 最新日韩免费视频| 6080国产精品一区二区| 97影院秋霞午夜在线观看| 国产精品国色综合久久| 亚洲在线黄色| 国产精品一区二区亚洲| 91精品国产麻豆| av网站一区二区三区| xxxwww国产| 欧美日韩美女在线观看| 蜜桃视频在线播放| 91色porny在线视频| 一级黄色大片儿| 日日狠狠久久偷偷综合色| 日本国产在线播放| 久久久久久亚洲综合影院红桃 | 樱桃成人精品视频在线播放| 无码人妻精品一区二区三| 欧美日韩精品在线播放| 成人18在线| 国产熟女高潮视频| 国产欧美精品一区二区三区四区| 中文字幕一区二区三区四区欧美| 中文欧美日本在线资源| 4438五月综合| 福利视频一二区| 国产亚洲女人久久久久毛片| 91在线精品入口| 欧美韩国理论所午夜片917电影| 牛牛精品成人免费视频| 少妇激情一区二区三区| 亚洲免费观看高清完整版在线 | 国产河南妇女毛片精品久久久| 在线免费观看毛片| 最近2019年手机中文字幕| 91欧美极品| 欧美亚洲日本在线观看| 亚洲一区视频在线| 国产午夜视频在线观看| 国产精华一区| 免费xxxx性欧美18vr| 青青操免费在线视频| 精品国内自产拍在线观看|