精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT-4正接管人類數據專家!先驗知識讓LLM大膽預測,準確率堪比傳統方式

人工智能 新聞
終有一天,LLM可以成為人類數據專家,針對不同領域進行數據分析,大大解放AI研究員。

在數據科學中,AI研究員經常面臨處理不完整數據集的挑戰。

然而,許多已有的算法根本無法處理「不完整」的數據序列。

傳統上,數據科學家會求助于專家,利用他們的專業知識來填補空白,然而這一過程既耗時,卻又不實用。

如果AI可以接管專家的角色,又會如何呢?

近日,來自德國人工智能中心、大阪公立大學等團隊的研究人員,調查了LLM能否足以充當數字專家。

畢竟,當前大模型都在大量文本的基礎上進行了訓練,可能對醫學數據、社會科學等不同主題的問題有著深刻的理解。

圖片

論文地址:https://arxiv.org/pdf/2402.07770.pdf

研究人員通過將LLM的答案與實際數據進行比較,并建立了處理數據差距的統計方法。

結果表明,在許多情況下,LLM可以在不依賴人類專家的情況下,提供與傳統方法類似的準確估計。

用LLM進行「數據插補」

在分析數據時,無論是醫學、經濟學還是環境研究,經常會遇到信息不完整的問題。

這就需要用到兩種關鍵技術:先驗啟發(確定先驗知識)和數據插補(補充缺失數據)。

先驗啟發是指,系統地收集現有的專家知識,以對模型中的某些參數做出假設。

另一方面,當我們的數據集中缺少信息時,數據插補就開始發揮作用。

科學家們不會因為一些缺失而放棄有價值的數據集,而是使用統計方法用看似合理的值來填補。

研究中,主要采用的數據集為OpenML-CC18 Curated Classification Benchmark,其中包括72個分類數據集,涵蓋從信用評級到醫藥和營銷等各個領域。

這種多樣性確保了實驗涵蓋了廣泛的現實世界場景,并為LLM在不同環境下的性能提供了相關見解。

值得一提的是,最新方法中最關鍵的一個步驟便是——人為在數據集中生成缺失值,以模擬數據點不完整的情況。

研究人員用隨機缺失(MAR)模式從完整條目中生成這種缺失數據,以便與基本事實進行比較。

他們首先從OpenML描述中,為每個數據集生成一個適當的專家角色,然后使用它來初始化LLM,以便可以查詢它是否缺少值。

使用LLM進行插值,包括LLaMA 2 13B Chat、LLaMA 2 70B Chat、Mistral 7B Instruct,以及Mixtral 8x7B Instruct,每一種都進行了單獨的評估。

將這些模型與這類分析中常用的3種經驗方法進行了比較:分別用于連續特征和分類特征的平均值和模式估算、k-近鄰(k-NN)估算和隨機森林估算。

歸因質量的評估基于,連續特征和分類特征的歸一化均方根誤差(NRMSE)和F1分數。

通過這一方法,能夠讓研究人員可以調查LLM作為數據推算專家的能力,而且還可以將其表現與傳統方法進行比較。

這種創新的方法在處理不完整的數據集方面開辟了新的視角,并突出了LLM在數據科學中的潛力。

與傳統方法比較

與預期相反,分析結果表明,LLM的估算質量一般不會超過三種經驗方法。

然而,基于LLM的插補對于某些數據集是有用的,特別是在工程和計算機視覺領域。

一些數據集,如這些領域的「PC1」、「PC3」和「Satimage」,表現出NRMSE約為0.1的歸因質量,在生物學和NLP領域也觀察到了類似的結果。

有趣的是,基于LLM歸因的下游表現因領域而異。

雖然社會科學和心理學等領域表現較差,但醫學、經濟學、商業和生物學表現較好。值得注意的是,基于LLM的插補在商業領域表現最好。

此外,研究還表明,至少在某些領域,LLM可以基于其豐富的訓練數據提供準確和相關的估計,這些數據可以與真實世界的數據相匹配。

使用LLM進行數據插補是有前景的,但它需要仔細考慮領域和特定用例。

因此,這項研究結果有助于更好地理解LLM在數據科學中的潛力和局限性。

用LLM先驗啟發

此外,研究人員還利用LLM研究了先驗啟發,旨在評估LLM能否提供有關特征分布的信息,以及這對數據收集和后續數據分析有何影響。

特別是,進一步了解LLM所獲得的先驗分布的影響和有效性,并比較它們與傳統方法和模型的性能如何。

作者將LLM的估計值與Stefan等人的實驗結果進行了比較。

在該實驗中,6位心理學研究人員被問及各自領域中典型的中小效應量和皮爾遜相關性。

使用類似的問題,要求LLM模擬一個專家、一組專家或一個非專家,然后查詢優先級分布。

在進行這項工作時,可以參考或不參考對比實驗中使用的訪談方案。

這里研究人員提出一種全新的提示策略,要求模型為貝葉斯數據分析提供專家知情的先驗分布。

在此過程中,ChatGPT 3.5展示了其對學術啟發框架的熟悉程度,比如謝菲爾德啟發框架與直方圖方法相結合。

研究人員使用該框架生成了全球25個大小城市12月份典型日氣溫和降水量的先驗分布。

ChatGPT使用從訓練數據中獲得的知識進行模擬專家討論,并構建參數概率分布。

實驗結果

令人驚訝的是,不同子領域的專家角色對LLM產生的先驗沒有顯著影響。

在實驗中,無論他們扮演什么角色,他們的判斷都非常相似:

大多數人工專家都傾向于謹慎預測,認為影響較小。只有GPT-4專家比較大膽,認為影響中等偏大。

當涉及到兩個事物之間的關系時,比如天氣對我們購物行為的影響,數字助理們與真人的觀點有所不同。

有些數字助理呈現出一條中間低、邊緣高的「浴缸」曲線,而GPT-4則向我們展示了一條更平滑的鐘形曲線。

然后,作者還觀察了這些數字專家對他們的預測的信心。一些人相當謹慎,提供了保守的估計,除了Mistral 7B Instruct——對其估計的質量非常有信心。

綜上所述,這些結果還表明,LLM在某些方面能夠產生與人類專家判斷競爭的先驗,但在其他方面卻顯著不同。

結論

這項研究表明,在醫學、經濟和生物等領域,LLM已經可以基于傳統的數據插補的方法,提供有價值的見解。

LLM能夠綜合來自各種來源的知識,并將其應用于特定的應用環境,為數據分析開辟了新的視野。

特別是在專家難覓,或時間寶貴的情況下,LLM可以成為寶貴的資源。

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-10-14 17:24:49

2023-10-14 13:09:53

谷歌模型

2023-10-10 14:00:00

AI模型

2023-11-20 21:56:04

AI推理

2024-01-29 12:49:00

AI模型

2023-09-19 09:20:16

2024-04-15 11:48:09

2023-08-17 13:30:28

AI測試

2023-12-04 13:51:00

模型數據

2017-05-08 09:36:50

人工智能法官法院

2025-01-21 08:00:00

2024-05-20 08:40:00

2024-10-23 11:59:33

2025-09-15 09:11:00

2024-05-27 13:42:00

2023-05-10 15:10:00

人工智能工作

2023-08-15 10:33:06

微軟必應人工智能

2024-06-11 00:04:00

GPT-4PNASLLM

2025-05-26 08:33:00

2024-01-03 13:37:00

模型數據
點贊
收藏

51CTO技術棧公眾號

久久久久无码国产精品不卡| 男人添女人下部高潮视频在观看| 中文字幕自拍偷拍| 色喇叭免费久久综合| 欧美一级夜夜爽| 全黄性性激高免费视频| 内衣办公室在线| 久久精品国产精品亚洲综合| 欧美国产在线视频| 日韩乱码人妻无码中文字幕久久| 欧美激情啪啪| 亚洲成人你懂的| 视频三区二区一区| 成人免费视频国产免费麻豆| 日本伊人精品一区二区三区观看方式| 久久在线免费视频| 国产肉体xxxx裸体784大胆| 久久99国产精品二区高清软件| 亚洲国产一区视频| 亚洲视频在线二区| 亚洲三级黄色片| 国内精品久久久久影院一蜜桃| 91精品国产91久久久久久久久 | 91污在线观看| 91日本在线视频| 天天干天天操天天爱| 中文字幕午夜精品一区二区三区 | 超碰超碰在线| 国产婷婷色一区二区三区在线| 成人免费视频视频在| 中文字幕乱码中文字幕| 亚洲综合丁香| 欧美交受高潮1| 手机在线免费看毛片| 欧美人妖在线| 日韩精品免费电影| 无码av免费精品一区二区三区| 欧美午夜三级| 欧美亚日韩国产aⅴ精品中极品| 欧美爱爱视频免费看| 亚洲第一图区| 亚洲美女偷拍久久| 青青草原国产免费| 日本中文在线| 国产精品视频在线看| 欧美极品色图| 人操人视频在线观看| 99久久精品免费精品国产| 福利精品视频| 丰满熟妇乱又伦| 国产精品88av| 7777精品久久久大香线蕉小说| 亚洲中文一区二区三区| 免费观看日韩电影| 国产精品专区一| 日本三级一区二区三区| 日韩—二三区免费观看av| 日本一区二区在线播放| 国产美女激情视频| 久久高清一区| 国产精品综合不卡av| 伊人亚洲综合网| 久久狠狠亚洲综合| 亚洲精品日韩av| 99久久夜色精品国产亚洲| 国产一区二区福利视频| 51国偷自产一区二区三区| 亚洲国产精品suv| 波多野结衣在线aⅴ中文字幕不卡| 粉嫩av一区二区三区免费观看| 欧美 日韩 综合| 99精品在线免费| 欧美一区亚洲二区| 麻豆免费在线观看| 夜夜精品视频一区二区| 国产资源在线视频| a日韩av网址| 欧美三级蜜桃2在线观看| 6080国产精品| 久草在线综合| 亚洲日韩中文字幕| 国产精品视频看看| 欧美日韩国产一区精品一区| 97国产精品人人爽人人做| 亚洲精品男人的天堂| 美腿丝袜在线亚洲一区| 91免费观看网站| 国模无码一区二区三区| 久久九九久精品国产免费直播| 亚洲春色综合另类校园电影| 日本在线视频中文有码| 欧美性猛交xxxx乱大交| 日韩欧美国产片| 中文一区二区三区四区| 亚洲欧洲一区二区三区在线观看| 亚洲综合图片一区| 亚洲麻豆av| 国产日韩欧美黄色| 色噜噜在线播放| 国产精品美女久久久久aⅴ国产馆| 国产树林野战在线播放| 中文在线免费二区三区| 欧美丰满一区二区免费视频| 国产 xxxx| 欧美亚洲激情| 5566成人精品视频免费| 国产色综合视频| 91蝌蚪国产九色| 99re8这里只有精品| 黄色漫画在线免费看| 欧美日本国产一区| 亚洲av片不卡无码久久| 中文字幕一区二区精品区| 欧洲午夜精品久久久| 国产高清在线观看视频| 国产片一区二区| 免费无码毛片一区二三区| 日韩黄色在线| 亚洲欧洲第一视频| 日韩 国产 在线| 国产资源精品在线观看| 亚洲高清123| 九色porny自拍视频在线播放| 欧美二区乱c少妇| 精品无码一区二区三区| 在线观看日韩av电影| 国产在线不卡精品| 成年人在线视频| 狠狠色狠狠色综合日日五| 亚洲天堂小视频| 天天射成人网| 国产精品中文字幕在线| av免费观看一区二区| 欧美体内谢she精2性欧美| 亚洲少妇一区二区| 亚洲一区色图| 成人免费福利在线| 在线观看麻豆| 欧美精品久久久久久久多人混战| 国产精品久久久久无码av色戒| 亚洲午夜一级| 91精品入口蜜桃| 亚洲区欧洲区| 日韩午夜激情电影| 99久久99久久精品国产| 久久超碰97中文字幕| 午夜精品一区二区在线观看的| 国产综合色区在线观看| 亚洲全黄一级网站| 最近中文字幕免费观看| 亚洲国产精品成人久久综合一区| 久久久久久久少妇| 九色精品91| 国产精品久久不能| www.视频在线.com| 欧美日韩另类国产亚洲欧美一级| 农村老熟妇乱子伦视频| 奇米精品一区二区三区在线观看 | 青青草在线免费视频| 黑人巨大精品欧美一区二区免费| 久久久无码人妻精品一区| 亚洲一区二区三区免费在线观看| 久久99国产精品| 成人美女黄网站| 亚洲最新av在线网站| 影音先锋国产资源| 综合色天天鬼久久鬼色| 亚洲天堂小视频| 亚洲激情在线| 欧美日韩国产一二| 日韩国产一二三区| 欧美人与性动交a欧美精品| 亚洲奶汁xxxx哺乳期| 偷拍与自拍一区| 波多野吉衣中文字幕| 美女脱光内衣内裤视频久久网站 | 毛片网站在线看| 亚洲精品美女在线观看播放| 无码人妻精品一区二区蜜桃色欲| 欧美激情一区二区三区在线| 一级片视频免费观看| 欧美久久一区| 久久福利电影| 欧美高清免费| 欧美精品videossex88| 欧美孕妇孕交xxⅹ孕妇交| 欧美色视频一区| 午夜写真片福利电影网| 久久综合九色综合欧美亚洲| 免费看黄色一级大片| 欧美成人综合| 欧美韩国日本精品一区二区三区| 亚洲精品第一| 国内精品一区二区三区| 在线观看免费高清完整| 亚洲第一网站男人都懂| 日韩av免费播放| 一区二区三区小说| 极品蜜桃臀肥臀-x88av| 国产成人精品免费| 爆乳熟妇一区二区三区霸乳| 欧美国产三级| 色吧亚洲视频| 久久久伦理片| 成人有码在线播放| 97se综合| 久久久久久中文| 在线a人片免费观看视频| 亚洲黄色在线观看| 国产一区二区三区黄片| 欧美日韩一区二区在线播放| 日韩激情小视频| 久久夜色精品国产噜噜av| 永久av免费在线观看| 日韩精品视频网| 免费毛片网站在线观看| 91精品在线观看国产| 欧美性天天影院| 欧美变态网站| 99久热re在线精品996热视频 | 岛国视频一区免费观看| 日日夜夜精品| 国产精品69精品一区二区三区| av午夜在线观看| 欧美成年人视频网站| 国产区在线视频| 日韩电影免费在线观看中文字幕 | 99国产精品久久久久久久久久| www.日本久久| 蜜桃av一区二区三区电影| 久久久久久久久久久久久久国产| 黄色av成人| 日本a在线天堂| 91高清一区| 偷拍盗摄高潮叫床对白清晰| 欧美熟乱15p| 欧美一级二级三级九九九| 色天天色综合| 麻豆av一区二区三区久久| 风间由美性色一区二区三区四区 | 下面一进一出好爽视频| 麻豆成人久久精品二区三区小说| 日本成人在线免费视频| 亚洲欧美日韩一区在线观看| 777777av| 久久国产精品99国产| 日韩a在线播放| 久久综合影视| 国产超碰在线播放| 日韩精品电影在线| 伊人网在线综合| 精品一区二区三区不卡| 一级黄色大片儿| 国产高清久久久久| 香蕉视频免费网站| 97se亚洲国产综合自在线不卡| 美女搡bbb又爽又猛又黄www| 99久久er热在这里只有精品15 | 亚洲欧美日韩久久| 青娱乐免费在线视频| 亚洲图片欧美视频| 国产精品久久久久久久妇| 色综合一个色综合亚洲| www.com亚洲| 欧美日韩一区二区在线视频| 国产欧美熟妇另类久久久| 欧美α欧美αv大片| 人妻妺妺窝人体色www聚色窝 | 欧美系列亚洲系列| 91tv国产成人福利| 日韩欧美高清在线| 婷婷色在线观看| 国产亚洲精品久久久久久777| eeuss影院在线观看| 另类视频在线观看| 成年人黄色大片在线| 国产精品对白刺激| 高清久久精品| 极品日韩久久| 日韩精品网站| 亚洲色欲久久久综合网东京热| 99国产精品99久久久久久粉嫩| 一区二区三区国产免费| 国产99久久久久| 老牛影视av老牛影视av| 中文字幕一区二区三| 国产一级特黄aaa大片| 欧美色老头old∨ideo| 精品国产99久久久久久宅男i| 日韩av在线免费观看| 在线观看免费版| 午夜精品理论片| 久久影视精品| 91免费在线观看网站| 91精品久久久久久综合五月天| 欧美一级日本a级v片| 图片区亚洲欧美小说区| 国产91在线视频观看| 国产麻豆午夜三级精品| 少妇精品无码一区二区三区| 亚洲欧洲另类国产综合| 天堂在线免费观看视频| 欧美老人xxxx18| 你懂的免费在线观看| 色综合导航网站| 欧美片第一页| wwwxx欧美| 国产欧美高清视频在线| 国产日本在线播放| 久久9热精品视频| 老司机免费视频| 一区二区三区中文在线| 午夜一级黄色片| 欧美精品一区男女天堂| 成人在线直播| 国产精品亚洲综合天堂夜夜| 久久悠悠精品综合网| 日韩中文在线字幕| 青青草国产精品97视觉盛宴| 欧美日韩一区二区三区四区五区六区| 国产精品国产三级国产aⅴ无密码| 中文字幕第四页| 日韩欧美在线不卡| 日本蜜桃在线观看| 午夜精品福利视频| 人人爱人人干婷婷丁香亚洲| 亚洲在线视频一区二区| 日韩天堂av| 天天躁日日躁狠狠躁av| 一区二区三区精密机械公司| 中文天堂在线播放| 亚洲人成电影在线| 男人皇宫亚洲男人2020| 国产激情美女久久久久久吹潮| 亚洲影视一区二区三区| 欧美一级特黄aaa| 国产欧美一区二区精品性| jizz国产在线观看| 亚洲男人的天堂在线| 超碰成人av| 九九九九精品九九九九| 国产欧美日韩综合一区在线播放 | 成人高清在线视频| 黄色小说在线观看视频| 精品福利一二区| 在线毛片网站| 91亚洲精品在线观看| 91精品蜜臀一区二区三区在线| 亚洲狼人综合干| 欧美国产欧美亚州国产日韩mv天天看完整| 亚洲欧美偷拍一区| 日韩成人av在线| 超级碰碰久久| 午夜精品一区二区三区四区 | 欧美噜噜久久久xxx| 一区二区三区自拍视频| 宅男av一区二区三区| 激情图区综合网| 日本老熟俱乐部h0930| 欧美人动与zoxxxx乱| aaa大片在线观看| 国产厕所精品在线观看| 日本电影一区二区| 亚洲一区精品视频在线观看| 亚洲欧美色图小说| 国产精品无码免费播放| 久久久国产91| 91欧美极品| 国产欧美高清在线| 国产日韩av一区二区| 91丨九色丨丰满| 欧美—级高清免费播放| 久久九九热re6这里有精品| 成年人在线观看视频免费| 1024精品合集| www.狠狠干| 清纯唯美亚洲激情| 久久精品国内一区二区三区水蜜桃| 婷婷中文字幕在线观看| 无码av免费一区二区三区试看| 欧美美乳在线| 国产欧美一区二区三区久久| 在线成人h网| 美国黄色特级片| 欧美一区二区精品在线| av美女在线观看| 亚洲午夜精品久久| 国产99精品国产| 精品无码人妻一区二区三区| 精品国内自产拍在线观看视频| 日韩一区二区三区视频| 最近免费中文字幕中文高清百度| 美脚恋feet久草欧美| 色哟哟亚洲精品| 亚洲中文字幕无码专区| 欧美成a人免费观看久久| 精品国偷自产一区二区三区| 国产午夜精品一区二区三区嫩草 | 特级西西444www| 五月天中文字幕一区二区|