精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI版華爾街之狼!o3-mini靠「神之押注」狂賺9倍,DeepSeek R1最特立獨行

人工智能 新聞
AI能像科幻電影中的先知一樣預測未來嗎?一個名為「Prophet Arena」的全新基準測試,正通過預測真實世界事件來評估AI的「預言」能力。

AI能預測未來嗎?

在《黑客帝國》里,先知能對Neo的未來做出預測。

以ChatGPT為代表的AI,則可以根據過去的語料來「預測下一個Token」。

那問題來了,AI能不能像先知一樣,從全世界的雜亂信息里找出蛛絲馬跡,準確地預測未來呢?

比如:

  • AI監管今年能否成為聯邦法律?
  • 美國職業足球大聯盟比賽中,誰會獲勝?
  • NBA今年的冠軍會是誰?

在昨晚的男籃亞洲杯冠軍爭奪戰中,中國男籃雖以1分之差惜敗澳大利亞,但已是近十年來的最好成績!

相信絕大部分人都不會猜到這個比分,那么,AI能否根據中國隊此前的表現,提前預測到呢?

更進一步的,AI能否像拉普拉斯妖一樣,在獲取了當下世界的所有信息后,精確預測未來的一切?

如果它能在某一瞬間知道宇宙中所有粒子的位置與速度,并且完全理解自然規律。

那么,就可以準確計算出過去的一切,并且精確預測未來的一切。

今天要介紹的Prophet Arena就是一個通過實時更新的真實世界預測任務來評估AI系統預測智能的基準測試。

把市場共識、自動化預測、信息整理和社區洞察結合起來,形成更強的整體預測能力

簡單來說,Prophet Arena作為基準測試是獨一無二的:

  • 考的是預測能力:這是一種需要綜合理解力、推理能力的高級智慧。
  • 為「人機協作」而生:你可以給AI提供線索,看看它的預測如何變化;AI也會把它的思考過程告訴你。
  • 不會過擬合,數據永不過時:因為未來的事件永遠是全新的考題。
  • 直面真實世界:AI的預測直接與真實的投注決策掛鉤,表現好的模型真的能在虛擬市場里賺到錢。

Prophet Arena由芝加哥大學SIGMA Lab開發(https://www.prophetarena.co/about),以實時預測市場事件為依托,首次建立了一個無法「刷題」的動態基準。

全面衡量AI在不確定性推理、信息整合、概率預測和真實收益中的表現。

就連OpenAI 推理研究(AI reasoning research)負責人Noam Brown也贊嘆,預測能力是人類獨有的能力,現在AI終于開始涉足了。

競技場規則大公開

在Prophet Arena里,AI模型們要回答一個簡單又根本的問題:

預測真實世界里還沒發生的事,到底行不行?

Prophet Arena從像Kalshi和Polymarket這樣的預測市場平臺挑選熱門、多樣且周期性的真實事件作為考題。

Kalshi是一家美國的金融交易所和預測市場平臺,是美國第一個受美國商品期貨交易委員會(CFTC)監管的、專注于交易「事件結果」的交易所

polymarket上關于AI相關的預測話題

整個比賽流程分為三步:

1. 情報收集

AI模型們利用搜索引擎,像偵探一樣收集關于某個事件的新聞報道,整理成一份精煉的「情報簡報」。同時,也會把當時的市場價格(可以看作是群眾的集體智慧)放進去。

2. 提交預測

拿到相同的情報后,每個AI模型都要提交一份詳細的「預測報告」:對所有可能的結果給出一個概率分布,并附上長篇大論的理由,解釋自己為什么這么看。

3. 結果揭曉與評分

事件結束,結果揭曉。會用一套專業的指標來評估AI的預測到底有多準,然后更新在一個實時排行榜上。

預測指標設定

排行榜主要看兩個指標:一個是衡量準確度和校準度的Brier分數(越高越好),另一個是模擬真實投注的平均回報(看誰能賺錢)。

除了上述兩個核心指標外,Prophet Arena還采用了受統計學和心理測量建模啟發的高級評估方法,如項目反應理論(Item Response Theory,IRT)和廣義Bradley-Terry(BT)模型。

這些補充性指標豐富了排行榜,能夠更細致和全面地理解預測智能。

AI「預言家」成績單出爐

Prophet的秘密發現

你可能會覺得,預測越準,賺的錢肯定越多吧?

大部分時候是這樣,但在數據里發現了一個特別有意思的「反轉區域」

秘密一:最賺錢的預測,不一定是最準的

在Brier分數不高(0.3-0.5分)的區間里,反而誕生了許多回報率驚人的預測。

深挖一下,發現很多都來自爆冷的體育比賽。

比如一場溫布爾登網球賽,賽前市場普遍認為選手保羅有84%的勝率,甚至在開賽前一度攀升至95%。

但很多AI模型比市場更保守,只給了他80%左右的勝率。

正是這微小的差異,讓模型在下注時,認為押注對手奧夫納獲勝的「性價比」更高。

結果,奧夫納真的爆冷贏了!這筆投注帶來了近6倍的回報。

你看,AI并沒有準確預測到勝者,所以它的準確度分數(Brier分數)很一般。

但它敏銳地發現了市場的「定價偏差」,做出了高回報的選擇。

這說明,成為一個準確的預言家和成為一個賺錢的投資者,是兩種不完全相同的技能。

為了探討這一點,檢查了每個Brier得分區間的模型構成,每個模型用不同的顏色表示。

一個直接的觀察結果是,較高的Brier得分區間中的預測數量通常更多。

絕大多數LLM在預測時傾向于與主流信息保持一致,因此大部分預測集中在高Brier分數區間。

秘密二:AI也有「性格」,激進派or保守派

面對同樣的信息,不同的AI模型會表現出截然不同的「性格」。

比如在「AI監管法規會在2026年前成為聯邦法律嗎?」這個事件上,市場認為可能性只有25%。

但模型可比人類激進多了。

激進派代表Qwen3:它看到各種法案都在推進,覺得勢頭很猛,直接給出了75%的超高概率。

保守派代表Llama 4 Maverick:它也看到了同樣的信息,但認為立法過程復雜又緩慢,所以只給出了比市場略高一點的35%。

而GPT-4.1處于他們二者之間,給出了60%的概率。

這太有趣了!

AI的預測并非隨機,它們有著結構化的推理和獨特的風險偏好,就像人類專家也會有觀點分歧一樣。

秘密三:AI勝利的秘訣在于「贏得大」而非「贏得多」

在這些模型中,哪個模型最能賺錢?

在排行榜上,OpenAI的o3-mini模型在平均回報指標上名列前茅。

這還是很出人意料的。

例如在圣地亞哥與多倫多的美國職業足球大聯盟比賽中,o3-mini在1美元的投注上獲得了9美元的回報。

根據市場數據和新聞來源,o3-mini預測多倫多獲勝的概率為30%,而市場隱含的概率僅為11%(價格=0.11)。

盡管多倫多是不被看好的一方,但AI識別到了正的期望值,并由于其最大的優勢比率30%/11%≈3。

選擇了投注多倫多FC獲勝。

結果證明,多倫多最終獲勝,為o3-mini帶來了可觀的已實現收益。

但它在很多比賽中,和市場主流觀點的正面交鋒其實是輸多贏少。

那它為什么還能賺錢呢?因為它贏的時候,贏得特別多

它總能找到一些市場沒注意到的細微差別,然后下注在那些「性價比」超高的選項上。

就像在上面那場足球賽中,市場認為多倫多隊只有11%的勝算,但o3-mini經過分析認為有30%。

它果斷押注多倫多隊,結果多倫多隊爆冷獲勝,這一筆就賺了9倍。

所以,在預測的世界里,成功的關鍵不在于每次都對,而在于你對的時候能帶來多大的回報。

彩蛋

在不同模型的對比中,發現了一些很有趣的現象。

下圖每個格子里的數值表示兩兩模型在預測分布上的平均差異程度

數值越低(顏色越深的單元格)表示概率推理更接近一致;數值越高(顏色越淺的單元格)則表明分歧越大。

其中一個突出的模型是DeepSeek R1,它的預測結果常常與其他模型大相徑庭。

與Kimi K2、o3和Llama 4 Maverick等模型相比,它的L2距離始終高于0.7,這表明其可能采用了不同的校準方式或內部決策機制。

在頻譜的另一端,諸如Grok-4和GPT-5之類的模型經常作出高度一致的預測,L2距離通常低于0.3。

這些模型似乎在解讀事件特征和匹配市場信號方面有更多的共同點。

換句話說,這張圖展示了AI預測的多樣性:有些模型形成「群體共識」、有些模型像「特立獨行的異議者」。

因此AI預測并不是隨機輸出,而是各自內部結構化推理的結果。

打造人機協作的「預言家聯盟」

Prophet Arena僅僅是個開始。

終極目標是建立一個平臺,讓AI驅動的洞見來增強理解和預測世界的方式。

未來,你可以直接問AI:「這件事發生的可能性有多大?」

它不僅會給你一個概率,還會清晰地解釋背后的邏輯。

你甚至可以提供新的信息,看看AI會不會因此改變想法。

設想,AI系統將成為預測市場的積極參與者,將人類的直覺洞察與AI強大的數據分析能力相結合,最終提升整個社會的集體遠見,為那些高風險的決策提供更可靠的依據。

畢竟,如果說語言模型的下一步是預測下一個詞,那么它的終極形態,或許就是預測這個真實世界的下一個事件。

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-02-03 14:06:32

2025-02-17 08:12:00

AI模型生成

2025-02-03 12:38:28

2021-07-09 06:48:30

語言Scala編程

2025-03-31 08:00:00

AI模型測評

2025-04-10 10:02:43

2011-05-01 21:48:54

Ubuntu 11.0

2025-02-18 09:00:00

2025-02-14 10:47:40

2025-02-08 11:44:03

2024-12-24 16:15:04

2025-11-21 08:29:14

2025-03-03 07:30:00

谷歌模型AI

2025-01-27 12:30:07

2025-02-27 00:00:05

2021-12-01 11:52:35

WOT技術峰會技術

2025-03-13 06:34:49

2025-02-12 12:12:59

2025-02-25 08:20:50

AI程序員DeepSeek

2025-03-10 08:10:00

AI研究安全
點贊
收藏

51CTO技術棧公眾號

夜夜春很很躁夜夜躁| 欧美亚洲黄色片| 在线免费a视频| 在线免费观看日本欧美爱情大片| 日韩欧美成人午夜| 99热成人精品热久久66| 免费a级在线播放| 成人黄色在线看| 国产精品久久久久久久久男| 久久久久久久久毛片| 九一精品国产| 日韩欧美一区二区三区在线| 老熟妇仑乱视频一区二区| 超碰在线最新| 国产亚洲欧美在线| 国产精品久久久对白| 欧美 亚洲 另类 激情 另类| 国内精品久久久久久久影视蜜臀 | 99久久夜色精品国产亚洲96 | 欧美精品福利| 国产亚洲福利一区| 日本道中文字幕| 日韩有码欧美| 色婷婷久久久久swag精品 | freexxx性亚洲精品| 国产精品久久久久久久久免费丝袜 | 婷婷视频一区二区三区| 欧美日韩一区中文字幕| av天堂永久资源网| av岛国在线| 亚洲精品国产精品乱码不99| 亚洲午夜精品久久久久久浪潮| 三级av在线| 99久久婷婷国产综合精品电影| 91精品黄色| 国产裸体无遮挡| 免费看欧美美女黄的网站| 日本韩国在线不卡| 亚洲日本韩国在线| 亚洲香蕉网站| 精品中文字幕在线观看| 国产黄在线免费观看| 色综合咪咪久久网| 日韩中文字幕在线免费观看| 日本乱子伦xxxx| 欧美美乳视频| 亚洲欧美制服中文字幕| 素人fc2av清纯18岁| 久久aimee| 亚洲国内高清视频| 一本加勒比波多野结衣| 国产三级精品三级在线观看国产| 精品欧美久久久| 中文字幕乱码一区| 麻豆一区一区三区四区| 日韩成人免费视频| 三叶草欧洲码在线| 精品国产一区二区三区久久久蜜臀 | 亚洲激情在线播放| 日韩成人三级视频| 大桥未久在线视频| 色欧美乱欧美15图片| 97公开免费视频| 日韩一区二区三区免费视频| 欧美日韩一区高清| 久久久精品视频国产| 伊人久久噜噜噜躁狠狠躁| 日韩欧美在线观看一区二区三区| 苍井空张开腿实干12次| 国产欧美三级电影| 亚洲无av在线中文字幕| 国精品人伦一区二区三区蜜桃| 日韩一区二区中文| 久久成人亚洲精品| 亚洲精品77777| 久久高清一区| 成人黄色av网站| 亚洲第一免费视频| 97精品视频在线观看自产线路二| 任我爽在线视频精品一| 男人影院在线观看| 亚洲成人自拍一区| 色诱视频在线观看| 欧美片网站免费| 亚洲国产精品一区二区久| 国产又粗又猛又爽又黄av| 91九色精品| 欧美一区第一页| 亚洲视频久久久| 成人在线视频一区二区| 奇米精品在线| 五月天激情在线| 日本高清不卡在线观看| 亚洲天堂一区二区在线观看| 欧美一区二区三区久久| 丝袜一区二区三区| 国产69精品久久久久久久久久| 久色婷婷小香蕉久久| 国外成人免费视频| 黄色成人影院| 色狠狠综合天天综合综合| 国产大片一区二区三区| 妖精一区二区三区精品视频 | 日韩精品欧美专区| 色老头在线观看| 国产精品白浆| 欧美在线三级电影| 国偷自产av一区二区三区麻豆| 欧美男gay| 欧美激情精品久久久久久变态| 樱花视频在线免费观看| 丁香另类激情小说| 国产卡一卡二在线| 日日av拍夜夜添久久免费| 日韩天堂在线观看| 青青草华人在线视频| 午夜在线视频一区二区区别| 亚洲a在线播放| √新版天堂资源在线资源| 欧美日韩国产色| 亚洲欧美激情一区二区三区| 日韩精品免费一区二区在线观看| 91国内免费在线视频| 亚洲va久久久噜噜噜无码久久| 中文成人av在线| 日本三区在线观看| 日韩成人一级| 性视频1819p久久| 欧美性受xxxx狂喷水| 亚洲男同性视频| 最新天堂在线视频| 日韩久久综合| 国产精品jizz在线观看麻豆| 色视频在线看| 日韩欧美精品网址| 97人妻天天摸天天爽天天| 很黄很黄激情成人| 国产精品播放| 毛片大全在线观看| 日韩免费视频一区二区| 翔田千里88av中文字幕| 韩国av一区二区| 2021狠狠干| 国产一区二区三区国产精品| 久久亚洲精品一区| aaaa一级片| 亚洲激情校园春色| 中国特级黄色大片| 亚洲激情自拍| 久久久久九九九| 手机看片久久| 综合激情国产一区| 一卡二卡三卡在线| 亚洲精品乱码久久久久久黑人| 最好看的中文字幕| 在线成人欧美| 免费久久久一本精品久久区| 欧美极品影院| www国产亚洲精品久久网站| 国产美女永久免费| 一区二区三区成人在线视频| 午夜视频在线观看国产| 亚欧美中日韩视频| 日韩经典在线视频| 国产精品一级在线观看| 欧美激情一区二区三区高清视频 | 久久久久久久久久影院| 久久精品人人做人人爽97| 手机在线成人免费视频| 亚洲精品二区三区| 国产精品欧美久久| 国产日韩另类视频一区| 日韩在线观看你懂的| 精品人妻一区二区三区麻豆91| 亚洲国产你懂的| 精品少妇一区二区三区免费观| 久久综合五月| 大地资源第二页在线观看高清版| www国产精品| 国产91精品最新在线播放| 久热国产在线| 日韩成人av在线播放| 在线视频1卡二卡三卡| 亚洲曰韩产成在线| 色欲狠狠躁天天躁无码中文字幕| 国产真实乱偷精品视频免| 国产91xxx| 97在线精品| 精品一区二区三区视频日产| 欧美成人家庭影院| 97色在线观看| 黄色一级片在线观看| 精品亚洲国产视频| 国产乱码一区二区| 欧美性猛交丰臀xxxxx网站| 亚洲少妇xxx| 97se亚洲国产综合自在线不卡| 亚洲综合欧美激情| 午夜偷拍福利视频| 国产乱子轮精品视频| 国产中文字幕在线免费观看| 国产大片一区| 欧美精品一区二区三区在线四季| 精品国产乱码一区二区三区| 欧美在线日韩在线| 先锋成人av| www.日韩系列| 国产美女视频一区二区三区| 亚洲精品在线观看网站| 在线播放一级片| 欧美日韩性视频| 一区二区视频免费看| 国产日产精品一区| 国产一级二级在线观看| 久久99在线观看| 国产原创中文在线观看| 欧美日韩三区| 亚洲一区3d动漫同人无遮挡 | 色综合久久av| 狼人精品一区二区三区在线 | 1024成人网| 夜夜春很很躁夜夜躁| 99riav久久精品riav| 亚洲丝袜在线观看| 久久精品国产99| 欧美性猛交久久久乱大交小说 | 五月天中文字幕在线| 久久先锋影音| 国模吧无码一区二区三区 | 色婷婷成人在线| 国产精品日本| 国产午夜福利在线播放| 亚洲国产片色| 麻豆tv在线播放| 亚洲视频一二| 国产freexxxx性播放麻豆| 欧美一区二区三区久久精品| www.黄色网址.com| 一本到12不卡视频在线dvd| 一区二区三区欧美在线| 欧美成人精品一区二区三区在线看| 免费国产一区二区| 国产精品一区二区99| 日本不卡二区| 欧美一区2区| 四虎影院一区二区三区| 日韩av密桃| 91社在线播放| 国产精品草草| 国产午夜福利100集发布| 国产手机视频一区二区| 国产日产欧美视频| 日韩国产一区二| 午夜免费高清视频| 久久se精品一区精品二区| 国产在线视频三区| 成人性生交大片免费看视频在线| 日本一区二区在线免费观看| 95精品视频在线| 亚洲av熟女国产一区二区性色| 日本一区二区三区在线不卡| 国产精品麻豆一区| 亚洲精品成a人| 久久狠狠高潮亚洲精品| 欧美性猛交xxxx| 一区二区三区免费在线视频| 日韩一级大片在线| 外国精品视频在线观看| 中日韩美女免费视频网址在线观看 | 91视频观看视频| 激情五月深爱五月| 亚洲综合激情小说| 欧美啪啪小视频| 欧美日韩亚洲综合| 亚洲国产精品国自产拍久久| 日韩精品一区二区三区第95| 五月天婷婷在线视频| 欧美激情亚洲激情| 四虎4545www国产精品| 91久久久久久| 网友自拍一区| 日本丰满少妇黄大片在线观看| 99日韩精品| 亚洲免费黄色录像| 99麻豆久久久国产精品免费| 懂色av蜜臀av粉嫩av永久| 亚洲一区二区黄色| 青青艹在线观看| 欧美精品一区二区三区蜜桃视频| 成人在线免费电影| 欧美精品videos另类日本| 黄色精品视频| 精品欧美一区二区精品久久| 国产区精品区| 日韩精品视频在线观看视频| 日韩av网站免费在线| 最新版天堂资源在线| 国产精品成人免费在线| 国产又黄又粗又爽| 91精品国产91久久久久久最新毛片| 深夜福利视频在线观看| 美女国内精品自产拍在线播放| 中文字幕av一区二区三区佐山爱| 147欧美人体大胆444| 成人亚洲一区| 女性女同性aⅴ免费观女性恋| 国产呦萝稀缺另类资源| 无码人妻aⅴ一区二区三区69岛| 亚洲一区二区精品久久av| 国产又粗又猛又爽又黄91| 亚洲精品自在久久| 2020国产在线| 国产精品sss| 午夜欧美视频| 樱花草www在线| 国产欧美日韩精品一区| 久久国产精品免费看| 欧美大片在线观看| 18av在线播放| 成人免费午夜电影| 色综合久久一区二区三区| 国产成人无码一二三区视频| www.成人网.com| 国产一级特黄视频| 日韩精品一区二区三区视频播放 | 成人亚洲综合天堂| 日韩免费观看高清| 中文字幕av一区二区三区人| 日本免费不卡一区二区| 成人h精品动漫一区二区三区| 劲爆欧美第一页| 日韩欧美综合一区| 视频在线这里都是精品| 亚洲一区二区久久久久久| 97久久视频| 久久久精品视频国产| 亚洲精品久久7777| www.激情五月.com| 欧美韩国理论所午夜片917电影| 欧美成年网站| 欧美视频在线第一页| 国产sm精品调教视频网站| 久久婷婷一区二区| 精品少妇一区二区三区日产乱码| 中文字幕有码在线观看| 51精品国产人成在线观看| 欧美大片专区| 国产一级免费片| 欧美日韩性视频| 黄色av免费在线观看| 国产精品日韩精品| 99久久精品网站| 亚洲性图第一页| 天天免费综合色| 可以在线观看的av| 国产日韩亚洲欧美| 综合激情婷婷| 精品人妻在线视频| 色综合久久精品| 日本中文字幕在线2020| 91精品黄色| 亚洲欧美日韩精品一区二区| xxxx日本黄色| 日韩午夜在线观看视频| 蜜桃麻豆影像在线观看| 日韩欧美亚洲日产国产| 国产综合一区二区| 国产一级二级毛片| 亚洲三级 欧美三级| 日韩精品一页| 国产传媒久久久| 久久男人中文字幕资源站| 国产精品sm调教免费专区| 欧美www在线| 亚洲男人都懂第一日本| 一道本在线免费视频| 亚洲成人av福利| fc2在线中文字幕| 69174成人网| 久久久亚洲人| 黑鬼狂亚洲人videos| 国产视频精品免费播放| 日韩精品第二页| 国产成人精品视频免费看| 日韩一区欧美一区| 色就是色亚洲色图| 亚洲最大av网站| 久久亚洲影院| 黄色一级片在线免费观看| 亚洲日韩中文字幕在线播放| 在线播放一区二区精品视频| 国产成人无码av在线播放dvd| 一区二区三区不卡在线观看| 国产福利在线看| 国产视频不卡| 国内精品伊人久久久久影院对白| 国产一级18片视频| 欧美人与性动交| 日韩一区二区中文| 深爱五月激情网|