精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

生活機器人最后考驗!楊笛一團隊發布EgoNormia:現實中能否符合社會規范?

人工智能 新聞
EgoNormia基準可以評估視覺語言模型在物理社會規范理解方面能力,從結果上看,當前最先進的模型在規范推理方面仍遠不如人類,主要問題在于規范合理性和優先級判斷上的不足。

隨著人工智能技術日益成熟,社會各界對AI或機器人能否學習并遵循社會規范的問題越來越關注。從早期的科幻小說到如今的現實應用,人類始終期望機器能夠理解并內化這些根植于社會生活中的「規范」。

隨著視覺語言模型(VLMs)不斷進步,研究者們陸續推出了諸多基準和數據集,用以評估其第一視角下的視頻理解能力。例如,HourVideo和EgoSchema等基準主要關注長視頻解析以及對物體和事件的識別能力。

然而,這些評估工具難以衡量模型在規范推理(normative reasoning)方面的表現,為此,斯坦福大學團隊提出了EgoNormia基準,旨在挑戰當前最前沿的視覺語言模型,促使它們在復雜場景中做出符合人類常識的規范決策。

圖片

論文鏈接:https://arxiv.org/abs/2502.20490

網頁鏈接:https://egonormia.org

代碼鏈接:https://github.com/Open-Social-World/EgoNormia

在現實生活中,人們做決策時遇到的情境往往充滿矛盾與取舍。

例如:在戶外遠足的時候,如果一位同伴在泥濘中被困;一方面,安全規范要求人們保持足夠距離,以防發生意外;另一方面,協作精神又促使人們對同伴伸出援手。

對于人類來說,這樣的權衡似乎是自然而然的選擇,人們會在保護自己安全的前提下向同伴施以援手;但對于視覺語言模型來說,如何在理解場景、提取關鍵線索的同時做出合乎社會規范的決策,仍然是一個亟待攻克的難題。

圖片

為全面衡量視覺語言模型在規范推理上的能力,論文主要提出了以下研究問題:

  • RQ1:模型是否能做出與人類共識一致的規范決策?
  • RQ2:當模型決策與人類不符時,究竟是因為視覺感知(如物體識別)出現偏差,還是在深入推理規范時存在缺陷?
  • RQ3:是否可以借助 EgoNormia 數據集來提升模型在復雜情境下的規范推理表現?

Physical Social Norm

為了更好地研究規范,論文首先將物理社會規范做出了以下定義:

「物理社會規范(Physical Social Norm)是指在共享環境中約定俗成的期望,這些期望規范著行為者的行為及其與他人的互動方式。」

同時,論文也對于物理社會規范進行了分類,有一類規范明確用于最大化多智能體系統的整體效用,論文稱之為效用規范,即合作、協調和溝通規范。

另一類規范則更側重于人類社會性:安全、禮貌、隱私和空間距離。

人類社會規范往往與群體效用規范存在沖突,這種沖突為評估智能體在沖突目標下的決策提供了場景。重要的是,每一類物理社會規范都能直接影響人機協作的成功,每一種規范具體的例子如下圖。

圖片

任務

EgoNormia基準主要包含三個子任務,所有子任務均采用多項選擇題的形式。

子任務1:動作選擇,選出在當前情境下最符合規范要求的唯一動作。

子任務2:理由選擇,選出最能支持其所選規范動作的理由。

子任務3:動作合理性判斷,從給定選項中選出那些合理的(即符合規范但不一定是最佳的)動作。

圖片

基準生成

EgoNormia基準生成流程主要包含四個階段:片段采樣,答案生成,篩選,人工驗證。這些流程保證了最終數據集保持了多樣性,挑戰性,和人工共識性。

經過一系列流程,論文最終得到了來自1077個原始視頻的1853個視頻切片,涵蓋97種場景和93種不同動作。

借助GPT-4o的自動聚類技術,所有視頻被歸納為 5 個高層級類別和 23 個低層級類別,充分展示了數據的多樣性和豐富性(詳見餅圖)。

圖片

實驗結果

在EgoNormia的評估中,大多數模型的平均準確率均低于40%,而人類的平均得分高達92.4%,表現最好的模型Gemini 1.5 Pro在取得了45.3%的平均準確率,表明當前模型在做具體現身的規范決策(RQ1)方面能力有限。

此外,即便使用了更豐富的文本描述和最先進的推理模型如 o3-mini,表現仍然不及采用視覺輸入的模型,證明了語言在捕捉連續、推理中細微特征(如空間關系、可見情緒與情感以及物理動態)方面存在根本性局限。

圖片

為了探究視覺語言模型規范推理能力受限的原因(RQ2),論文對 EgoNormia 中 100 個具代表性任務的模型回復進行了標注,并進一步將規范推理錯誤進行了分類。

論文共識別出四種失敗模式:(1) 規范合理性錯誤,(2) 規范優先級錯誤,(3) 感知錯誤,以及 (4) 拒絕回答。

對于模型而言,大多數錯誤源自合理性錯誤而非感知錯誤,這表明基礎模型在處理視頻輸入的視覺上下文方面表現尚可,但在對解析出的情境進行有效規范推理時則存在不足。此外,隨著整體性能的提高,規范優先級錯誤的比例也逐步增加(GPT-4o < Gemini 1.5 Pro < 人類),表明更強大的模型在面對模棱兩可的情境時,更難確定哪項規范應當優先。

圖片

最后,研究人員評估了EgoNormia是否可以直接用于提升視覺語言模型的規范推理能力(RQ3)。

研究人員提出采用檢索增強生成(Retrieval-Augmented Generation,RAG),為更深層次的規范推理任務提供基于上下文的規范示例,使其能作為多示例學習的參考。

為了公平地測試EgoNormia在新數據上的效用,研究人員構建了一個基于第一人稱機器人助手視頻的域外測試數據集,基線GPT-4o的得分僅為18.2%。

通過對EgoNormia的檢索,論文展示了在未見域內任務上,相對于最佳非RAG模型和基礎GPT-4o,EgoNormia提供了9.4%的性能提升,并比隨機檢索 EgoNormia 提高了7.9%。

總結

EgoNormia是一種新穎的基準和數據集,旨在嚴格評估視覺語言模型(VLMs)在第一人稱視角下的物理社會規范(PSN)的理解能力。

論文證明,盡管當前最先進的模型在視覺識別和抽象推理方面表現強勁,但在PSN理解上仍然遜色于人類,主要原因在于規范合理性理解和優先級判斷上的錯誤。

通過測試一種基于檢索的方法,論文展示了EgoNormia在提升規范理解方面的直接實用性,在域外和不同體現的視頻上均取得了改進。

最后,論文還指出了具體現身規范理解未來的研究機遇,并建議在大規模規范數據集上進行后續訓練,這將是一個極具前景的研究方向。

部分作者介紹

楊笛一:斯坦福大學計算機系的助理教授,主要關注具有社會意識的自然語言處理,其研究目標是深入理解社會語境下的人類溝通,并開發支持人與人及人機交互的語言技術。

朱昊:斯坦福大學計算機系博士后,卡內基梅隆大學博士,專注于打造能夠學習與人類溝通和協作的人工智能代理。

張彥哲:佐治亞理工學院計算機系博士生,致力于使模型具備持續學習多任務并實現知識遷移的能力,以及使模型能夠從其他模態和人類中受益并為其服務。

伏奕澄:斯坦福大學電氣工程系碩士生,特別關注如何將大規模語言模型應用于現實場景,并致力于開發能夠更高效地與人類及外部世界進行交互的智能系統。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-06-17 07:47:00

2025-04-02 09:50:00

機器人訓練數據

2023-03-13 09:35:07

ChatGPTAI

2022-01-04 10:19:23

架構運維技術

2023-05-09 12:27:52

亞馬遜微服務重構

2024-09-18 09:10:00

AI模型

2017-05-19 12:00:43

機器人家庭醫生YOBY

2024-04-09 08:36:01

2021-11-06 10:53:07

機器學習機器人AI

2020-03-26 21:59:50

機器人機器人警察人工智能

2025-06-27 09:33:38

2024-07-16 13:15:23

2020-08-18 19:24:17

機器人護理機器人人工智能

2009-12-16 09:52:15

Linux操作系統

2022-12-29 18:07:25

DDD電話機器人

2021-07-19 09:11:05

機器人人工智能算法

2022-03-21 13:38:42

機器人人工智能AI

2017-09-18 13:06:54

機器人AI人工智能

2021-07-26 21:31:13

機器人人工智能AI

2017-03-28 17:18:20

點贊
收藏

51CTO技術棧公眾號

国产东北露脸精品视频| 91综合在线| 在线观看免费视频综合| 亚洲精品一卡二卡三卡四卡| 国产理论视频在线观看| 欧美日韩一视频区二区| 国产视频一区在线| 一二三av在线| 桃花岛成人影院| 亚洲精品第1页| 日本一区视频在线观看免费| 精品国产av 无码一区二区三区| 在线综合欧美| 欧美超级免费视 在线| 精品久久久久久中文字幕人妻最新| 国产亚洲欧美日韩精品一区二区三区 | 欧美91视频| 一区二区三区天堂av| av地址在线观看| 国产精品伦一区二区| 午夜精品一区二区三区三上悠亚| 亚洲第一综合| 丝袜视频国产在线播放| 国产精品1区2区3区| 国产精品久久久亚洲| 日本a在线观看| 午夜精品久久久久99热蜜桃导演| 亚洲人免费视频| 午夜男人的天堂| 视频一区日韩| 欧美高清hd18日本| 成人免费在线观看视频网站| 欧美aa免费在线| 一个色在线综合| 综合视频在线观看| 日本黄色片一级片| 欧美zozozo| 国内久久婷婷综合| 日韩一级免费观看| www.xxx亚洲| 国产伦理精品| 亚洲国产欧美一区二区三区丁香婷| 色一情一乱一伦一区二区三区丨| 无码国产精品高潮久久99| 国产一区二区成人久久免费影院| 国产精品毛片a∨一区二区三区|国| 国产精品一区视频| 亚洲一区二区91| 欧美日韩爆操| 欧美黄色片视频| 精品99在线观看| 永久亚洲成a人片777777| 色综合亚洲精品激情狠狠| 日本精品在线观看视频| 国产精品一在线观看| 日韩精品视频在线播放| 亚洲 欧美 日韩在线| 波多野结衣欧美| 亚洲成人av在线播放| 国产麻豆剧传媒精品国产av| 久久久久久久久久久久久久久久久久久久| 欧美精品一区二区三区一线天视频| 伦伦影院午夜理论片| 亚洲精品视频一二三区| 欧美sm美女调教| 日韩免费高清一区二区| 蜜臀91精品国产高清在线观看| 亚洲欧美中文日韩在线| 国产调教在线观看| 一区二区影院| 久久久噜噜噜久久| 国产无套丰满白嫩对白| 日韩电影在线免费观看| 成人国产精品久久久久久亚洲| 91福利在线观看视频| 国产精品18久久久久久久久久久久| 91精品入口蜜桃| 亚洲 小说区 图片区 都市| 26uuu国产在线精品一区二区| 欧美日韩免费观看一区| 色综合久久影院| 亚洲一区成人在线| av动漫免费看| 国产中文欧美日韩在线| 亚洲国产精品小视频| 少妇精品无码一区二区免费视频| 国产精品91一区二区三区| 欧美人在线观看| 五月婷婷激情视频| 国产女人在线视频| 国产一区二区三区国产| 日韩欧美在线播放| 91.com在线| 精品国产免费人成网站| 欧美精品在线观看一区二区| 亚洲国产精品第一页| 精品中文一区| 欧美成人免费小视频| 亚洲午夜18毛片在线看| 国产综合久久久久影院| 久久99精品久久久久久久久久| 国产一二三区在线视频| 一区二区三区国产精品| 亚洲狼人综合干| 国产亚洲成av人片在线观黄桃| 国产一区二区三区直播精品电影| 久久精品这里只有精品| 日韩国产精品久久久| 成人h视频在线观看| 都市激情一区| 欧美日韩国产区| 亚洲欧美日韩网站| 欧美视频网址| 2018日韩中文字幕| 亚洲成人久久精品| 国产精品久久久久久久久果冻传媒 | 国产精品探花视频| 91视频在线观看免费| 视色,视色影院,视色影库,视色网 日韩精品福利片午夜免费观看 | 99久热这里只有精品视频免费观看| 亚洲香蕉成人av网站在线观看| 欧美日韩精品一区二区三区视频播放| 日韩国产欧美三级| 久久久久高清| 成人三级小说| 欧美一级专区免费大片| 国产一区二区三区视频播放| 免费亚洲网站| 精品一区在线播放| 欧美24videosex性欧美| 欧美一区二区三区在线观看 | 亚洲美女偷拍久久| 色婷婷狠狠18| 欧美军人男男激情gay| 欧美在线一区二区视频| 蜜臀av中文字幕| 一区二区三区成人| 黄页网站在线看| 一区二区中文字| 7777精品久久久大香线蕉小说| 69久久久久| 欧美三级电影网站| 一级片久久久久| 蜜臀av一区二区| 性欧美.com| 成人看片毛片免费播放器| 亚洲欧美日韩图片| 欧美性猛交xxxx乱大交hd| 久久久久久久综合狠狠综合| 久久9精品区-无套内射无码| 欧美亚洲国产日韩| 日本久久中文字幕| 国产精品99999| 欧美亚洲一区二区三区四区| 小早川怜子久久精品中文字幕| 国产一区二区三区的电影| 九色91在线视频| 电影网一区二区| 中文字幕国产精品久久| 最新黄色网址在线观看| 亚洲国产激情av| 最新免费av网址| 欧美在线亚洲综合一区| 成人午夜电影免费在线观看| 国产盗摄精品一区二区酒店| 亚洲国产精彩中文乱码av在线播放| 中文在线观看免费网站| 91老师片黄在线观看| 免费一级特黄录像| 天天色天天射综合网| 99久久国产免费免费| 成年女人在线看片| 亚洲欧美日韩中文在线| 一本久道久久综合无码中文| 亚洲视频免费看| 日韩免费高清一区二区| 日韩vs国产vs欧美| 正在播放精油久久| 成人在线视频你懂的| 日韩免费av一区二区| 日本在线视频站| 亚洲第一网中文字幕| 日本黄色一级视频| 亚洲女厕所小便bbb| 午夜男人的天堂| 男女男精品视频网| 4444亚洲人成无码网在线观看| 欧美电影完整版在线观看| 国产精品吹潮在线观看| 欧美性受ⅹ╳╳╳黑人a性爽| 日韩国产精品一区| 国产又黄又大又粗的视频| 亚洲电影第三页| 美国黄色特级片| 成人丝袜高跟foot| wwwxxx黄色片| 欧美精品九九| 日韩啊v在线| 波多野结衣在线一区二区| 国产精品久久久久77777| 日本电影在线观看| 一本色道久久综合亚洲精品小说 | 白白色 亚洲乱淫| 日本人视频jizz页码69| 亚洲成人直播| 免费观看黄色的网站| 亚洲va久久| 国产主播喷水一区二区| 黄频免费在线观看| 欧美另类暴力丝袜| caoporn国产精品免费视频| 亚洲高清免费观看高清完整版| 亚洲天堂中文在线| 欧美性猛交丰臀xxxxx网站| 男的操女的网站| 国产精品系列在线| 偷拍夫妻性生活| 成人av在线电影| 日本r级电影在线观看| 免费在线观看成人| 国产真实乱子伦| 亚洲美女色禁图| 大胆欧美熟妇xx| 亚洲色图网站| 中文字幕一区综合| 欧洲杯什么时候开赛| 欧美精品一区二区三区在线四季 | 免费观看国产视频在线| 欧美日韩黑人| 日韩精品一线二线三线| 久久综合影院| 久久人人九九| 色爱综合av| 久久国产一区| 日韩av字幕| 久久青青草综合| 婷婷综合电影| 欧美日韩国产免费一区二区三区| 国产精品久久久久久久久久白浆| 97超级碰碰| 日韩视频一区二区三区四区| 亚洲一区二区在线| 国产日韩欧美中文在线| 91理论片午午论夜理片久久| 欧美网站免费| 成人免费淫片视频软件| 欧洲美女精品免费观看视频| 成人精品视频一区二区三区 | av电影在线不卡| 国产欧美视频一区二区三区| 91中文字幕永久在线| 久久久精品人体av艺术| 伊人网在线视频观看| 国产视频在线观看一区二区三区 | 国产午夜一区| 少妇特黄a一区二区三区| 精品视频久久| 最新精品视频| 欧美午夜a级限制福利片| 男人的天堂avav| 一本色道久久| 可以免费在线看黄的网站| 另类成人小视频在线| 一级黄色片在线免费观看| 国产福利一区二区| 99久久人妻精品免费二区| 2017欧美狠狠色| a资源在线观看| 亚洲精品国产视频| 圆产精品久久久久久久久久久| 欧美日韩亚洲激情| 中文字幕资源网| 日韩午夜小视频| 色视频在线观看免费| 亚洲日本中文字幕| 国产秀色在线www免费观看| 九九九久久久久久| 三级在线看中文字幕完整版| 国产精品精品国产| 日韩成人视屏| 免费99视频| 五月开心六月丁香综合色啪 | 色欲一区二区三区精品a片| 一区二区三区在线观看动漫 | 青春草在线免费视频| 2024亚洲男人天堂| 欧洲美女精品免费观看视频| 国产精品永久入口久久久| 九九热爱视频精品视频| 视频一区二区视频| 亚洲一区久久| 91蝌蚪视频在线| 国产欧美一区二区精品性色超碰| www.超碰在线观看| 色天使久久综合网天天| 国产激情久久久久久熟女老人av| 国产视频在线观看一区二区| 男人添女人下部高潮视频在观看| 一区精品久久| 老司机久久精品| 韩国美女久久| 性xx色xx综合久久久xx| 亚洲人辣妹窥探嘘嘘| 成年人网站91| 国产又粗又硬又长又爽| 五月天中文字幕一区二区| 在线观看视频二区| 日韩麻豆第一页| 色综合999| 国产精品一区二区三区成人| 国产suv精品一区| 亚洲最新免费视频| 久久精品一区二区三区中文字幕 | 成人免费毛片高清视频| 成人黄色短视频| 色婷婷激情综合| 色窝窝无码一区二区三区| 久久成人精品视频| 久久久加勒比| 日韩中文字幕av在线| 国产欧美一区二区色老头| 国产精品19p| 亚洲美女免费在线| 国产又大又黄的视频| 一区二区三区天堂av| 黑人巨大精品| 久久天天狠狠| 精品人妻午夜一区二区三区四区| 天天天综合网| 亚洲美女激情视频| 1pondo在线播放免费| 日本久久久久久久久| 日韩高清在线免费观看| 国产精品www在线观看| 国产精品一区二区免费不卡| 日韩亚洲欧美中文字幕| 欧美午夜影院一区| 成人福利在线| 清纯唯美亚洲激情| 一级片在线免费观看视频| 亚洲国产高清高潮精品美女| 国产网红在线观看| 国产精品国产精品国产专区不卡| 欧美国产三级| 欧美一级大片免费看| 一区二区免费在线| 欧美熟妇另类久久久久久不卡 | 战狼4完整免费观看在线播放版| 日本韩国精品在线| 欧美色图17p| 精品一区二区成人精品| 久久精品综合视频| 欧美日韩一区二区精品| 日本大片在线观看| 国产成人精品在线观看| 欧美一区二区性| 久热在线视频观看| 亚洲美女少妇撒尿| 日韩永久免费视频| 91精品国产色综合| 国产不卡一二三区| 亚洲小视频网站| 一二三区精品视频| 天天干天天插天天操| 日本精品一区二区三区在线播放视频| 国产精选一区| 国产精品久久久久久9999| 一区二区三区在线视频免费| 涩涩视频免费看| 国产成人亚洲综合91精品| 97精品国产福利一区二区三区| 亚洲一区二区中文字幕在线观看| 亚洲最大的成人av| 亚洲欧美综合在线观看| 国产精品福利片| 亚洲欧美偷拍自拍| 国产高清自拍视频| 欧美精品在线观看一区二区| 久草在线视频网站| 视频一区视频二区视频三区高| 精品一区二区久久久| 日本熟妇色xxxxx日本免费看| 亚洲人成网7777777国产| 成人污版视频| 人妻少妇被粗大爽9797pw| 国产精品久久久久9999吃药| 日本黄色三级视频| 国产激情综合五月久久| 欧美日韩少妇| 精品无码在线观看| 亚洲精品一区二区三区福利| 粉嫩91精品久久久久久久99蜜桃 | 影音先锋在线播放| 欧美日韩国产三区| 国产白丝网站精品污在线入口| 性色av免费观看| 欧美日韩国产va另类| 色婷婷综合网| 在线免费观看a级片| 91精品在线一区二区|