精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力

發布于 2024-11-13 16:20
瀏覽
0收藏

大家好,我是HxShine。

前段時間Google推出Gemini多模態大模型,展示了不凡的對話能力和多模態能力,其表現究竟如何呢?

本文對Gemini報告進行分析,總的來說Gemini模型在圖像、音頻、視頻和文本理解方面表現出卓越的能力。其包括 Ultra、Pro 和 Nano 尺寸,能夠適用于從復雜推理任務到設備內存受限用例的各種應用。

不像OpenAI接入多模態能力需要利用多個不同的模型,Google直接在預訓練階段直接接受多模態的輸入是Gemini的特點之一,它能夠直接處理多模態的數據,并且各項指標都還不錯。另外可以看出具備圖文理解等能力后,再結合大模型的對話能力,能夠帶來更驚艷的效果體驗。

一、概述

Title:Gemini: A Family of Highly Capable Multimodal Models

論文地址:https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf

1 Motivation

發布Google的能與GPT4競爭的大模型,同時兼具多模態能力,包括文字、圖像、視頻、音頻識別與理解能力。

2 Methods

1)Gemini模型支持4種格式輸入,2種格式輸出

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

特點:同時支持text文本,image圖像,video視頻和audio音頻輸入,支持文本和圖片的輸出。可以直接處理音頻文件,不需要將音頻轉為文字等。

猜測的訓練方法(張俊林:https://www.zhihu.com/question/633684692/answer/3316675674):

  • 多模態訓練方法:Gemini是幾種模態一起聯合從頭訓練的,包括文本、圖片、音頻、視頻等。這與目前通常的多模態做法不太一樣,目前的多模態模型一般是使用現成的語言大模型或者經過預訓練過的圖片模型(比如CLIP的圖片編碼部分),然后利用多模態訓練數據在此基礎上加上新的網絡層訓練;如果是幾個模態從頭開始一起訓練,那么按理說應該都遵循next token prediction的模式,就應該是LVM的那個路子,其它模態的數據打成token,然后圖片、視頻等平面數據先轉換成比如16*16=256個token,然后搞成一維線性輸入,讓模型預測next token,這樣就把不同模態在訓練階段統一起來。
  • 解碼結構:Decoder only的模型結構,針對結構和優化目標做了優化,優化目的是大規模訓練的時候的訓練和推理的穩定性,所以大結構應該是類似GPT的Decoder-only預測next token prediction的模式。目前支持32K上下文。
  • 命令理解方面:和GPT一樣,采用多模態instruct數據進行SFT+RM+RLHF三階段,這里的RM部分在訓練打分模型的時候,采用了加權的多目標優化,三個目標helpfulness factuality和 safety,猜測應該是對于某個prompt,模型生成的結果,按照三個指標各自給了一個排序結果。
  • 模型大小:從硬件描述部分來看,意思是動用了前所未有的TPU集群,所以推測Gemini Ultra的模型規模應該相當大,猜測如果是MOE大概要對標到GPT 4到1.8T的模型容量,如果是Dense模型估計要大于200B參數。考慮到引入視頻音頻(當然是來自于Youtube了,難道會來自TikTok么)多模態數據,所以總數據量*模型參數,會是非常巨大的算力要求,技術報告說可以一周或者兩周做一次訓練。
  • 訓練細節:可能分成多個階段,最后階段提高了領域數據的混合配比,猜測應該指的是邏輯和數學類的訓練數據增加了配比,目前貌似很多這么做的,對于提升模型邏輯能力有直接幫助。
  • 代碼能力:AlphaCode2是在Gemini pro基礎上,使用編程競賽的數據fine-tune出來的,效果提升很明顯,在編程競賽上排名超過85%的人類選手,之前的AlphaCode1超過50%的人類選手;

2)Gemini模型有多個版本,最小有1.8B

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

特點:其中Nano首先從大模型蒸餾,然后4bit量化。Gemini Nano包含兩個版本:1.8B面向低端手機,3.25B面向高端手機。

3 Conclusion

1)文本理解:Ultra性能超過了GPT4

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

  • Ultra比gpt4效果好,pro比gpt3.5效果好,MMNLU第一次超過人類專家水平。
  • Gemini Ultra 在六個不同數據集上都是最佳。Gemini Pro是Gemini系列中的第二大模型,效率更高的同時也頗具競爭力。

2)圖像理解:zero-shot效果超過很多微調后的模型

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

3)視頻理解:超過之前的few-shot SoTA模型

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

  • 也是取得了SoTA,特別是英語視頻字幕數據集(VATEXT、YouCook2)上提升比較大,其他感覺提升沒那么大。相關評估指標如下:視頻字幕 -> CIDER,NextQA -> WUPS,Perception Test -> top-1 accuracy,ActivityNet-QA -> ActivityNet-QA。

4)不同版Genmini模型的性能


Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

  • “事實性” :涵蓋開放/閉卷檢索和問題回答任務;
  • “長文本” :涵蓋長篇摘要、檢索和問題回答任務;
  • “數學/科學” :包括數學問題解決、定理證明和科學考試等任務;
  • “推理” :需要算術、科學和常識推理的任務;
  • “多語言” :用于多語言翻譯、摘要和推理的任務。

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

Nano2模型很多超過了Pro版本的50%,部分達到90的水平,效果還不錯。

5)多語種翻譯:性能超過GPT4

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

翻譯能力也是比GPT-4好,WMT23指標中4個有3個超過GPT4的表現。

6)圖像理解數據集:MMMU數據集表現

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

  • MMMU(Yue et al., 2023):是最近發布的評估基準,由6個學科的圖像問題組成,每個學科內有多個主題,需要大學水平的知識來解決這些問題。
  • Gemini Ultra將最先進的結果提高了 5 個百分點以上,6個學科中有5個學科中超越了之前的最佳成績,展示了其多模態推理能力。

二、詳細內容

1 多模態推理能力:識別手寫答案,對物理問題進行解答

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

特點:識別書寫結果,這個和OpenAI之前演示的根據草圖寫前端代碼是一樣的,不過識別的準確率是存疑的。

2 多模態推理能力:重新組織子圖順序

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

  • Gemini的多模態推理能力可生成用于重新排列子圖的matplotlib代碼。
  • Prompt:識別當前子圖的結果,重新組織子圖的順序并解釋。

解決此任務需要模型具備以下能力:

  • (1) 識別圖中描繪的函數;
  • (2) 逆向圖形來推斷生成子圖的代碼;
  • (3) 按照指令將子圖放置在所需的位置;
  • (4) 抽象推理,推斷指數圖必須留在原來的位置,因為正弦圖必須為 3 維圖移動。

3 圖像生成能力:多模態理解+圖像生成

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

要具備上面的功能需要以下能力:

  • (1)識別圖像中的顏色。這個難度不大。
  • (2)生成文字+圖片結果。這個難度好像也沒有那么大,可能有two-stage的實現方法或者end-to-end的實現方法。不太確定google用的哪種方法。

4 語音理解能力:具備語音識別和語音翻譯能力

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

對比的是OpenAI的Whisper,看著Gemini就是把多個SoTA模型包裝起來了。

5 多模態理解:支持圖片+音頻輸入

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

這個gptv+加個語音轉文字的模型可以做,這里的特點可能是直接用一個模型就可以解決?

三、多模態能力展示

1 幾何推理能力:求平行四邊形的高

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

2 視覺多模態推理能力:根據圖片確定地點

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

3 多語言常識推理:識別中文關系圖

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

4 視頻理解能力:分析視頻中的人如何提升足球技術

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

四、總結

  1. ?直接支持多模態的能力是Gemini的特點,Google從預訓練階段就統一了多模態大模型的訓練,該策略也可能是后續大模型的發展趨勢,但是其具體實現方法、帶來的增益、以及cost還未知。OpenAI多模態的能力是引入(支持語音)其他模型或者通過插件(支持圖像)來實現。

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

  1. Gemini的多模態能力比GPT4-V要強,科學推理能力可能稍微弱于GPT4。

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

  1. 圖文理解+視頻理解等多模態能力與最新的大模型強強組合確實能帶來驚艷的效果,但是其穩定性,是否真實能落地還有待進一步觀察。例如結合圖像信息求平行四邊行的高,在教育領域相對于純文本可能會更有價值,但是OCR等技術還面臨魯棒性偏差的問題,Google的模型段時間應該還是沒辦法解決這些問題。

Gemini技術報告解讀:從Google多模態大模型看后續大模型應該具備哪些能力-AI.x社區

本文轉載自 ??NLP PaperWeekly??,作者: NLP PaperWeekly



收藏
回復
舉報
回復
相關推薦
成人免费视频国产| 欧美性生交大片| 日韩经典一区| 国产精品久久久久桃色tv| 亚洲free性xxxx护士hd| 国产亚洲欧美精品久久久久久 | 三级av在线| 视频一区国产视频| 欧美精品免费在线| 欧美性xxxx图片| 六九午夜精品视频| 亚洲高清视频在线| 亚洲欧洲一区二区在线观看| 亚洲a视频在线观看| 久久亚洲美女| 久久99久国产精品黄毛片入口| 少妇真人直播免费视频| 日本一区二区三区电影免费观看| 欧美日韩在线免费| 精品国产一区二区三区在线| 男女污视频在线观看| 国产成人av福利| 国产精品日韩在线观看| 日本在线小视频| 99欧美视频| 亚洲欧美综合v| 精品人妻无码中文字幕18禁| 成人在线免费av| 欧美日韩中文字幕在线视频| 特级西西人体www高清大胆| 久久经典视频| www.日韩大片| 5g国产欧美日韩视频| 国产无遮挡又黄又爽又色视频| 1024精品一区二区三区| 久久精品国产一区二区电影| av电影网站在线观看| 老司机aⅴ在线精品导航| 欧美一区二区精美| av亚洲天堂网| jizz欧美| 在线国产亚洲欧美| 国产午夜福利视频在线观看| 97在线视频免费观看完整版| 一区二区三区在线免费视频| 影音先锋亚洲视频| 啊v视频在线| 国产亚洲欧美中文| 欧美精品v日韩精品v国产精品| 成人乱码一区二区三区 | 蜜桃视频在线观看视频| 99国产精品久| 精品亚洲第一| 亚洲日本中文字幕在线| yourporn久久国产精品| 国产98在线|日韩| www.污视频| 国产精品888| 99在线观看视频| 国产婷婷在线视频| 国产乱码字幕精品高清av| 91久久国产精品| 国产精品久久久久毛片| 国产一区二区三区香蕉| 3d动漫啪啪精品一区二区免费| 99久久久国产精品无码网爆| 国产一二三精品| 成人做爰www免费看视频网站| 91亚洲国产成人精品一区| 精品在线播放免费| 91精品久久久久久蜜桃| 男人天堂手机在线观看| 99精品在线免费| 欧美一二三四五区| 色视频在线免费观看| 亚洲色图在线播放| 欧美一级爱爱视频| 黄色激情在线播放| 色美美综合视频| 欧美三级午夜理伦三级富婆| 亚洲精品自拍| 欧美成人女星排行榜| av鲁丝一区鲁丝二区鲁丝三区| 日本成人a网站| 伊人久久免费视频| 欧美亚洲日本在线| 亚洲免费播放| 国产精品日本精品| 精品久久国产视频| 91免费版在线看| 自拍偷拍亚洲色图欧美| 精灵使的剑舞无删减版在线观看| 色婷婷国产精品久久包臀| 91 在线视频观看| 高清精品xnxxcom| 亚洲深夜福利视频| 国产这里有精品| 亚洲免费影院| 亚洲精品免费av| 偷拍25位美女撒尿视频在线观看| 日本一区二区三区国色天香 | 国产精品实拍| 疯狂欧美牲乱大交777| 五月天激情播播| 青青一区二区| 在线成人激情视频| 香蕉视频一区二区| 久久国产精品色婷婷| 国精产品一区二区| 美女羞羞视频在线观看| 欧美日韩国产中文精品字幕自在自线| 亚洲老女人av| 日韩极品在线| 久久91亚洲精品中文字幕奶水| 国产尤物在线视频| 精品一区二区三区免费| 欧美日韩高清免费| 黄色的视频在线观看| 欧美亚男人的天堂| 手机免费看av片| 亚洲国产日韩欧美在线| 国产精品91在线| 四虎永久在线观看| 伊人色综合久久天天| 日本a√在线观看| 日韩大胆成人| 久久人人97超碰精品888| 91福利免费视频| 国产欧美一区二区精品婷婷 | 久久精品欧美| 性欧美猛交videos| 欧美日韩国产片| www.黄色在线| 欧美一级播放| 久久久久国产精品视频| 久久国产精品黑丝| 日韩欧美在线影院| 亚洲精品卡一卡二| 精品写真视频在线观看| 亚洲欧美日韩国产yyy| av在线一区不卡| 亚洲欧洲激情在线| 日日摸天天添天天添破| 97精品久久久午夜一区二区三区 | 欧美日韩国产一级二级| 国产三级在线观看完整版| 久久亚洲综合| 秋霞在线观看一区二区三区| 亚洲美女久久精品| 日韩精品高清在线| 毛片基地在线观看| 91啪亚洲精品| 日本一本二本在线观看| 香蕉久久精品| 国产高清在线不卡| av网站在线免费播放| 在线看不卡av| 999精品久久久| 黑人精品欧美一区二区蜜桃 | 中文字字幕码一二三区| 国产一区二区三区久久| 免费久久99精品国产自| 日韩精品99| 中文字幕亚洲欧美一区二区三区| 一区精品在线观看| 一区在线播放视频| 善良的小姨在线| 国产一区二区中文| 精品国产乱码久久久久久108| 午夜影院一区| 在线成人中文字幕| 亚洲综合免费视频| 一区二区三区四区精品在线视频 | 无码粉嫩虎白一线天在线观看| 精品按摩偷拍| 国产精品69av| 国产欧美黑人| 亚洲精品国精品久久99热| 国产精品久久久久久人| 国产精品美日韩| 久久综合桃花网| 中文高清一区| 亚洲欧美久久234| 日本在线一区二区三区| 欧美亚洲日本网站| 日本欧美在线视频免费观看| 欧美一区二区成人6969| 国产无套丰满白嫩对白| 国产精品美女久久久久aⅴ国产馆 国产精品美女久久久久av爽李琼 国产精品美女久久久久高潮 | 国产无遮挡免费视频| 久久日韩精品一区二区五区| 国产精品入口免费软件| 欧美96在线丨欧| 久久精品日韩| 色诱色偷偷久久综合| 久久久久久91香蕉国产| 国产乱视频在线观看| 欧美一区二区久久久| 国产日产精品一区二区三区| 亚洲欧美激情视频在线观看一区二区三区| 国产人妻精品午夜福利免费| 久久三级福利| www成人免费| 清纯唯美日韩| 久久精品日产第一区二区三区| 9999在线精品视频| 秋霞成人午夜鲁丝一区二区三区| 国产精品扒开做爽爽爽的视频| 亚洲午夜精品在线观看| 99热这里只有精品在线| 午夜av一区二区三区| 调教驯服丰满美艳麻麻在线视频| 高清不卡在线观看| 中文字幕成人在线视频| 亚洲一级在线| 日韩a级黄色片| 欧美在线观看视频一区| 99久久99久久精品国产片| 99riav视频一区二区| 5252色成人免费视频| 在线观看a级片| 在线精品国产成人综合| 亚洲av成人无码网天堂| 日韩欧美第一区| 91精品国产乱码久久久久| 欧美性猛交xxxx富婆| 日韩美女视频网站| 亚洲欧美国产三级| 日本人亚洲人jjzzjjz| xnxx国产精品| 精品一区二区视频在线观看 | 中文字幕在线视频一区二区| 肉丝袜脚交视频一区二区| 91九色丨porny丨国产jk| 亚洲最大黄网| 亚洲乱码一区二区三区三上悠亚| 免费一区二区三区视频导航| 久久久av水蜜桃| 国产毛片精品| 国产精品国产精品国产专区蜜臀ah | 亚洲男帅同性gay1069| 日韩精品一区二区三区在线视频| 久久精品在线观看| 亚洲 小说 欧美 激情 另类| 久久亚洲二区三区| 9.1成人看片| 91亚洲资源网| 中文精品在线观看| 99视频有精品| 亚洲熟妇一区二区三区| 99riav一区二区三区| 狠狠人妻久久久久久综合蜜桃| 成人h动漫精品一区二区| 污污免费在线观看| 北条麻妃国产九九精品视频| 国产精品果冻传媒| 成人18视频日本| 无码成人精品区在线观看| 成人av在线影院| 在线 丝袜 欧美 日韩 制服| 国产亚洲一区二区三区| 欧美一区二区三区粗大| 国产精品欧美极品| 婷婷激情四射网| 一区二区久久久久| 国产午夜视频在线播放| 精品国产电影一区| 少妇久久久久久久| 欧美精品久久天天躁| 999av视频| 精品久久久久久综合日本欧美 | 国产91精品在线观看| 亚洲激情 欧美| 91麻豆福利精品推荐| 免费网站在线高清观看| 国产精品欧美一区喷水| 无码人妻精品一区二区三区夜夜嗨| 人人超在线公开视频| 国产亚洲综合久久| 调教视频免费在线观看| 欧美久久精品一级黑人c片 | 精品国产一区探花在线观看| 超碰成人在线免费观看| 国产综合精品| 国产精品亚洲αv天堂无码| 九一九一国产精品| 娇妻高潮浓精白浆xxⅹ| 久久精品一区二区三区不卡| 天天色影综合网| 亚洲大型综合色站| 中国一区二区视频| 日韩欧美一级片| 能在线看的av| 美日韩丰满少妇在线观看| 日韩激情电影免费看| 国产剧情日韩欧美| 国产精品毛片av| 亚洲精品影院| 在线观看的日韩av| 日本黄大片一区二区三区| 成人白浆超碰人人人人| 香蕉成人在线视频| 亚洲超碰精品一区二区| 中文字幕在线观看国产| 亚洲精品在线观看视频| www.av在线播放| 97精品伊人久久久大香线蕉| 日本久久二区| 欧美精品一区二区三区在线四季| 伊人久久大香线蕉综合四虎小说| 久久精品99国产| 国产成人免费视频一区| www.黄色在线| 亚洲国产一区二区三区a毛片 | 欧美一区二区三区免费观看视频| 香蕉久久国产av一区二区| 久久精品国产欧美亚洲人人爽| av电影一区| 国产精品区一区二区三含羞草| 日韩免费特黄一二三区| 久色视频在线播放| 激情综合色综合久久| 亚洲色成人网站www永久四虎| 亚洲伊人色欲综合网| 一级特黄aaa大片在线观看| 亚洲视频视频在线| 国产粉嫩在线观看| 亚洲综合一区二区不卡| 欧美gay男男猛男无套| 青青草原av在线播放| 不卡视频一二三四| 日韩一区二区三区四区在线| 欧美三级电影在线看| 猫咪在线永久网站| 18久久久久久| 激情av综合| 亚洲精品蜜桃久久久久久| 国产一区二区三区免费在线观看| 性猛交娇小69hd| 一本大道久久精品懂色aⅴ| 手机在线观看毛片| 久久久在线视频| 日韩精品一区二区三区中文在线| 在线观看日本一区| 精品亚洲成a人| 日本少妇aaa| 69精品人人人人| 国产在线69| 亚洲一区二区三区四区视频| 婷婷久久一区| 99999精品| 亚洲精品成a人| www.蜜臀av.com| xvideos成人免费中文版| 91成人福利社区| 中文字幕一区二区三区5566| 久久av资源网| 欧美h片在线观看| 日韩一级二级三级精品视频| 伊人在我在线看导航| 国产精品av一区| 日韩亚洲国产欧美| 中文乱码人妻一区二区三区视频| 精品国产乱码久久久久久天美| 天堂国产一区二区三区| 欧美亚洲国产视频| 欧美精品久久久久久| 午夜免费看毛片| 亚洲乱码国产乱码精品精可以看 | 国产视频综合在线| 91av亚洲| 亚洲综合五月天| 国产老妇另类xxxxx| 精品一区免费观看| 亚洲精品视频免费| 巨大黑人极品videos精品| 中文字幕日韩精品久久| 国产精品一区一区三区| 国产一级在线观看视频| 亚洲精品乱码久久久久久按摩观| 日韩欧美另类一区二区| 制服丝袜综合日韩欧美| 国产精品亚洲人在线观看| 五月婷婷中文字幕| 丝袜美腿精品国产二区| 8x国产一区二区三区精品推荐| jizzjizzxxxx| 亚洲欧洲日韩av| 高h震动喷水双性1v1| 国产成人啪精品视频免费网| 91精品动漫在线观看| 手机在线成人av| 欧美性大战久久久久久久| 中文字幕伦理免费在线视频| 久久综合福利| 国产一区二区女| 精品人妻一区二区色欲产成人| 超碰97人人做人人爱少妇| 日韩高清电影免费| 国内av一区二区|