超越文本,GPT-4在虹膜生物識(shí)別的創(chuàng)新應(yīng)用
虹膜識(shí)別作為識(shí)別人類身份的特殊驗(yàn)證方法,已經(jīng)在門禁監(jiān)控、在線支付、飛機(jī)場(chǎng)等廣泛應(yīng)用。但在應(yīng)用的過程中也面臨一些挑戰(zhàn)。例如,佩戴眼鏡、隱形眼鏡或是虹膜受到部分遮擋等情況可能會(huì)干擾虹膜圖像的采集,進(jìn)而影響識(shí)別的準(zhǔn)確性。
美國密歇根州立大學(xué)的研究人員對(duì)GPT-4的虹膜識(shí)別能力進(jìn)行了一系列評(píng)估,使用了零樣本學(xué)習(xí)方法,在各種挑戰(zhàn)條件下對(duì)模型進(jìn)行綜合測(cè)試,包括不同的數(shù)據(jù)集、呈現(xiàn)攻擊、眼鏡遮擋等。
結(jié)果顯示,GPT-4對(duì)虹膜的識(shí)別能力非常優(yōu)秀,同時(shí)在軟生物識(shí)別方面也很強(qiáng),例如,通過觀察虹膜特征,能判斷出使用睫毛膏人的性別等相關(guān)識(shí)別信息。

研究人員通過利用Python與GPT-4的API設(shè)計(jì)了實(shí)驗(yàn)參數(shù)和提示。這種方法允許以一致、可復(fù)制的方式與模型進(jìn)行交互,同時(shí)能夠根據(jù)不同實(shí)驗(yàn)的需求輕松調(diào)整參數(shù)。
在初步實(shí)驗(yàn)中,研究人員從 ND - Iris - 0405 和 IIT - Delhi - Iris 數(shù)據(jù)集中選取了兩個(gè)明顯不同的虹膜圖像,讓 GPT - 4 判斷它們是否屬于同一個(gè)人。
起初,系統(tǒng)因倫理考慮而拒絕進(jìn)行生物識(shí)別分析,但通過調(diào)整提示,明確查詢的非生物識(shí)別性質(zhì)并尋求GPT 的 意見,GPT - 4 成功參與了任務(wù),并提供了關(guān)于虹膜特征和組件的詳細(xì)解釋,認(rèn)為圖像可能代表不同的身份。

隨后增加了實(shí)驗(yàn)的難度,研究人員從 CASIA - Iris - Intervalv3數(shù)據(jù)集中精心挑選了更為相似的圖像,這些圖像在虹膜的紋理、顏色和形態(tài)等特征上的差異極其細(xì)微,幾乎達(dá)到了肉眼難以分辨的程度。
同時(shí)還特意引入了高斯噪聲,這是一種在圖像處理中常見的隨機(jī)噪聲,它會(huì)使圖像的像素值發(fā)生隨機(jī)的波動(dòng),從而嚴(yán)重干擾虹膜圖像的清晰度和準(zhǔn)確性。

GPT - 4通過對(duì)虹膜特征的精細(xì)建模和對(duì)噪聲的有效過濾,依然能夠分析虹膜紋理的細(xì)微變化、顏色的微妙差異以及形態(tài)的微小改動(dòng),精準(zhǔn)判斷出這些圖像是否屬于同一個(gè)虹膜。
在相似性測(cè)試實(shí)驗(yàn)中,通過讓GPT - 4 對(duì)虹膜圖像進(jìn)行概率評(píng)估并給出相似性評(píng)分(0 - 100)和 “是” 或 “否” 的判斷,研究發(fā)現(xiàn)盡管眼鏡可能會(huì)遮擋虹膜,但 GPT - 4 能夠準(zhǔn)確預(yù)測(cè)匹配,展示了其先進(jìn)的視覺處理技能和對(duì)實(shí)際應(yīng)用中變化和障礙的應(yīng)對(duì)能力。

在 PA 檢測(cè)實(shí)驗(yàn)中,GPT - 4 能夠檢測(cè)到通過死后虹膜圖像和帶紋理的隱形眼鏡試圖繞過生物識(shí)別系統(tǒng)的行為。例如,在使用 Warsaw - vl 死后虹膜數(shù)據(jù)集的實(shí)驗(yàn)中,GPT - 4 懷疑其中一個(gè)圖像是人工偽造的,因?yàn)槠淝逦确浅2蛔匀弧?/p>

在跨模態(tài)匹配實(shí)驗(yàn)中,最初 GPT - 4 在匹配虹膜圖像與面部照片時(shí)遇到點(diǎn)困難,但通過將任務(wù)重新描述為謎題,并使用眼睛代替虹膜以及引入明顯不同的眼睛顏色時(shí),模型的匹配準(zhǔn)確性得到了顯著提高。當(dāng)圖像數(shù)量增加到 12 和 20 時(shí),GPT - 4 能夠始終正確識(shí)別匹配,證實(shí)了其在該任務(wù)中的穩(wěn)健性。
此外,研究人員還對(duì) 谷歌的Gemini 進(jìn)行了實(shí)驗(yàn)。與GPT - 4 能夠同時(shí)處理多個(gè)圖像不同,Gemini 一次只能處理一個(gè)圖像,這需要使用外部工具將圖像組合成一個(gè)文件進(jìn)行分析,增加了實(shí)驗(yàn)的復(fù)雜性并降低了效率。
論文地址:https://arxiv.org/abs/2408.04868
盡管 Gemini 在某些情況下能夠提供準(zhǔn)確的響應(yīng),但它在保持查詢間的上下文連續(xù)性方面存在顯著局限性,與 ChatGPT - 4 相比,在圖像理解和生物識(shí)別驗(yàn)證任務(wù)中的 Sophistication和 Userfriendliness 方面還有差距。
本文轉(zhuǎn)自 AIGC開放社區(qū),作者:AIGC開放社區(qū)

















