ChatGPT實時視頻通話功能全量開放,AI終于睜開了"眼睛"
"ChatGPT又崩了……"
"期末論文怎么辦?"
"工作報告還沒寫完啊!"

這是昨天ChatGPT宕機(jī)4小時時,推特上此起彼伏的哀嚎。而就在24小時后,當(dāng)我第一次通過攝像頭與ChatGPT"面對面"時,這種感覺,說實話,有點奇妙。
Openai給我們帶來了一個重磅更新 - ChatGPT的實時視頻通話功能全量開放了。
這個功能最讓人驚嘆的地方在于它的實時視覺理解能力。ChatGPT不僅能看到你,還能實時理解你的一舉一動。
比如,你在鏡頭前展示一道數(shù)學(xué)題,它能立即指出解題思路;你展示一盆觀葉植物,它能識別出植物品種并給出養(yǎng)護(hù)建議;你演示一個瑜伽動作,它能及時糾正你的姿勢要領(lǐng)。這種實時互動的體驗,就像有一位無所不知的導(dǎo)師在身邊,隨時準(zhǔn)備解答你的疑惑。
在OpenAI的演示中,產(chǎn)品負(fù)責(zé)人Kevin讓ChatGPT跟團(tuán)隊成員一一打招呼。每個人介紹完后,ChatGPT都能很自然地回應(yīng),還能說出"ChatGPT多模態(tài)團(tuán)隊的工程師?很有趣的工作"、"看起來你們在做一些很棒的項目"這樣情商在線的話。

更神奇的是,ChatGPT還有"記憶力"。當(dāng)Kevin突然問它"剛才那個人是誰",ChatGPT不僅能準(zhǔn)確說出名字,還記得對方說過的每一句話。它能準(zhǔn)確回答。就像AI第一次有了跟人類一樣的眼睛,能看見、能理解、能記住。

還有在咖啡制作的演示中,ChatGPT不僅能看懂每個步驟,還會提醒"先用熱水沖洗濾紙去除紙味",建議"讓咖啡粉充分浸泡30秒釋放氣體",甚至?xí)f"你的水流有點快,建議放慢速度保證充分萃取"這樣專業(yè)的建議。

這次更新的意義,遠(yuǎn)不止是加入了一個視頻通話功能那么簡單。在此之前,我們跟AI的交流主要依賴文字。即使是圖像理解,也是通過上傳靜態(tài)圖片的方式。但現(xiàn)在,AI可以實時看到我們的動作、表情,甚至能理解環(huán)境中的變化。這讓AI更接近于真實的人類交互體驗。

在教育領(lǐng)域,這個功能的潛力尤其令人期待。
老師可以實時展示教具,AI能即時理解并給出講解建議;學(xué)生做實驗時,AI能實時觀察并指出操作中的問題;在線教育可以變得更加互動,AI能根據(jù)學(xué)生的實時反應(yīng)調(diào)整教學(xué)節(jié)奏。比如他們演示了一個現(xiàn)場教人做咖啡的場景,AI不僅能看懂每個步驟,還能及時糾正錯誤動作,給出專業(yè)建議。
我們已經(jīng)看到了未來AI助手的模樣——不再局限于文字框里的對話,而是能真正"走進(jìn)"我們的生活,看見我們的世界。這不僅是技術(shù)的進(jìn)步,更是人機(jī)交互范式的革新。當(dāng)AI能實時看到、理解我們的行為時,它就真正開始融入我們的日常生活。
就像電影《Her》中描繪的場景正在一步步成為現(xiàn)實。AI不再是冰冷的代碼,而是能看見你、理解你,甚至能記住你的一個更智能的助手。這或許就是AI時代最迷人的地方——科技在不斷突破我們的想象,讓未來的圖景變得越來越清晰。而這一切,才剛剛開始。
而且這次的更新還藏著一個應(yīng)景的彩蛋——Santa Mode。只需點擊屏幕上的雪花圖標(biāo),ChatGPT就會用圣誕老人溫暖歡快的聲音跟你對話。這個暖心的小功能將持續(xù)到整個12月。

不僅如此,這次更新還帶來了實時屏幕共享功能。你可以直接向ChatGPT展示你的屏幕內(nèi)容,讓它幫你分析文檔、審閱代碼,甚至幫你回復(fù)消息。在演示中,有人向ChatGPT展示了一條關(guān)于"想當(dāng)商場圣誕老人"的要求,AI立刻給出了一個既幽默又得體的回復(fù)建議。

使用這個功能非常簡單:打開ChatGPT,點擊輸入框右下角的語音模按鈕,然后你會看到左下角新增了一個視頻圖標(biāo)。點擊它,就能開啟視頻通話或屏幕共享。


目前,這項功能正在分批向用戶開放。團(tuán)隊版用戶和大部分Plus、Pro訂閱用戶將在一周內(nèi)陸續(xù)獲得訪問權(quán)限。歐洲地區(qū)的用戶可能需要稍等片刻獲得這項功能。
為了慶祝這次更新,OpenAI還特意在首次使用時重置了所有用戶的語音模式使用限制,讓每個人都能完整體驗這個改變?nèi)藱C(jī)交互方式的重大突破。
本文轉(zhuǎn)載自 ??AI進(jìn)修生??,作者: Aitrainee

















