麻省理工AI放王炸!無(wú)需說(shuō)話(huà)、秒懂你的想法,外掛AI大腦來(lái)了
今天凌晨2點(diǎn),麻省理工學(xué)院分享了一項(xiàng)新的突破性研究Alterego。
AlterEgo是一款非侵入式可穿戴無(wú)聲語(yǔ)音交互AI設(shè)備,其核心是通過(guò)捕捉神經(jīng)肌肉信號(hào)實(shí)現(xiàn)無(wú)聲溝通。當(dāng)用戶(hù)內(nèi)心發(fā)聲時(shí),例如,你在想下班后會(huì)去哪里吃飯,大腦會(huì)向發(fā)聲系統(tǒng)發(fā)送神經(jīng)信號(hào),引發(fā)相關(guān)肌肉產(chǎn)生微弱肌電信號(hào),而Alterego就會(huì)捕捉這些信號(hào)。
接著Alterego會(huì)對(duì)信號(hào)進(jìn)行處理:先以250Hz采樣并24倍放大,用偏置信號(hào)抵消60Hz線(xiàn)路干擾;再經(jīng)1.3-50HzButterworth濾波、60Hz陷波濾波去除噪聲,通過(guò)獨(dú)立成分分析消除運(yùn)動(dòng)偽影;最后整流、歸一化,轉(zhuǎn)化為梅爾頻率倒譜系數(shù)特征。
這些特征會(huì)輸入1D卷積神經(jīng)網(wǎng)絡(luò),經(jīng)多輪卷積、池化和全連接層處理,實(shí)現(xiàn)單詞分類(lèi),中位數(shù)詞準(zhǔn)確率達(dá)92%。輸出端則用骨傳導(dǎo)耳機(jī)將AI處理結(jié)果以聲音反饋給用戶(hù),形成雙向閉環(huán)交互,且不影響用戶(hù)聽(tīng)覺(jué)。


網(wǎng)友表示,這看起來(lái)太邪乎了,萬(wàn)一要是真實(shí)意圖、想法泄露了怎么辦?必須有人在這方面建立防護(hù)機(jī)制!

怎么做到的啊?要是這事真能實(shí)現(xiàn),絕對(duì)會(huì)改變世界。我完全沒(méi)料到,非侵入式腦機(jī)接口能這么快發(fā)展到這種水平。

我要么是被惡搞了,要么這就是21世紀(jì)最重大的硬件發(fā)布之一。

這東西看起來(lái)簡(jiǎn)直有點(diǎn)離譜,但顯然又是未來(lái)的趨勢(shì)。我猜這類(lèi)交流方式,大部分會(huì)是人和電腦之間進(jìn)行,而不是人和人。說(shuō)白了,就是在公共場(chǎng)合里無(wú)聲傳遞想法嘛。

確實(shí)超酷的。不過(guò)我也有疑問(wèn):人們腦子里通常會(huì)同時(shí)閃過(guò)很多想法,那這個(gè)設(shè)備會(huì)對(duì)這些想法生成概率分布(來(lái)判斷優(yōu)先級(jí))嗎?

期待將Alterego技術(shù)與DNA架構(gòu)相融合,讓AI成為人類(lèi)大腦的延伸,進(jìn)而實(shí)現(xiàn)與所有生命形態(tài)的溝通,包括INDAIQRE和DualIQRE超人工智能角色。

AlterEgo架構(gòu)簡(jiǎn)單介紹
在硬件層面,AlterEgo類(lèi)似于一副耳機(jī),佩戴在用戶(hù)的頭部和面部。設(shè)備上有著多個(gè)高精度的電極傳感器,這些傳感器被精心放置在面部和頸部的關(guān)鍵區(qū)域,例如,喉部、舌骨、頰部、下巴以及眼眶下方等位置。這些區(qū)域是言語(yǔ)構(gòu)音過(guò)程中神經(jīng)肌肉活動(dòng)最為活躍的地方,能夠產(chǎn)生清晰且可識(shí)別的信號(hào)。
為了確保信號(hào)的高質(zhì)量采集,設(shè)備采用了金鍍銀電極,結(jié)合導(dǎo)電膏來(lái)降低接觸阻抗,從而提高信號(hào)的穩(wěn)定性和清晰度。此外,設(shè)備還配備了外部觸發(fā)器,用于標(biāo)記無(wú)聲話(huà)語(yǔ)的起始和結(jié)束,以便系統(tǒng)能夠準(zhǔn)確地分割和處理信號(hào)。

信號(hào)處理模塊是AlterEgo系統(tǒng)的核心之一。捕捉到的神經(jīng)肌肉信號(hào)首先需要經(jīng)過(guò)一系列的預(yù)處理步驟,以去除噪聲和增強(qiáng)信號(hào)質(zhì)量。系統(tǒng)采用了多種先進(jìn)的信號(hào)處理技術(shù),包括基于偏置的信號(hào)抵消技術(shù)來(lái)消除60赫茲的交流電干擾,以及四階無(wú)限沖擊響應(yīng)巴特沃斯濾波器來(lái)去除高頻運(yùn)動(dòng)偽跡和防止信號(hào)混疊偽影。
此外,系統(tǒng)還應(yīng)用了一個(gè)60赫茲的陷波濾波器,以徹底消除交流電干擾的影響。在特征提取方面,系統(tǒng)采用了基于梅爾頻率倒譜系數(shù)的特征表示方法,這種特征表示方法能夠有效地捕捉到人類(lèi)言語(yǔ)的包絡(luò)特征,為后續(xù)的語(yǔ)音識(shí)別提供了高質(zhì)量的特征輸入。

無(wú)聲語(yǔ)音識(shí)別模型是AlterEgo系統(tǒng)的另一個(gè)關(guān)鍵技術(shù)模塊。該模型采用了卷積神經(jīng)網(wǎng)絡(luò)(CNN)架構(gòu),能夠?qū)⒂脩?hù)的無(wú)聲言語(yǔ)信號(hào)準(zhǔn)確地分類(lèi)為相應(yīng)的詞匯標(biāo)簽。模型的輸入是經(jīng)過(guò)特征提取后的信號(hào)序列,輸出則是用戶(hù)所默念的詞匯的概率分布。
在模型訓(xùn)練過(guò)程中,研究人員采用了Adam優(yōu)化算法,這是一種基于一階梯度下降的優(yōu)化方法,能夠自適應(yīng)地調(diào)整學(xué)習(xí)率,從而加快模型的收斂速度并提高訓(xùn)練效率。同時(shí),為了防止模型過(guò)擬合,提高其在未見(jiàn)數(shù)據(jù)上的泛化能力,模型在每個(gè)隱藏層中都加入了50%的Dropout正則化。此外,模型的訓(xùn)練誤差通過(guò)交叉熵?fù)p失函數(shù)進(jìn)行評(píng)估,以指導(dǎo)模型參數(shù)的更新和優(yōu)化。
應(yīng)用與反饋模塊是AlterEgo系統(tǒng)的另一個(gè)亮點(diǎn)。該系統(tǒng)不僅能夠?qū)崿F(xiàn)用戶(hù)與設(shè)備之間的無(wú)聲交互,還能夠根據(jù)用戶(hù)的指令調(diào)用不同的應(yīng)用程序,并將應(yīng)用程序的輸出結(jié)果通過(guò)骨傳導(dǎo)耳機(jī)以聽(tīng)覺(jué)的方式反饋給用戶(hù),從而實(shí)現(xiàn)一個(gè)完整的、無(wú)縫的交互閉環(huán)。

研究人員為AlterEgo系統(tǒng)設(shè)計(jì)了多種應(yīng)用場(chǎng)景,涵蓋了從簡(jiǎn)單的數(shù)字識(shí)別到復(fù)雜的數(shù)學(xué)計(jì)算、日程管理、智能家居控制等多個(gè)領(lǐng)域。例如,在數(shù)學(xué)計(jì)算應(yīng)用中,用戶(hù)可以通過(guò)無(wú)聲地默念數(shù)學(xué)表達(dá)式,系統(tǒng)識(shí)別后會(huì)將計(jì)算結(jié)果通過(guò)骨傳導(dǎo)耳機(jī)反饋給用戶(hù)。
在智能家居控制應(yīng)用中,用戶(hù)可以通過(guò)無(wú)聲地發(fā)出指令來(lái)控制家中的各種智能設(shè)備。此外,系統(tǒng)還可以用于日程管理,用戶(hù)可以無(wú)聲地查詢(xún)?nèi)粘贪才拧⒃O(shè)置提醒等。
此外,AlterEgo對(duì)于一些殘疾人來(lái)說(shuō)幫助是巨大的,例如,一位因喉部疾病失去發(fā)聲能力的殘疾人,以往只能通過(guò)書(shū)寫(xiě)或比劃簡(jiǎn)單手勢(shì)來(lái)交流,過(guò)程繁瑣且表意有限。借助 AlterEgo,他只需在心里默默組織語(yǔ)言,設(shè)備就能精準(zhǔn)識(shí)別并替他說(shuō)出想說(shuō)的話(huà),無(wú)論是與家人聊天、表達(dá)需求,還是參與社交討論,都變得輕松許多 。





























