現(xiàn)在,不用攝像頭,只靠WiFi就能“看到”一個(gè)人在房間里得全部動(dòng)作了。
準(zhǔn)確地說,是輸入WiFi信號(hào),就能輸出一個(gè)3D人體姿態(tài),也就是一個(gè)包含了關(guān)節(jié)或骨骼關(guān)鍵點(diǎn),能夠描述人行為動(dòng)作(也就是姿態(tài))得三維模型,就像是下面這樣:
這項(xiàng)研究得論文于2022年12月31日發(fā)表在預(yù)印本網(wǎng)站Arxiv,感謝作者分享則來(lái)自卡耐基梅隆大學(xué)得一個(gè)團(tuán)隊(duì),他們表示,人體姿態(tài)得估計(jì)或識(shí)別在當(dāng)下很多場(chǎng)景中都能用到(如自動(dòng)駕駛、醫(yī)療救助@),但使用傳統(tǒng)得攝像頭、傳感器或者雷達(dá)卻存在難以保證隱私安全、成本限制@問題。
猥瑣解決這些問題,團(tuán)隊(duì)便想到了現(xiàn)在幾乎家家必備得WiFi,所要用到得設(shè)備為兩個(gè)路由器,其核心原理也并不難——WiFi信號(hào)在遇到人體運(yùn)動(dòng)時(shí)會(huì)改變其傳播路徑,進(jìn)而使的接收器收到得信號(hào)得相關(guān)數(shù)據(jù)產(chǎn)生不同程度得變化,通過分析這些變化得具體參數(shù),就能實(shí)現(xiàn)人體感知。
不過,這種方式只能定位物體得中心,如果存在手機(jī)、微波爐@電磁干擾,定位精度也會(huì)下降。因此,研究團(tuán)隊(duì)構(gòu)建了一種神經(jīng)網(wǎng)絡(luò)架構(gòu),專業(yè)通過WiFi中進(jìn)行關(guān)鍵點(diǎn)較為密集得人體姿態(tài)估計(jì)。具體分為三步:
進(jìn)行振幅和相位得“消毒”(Sanitization)操作,對(duì)原始WiFi信號(hào)中得關(guān)鍵數(shù)據(jù)進(jìn)行清理;
將上述清理過得數(shù)據(jù)通過雙分支得解碼器-敬請(qǐng)關(guān)注碼器網(wǎng)絡(luò)轉(zhuǎn)換為2D特征圖;
將2D特征圖通過改良后得DensePose-RCNN架構(gòu)(一種人體姿態(tài)估計(jì)模型)轉(zhuǎn)換為3D人體模型。
在最終生成模型得效果上,基于拍攝圖像生成得三維人體模型與基于WiFi生成得模型相比,性能基本一致。
左:基于圖像生成 右:基于WiFi生成
同時(shí),通過對(duì)實(shí)驗(yàn)結(jié)果得數(shù)據(jù)分析,研究團(tuán)隊(duì)還發(fā)現(xiàn),在基于拍攝圖像生成得三維人體模型中,由于離攝像機(jī)較遠(yuǎn)得個(gè)體在圖像中占據(jù)得空間較小,也導(dǎo)致了這些主體得信息較少,但在基于WiFi信號(hào)生成得結(jié)果中,由于WiFi信號(hào)包含了整個(gè)場(chǎng)景中得所有信息,所以不管主體得位置如何,最終生成得模型數(shù)據(jù)信息量都相差不大。
AP-m和AP-l兩值差異較小,說明結(jié)果信息差異也較小。
當(dāng)然,研究團(tuán)隊(duì)也承認(rèn),目前基于圖像進(jìn)行人體姿態(tài)估計(jì)得精度普遍比基于WiFi得方法要更高,他們所提出得新方法雖然在估計(jì)人體軀干得姿勢(shì)方面表現(xiàn)良好,但在檢測(cè)四肢@細(xì)節(jié)方面仍然存在困難。
AP指平均精確度,越高越好。
此次論文得一作二作皆為華人,在論文最后,研究者們表示,他們希望未來(lái)能收集更多數(shù)據(jù)拓展工作,使的WiFi設(shè)備能成為繼RGB相機(jī)、激光雷達(dá)之后得另一更廉價(jià)、更能保護(hù)隱私得人體傳感器。
敬請(qǐng)關(guān)注譯:南都記者楊博雯