據Engadget報道,馬里蘭大學的研究人員已能利用人眼反射重建出3D場景。該項工作建立在神經輻射場(NeRF)基礎上,該AI技術可從2D照片中重建環境。儘管在實際應用之前還有很長的路要走,但這項研究提供了迷人的一瞥,技術最終可以從一系列簡單的人像照片中重建環境。
使用單個傳感器拍攝的連續圖像,研究小組利用在人眼中捕捉到的微妙的光線反射,試圖分辨出人周邊的環境。他們首先從一個固定位置的相機拍攝幾張高分辨率的圖像,拍攝一個看向相機的移動的人,然後,放大反射,隔離並計算出照片中眼睛所看的位置。
結果顯示在受控環境中,從眼睛中獲得了可辨識的環境重建。使用合成眼睛捕捉到的場景產生了一個更令人印象深刻的夢幻般的場景。然而,試圖從賽勒斯(Miley Cyrus)和Lady Gaga的音樂視頻中模擬眼睛的反射,只產生了模糊的斑點,研究人員只能猜測是一個LED網格和一個三腳架上的相機,說明這項技術離現實世界的使用有多遠。
該團隊克服了很大的障礙,甚至重建出粗糙和模糊的場景。例如,角膜有「固有的噪音」,難以從人類複雜的虹膜紋理中分離出反射光。為了解決這個問題,他們在訓練中引入了角膜姿態優化(估計角膜的位置和方向)和虹膜紋理分解。最後,紋理正則化損失(機器學習技術,可模擬比源材料更平滑的紋理)有助於進一步隔離和增強反射的場景。
儘管取得進展並有了巧妙的變通方法,該技術仍然存在重大障礙。「我們目前取得的真實世界的結果是來自『實驗室設置』,例如放大一個人的臉,區域燈照亮場景,以及人的有意的運動。」作者寫道,由於傳感器分辨率較低、動態範圍和運動模糊,挑戰更多不受限制的設置仍然困難(如視頻會議)。 此外,該團體標識,關於虹膜紋理的普遍假設可能過於簡單,無法廣泛適用。不過,該團隊仍然認為他們的進展是一個里程碑,可以激勵未來的突破。本報訊