eLight·封面 | 基于物理模擬的顛覆性視覺增強(qiáng)算法

中国光学

关注

2023-03-11 16:57

吉林

来源：澎湃新聞·澎湃號·湃客

撰稿 | 郭宸孜、蔡淼

| 導(dǎo)讀 |

今日，美國工程院院士、加州大學(xué)洛杉磯分校講席教授Bahram Jalali提出了一種基于物理模擬的顛覆性視覺增強(qiáng)技術(shù)，并將其命名為“基于虛擬衍射和相干探測的視覺增強(qiáng)算法（簡稱為VEViD）”。該算法將數(shù)字圖像“隱喻”為一個空間變化的“離散化光場”，將其映射至衍射和相干探測的虛擬物理過程，以輸出的相位而非強(qiáng)度代表圖像。VEViD在低光照下展現(xiàn)了超強(qiáng)、超快的圖像增強(qiáng)能力，極優(yōu)的色彩增強(qiáng)能力，以及絕佳的輔助目標(biāo)探測能力，對低光照條件下的成像及檢測技術(shù)發(fā)展，具有重大意義。

該受邀文章發(fā)表于卓越計(jì)劃高起點(diǎn)新刊eLight，題為“VEViD: Vision Enhancement via Virtual diffraction and coherent Detection”。作者為Bahram Jalali院士和Callen MacPhee博士，其中，Jalali院士擔(dān)任一作兼通信。

圖1： eLight封面

▍研究背景

低光照圖像增強(qiáng)對于我們的生活和科學(xué)研究具有重大意義。最直觀的是，它能使手機(jī)、相機(jī)夜拍更清晰，使目標(biāo)識別更容易，使自動駕駛更安全；而在生物體成像中，諸多場景需要低光照以降低光毒性，但信息缺失的低光照圖像給后續(xù)研究帶來了極大困難。

此前的低光照圖像增強(qiáng)技術(shù)主要依賴于經(jīng)驗(yàn)主義或是神經(jīng)網(wǎng)絡(luò)訓(xùn)練形成的算法，但目前尚缺乏能夠精確反映人眼感知能力的定量損失函數(shù)，因此，過往的技術(shù)最終受限于缺乏參考數(shù)據(jù)，可解釋性差，難以迅速高效增強(qiáng)。

▍研究亮點(diǎn)

據(jù)此，Jalali院士提出了一種全新的圖像增強(qiáng)范式，該范式將衍射和相干檢測的物理過程作為算法的一部分，來執(zhí)行計(jì)算成像任務(wù)，構(gòu)成了一種圖像增強(qiáng)工具。在研究中，研究團(tuán)隊(duì)將數(shù)字圖像重新理解為空間變化的虛擬“光場”，然后將該場置于虛擬衍射和相干檢測的物理過程中。在該過程中，光場被像素化和離散化，并且傳播與頻率相關(guān)的相位，并將數(shù)字圖像的R-G-B三個通道理解為該虛擬光場的時(shí)頻波段。最終由輸出的相位，而不是強(qiáng)度來代表輸出的圖像，進(jìn)行編碼優(yōu)化。研究團(tuán)隊(duì)將該算法命名為“基于虛擬衍射和相干探測的視覺增強(qiáng)算法（VEViD）”，其算法的物理解釋和流程參見圖2-圖3：

圖2：VEViD算法的物理解釋，展示了該算法在空間域（中間行）和光譜域（底行）中的影響。在空間域中，圖像的實(shí)部幾乎沒有變化，而虛部在衍射后產(chǎn)生

圖3：VEViD算法流程

研究團(tuán)隊(duì)將VEViD算法應(yīng)用于多種低光照圖像，取得了絕佳的圖像增強(qiáng)效果（圖4），其效果優(yōu)于Zero-DCE算法（現(xiàn)今性能最佳的神經(jīng)網(wǎng)絡(luò)圖像增強(qiáng)算法），且VEViD的優(yōu)化速度要更快的多。進(jìn)一步，團(tuán)隊(duì)演示了VEViD在顏色增強(qiáng)中的應(yīng)用（圖5）。

圖4：VEViD將6張黑暗圖像（第一、第三欄），增強(qiáng)為清晰、細(xì)節(jié)豐富的圖像（第二、第四欄）

圖5：使用VEViD算法進(jìn)行色彩增強(qiáng)

與此同時(shí)，團(tuán)隊(duì)展示了簡化加速版的VEViD算法，可以對4K高清視頻實(shí)現(xiàn)200幀/秒的圖像增強(qiáng)。此外，VEViD算法還可疊加于現(xiàn)有的基于深度學(xué)習(xí)算法的目標(biāo)探測中，大幅提升其探測能力（見圖6-圖7）。最后，Jalali院士提到，將來，該算法可以植入模擬物理器件中，幫助快速高效的計(jì)算。

圖6：VEViD預(yù)處理對目標(biāo)檢測的影響（左側(cè)：未采用VEViD；右側(cè)：采用VEViD）

圖7：左圖為YOLO神經(jīng)網(wǎng)絡(luò)處理后圖像，右圖為真實(shí)場景，中圖為VEViD預(yù)處理后的圖像；可看出，VEViD揭示的隱藏細(xì)節(jié)與真實(shí)場景更加匹配

綜合來看，該算法速度極快，可解釋性高，并可以最終轉(zhuǎn)化為一個簡單、直觀的數(shù)學(xué)表達(dá)式，為手機(jī)、相機(jī)成像，自動駕駛，生物醫(yī)學(xué)成像等領(lǐng)域提供強(qiáng)大的圖像增強(qiáng)工具，尤其對于實(shí)時(shí)性要求很高的圖像增強(qiáng)領(lǐng)域（如自動駕駛），具有極其重要的價(jià)值。此外，極快的運(yùn)算時(shí)間使得該算法可以作為各類深度學(xué)習(xí)圖像處理算法的預(yù)處理算法，具有廣闊的研究價(jià)值與應(yīng)用空間。

文章發(fā)表后，完整代碼將于Github公開，以便研究人員及產(chǎn)業(yè)人員迅速跟進(jìn)。

▍后記：靈感來源與思考

在該項(xiàng)研究的審稿和編輯討論過程中，Jalali院士和編輯、審稿人討論了該文的靈感來源。

Jalali院士認(rèn)為，人類很早就開始利用物理設(shè)備模擬預(yù)測天體的位置和炮彈的軌跡。在計(jì)算機(jī)出現(xiàn)后，絕大部分模擬計(jì)算任務(wù)都由計(jì)算機(jī)來完成。然而，電子計(jì)算機(jī)對功耗和處理速度的要求，使得利用物理過程來實(shí)現(xiàn)更快、更高效的模擬映射仍然具有極高的研究與應(yīng)用價(jià)值。此前，已有科學(xué)家利用超快非線性光學(xué)作為模擬計(jì)算機(jī)來探測復(fù)雜現(xiàn)象（如異常波）。因此，將合適的物理光學(xué)過程作為模擬計(jì)算機(jī)，來實(shí)現(xiàn)不同領(lǐng)域的任務(wù)，無疑具有極高的價(jià)值與應(yīng)用前景。本研究就是基于該思路，通過模擬衍射和相干探測，來實(shí)現(xiàn)低光照下的數(shù)字圖像增強(qiáng)。

| 論文信息 |

Jalali, B., MacPhee, C. VEViD: Vision Enhancement via Virtual diffraction and coherent Detection. eLight 2, 24 (2022).

https://doi.org/10.1186/s43593-022-00034-y

閱讀原文

特别声明

本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

我要举报