百家乐官网 (中国)有限公司官网

澎湃Logo
下载客户端

登录

  • +1
    8

eLight·封面 | 基于物理模擬的顛覆性視覺增強(qiáng)算法

2023-03-11 16:57
吉林
来源:澎湃新聞·澎湃號·湃客
字号

撰稿 | 郭宸孜、蔡淼

| 導(dǎo)讀 |

今日,美國工程院院士、加州大學(xué)洛杉磯分校講席教授Bahram Jalali提出了一種基于物理模擬的顛覆性視覺增強(qiáng)技術(shù),并將其命名為“基于虛擬衍射和相干探測的視覺增強(qiáng)算法(簡稱為VEViD)”。該算法將數(shù)字圖像“隱喻”為一個空間變化的“離散化光場”,將其映射至衍射和相干探測的虛擬物理過程,以輸出的相位而非強(qiáng)度代表圖像。VEViD在低光照下展現(xiàn)了超強(qiáng)、超快的圖像增強(qiáng)能力,極優(yōu)的色彩增強(qiáng)能力,以及絕佳的輔助目標(biāo)探測能力,對低光照條件下的成像及檢測技術(shù)發(fā)展,具有重大意義。

該受邀文章發(fā)表于卓越計(jì)劃高起點(diǎn)新刊eLight,題為“VEViD: Vision Enhancement via Virtual diffraction and coherent Detection”。作者為Bahram Jalali院士和Callen MacPhee博士,其中,Jalali院士擔(dān)任一作兼通信。

圖1: eLight封面

▍研究背景

低光照圖像增強(qiáng)對于我們的生活和科學(xué)研究具有重大意義。最直觀的是,它能使手機(jī)、相機(jī)夜拍更清晰,使目標(biāo)識別更容易,使自動駕駛更安全;而在生物體成像中,諸多場景需要低光照以降低光毒性,但信息缺失的低光照圖像給后續(xù)研究帶來了極大困難。

此前的低光照圖像增強(qiáng)技術(shù)主要依賴于經(jīng)驗(yàn)主義或是神經(jīng)網(wǎng)絡(luò)訓(xùn)練形成的算法,但目前尚缺乏能夠精確反映人眼感知能力的定量損失函數(shù),因此,過往的技術(shù)最終受限于缺乏參考數(shù)據(jù),可解釋性差,難以迅速高效增強(qiáng)。

▍研究亮點(diǎn)

據(jù)此,Jalali院士提出了一種全新的圖像增強(qiáng)范式,該范式將衍射和相干檢測的物理過程作為算法的一部分,來執(zhí)行計(jì)算成像任務(wù),構(gòu)成了一種圖像增強(qiáng)工具。在研究中,研究團(tuán)隊(duì)將數(shù)字圖像重新理解為空間變化的虛擬“光場”,然后將該場置于虛擬衍射和相干檢測的物理過程中。在該過程中,光場被像素化和離散化,并且傳播與頻率相關(guān)的相位,并將數(shù)字圖像的R-G-B三個通道理解為該虛擬光場的時(shí)頻波段。最終由輸出的相位,而不是強(qiáng)度來代表輸出的圖像,進(jìn)行編碼優(yōu)化。研究團(tuán)隊(duì)將該算法命名為“基于虛擬衍射和相干探測的視覺增強(qiáng)算法(VEViD)”,其算法的物理解釋和流程參見圖2-圖3:

圖2:VEViD算法的物理解釋,展示了該算法在空間域(中間行)和光譜域(底行)中的影響。在空間域中,圖像的實(shí)部幾乎沒有變化,而虛部在衍射后產(chǎn)生

圖3:VEViD算法流程

研究團(tuán)隊(duì)將VEViD算法應(yīng)用于多種低光照圖像,取得了絕佳的圖像增強(qiáng)效果(圖4),其效果優(yōu)于Zero-DCE算法(現(xiàn)今性能最佳的神經(jīng)網(wǎng)絡(luò)圖像增強(qiáng)算法),且VEViD的優(yōu)化速度要更快的多。進(jìn)一步,團(tuán)隊(duì)演示了VEViD在顏色增強(qiáng)中的應(yīng)用(圖5)。

圖4:VEViD將6張黑暗圖像(第一、第三欄),增強(qiáng)為清晰、細(xì)節(jié)豐富的圖像(第二、第四欄)

圖5:使用VEViD算法進(jìn)行色彩增強(qiáng)

與此同時(shí),團(tuán)隊(duì)展示了簡化加速版的VEViD算法,可以對4K高清視頻實(shí)現(xiàn)200幀/秒的圖像增強(qiáng)。此外,VEViD算法還可疊加于現(xiàn)有的基于深度學(xué)習(xí)算法的目標(biāo)探測中,大幅提升其探測能力(見圖6-圖7)。最后,Jalali院士提到,將來,該算法可以植入模擬物理器件中,幫助快速高效的計(jì)算。

圖6:VEViD預(yù)處理對目標(biāo)檢測的影響(左側(cè):未采用VEViD;右側(cè):采用VEViD)

圖7:左圖為YOLO神經(jīng)網(wǎng)絡(luò)處理后圖像,右圖為真實(shí)場景,中圖為VEViD預(yù)處理后的圖像;可看出,VEViD揭示的隱藏細(xì)節(jié)與真實(shí)場景更加匹配

綜合來看,該算法速度極快,可解釋性高,并可以最終轉(zhuǎn)化為一個簡單、直觀的數(shù)學(xué)表達(dá)式,為手機(jī)、相機(jī)成像,自動駕駛,生物醫(yī)學(xué)成像等領(lǐng)域提供強(qiáng)大的圖像增強(qiáng)工具,尤其對于實(shí)時(shí)性要求很高的圖像增強(qiáng)領(lǐng)域(如自動駕駛),具有極其重要的價(jià)值。此外,極快的運(yùn)算時(shí)間使得該算法可以作為各類深度學(xué)習(xí)圖像處理算法的預(yù)處理算法,具有廣闊的研究價(jià)值與應(yīng)用空間。

文章發(fā)表后,完整代碼將于Github公開,以便研究人員及產(chǎn)業(yè)人員迅速跟進(jìn)。

▍后記:靈感來源與思考

在該項(xiàng)研究的審稿和編輯討論過程中,Jalali院士和編輯、審稿人討論了該文的靈感來源。

Jalali院士認(rèn)為,人類很早就開始利用物理設(shè)備模擬預(yù)測天體的位置和炮彈的軌跡。在計(jì)算機(jī)出現(xiàn)后,絕大部分模擬計(jì)算任務(wù)都由計(jì)算機(jī)來完成。然而,電子計(jì)算機(jī)對功耗和處理速度的要求,使得利用物理過程來實(shí)現(xiàn)更快、更高效的模擬映射仍然具有極高的研究與應(yīng)用價(jià)值。此前,已有科學(xué)家利用超快非線性光學(xué)作為模擬計(jì)算機(jī)來探測復(fù)雜現(xiàn)象(如異常波)。因此,將合適的物理光學(xué)過程作為模擬計(jì)算機(jī),來實(shí)現(xiàn)不同領(lǐng)域的任務(wù),無疑具有極高的價(jià)值與應(yīng)用前景。本研究就是基于該思路,通過模擬衍射和相干探測,來實(shí)現(xiàn)低光照下的數(shù)字圖像增強(qiáng)。

| 論文信息 |

Jalali, B., MacPhee, C. VEViD: Vision Enhancement via Virtual diffraction and coherent Detection. eLight 2, 24 (2022). 

https://doi.org/10.1186/s43593-022-00034-y

閱讀原文

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    8
    收藏
    我要举报
    评论(0)
    发表
    已经到底了
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2025 上海东方报业有限公司

            反馈
            百家乐加牌规则| 环球百家乐官网的玩法技巧和规则| 澳门百家乐官网奥秘| 新全讯网网站112| 百家乐娱乐网站| 大发888游戏场下载| 富易堂百家乐娱乐城| 百家乐官网真人游戏娱乐场| 顶尖百家乐官网学习| 香港六合彩开码| 百家乐节目视频| 宁海县| 扑克王百家乐的玩法技巧和规则| 大发888分享| 百家乐注码投注论坛| 百家乐官网永利赌场娱乐网规则| 亚洲皇冠| 大发888娱乐城下栽| 星河百家乐官网的玩法技巧和规则| 百家乐官网怎样概率大| 百家乐游戏唯一官网站| 易球百家乐官网娱乐城| 娱乐城开户彩金| 大发888网页版官网| 百家乐翻天在线观看| 豪门百家乐的玩法技巧和规则| 3U百家乐娱乐城| 百家乐有没有绝| 百家乐赔率技巧| 百家乐官网娱乐平台网| 嬴澳门百家乐官网的公式| 和政县| 太阳城申博| 水果老虎机的程序| 百家乐小路是怎么画的| 百家乐打印机分析| 百家乐看单技术| 百家乐开户送百元| 金沙百家乐现金网| 评测百家乐博彩网站| 百家乐平台网|