- +1
液晶與顯示|改進(jìn)的YOLOv5s太陽能電池片缺陷檢測(cè)算法
▎導(dǎo) 讀
太陽能作為一種可再生能源,具有儲(chǔ)量大、永久性、清潔無污染、可再生、就地取材等特點(diǎn),在推動(dòng)新能源領(lǐng)域特別是光伏行業(yè)的發(fā)展方面,成為了世界各國(guó)的共識(shí)。因此,快速、準(zhǔn)確地檢測(cè)太陽能電池片缺陷成為了保障太陽能電池片生產(chǎn)質(zhì)量和提高能源利用率的重要問題。
近日,福州大學(xué)、閩都創(chuàng)新實(shí)驗(yàn)室林志賢教授團(tuán)隊(duì)在《液晶與顯示》(ESCI、Scopus收錄、中文核心期刊)2024年第2期發(fā)表了題為“改進(jìn)的YOLOv5s太陽能電池片缺陷檢測(cè)算法”的研究文章,并被選作當(dāng)期封面文章。該文章基于YOLOv5s網(wǎng)絡(luò)對(duì)太陽能電池片進(jìn)行小目標(biāo)缺陷信息的提取和訓(xùn)練,實(shí)現(xiàn)了對(duì)太陽能電池片小目標(biāo)缺陷的檢測(cè)。
圖1:《液晶與顯示》2024年第2期封面圖
▎主干網(wǎng)絡(luò)的改進(jìn)
YOLOv5s在小目標(biāo)檢測(cè)方面存在效率低下的問題,主要原因是其過大的下采樣倍數(shù)以及一些池化操作導(dǎo)致高層次特征圖的分辨率過低。這導(dǎo)致在高層次特征圖上僅有極少像素用于表示具有劃痕和損壞等小缺陷的電池片,從而影響了模型的檢測(cè)能力。
針對(duì)上述問題,引入了上下文轉(zhuǎn)換模塊(Contextual Transformer block,CoT)(如圖2所示)。引入上下文編碼和動(dòng)態(tài)多頭注意力機(jī)制的CoT模塊,可以有效地收集相鄰像素之間的豐富上下文信息,進(jìn)而提升了對(duì)小缺陷的檢測(cè)精度。相比傳統(tǒng)的C3模塊,CoT模塊能夠更細(xì)致地感知和利用局部鄰域鍵之間的靜態(tài)上下文信息,使模型能夠更準(zhǔn)確地定位和分類劃痕和損壞等類型的小缺陷。
圖2:上下文轉(zhuǎn)換模塊
圖源:液晶與顯示, 2024, 39(2): 237-247. Fig.1
▎CBAM注意力機(jī)制
在進(jìn)行太陽能電池片缺陷檢測(cè)時(shí)往往會(huì)受到光照、污染物、溫度變化等因素的影響,造成識(shí)別率低和誤報(bào)率高的問題。為了提高檢測(cè)的準(zhǔn)確性并降低干擾,本文將卷積注意力模塊 (Convolutional Block Attention Module,CBAM)引入到Head部分,以增強(qiáng)模型的特征表達(dá)能力。CBAM(如圖3所示)是一種將通道注意力(如圖4所示)與空間注意力(如圖5所示)有機(jī)結(jié)合的技術(shù),它可以有效地提升注意力的效率,從而實(shí)現(xiàn)更高效的學(xué)習(xí)。
圖3:卷積注意力模塊
圖源:液晶與顯示, 2024, 39(2): 237-247. Fig.3
圖4:通道注意力模塊
圖源:液晶與顯示, 2024, 39(2): 237-247. Fig.4
圖5:空間注意力模塊
圖源:液晶與顯示, 2024, 39(2): 237-247. Fig.5
▎上采樣方式的改進(jìn)
YOLOv5s在其特征融合網(wǎng)絡(luò)中使用了最近鄰插值來進(jìn)行上采樣。然而,這種簡(jiǎn)單的方式僅僅根據(jù)像素點(diǎn)的位置來確定上采樣核,未充分利用特征圖中的豐富語義信息。通過引入了CARAFE這一輕量級(jí)通用上采樣算子,具體示意圖見圖6。CARAFE算子主要包括兩個(gè)部分:上采樣核預(yù)測(cè)模塊和特征重組模塊。上采樣核預(yù)測(cè)模塊分析編碼輸入特征圖,以推斷不同位置的特征點(diǎn)所需的上采樣核。特征重組模塊充分利用了上采樣核預(yù)測(cè)模塊生成的上采樣核,實(shí)現(xiàn)高效的上采樣操作。相對(duì)于最近鄰插值上采樣,CARAFE算子在目標(biāo)檢測(cè)任務(wù)中顯示出更好的性能,并在太陽能電池片缺陷檢測(cè)方面具有明顯優(yōu)勢(shì)。通過利用語義信息和周圍特征點(diǎn)的影響,CARAFE算子在上采樣過程中能夠?qū)崿F(xiàn)更精確的特征重建,從而提高上采樣后特征圖的質(zhì)量和表達(dá)能力。
圖6:CARAFE模塊結(jié)構(gòu)
圖源:液晶與顯示, 2024,39(2):237-247. Fig.6
▎損失函數(shù)的改進(jìn)
在太陽能電池片缺陷檢測(cè)任務(wù)中,YOLOv5s的損失函數(shù)包含三個(gè)部分,分別是分類損失、置信度損失和回歸損失。傳統(tǒng)的完整交并比(Complete Intersection over Union,CIoU)損失函數(shù)僅考慮了重疊區(qū)域的大小,未充分考慮邊界框的位置和形狀信息。然而,邊界框的位置和形狀信息對(duì)于太陽能電池片缺陷檢測(cè)是至關(guān)重要的。它們能夠準(zhǔn)確描述缺陷的位置和形狀,并評(píng)估缺陷的嚴(yán)重程度。為了解決這一問題,采用了一種改進(jìn)的損失函數(shù),即加權(quán)交并比(Weighted Intersection over Union,WIoU)損失函數(shù)。WIoU損失函數(shù)在計(jì)算邊界框之間的重疊度時(shí),考慮了邊界框的尺寸和位置信息,不僅關(guān)注重疊區(qū)域的大小,還考慮了邊界框的相對(duì)位置和形狀。這使得WIoU對(duì)邊界框的完整性更加敏感,能夠更準(zhǔn)確地衡量預(yù)測(cè)框和真實(shí)框之間的匹配程度。
▎改進(jìn)之后的網(wǎng)絡(luò)模型
基于以上描述,改進(jìn)之后的YOLOv5s網(wǎng)絡(luò)結(jié)構(gòu)如圖7所示。
圖7:改進(jìn)的YOLOv5s網(wǎng)絡(luò)結(jié)構(gòu)圖
圖源:液晶與顯示, 2024, 39(2): 237-247. Fig.7
▎實(shí)驗(yàn)結(jié)果分析
總之,本研究提出的改進(jìn)版YOLOv5s算法具有最佳的檢測(cè)精度和顯著的整體表現(xiàn),從而論證了該算法的優(yōu)勢(shì)。為了更直觀地評(píng)估改進(jìn)效果,在圖8中對(duì)比了改進(jìn)前后的檢測(cè)結(jié)果。在圖8(a)中的第二張圖中,原始的YOLOv5s算法誤將原始標(biāo)注為“scratch”的區(qū)域識(shí)別為“broken”,導(dǎo)致誤檢現(xiàn)象的存在。而在圖8(a)的第四張圖中,原始的YOLOv5s算法在最初標(biāo)注為三個(gè)“scratch”的情況下,僅檢測(cè)到了其中兩個(gè)。通過觀察圖8(c),可以清晰地看到,改進(jìn)后的YOLOv5s算法不再存在漏檢和誤檢的問題。在PV-Multi-Defect數(shù)據(jù)集檢測(cè)任務(wù)中,本研究對(duì)YOLOv5s算法進(jìn)行了改進(jìn),有效解決了原算法的漏檢和誤檢問題,同時(shí)顯著提高了對(duì)太陽能電池片表面缺陷的平均識(shí)別精度。這些結(jié)果表明,改進(jìn)版YOLOv5s算法在太陽能電池片缺陷檢測(cè)領(lǐng)域具有極大的潛力和實(shí)際應(yīng)用價(jià)值。
圖8:改進(jìn)前后檢測(cè)效果對(duì)比。(a)原圖;(b)YOLOv5s檢測(cè)效果圖;(c)改進(jìn)后的YOLOv5s檢測(cè)效果圖
圖源:液晶與顯示, 2024, 39(2): 237-247. Fig.10
▎總結(jié)與展望
太陽能電池片在生產(chǎn)過程中難免會(huì)出現(xiàn)缺陷,這些缺陷在不同程度上影響太陽能電池片的壽命和發(fā)光效率,故太陽能電池片在生產(chǎn)過程中要進(jìn)行缺陷檢測(cè)。該文以此作為切入點(diǎn),基于YOLOv5s算法,在主干部分引入CoT模塊,以增強(qiáng)特征的表達(dá)能力和感受野范圍,從而更準(zhǔn)確地捕捉太陽能電池片缺陷的細(xì)節(jié)和上下文信息。其次,將CBAM注意力加入到Head部分的C3模塊之后,能夠更好地捕捉輸入特征圖的重要通道和空間位置,提高模型的性能和魯棒性。接著,使用輕量級(jí)的通用上采樣算子CARAFE,減少上采樣過程中特征信息的損失,保證了特征信息的完整性。最后,使用WIoU作為邊界框損失函數(shù),可以大幅提升回歸的準(zhǔn)確性,并且有助于快速實(shí)現(xiàn)模型的收斂。實(shí)驗(yàn)結(jié)果表明,改進(jìn)后的模型在太陽能電池片缺陷檢測(cè)任務(wù)上表現(xiàn)出很高的性能提升,為太陽能電池片缺陷檢測(cè)提供了一種可靠且高效的解決方案。
▎論文信息
彭雪玲,林珊玲,林志賢,郭太良.改進(jìn)的YOLOv5s太陽能電池片缺陷檢測(cè)算法[J]. 液晶與顯示, 2024,39(2):237-247.
https://cjlcd.lightpublishing.cn/thesisDetails#10.37188/CJLCD.2023-0249
▎通訊作者簡(jiǎn)介
林珊玲,博士,碩士研究生導(dǎo)師,2020年于福州大學(xué)獲得博士學(xué)位,主要從事顯示驅(qū)動(dòng)、圖像處理等方面的研究。
E-mail: sllin@fzu.edu.cn
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問http://renzheng.thepaper.cn。
- 澎湃新聞微博
- 澎湃新聞公眾號(hào)
- 澎湃新聞抖音號(hào)
- IP SHANGHAI
- SIXTH TONE
- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司