• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種多模態頻域交叉圖像融合方法技術

    技術編號:45274134 閱讀:3 留言:0更新日期:2025-05-13 19:13
    本發明專利技術提供一種多模態頻域交叉圖像融合方法,涉及圖像融合技術領域。該方法包括:S1、構建多模態圖像融合網絡;其中,所述多模態圖像融合網絡包括:編碼器網絡、跨模態交叉融合網絡以及解碼器;多模態圖像融合網絡的執行步驟包括:使用編碼器網絡對輸入的各個模態圖像提取不同頻域特征;使用跨模態交叉融合網絡通過跨層連接與交叉連接的方式實現不同模態圖像各個頻域特征的融合;將融合后的特征輸入解碼器,對融合特征進行解碼,輸出融合圖片;S2、利用多模態圖像對構建的多模態圖像融合網絡進行訓練,輸出包含各個模態圖像特征的融合圖片。采用本發明專利技術,能夠提高多模態圖像的融合效果,使得融合結果具有更清晰的細節以及更豐富的信息。

    【技術實現步驟摘要】

    本專利技術涉及圖像融合,特別是指一種多模態頻域交叉圖像融合方法


    技術介紹

    1、在現代多傳感器系統中,紅外圖像與可見光圖像的融合技術正迅速發展,成為許多應用中的關鍵工具。這種技術通過結合不同光譜范圍內獲取的信息來提高整體感知能力,不僅增強圖像的細節和特征,而且擴展了應用的可能性,尤其在目標檢測、監控、導航和輔助駕駛等領域具有重要的應用價值。紅外成像設備通過捕捉熱輻射,能夠在低光照或夜間條件下探測物體,但通常存在分辨率較低和對比度不足的問題,可見光成像則依賴于環境的光線,通過反射光獲取物體的結構和顏色信息,其圖像分辨率高,細節豐富,但在低光照或復雜環境條件下圖像效果會顯著下降。紅外圖像和可見光圖像的融合圖像結合了兩者的優點,提高了系統的整體性能,融合結果在對目標識別能力、環境適應性和可靠性等場景下均表現出明顯優勢。

    2、紅外與可見光圖像的融合方法主要分為三種類別。其中,圖像級別融合直接對兩種圖像進行像素級合成,通過變換和重建等手段來生成融合圖像,方法簡單直觀,但可能會引入不同來源的數據噪聲和失真;特征級別融合則通過提取兩種圖像的特征,融合特征信息后再進行決策,能夠在信息壓縮和特征增強方面效果顯著,但也需要解決特征提取的復雜性問題;決策級別融合則基于高層次信息將來自不同傳感器的決策結果進行融合,從而提高判斷的準確性,通常用于僅關心最終決策結果的應用場景。隨著人工智能和深度學習技術的日益成熟,紅外與可見光圖像融合技術的未來可能會越來越依賴于數據驅動的智能模型。通過大量的訓練數據和復雜的網絡結構,深度學習方法有可能顯著提升圖像融合的自動化水平和融合效果。與此同時,如何有效處理和解釋多模態感知信息,以及在實時應用中提供高效的融合算法,仍然是我們將要面臨的重要挑戰。


    技術實現思路

    1、本專利技術實施例提供了一種多模態頻域交叉圖像融合方法,能夠提高多模態圖像的融合效果,使得融合結果具有更清晰的細節以及更豐富的信息。所述技術方案如下:

    2、本專利技術實施例提供了一種多模態頻域交叉圖像融合方法,包括:

    3、s1、構建多模態圖像融合網絡;其中,所述多模態圖像融合網絡包括:編碼器網絡、跨模態交叉融合網絡以及解碼器;多模態圖像融合網絡的執行步驟包括:

    4、使用編碼器網絡對輸入的各個模態圖像提取不同頻域特征;

    5、使用跨模態交叉融合網絡通過跨層連接與交叉連接的方式實現不同模態圖像各個頻域特征的融合;

    6、將融合后的特征輸入解碼器,對融合特征進行解碼,輸出融合圖片;

    7、s2、利用多模態圖像對構建的多模態圖像融合網絡進行訓練,輸出包含各個模態圖像特征的融合圖片。

    8、進一步地,所述編碼器網絡包括:共享特征編碼器、基礎轉換網絡編碼器以及細節卷積神經網絡編碼器;

    9、模態圖像包括:紅外圖像與可見光圖像;

    10、所述使用編碼器網絡對輸入的各個模態圖像提取不同頻域特征包括:

    11、通過共享特征編碼器實現跨模態淺層特征提取,獲得紅外圖像與可見光圖像淺層特征其中,分別表示紅外圖像與可見光圖像的淺層特征;

    12、對淺層特征采用基礎轉換網絡編碼器進一步提取特征,獲得低頻基礎特征其中,分別表示紅外圖像與可見光圖像的低頻基礎特征;

    13、對淺層特征采用細節卷積神經網絡編碼器進一步提取特征,獲得高頻細節特征其中,分別表示紅外圖像與可見光圖像的高頻細節特征。

    14、進一步地,所述共享特征編碼器包括:2個基于恢復轉換器塊的轉換器層;

    15、每個共享特征編碼器都由2個基于恢復轉換器塊的轉換器層堆疊而成,兩個共享特征編碼器之間的參數相互獨立;

    16、共享特征編碼器的公式表示為:

    17、

    18、其中,s(·)表示共享特征編碼器提取特征的過程,{i,v}分別表示輸入的成對紅外圖像與可見光圖像。

    19、進一步地,所述基礎轉換網絡編碼器包括一個基于輕量化轉換器的轉換網絡模塊,用于從淺層特征中提取低頻基礎特征;

    20、每個轉換網絡模塊包括:2個norm層、1個基礎attention層和1個mlp層;其中,norm為歸一化,attention為注意力,mlp為多層感知機;

    21、基礎轉換網絡編碼器的公式表示為:

    22、norm(attention(norm(mlp(·))))=b(·)

    23、

    24、其中,b(·)表示基礎轉換網絡編碼器提取特征的過程。

    25、進一步地,所述細節卷積神經網絡編碼器包括3個inn,用于從淺層特征中提取高頻細節特征;其中,inn為可逆神經網絡;

    26、在每一次可逆神經網絡的處理過程中,變換過程為:

    27、

    28、其中,⊙表示哈達瑪積運算,表示第k個可逆層輸入特征中的第1到第c個通道,k=1,2,...,k,k表示可逆層處理數,c表示輸入特征通道數,cat(·)是通道連接操作,ii是任意映射函數,i=1,...,3,i表示不同的映射函數標識,在可逆神經網絡重復處理3遍后,輸出細節卷積神經網絡編碼器特征提取結果,即高頻細節特征;

    29、整個細節卷積神經網絡編碼器的公式表示為:

    30、

    31、其中,d(·)表示細節卷積神經網絡編碼器提取特征的過程。

    32、進一步地,跨模態交叉融合網絡包含高頻與低頻分支和通道注意力模塊,用于融合編碼器提取到的頻域特征;其中,每個高頻和低頻分支都由3個代表不同深度的層特征提取模塊組成;

    33、層特征提取模塊的層特征提取過程表示為:

    34、lfc(θb′)=θb″,lfc(θb′,θb″)=θb″′,

    35、lfc(θd′)=θd″,lfc(θd′,θd″)=θd″′

    36、其中,分別表示紅外圖像與可見光圖像的低頻基礎特征,分別表示紅外圖像與可見光圖像的高頻細節特征,lfc(·)代表層特征提取,用于提取不同層級的高低頻特征,根據處理次數的多少可以產生由淺到深的不同階段特征;{θb′,θb″,θb″′}表示低頻各階段特征;{θd′,θd″,θd″′}表示高頻各階段特征。

    37、進一步地,所述使用跨模態交叉融合網絡通過跨層連接與交叉連接的方式實現不同模態圖像各個頻域特征的融合包括:

    38、對得到的不同模態圖像的頻域特征,利用層特征提取模塊提取由淺到深的不同階段特征;

    39、在對階段特征處理的過程中,采用跨層連接的方式,鏈接不同層級特征,將淺層特征向各個深層特征進行傳遞;

    40、基于處理不同頻域特征信息要求,完成頻域特征融合,采用交叉連接的方式,通過提取初級特征{fb,fd}并與跨層處理結果相互鏈接,得到經過異頻域特征修飾的異模態同頻融合特征{θb,θd};其中,跨層連接和交叉連接的過程表示為:

    41、

    42、lfc(θb′,θb″,θb″′,fd)=本文檔來自技高網...

    【技術保護點】

    1.一種多模態頻域交叉圖像融合方法,其特征在于,所述方法包括:

    2.根據權利要求1所述的多模態頻域交叉圖像融合方法,其特征在于,所述編碼器網絡包括:共享特征編碼器、基礎轉換網絡編碼器以及細節卷積神經網絡編碼器;

    3.根據權利要求2所述的多模態頻域交叉圖像融合方法,其特征在于,所述共享特征編碼器包括:2個基于恢復轉換器塊的轉換器層;

    4.根據權利要求3所述的多模態頻域交叉圖像融合方法,其特征在于,所述基礎轉換網絡編碼器包括一個基于輕量化轉換器的轉換網絡模塊,用于從淺層特征中提取低頻基礎特征;

    5.根據權利要求4所述的多模態頻域交叉圖像融合方法,其特征在于,所述細節卷積神經網絡編碼器包括3個INN,用于從淺層特征中提取高頻細節特征;其中,INN為可逆神經網絡;

    6.根據權利要求1所述的多模態頻域交叉圖像融合方法,其特征在于,跨模態交叉融合網絡包含高頻與低頻分支和通道注意力模塊,用于融合編碼器提取到的頻域特征;其中,每個高頻和低頻分支都由3個代表不同深度的層特征提取模塊組成;

    7.根據權利要求6所述的多模態頻域交叉圖像融合方法,其特征在于,所述使用跨模態交叉融合網絡通過跨層連接與交叉連接的方式實現不同模態圖像各個頻域特征的融合包括:

    8.根據權利要求1所述的多模態頻域交叉圖像融合方法,其特征在于,在訓練過程添加混合梯度損失,所述混合梯度損失由表面層與梯度層組合而成,確保多模態圖像融合網絡訓練過程能夠學習到更完整的融合梯度信息。

    9.根據權利要求8所述的多模態頻域交叉圖像融合方法,其特征在于,所述混合梯度損失將可見光圖像轉換為Lab色彩空間,提取L亮度通道作為可見光處理通道;將可見光圖像L亮度通道與紅外圖像通道進行混合處理Mix(·),產生表面層損失結果同時使用sobel算子實現可見光圖像L亮度通道與紅外圖像通道的梯度提取,將提取得到的梯度圖進行梯度混合處理MixGrad(·),產生梯度層損失結果將獲得的表面層損失結果與梯度層損失結果按權重進行求和,得到最終的混合梯度損失LossMixed_Grad,表示為:

    10.一種計算機可讀取存儲介質,其特征在于,所述計算機可讀取存儲介質中存儲有程序代碼,所述程序代碼可被處理器調用執行如權利要求1至9任一項所述的方法。

    ...

    【技術特征摘要】

    1.一種多模態頻域交叉圖像融合方法,其特征在于,所述方法包括:

    2.根據權利要求1所述的多模態頻域交叉圖像融合方法,其特征在于,所述編碼器網絡包括:共享特征編碼器、基礎轉換網絡編碼器以及細節卷積神經網絡編碼器;

    3.根據權利要求2所述的多模態頻域交叉圖像融合方法,其特征在于,所述共享特征編碼器包括:2個基于恢復轉換器塊的轉換器層;

    4.根據權利要求3所述的多模態頻域交叉圖像融合方法,其特征在于,所述基礎轉換網絡編碼器包括一個基于輕量化轉換器的轉換網絡模塊,用于從淺層特征中提取低頻基礎特征;

    5.根據權利要求4所述的多模態頻域交叉圖像融合方法,其特征在于,所述細節卷積神經網絡編碼器包括3個inn,用于從淺層特征中提取高頻細節特征;其中,inn為可逆神經網絡;

    6.根據權利要求1所述的多模態頻域交叉圖像融合方法,其特征在于,跨模態交叉融合網絡包含高頻與低頻分支和通道注意力模塊,用于融合編碼器提取到的頻域特征;其中,每個高頻和低頻分支都由3個代表不同深度的層特征提取模塊組成;

    7.根據權利要求6所述的多模態頻域交叉圖...

    【專利技術屬性】
    技術研發人員:曾慧焦熙坤管靈董純柱
    申請(專利權)人:北京科技大學
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 无码专区6080yy国产电影| 国产精品无码专区在线观看| av无码人妻一区二区三区牛牛 | 亚洲日韩精品一区二区三区无码| 国产品无码一区二区三区在线蜜桃| 极品粉嫩嫩模大尺度无码视频| 蜜桃臀无码内射一区二区三区 | 日韩激情无码免费毛片| 无码人妻久久一区二区三区蜜桃| 国产成人亚洲综合无码精品| 国产精品JIZZ在线观看无码| 小SAO货水好多真紧H无码视频| 精品无码黑人又粗又大又长| 精品日韩亚洲AV无码一区二区三区| 亚洲毛片av日韩av无码| 国产精品无码亚洲一区二区三区| 国产成人精品无码一区二区| 亚洲AV无码一区二区三区在线观看 | 免费无码黄十八禁网站在线观看 | 亚洲AV无码专区电影在线观看| av色欲无码人妻中文字幕| 久久久久亚洲AV片无码下载蜜桃| 中文字幕无码日韩专区免费| 少妇无码太爽了不卡视频在线看| 无码丰满熟妇一区二区| 亚洲精品中文字幕无码AV| 日韩精品少妇无码受不了| 亚洲国产一二三精品无码| 亚洲中文字幕无码久久综合网| 国产成人无码免费网站| 亚洲人成人无码网www国产| 国产午夜无码视频免费网站| 成人免费a级毛片无码网站入口 | 亚洲最大中文字幕无码网站| 久久亚洲精品成人av无码网站| 国产精品无码无需播放器| 亚洲欧洲自拍拍偷午夜色无码| 国产成A人亚洲精V品无码| 国产V亚洲V天堂A无码| 亚洲色无码一区二区三区| 亚洲国产a∨无码中文777|