本發明專利技術公開一種解碼裝置,包括:變換單元,將對包含于編碼裝置所生成的編碼中的低頻頻譜部分的編碼進行解碼所得的信號變換成頻域信號而生成第一低頻頻譜;變形信息估計單元,使用所述第一低頻頻譜的頻譜輪廓信息估計變形信息,所述變形信息用于對所述第一低頻頻譜的振幅進行一致性限制;限制單元,使用估計出的所述變形信息,對所述第一低頻頻譜的振幅進行一致性限制而生成第二低頻頻譜;以及解碼單元,基于包含于所述編碼裝置所生成的編碼中的高頻頻譜部分的編碼,復制所述第二低頻頻譜而生成高頻頻譜。
【技術實現步驟摘要】
本專利技術涉及對語音信號、音頻信號等進行編碼/解碼的編碼裝置、解碼裝 置以及編碼/解碼方法。
技術介紹
將語音信號通過低比特率進行壓縮的語音編碼技術,對于移動臺通信進 行電波等的有效利用十分重要。特別是作為近年來的趨勢來講,對提高通話 語音的質量寄予的期待日益增加,希望能夠實現具有高度的真實感的通話服 務。在此所指的真實感為說話者置身的環境(譬如BGM),因此希望對音頻 等的語音之外的信號也能夠高質量地進行編碼。在將語音信號編碼的語音編碼4支術中,存在G726、 G729等的由ITU-T Sector)標準化的方式。這些方式是以窄帶信號(300Hz 3.4kHz)為對象,能 夠通過8kbit/s ~ 32kbit/s進行編碼。雖然這些方式可以通過低比特率進行編碼, 但是作為編碼對象的窄帶信號的頻域最大只到3.4KHz,仍然太窄,因此其質 量不能提高而導致缺乏真實感。另夕卜,在ITU匿T和3GPP ( The 3rd Generation Partnership Project)中存在 對信號頻帶為50Hz ~ 7kHz的語音進行編碼的標準方式(G722、 G.722.1 、 AMR-WB等)。雖然這些方式能夠通過6.6kbit/s ~ 64kbit/s的比特率進行寬帶 語音信號的編碼,但是對寬帶語音信號高質量地進行編碼需要相對提高比特 率。而且從音質的角度來講,寬帶語音與窄帶語音相比雖然具有高音質,但 是對要求高度的真實感的服務來講很難說已經足夠。一般來講,當信號的最大頻率達到10 ~ 15kHz左右時,能夠得到相當于 FM廣播的真實感,而達到20kHz左右時,能夠得到相當于CD的質量。對 于具有如此頻帶的信號,由MPEG ( Moving Picture Expert Group )標準化了 的以層3方式和AAC方式等為代表的音頻編碼方式比較適合。但是,如果將 這些音頻編碼方式作為語音通信的編碼方式來采用的話,需要設定高比特率 以對語音高質量地進行編碼。另外還會發生編碼遲延變大等的問題。作為將寬頻域的信號通過低比特率高質量地進行編碼的方法,具有下述 技術將輸入信號的頻譜分割為低頻部分和高頻部分的兩個頻語,然后將低 頻頻譜進行復制并置換高頻頻譜(將高頻頻譜通過低頻頻譜代用),由此降低 整體的比特率(譬如參照專利文獻1 )。該技術將較多的比特分配用于低頻頻 譜的編碼而進行高質量的編碼,相反,對于高頻頻譜則進行將編碼后的低頻 頻譜進行復制的基本處理,由此可以通過較少的比特分配來進行編碼。另外,作為與該技術類似的技術,還有下述技術對不能充分分配編碼比特的頻帶,利用其它預定的部分頻頻頻譜信息進行近似處理而提高質量(譬如參照專利文獻2 )。在沒有附加信息的情況下對窄帶信號進行頻帶擴展使其成為寬帶信號,因此將窄帶信號的低頻頻譜復制于高頻頻譜來作為基本處理 (譬如參照專利文獻3)。再者,不論在哪種技術中,都將其它頻帶的頻譜進行復制,并在用于使 頻譜包絡線變得平滑而進行的增益調整后,將該復制頻譜插入需要進行頻譜 補充的頻帶。日本專利申請特表2001-521648號公報 [專利文獻2 ]日本專利申請特開平9-153811號公報 [專利文獻3 ]日本專利申請特開平9-90992號公報
技術實現思路
專利技術需要解決的問題但是,在語音信號或音頻信號的頻譜中,低頻頻譜的動態范圍(頻譜振 幅的絕對值(絕對振幅)的最大值與最小值的比)比高頻頻譜的動態范圍大 的現象很常見。圖1為用來說明該現象的圖,其示出了音頻信號的頻譜的一 例。該頻譜為將采樣頻率32kHz的音頻信號通過30ms的長度來進行頻率分 析時的對數頻語。如該圖所示,頻率為0 ~ 8000Hz的低頻頻譜峰值性很強(存在多個銳利 的語峰),在該頻帶的頻譜的動態范圍很大。與此相反,頻率為8 ~ 15000Hz 的高頻頻譜的動態范圍則很小。對具有這樣的頻譜特性的信號,如果利用傳 統的將低頻頻譜復制于高頻頻譜的方法的話,即使進行高頻頻譜的增益調整, 也會出現下述的現象,即在高頻頻譜中出現不必要的譜峰形狀。圖2為表示將如圖1所示頻譜的^f氐頻頻譜(1000 ~7000Hz)復制,并通 過功率調整而得到高頻頻譜(10000- 16000Hz)時的全頻帶頻鐠的圖。如該圖所示,當進行上述處理時,在高于10000Hz的頻帶Rl出現了不 必要的譜峰形狀。該譜峰為原來的高頻頻譜中所沒有的。而且,在將該頻鐠 變換到時域而得到的解碼信號中,會發生鈴響似的噪聲,而導致主觀質量降 低的問題。如上所述,在將某頻帶的頻譜通過其它頻帶的頻譜代用的技術中, 需要恰當地調整插入頻譜的動態范圍。因此,本專利技術旨在提供一種編碼裝置、解碼裝置以及編碼/解碼方法,在 將某頻帶的頻譜通過其它頻帶的頻譜代用(置換)的技術中,能夠恰當地調 整插入頻譜的動態范圍來提高解碼信號的主觀質量。解決該問題的方案本專利技術的解碼裝置采用這種結構,包括變換單元,將對包含于編碼裝 置所生成的編碼中的低頻頻譜部分的編碼進行解碼所得的信號變換成頻域信 號而生成第一低頻頻譜;變形信息估計單元,使用所述第一低頻頻譜的頻譜 輪廓信息估計變形信息,所述變形信息用于對所述第一低頻頻譜的振幅進行 一致性限制;限制單元,使用估計出的所述變形信息,對所述第一低頻頻譜 的振幅進行一致性限制而生成第二低頻頻譜;以及解碼單元,基于包含于所 述編碼裝置所生成的編碼中的高頻頻語部分的編碼,復制所述第二低頻頻譜 而生成高頻頻譜。本專利技術還提供一種包括上述解碼裝置的通信終端裝置。本專利技術還提供一種包括上述解碼裝置的基站裝置。本專利技術還提供一種解碼方法,包括變換步驟,將對包含于編碼裝置所 生成的編碼中的低頻頻譜部分的編碼進行解碼所得的信號變換成頻域信號而 生成第一低頻頻譜;變形信息估計步驟,使用所述第一低頻頻譜的頻譜輪廓 信息估計變形信息,所述變形信息用于對所述第一低頻頻譜的振幅進行一致 性限制;限制步驟,使用估計出的所述變形信息,對所述第一低頻頻鐠的振 幅進行一致性限制而生成第二低頻頻譜;以及解碼步驟,基于包含于所述編碼裝置所生成的編碼中的高頻頻譜部分的編碼,復制所述第二低頻頻譜而生 成高頻頻譜。專利技術的有益效果根據本專利技術,在將某頻帶的頻譜通過其它頻帶的頻譜代用的技術中,能 夠恰當地調整插入頻譜的動態范圍而提高解碼信號的主觀質量。附圖說明圖1是表示音頻信號的頻譜的示例的圖。圖2為表示復制低頻頻譜并進行功率調整而得到高頻頻譜時的全頻帶的 頻譜的圖。圖3是表示實施方式1的編碼裝置的主要結構的方框圖。圖4是表示實施方式1的頻語編碼單元內部的主要結構的方框圖。圖5是表示實施方式1的頻譜變形單元內部的主要結構的方框圖。圖6是表示實施方式1的變形單元內部的主要結構的方框圖。圖7是表示實施方式1的通過變形單元而得到的變形頻譜的例子的圖。圖8是表示實施方式1的變形單元的其它變化形式的結構的方框圖。圖9是表示實施方式1的分層解碼裝置的主要結構的方框圖。圖IO是表示實施方式1的頻譜解碼單元內部的主要結構的方框圖。圖11是表示用于說明實施方式2的頻譜編碼單元的方框圖。圖12是表示實施方式2的頻譜編碼單元的其它變化形式的結構的方框圖。圖13是表示實施方式2的頻譜解碼單元的主要結構的方框圖。 圖14是表示實施本文檔來自技高網...
【技術保護點】
一種解碼裝置,包括: 變換單元,將對包含于編碼裝置所生成的編碼中的低頻頻譜部分的編碼進行解碼所得的信號變換成頻域信號而生成第一低頻頻譜; 變形信息估計單元,使用所述第一低頻頻譜的頻譜輪廓信息估計變形信息,所述變形信息用于對所述第 一低頻頻譜的振幅進行一致性限制; 限制單元,使用估計出的所述變形信息,對所述第一低頻頻譜的振幅進行一致性限制而生成第二低頻頻譜;以及 解碼單元,基于包含于所述編碼裝置所生成的編碼中的高頻頻譜部分的編碼,復制所述第二低頻頻譜而生成 高頻頻譜。
【技術特征摘要】
JP 2004-5-14 145425/04;JP 2004-11-5 322953/04;JP 21.一種解碼裝置,包括變換單元,將對包含于編碼裝置所生成的編碼中的低頻頻譜部分的編碼進行解碼所得的信號變換成頻域信號而生成第一低頻頻譜;變形信息估計單元,使用所述第一低頻頻譜的頻譜輪廓信息估計變形信息,所述變形信息用于對所述第一低頻頻譜的振幅進行一致性限制;限制單元,使用估計出的所述變形信息,對所述第一低頻頻譜的振幅進行一致性限制而生成第二低頻頻譜;以及解碼單元,基于包含于所述編碼裝置所生成的編碼中的高頻頻譜部分的編碼,復制所述第二低頻頻譜而生成高頻頻譜。2. 如權利要求1所述的解碼裝置,其中,所述限制單元使用從0到1 的范圍內的預定值對所述第一低頻頻譜的振幅一致地進行乘冪,由此生成所 述第二低頻頻譜。3. 如權利要求1所述的解碼裝置,其中,所述變形信息估計單元包括 頻譜輪廓信息存儲單元,...
【專利技術屬性】
技術研發人員:押切正浩,江原宏幸,
申請(專利權)人:松下電器產業株式會社,
類型:發明
國別省市:JP[]
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。