一種用于通過以下將音頻幀編碼的方法:通過將幀序列中的第一音頻幀代碼化,產生代碼化音頻樣本的第一幀;通過將幀序列中的第二音頻幀的至少一部分代碼化,產生代碼化音頻樣本的第二幀的至少一部分;以及產生用于生成音頻間隙填充樣本的參數,其中所述參數表示代碼化音頻樣本的第一幀的加權分段或者代碼化音頻樣本的所述一部分第二幀的加權分段。
【技術實現步驟摘要】
【國外來華專利技術】
本公開一般地涉及語音和音頻處理,并且尤其涉及用于處理包括通用音頻和語音幀的音頻信號的編碼器。
技術介紹
很多音頻信號可分類為具有較多語音類特性或者較多通用音頻特性,典型的有音樂、音調、背景噪聲、回響語音等等。基于適合于處理語音信號的源過濾器模型的編解碼器不能有效處理通用音頻信號。這樣的編解碼器包括線性預測代碼化(LPC)編解碼器,比如代碼激勵線性預測(CELP)代碼器。語音代碼器易于處理低比特率的語音信號。相反,諸如頻域變換編解碼器的通用音頻處理系統不能很好地處理語音信號。公知的是,提供分類器或辨別器來在逐個幀的基礎上確定音頻信號更像語音還是不太像語音,并基于分類來將信號引導到語音編解碼器或者通用音頻編解碼器。有時候將能夠處理不同信號類型的音頻信 號處理器稱為混合核心編解碼器。然而,已知分別使用語音和通用音頻編解碼器在語音幀與通用音頻幀的處理之間的變換在已處理的輸出信號中產生音頻間隙形式的不連續性。這樣的音頻間隙通常在用戶接ロ處是可感知的,并且一般不受歡迎。現有技術圖I圖示了在輸出幀序列中,在已處理的語音幀與已處理的通用音頻幀之間產生的音頻間隙。圖I還在102處圖示了輸入幀序列,該序列可分類為語音幀(m-2)和(m-Ι)以及后面的通用音頻幀(m)和(m+1)。樣本索引η對應于在幀序列內的時間η處獲得的樣本。為了該曲線的目的,η=0的樣本索引對應于獲得幀(m)的最后ー個樣本的相對時間。這里,可以在已經積累了 320個新樣本以后處理幀(m),這320個新樣本與之前積累的160個樣本組合,總共480個樣本。雖然很多采樣率和幀尺寸都可以,但是在該示例中,采樣率為16kHz,且對應的幀尺寸為20毫秒。可使用線性預測代碼化(LPC)語音代碼化來處理語音幀,其中在104處圖示了 LPC分析窗ロ。處理的語音幀(m-Ι)在106處被圖示,且前面是未圖示的與語音幀(m-2)相對應的代碼化語音幀(m-2)。圖I還在108處圖示了重疊代碼化通用音頻幀。通用音頻分析/綜合窗ロ對應于已處理的通用音頻幀的幅度包絡。由于算法處理延遲,已處理的幀106和108的序列在相對于輸入幀102的序列的時間上偏移,對于語音和通用音頻幀,這里又將算法處理延遲分別稱為先行延遲和重疊添加延遲。圖I中在108處代碼化通用音頻幀(m)和(m+1)的重疊部分對110處的對應連續處理的通用音頻幀(m)和(m+1)提供附加效果。然而,在108處代碼化通用音頻幀(m)的導尾不與相鄰通用音頻幀的拖尾重疊,因為前面的幀是代碼化語音幀。因此,在108處對應的已處理的通用音頻幀(m)的引導部分具有減小的幅度。將代碼化語音和通用音頻幀序列組合的結果是在已處理的輸出幀序列中已處理的語音幀與已處理的通用音頻幀之間的音頻間隙,如110處的合成輸出幀中所示。題為“Switching Between Coding Schemes (代碼化方案之間的切換)”的美國公開No. 2006/0173675公開了通過在逐個幀的基礎上在自適應多速率寬帶(AMR-WB)編解碼器與利用修正離散余弦變換(MDCT)的編解碼器(例如,MPEG 3編解碼器或者(AAC)編解碼器,只要最合適)之間進行選擇來兼容語音和音樂的混合代碼器。諾基亞改良了作為不能取消的混疊誤差出現的不連續性的不利效果,當使用具有接近完美的重構性質(其特征在于混疊誤差的最小化)的特殊MDCT分析/綜合窗ロ,從AMR-WB編解碼器切換到基于MDCT的編解碼器時出現上述混疊誤差。諾基亞公開的特殊MDCT分析/綜合窗ロ包括重疊基于正弦的窗ロ的3個組成部分H0 (n)、H1 (η)和H2 (η),這3個組成部分應用于跟隨語音幀的第一輸入音樂幀,以提供改進的已處理的音樂幀。然而,該方法可能經歷信號不連續性,信號不連續性可能由于通過H。(n) .H1 (η)和H2 (η)定義的關聯譜區域的下建模而出現。也就是說,可能可用的有限數目的比特需要在三個區域上分發,但是仍然需要在前面語音幀的末端與區域Htl (η)的開始之間產生接近完美的波形匹配。對本領域普通技術人員而言,通過仔細考慮本專利技術后面的具體實施方式以及后述附圖,本專利技術的各種方案、特征和優點將變得更充分地顯而易見。為了清楚起見,附圖可被簡化,并且不一定按照比例繪制。附圖說明 現有技術圖I示出具有音頻間隙的語音和通用音頻幀的傳統處理的序列。圖2是混合語音和通用音頻信號代碼器的示意性框圖。圖3是混合語音和通用音頻信號解碼器的示意性框圖。圖4圖不首頻イ目號編碼處通。圖5圖示經歷非傳統代碼化處理的語音和通用音頻幀序列。圖6圖示經歷另ー非傳統代碼化處理的語音和通用音頻幀序列。圖7圖示音頻解碼處理。具體實施例方式圖2圖示配置成將輸入幀流代碼化的混合核心代碼器200,ー些輸入幀流是語音幀,而其他輸入幀流是不太像語音的幀。不太像語音的幀在此被稱為通用音頻幀。混合核心編解碼器包括模式選擇器210,模式選擇器210處理輸入音頻信號s (η)的幀,其中η是樣本索引。當采樣率是每秒16k個樣本時(其對應于20毫秒的幀時間間隔),幀長度可包括320個音頻樣本,但是很多其他變化也是可能的。模式選擇器被配置成基于特定于每個幀的屬性或特性的估計來評估輸入幀序列中的幀是更像語音還是不太像語音。音頻信號辨別的細節或者更一般地音頻幀分類超出了本公開的范圍,但是為本領域技術人員所熟知。模式選擇碼字被提供給復用器220。碼字在逐個幀的基礎上指示處理輸入信號的對應幀的模式。因此,例如,可將輸入音頻幀處理作為語音信號或者作為通用音頻信號,其中碼字指示怎樣處理幀,并且特別是使用哪種類型的音頻代碼器來處理幀。碼字也可以傳遞關于從語音到通用音頻的轉變的信息。雖然轉變信息可以暗示來自之前的幀分類類型,但是發射信息的信道可能是有損耗的,并且因此關于之前幀類型的信息可能不可用。在圖2中,編解碼器一般包括第一代碼器230和第二代碼器240,第一代碼器230適合于將語音幀代碼化,第二代碼器240適合于將通用音頻幀代碼化。在一個實施例中,語音代碼器基于適合于處理語音信號的源過濾器模型,而通用音頻代碼器是基于時域混疊抵消(TDAC)的線性正交重疊變換。在一個實現中,除了適合于處理語音信號的其他代碼器之外,語音代碼器可利用代碼激勵線性預測(CELP)代碼器的線性預測代碼化(LPC)典型。通用音頻代碼器可實現為修正離散余弦變換(MDCT)編解碼器,或者修正離散正弦變換(MDST),或者基于不同類型的離散余弦變換(DCT)的MDCT的形式,或者DCT/離散正弦變換(DST)組合。在圖2中,通過基于由模式選擇器210選擇或確定的模式來控制的選擇開關250,第一代碼器230和第二代碼器240的輸入端耦合到輸入音頻信號。例如,可基于模式選擇器的碼字輸出,通過處理器來控制開關250。開關250選擇用于處理語音幀的語音代碼器230,并且該開關選擇用于處理通用音頻幀的通用音頻代碼器。借助于選擇開關250,可以通過僅ー個代碼器(例如,語音代碼器,或者通用音頻代碼器)來處理每個幀。更一般地,雖然圖2中僅圖示了兩個代碼器,但是可通過若干不同代碼器中的ー個將幀代碼化。例如,可選擇三個或更多個代碼器中的ー個來處理輸入音頻信號的特定幀。然而,在其他實施例中, 可通過下本文檔來自技高網...
【技術保護點】
【技術特征摘要】
【國外來華專利技術】2010.03.05 IN 218/KOL/20101.一種用于將音頻幀編碼的方法,所述方法包括 使用第一代碼化方法,通過將幀序列中的第一音頻幀代碼化來產生代碼化音頻樣本的第一中貞; 使用第二代碼化方法,通過將所述幀序列中的至少一部分第二音頻幀代碼化來產生代碼化音頻樣本的至少一部分第二幀;以及 產生用于生成音頻間隙填充樣本的參數,其中所述參數表示代碼化音頻樣本的所述第一幀的加權分段或者代碼化音頻樣本的所述一部分第二幀的加權分段。2.權利要求I所述的方法,通過選擇用于減少在所生成的所述音頻間隙填充樣本與所述幀序列中基準音頻間隙樣本集合之間失真的參數,來產生所述參數。3.權利要求I所述的方法,其中,如果將代碼化音頻樣本的所述第一幀與代碼化音頻樣本的所述一部分第二幀組合,則在代碼化音頻樣本的所述第一幀與代碼化音頻樣本的所述一部分第二幀之間將形成音頻間隙, 所述方法進ー步包括 基于所述參數來生成所述音頻間隙填充樣本; 形成包括所述音頻間隙填充樣本以及代碼化音頻樣本的所述一部分第二幀的序列, 其中,所述音頻間隙填充樣本填充了所述音頻間隙。4.權利要求I所述的方法,其中 代碼化音頻樣本的所述第一幀的所述加權分段包括第一加權參數和第一索引,所述第一加權參數和第一索引用于代碼化音頻樣本的所述第一幀的所述加權分段,以及 代碼化音頻樣本的所述一部分第二幀的所述加權分段包括第二加權參數和第二索引,所述第二加權參數和第二索引用于代碼化音頻樣本的所述一部分第二幀的所述加權分段。5.權利要求4所述的方法, 所述第一索引指定從所述幀序列中的基準音頻間隙樣本到代碼化音頻樣本的所述第一幀中對應樣本的第一時間偏移,以及 所述第二索引指定從所述基準音頻間隙樣本到代碼化音頻樣本的所述一部分第二幀中對應樣本的第二時間偏移。6.權利要求4所述的方法, 基于所述幀...
【專利技術屬性】
技術研發人員:烏達·米塔爾,喬納森·A·吉布斯,詹姆斯·P·阿什利,
申請(專利權)人:摩托羅拉移動有限責任公司,
類型:
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。