基于意群標(biāo)注的英語發(fā)音連讀標(biāo)記模型制造技術(shù)

技術(shù)編號(hào)：26971330 閱讀：28 留言：0更新日期：2021-01-06 00:02

本發(fā)明專利技術(shù)涉及英語發(fā)音標(biāo)注模型技術(shù)領(lǐng)域，尤其是一種基于意群標(biāo)注的英語發(fā)音連讀標(biāo)記模型，包括文本預(yù)處理、意群標(biāo)注模型以及連讀標(biāo)注模塊，所述的文本預(yù)處理為將輸入的文本進(jìn)行分句與分詞預(yù)處理，將預(yù)處理后的文本輸入意群標(biāo)注模型，意群標(biāo)注模型輸出意群信息與文本至連讀標(biāo)注模塊進(jìn)行連讀分析，連讀標(biāo)注模塊完成連讀標(biāo)注后輸出標(biāo)記結(jié)果，本發(fā)明專利技術(shù)能夠高效地并行運(yùn)算。

全部詳細(xì)技術(shù)資料下載

【技術(shù)實(shí)現(xiàn)步驟摘要】
基于意群標(biāo)注的英語發(fā)音連讀標(biāo)記模型
本專利技術(shù)涉及英語發(fā)音標(biāo)注模型
，具體領(lǐng)域?yàn)橐环N基于意群標(biāo)注的英語發(fā)音連讀標(biāo)記模型。
技術(shù)介紹
單詞間的連讀、變音是英語口語中的一種常見現(xiàn)象?？谡Z學(xué)習(xí)中，在文本上顯式地標(biāo)出需要連讀變音的位置能夠幫助學(xué)生更好地掌握地道的發(fā)音，并且可以提高學(xué)生對(duì)于連讀的聽力理解能力。因此，連讀、變音的標(biāo)注對(duì)于英語口語的學(xué)習(xí)具有促進(jìn)作用。常見的連讀、變音包括：失去爆破音、相同或相似音的失去、輕輔音[h]連讀、連讀發(fā)生音變成為復(fù)合輔音等。以上連讀與變音應(yīng)當(dāng)發(fā)生在語義緊密的詞之間，也就是同一個(gè)意群內(nèi)，不同的意群間的連讀顯得不自然，如Isitahatoracat中ora間的連讀。因此語句中意群的劃分是標(biāo)注連讀發(fā)音的前提。常規(guī)的序列標(biāo)注模型，如條件隨機(jī)場(chǎng)(CRF)、循環(huán)神經(jīng)網(wǎng)絡(luò)RNN以及變體如GRU、LSTM等被成功地運(yùn)用于意群的標(biāo)注。然而常規(guī)的循環(huán)神經(jīng)網(wǎng)絡(luò)序列標(biāo)注模型，在計(jì)算t時(shí)刻時(shí)需要依賴t-1時(shí)刻的運(yùn)算結(jié)果，也就是需要依次計(jì)算，這樣的按序列依次運(yùn)算的方式不利于并行化計(jì)算。基于Self-attention的Transformer結(jié)構(gòu)雖然可以并行化，但卻需要序列長度平方級(jí)的計(jì)算與空間復(fù)雜度。
技術(shù)實(shí)現(xiàn)思路
針對(duì)現(xiàn)有技術(shù)存在的不足，本專利技術(shù)的目的在于提供一種基于意群標(biāo)注的英語發(fā)音連讀標(biāo)記模型。為實(shí)現(xiàn)上述目的，本專利技術(shù)提供如下技術(shù)方案：一種基于意群標(biāo)注的英語發(fā)音連讀標(biāo)記模型，包括文本預(yù)處理、意群標(biāo)注模型以及連讀標(biāo)注模塊，所述的文本預(yù)處理為將輸入的文本進(jìn)行分句與分詞預(yù)處...

【技術(shù)保護(hù)點(diǎn)】
1.一種基于意群標(biāo)注的英語發(fā)音連讀標(biāo)記模型，其特征在于：包括文本預(yù)處理、意群標(biāo)注模型以及連讀標(biāo)注模塊，所述的文本預(yù)處理為將輸入的文本進(jìn)行分句與分詞預(yù)處理，將預(yù)處理后的文本輸入意群標(biāo)注模型，意群標(biāo)注模型輸出意群信息與文本至連讀標(biāo)注模塊進(jìn)行連讀分析，連讀標(biāo)注模塊完成連讀標(biāo)注后輸出標(biāo)記結(jié)果，/n所述的意群標(biāo)注模型包括字母級(jí)別的卷積神經(jīng)網(wǎng)絡(luò)編碼器、詞嵌入層、序列標(biāo)注模型和條件隨機(jī)場(chǎng)層(CRF層)，預(yù)處理后的文本通過卷積神經(jīng)網(wǎng)絡(luò)編碼器進(jìn)行每個(gè)詞字母編碼后與該詞的詞向量拼接后輸入到序列標(biāo)注模型進(jìn)行運(yùn)算處理，并將運(yùn)算結(jié)果輸入到條件隨機(jī)場(chǎng)層中解碼得到意群標(biāo)注序列，/n所述的連讀標(biāo)注模塊以句子與意群信息作為輸入，根據(jù)連讀規(guī)則在意群內(nèi)標(biāo)注連讀與變音。/n

【技術(shù)特征摘要】
1.一種基于意群標(biāo)注的英語發(fā)音連讀標(biāo)記模型，其特征在于：包括文本預(yù)處理、意群標(biāo)注模型以及連讀標(biāo)注模塊，所述的文本預(yù)處理為將輸入的文本進(jìn)行分句與分詞預(yù)處理，將預(yù)處理后的文本輸入意群標(biāo)注模型，意群標(biāo)注模型輸出意群信息與文本至連讀標(biāo)注模塊進(jìn)行連讀分析，連讀標(biāo)注模塊完成連讀標(biāo)注后輸出標(biāo)記結(jié)果，
所述的意群標(biāo)注模型包括字母級(jí)別的卷積神經(jīng)網(wǎng)絡(luò)編碼器、詞嵌入層、序列標(biāo)注模型和條件隨機(jī)場(chǎng)層(CRF層)，預(yù)處理后的文本通過卷積神經(jīng)網(wǎng)絡(luò)編碼器進(jìn)行每個(gè)詞字母編碼后與該詞的詞向量拼接后輸入到序列標(biāo)注模型進(jìn)行運(yùn)算處理，并將運(yùn)算結(jié)果輸入到條件隨機(jī)場(chǎng)層中解碼得到意群標(biāo)注序列，
所述的連讀標(biāo)注模塊以句子與意群信息作為輸入，根據(jù)連讀規(guī)則在意群內(nèi)標(biāo)注連讀與變音。

2.根據(jù)權(quán)利要求1所述的基于意群標(biāo)注的英語發(fā)音連讀標(biāo)記模型，其特征在于：所述的意群標(biāo)注模型還包括詞嵌入層，字母級(jí)別的卷積神經(jīng)網(wǎng)絡(luò)編碼器和詞嵌入層分別對(duì)預(yù)處理后的文本進(jìn)行計(jì)算處理，并將兩者的計(jì)算結(jié)果拼接后進(jìn)行一次線性變化后輸入序列標(biāo)注模塊。

3.根據(jù)權(quán)利要求2所述的基于意群標(biāo)注的英語發(fā)音連讀標(biāo)記模型，其特征在于：字母級(jí)別的卷積神經(jīng)網(wǎng)絡(luò)編碼器對(duì)輸入的文本單詞以字母序列的形式輸入到字母嵌入層，對(duì)字母嵌入表示進(jìn)行卷積運(yùn)算，運(yùn)算的結(jié)果做最大池化后輸出。

4.根據(jù)權(quán)利要求2所述的基于意群標(biāo)注的英語發(fā)音連讀標(biāo)記模型，其特征在于：所述的序列標(biāo)注模型由分組卷積神經(jīng)網(wǎng)絡(luò)與Position-WiseFeed-ForwardNetworks兩個(gè)子結(jié)構(gòu)構(gòu)成，分組卷積神經(jīng)網(wǎng)絡(luò)與Position-WiseFeed-ForwardNetworks兩個(gè)子結(jié)構(gòu)間以殘差連接并插入Layer-Normalization。

5.根據(jù)權(quán)利要求4所述的基于意群標(biāo)注的英語發(fā)音連讀標(biāo)記模型，其特征在于：所述的分組卷積神經(jīng)網(wǎng)絡(luò)由兩層分組卷積層構(gòu)成，兩層卷積層間插入ReLU作為激活函數(shù)，
設(shè)定第一層分組卷積層的分組數(shù)G等于輸入通道數(shù)C1，中間通道數(shù)C2為4C1，輸出通道數(shù)為C1，即，
輸入輸入到第一層分組卷積層，其中L為序列長度，dmodel為模型隱狀態(tài)大小，
y＝max(GroupedConv(x，K1，C1，C2，G)，0)
其中C1＝G＝dmodel，K1為卷積核的...

【專利技術(shù)屬性】
技術(shù)研發(fā)人員：徐書堯，秦龍，陳進(jìn)，陸勇毅，
申請(qǐng)(專利權(quán))人：北京先聲智能科技有限公司，
類型：發(fā)明
國別省市：北京;11

全部詳細(xì)技術(shù)資料下載我是這個(gè)專利的主人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條評(píng)論

還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。

發(fā)布您的意見

相關(guān)領(lǐng)域技術(shù)