一種視聽字幕制作系統及方法技術方案

技術編號：8347921 閱讀：253 留言：0更新日期：2013-02-21 01:22

本發明專利技術提供了一種視聽字幕制作系統及方法，所述系統包括原始文本處理模塊、注音模塊、原始聲音處理模塊、強制切分模塊、切分可信度評估模塊、錯誤處理模塊、字幕生成模塊。本發明專利技術能自動處理原始文本，分割為限定長度的句子或短語；采用形近詞替代等方法自動處理非登錄詞，建立多發音注音網絡；將注音網絡展開為隱含馬爾科夫識別語音對齊網絡，使用強容錯隱含馬爾科夫聲學模型對文本自動對齊強制切分；通過語音識別技術對每個切分段的切分結果進行可信度評估，可很容易發現切分錯誤以便進一步處理；直接根據切分結果生成各種格式適用于各種設備的視聽字幕文件。借此，本發明專利技術可在無人工干預或很少人工干預的情況下直接得到高質量的視聽字幕文件。

全部詳細技術資料下載

【技術實現步驟摘要】

本專利技術涉及外語電化教學領域，尤其涉及。
技術介紹
語言學習主要通過獲得大量的可理解輸入來實現，而“聽”是獲得可理解語言輸入的最重要的渠道。中國的外語學習者面臨著一個“讀得懂卻聽不懂”的尷尬狀態。基于多媒體技術的視聽輸入教學法，能再現人們真實交際場景，對改進外語教學起到了積極的推動作用。在視聽輸入教學法基礎上，將話語信息以文字的形式(即視聽字幕)同時呈現給受眾，對外語視聽教學更具有顯著的積極意義。目前，有字幕加配的視聽教學內容少之又少，其主要原因是當前字幕的加配主要是手工完成。專業技術人員需花費大量的時間和精力才能制作完成長度有限的字幕，成本太高而不能大規模應用。現代語音識別
中，在給定單句文本及其聲音后，可以用基于隱含馬爾科夫模型的核心模塊將音節起止信息在音軸上顯示出來。此方法主要應用于建立音節切分語音語料庫，它要求文本與聲音高度一致，否則就會切分失敗或效果很差。而視聽字幕的制作要求切分的單位是句子或短語，制作中要求方法有很高的容錯性，要能處理文本中含未知發音的未登錄詞、多音詞、含有錯誤文本段落等情況，要能發現指出切分錯誤之處，這些要求在傳統方法中均無法滿足。
技術實現思路
針對上述的缺陷，本專利技術的目的在于提供，其能夠在無人工干預或很少人工干預的情況下直接得到高質量的用于外語電化教學的視聽字幕文件。為了實現上述目的，本專利技術提供視聽字幕制作系統，所述系統包括原始文本處理模塊，用于將輸入的原始文本分詞后按指定規則分割為合適長度的句子或短語，并將所述句子或短語發送到注音模塊；注音模塊，用于處理所述句子或短語中的非登錄詞，然后通過查注音詞典生成注音...

【技術保護點】
一種視聽字幕制作系統，其特征在于，所述系統包括：原始文本處理模塊，用于將輸入的原始文本分詞后按指定規則分割為合適長度的句子或短語，并將所述句子或短語發送到注音模塊；注音模塊，用于處理所述句子或短語中的非登錄詞，然后通過查注音詞典生成注音網絡，并將所述注音網絡發送到強制切分模塊；？原始聲音處理模塊，用于將輸入的原始聲音處理成預定要求的聲音流，并將所述聲音流發送到強制切分模塊；強制切分模塊，用于將所述注音網絡切分為隱含馬爾科夫識別語音的對齊網絡，然后將所述聲音流提取為特征流并在所述對齊網絡對齊，并將切分結果輸入到切分可信度評估模塊；？切分可信度評估模塊，用于通過語音識別對所述切分結果中每個切分段進行可信度評估得到切分可信度評估結果，若所述切分可信度評估結果達到預定值，則將所述切分結果直接發送到字幕生成模塊，否則將所述切分可信度評估結果發送到錯誤處理模塊；錯誤處理模塊，用于顯示所述切分可信度評估結果，判斷是所述原始文本有誤還是所述切分結果需要人工微調，若所述切分結果需要人工微調則人工微調所述切分結果并發送到字幕生成模塊，若是所述原始文本有誤則人工修改原始文本后重新交由所述原始文本處理模塊切分...

【技術特征摘要】

【專利技術屬性】
技術研發人員：張云梯，莊智象，黃衛，黃河，張中良，
申請(專利權)人：上海外教社信息技術有限公司，
類型：發明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

暫無相關專利

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術