語音識別裝置及方法、以及半導體集成電路裝置制造方法及圖紙

技術編號：10369717 閱讀：203 留言：0更新日期：2014-08-28 12:25

本發明專利技術涉及一種語音識別裝置及方法、以及半導體集成電路裝置，通過使語音識別中選擇項信息的更新變容易從而適當限制選擇項信息的范圍以提高識別率、或者能應對較深的語音識別分級菜單。語音識別用的半導體集成電路裝置包括：將表示單詞或者語句的文本數據與指令一起接收并根據指令在轉換列表中設定文本數據的轉換候選設定部；從語音識別數據庫中提取與在轉換列表中所設定的文本數據表示的單詞或者語句的至少一部分相對應的標準模式的標準模式提取部；提取所輸入的語音信號的頻率成分并生成表示頻率成分的分布狀態的特征模式的信號處理部；檢測根據語音信號的至少一部分而生成的特征模式和標準模式的一致性并輸出語音識別結果的一致檢測部。

全部詳細技術資料下載

【技術實現步驟摘要】
語音識別裝置及方法、以及半導體集成電路裝置
本專利技術涉及一種語音識別裝置以及語音識別方法，所述語音識別裝置及語音識別方法作為自動販賣機、家電產品、家用設備、車載裝置(導航裝置等)、以及移動終端等中的人機界面技術的一環，對語音進行識別，并實施與該識別結果相對應的響應及處理。并且，本專利技術涉及一種在這種語音識別裝置中所使用的半導體集成電路裝置等。
技術介紹
語音識別為一種如下的技術，S卩，通過對被輸入的語音信號進行分析，并將作為該分析的結果而得出的特征模式、與根據被預先收錄的語音信號而存儲于語音識別數據庫中的標準模式(也稱為“模板”)進行對照，從而得到識別結果的技術。但是，在未對對照的范圍設置限制的情況下，應當進行比較的特征模式與標準模式的組合將成為龐大的數量，從而為了得到識別結果而需要花費較多的時間，并且由于具有相似的標準模式的單詞或者語句的數量也會變多，因此將會呈現出識別率降低的趨勢。作為相關聯的現有技術，在專利文獻I中公開了一種如下的播放裝置，其目的在于，不需要預先的準備或大量的詞典，通過語音便能夠指定應當播放的樂曲等的內容。該播放裝置讀取被存儲在⑶中的TOC (Table Of Contents:目錄表)數據內的曲名數據，預先將該曲名數據轉換為與語音識別結果相同的格式以作為候選數據而進行保存，并將對語音輸入的曲名實施語音識別處理而得到的結果與候選數據進行對照，并且對與匹配性最高的候選數據相對應的樂曲進行播放。其結果為，由于能夠通過用戶的語音來指定應當播放的樂曲，因此減少了由用戶實施的顯示確認及按鈕操作等。在專利文獻I的播放裝置中，語音識別中...

【技術保護點】
一種半導體集成電路裝置，具備：語音識別數據庫存儲部，其中存儲有語音識別數據庫，所述語音識別數據庫中包括，表示在預定的語言中所使用的多個音素的頻率成分的分布狀態的標準模式；轉換候選設定部，其將表示單詞或者語句的文本數據與指令一起接收，并按照所述指令而在轉換列表中設定文本數據；轉換列表存儲部，其中存儲有所述轉換列表；標準模式提取部，其從所述語音識別數據庫中提取與由在所述轉換列表中所設定的文本數據所表示的所述單詞或者語句的至少一部分相對應的所述標準模式；信號處理部，其通過對所輸入的語音信號實施傅立葉轉換從而提取所述語音信號的頻率成分，并生成表示所述語音信號的頻率成分的分布狀態的特征模式；一致檢測部，其對根據所述語音信號的至少一部分而生成的所述特征模式、和從所述語音識別數據庫中提取的所述標準模式之間的一致性進行檢測，并輸出語音識別結果，所述語音識別結果為，在成為轉換候選的多個單詞或者語句內確定出被檢測為一致的單詞或者語句的語音識別結果。

【技術特征摘要】
2013.02.25 JP 2013-034257;2013.03.05 JP 2013-042661.一種半導體集成電路裝置，具備: 語音識別數據庫存儲部，其中存儲有語音識別數據庫，所述語音識別數據庫中包括，表示在預定的語言中所使用的多個音素的頻率成分的分布狀態的標準模式；轉換候選設定部，其將表示單詞或者語句的文本數據與指令一起接收，并按照所述指令而在轉換列表中設定文本數據；轉換列表存儲部，其中存儲有所述轉換列表；標準模式提取部，其從所述語音識別數據庫中提取與由在所述轉換列表中所設定的文本數據所表示的所述單詞或者語句的至少一部分相對應的所述標準模式；信號處理部，其通過對所輸入的語音信號實施傅立葉轉換從而提取所述語音信號的頻率成分，并生成表示所述語音信號的頻率成分的分布狀態的特征模式；一致檢測部，其對根據所述語音信號的至少一部分而生成的所述特征模式、和從所述語音識別數據庫中提取的所述標準模式之間的一致性進行檢測，并輸出語音識別結果，所述語音識別結果為，在成為轉換候選的多個單詞或者語句內確定出被檢測為一致的單詞或者語句的語音識別結果。2.如權利要求1所述的半導體集成電路裝置，其中，還具備語音信號合成部，所述語音信號合成部接收表示針對于所述語音識別結果的響應內容的響應數據，并根據所述響應數據來合成輸出語音信號。3.如權利要求1或2 所述的半導體集成電路裝置，其中，所述信號處理部在所述語音信號的電平超過了預定的值時將語音檢測信號激活。4.一種語音識別裝置，具備: 權利要求1所述的半導體集成電路裝置；控制部，其將表示所述單詞或者語句的文本數據與指令一起發送至所述半導體集成電路裝置。5.一種語音識別裝置，具備: 權利要求2所述的半導體集成電路裝置；控制部，其接收所述語音識別結果，并將所述響應數據、以及所述表示單詞或者語句的文本數據，與所述指令一起發送至所述半導體集成電路裝置。6.一種語音識別裝置，具備: 權利要求3所述的半導體集成電路裝置；控制部，其以如下的方式對所述半導體集成電路裝置進行控制，即，在從所述語音檢測信號被激活起的預定的期間內未得到表現出所述特征模式與所述標準模式之間的一致的語音識別結果的情況下，將應當向所述轉換列中表追加的文本數據與所述指令一起發送至所述半導體集成電路裝置，并實施一致檢測。7.一種語音識別方法，包括如下步驟: 步驟(a)，將表示單詞或者語句的文本數據與指令一起接收，并按照所述指令而在轉換列表中設定文本數據；步驟(b)，從包括表示在預定的語言中所使用的多個音素的頻率成分的分布狀態的標準模式的語音識別數據庫中，提取與由在所述轉換列表中所設定的文本數據所表示的所述單詞或者語句中的至少一部分相對應的所述標準模式；步驟(C)，通過對所輸入的語音信號實施傅立葉轉換從而提取所述語音信號的頻率成分，并生成表示所述語音信號的頻率成分的分布狀態的特征模式；步驟(d)，對根據所述語音信號的至少一部分而生成的所述特征模式、和從所述語音識別數據庫中提取的所述標準模式之間的一致性進行檢測，并輸出語音識別結果，所述語音識別結果為，在成為轉換候選的多個單詞或者語句內確定出被檢測為一致的單詞或者語句的語音識別結果。8.一種半導體集成電路裝置，具備: 語音識別數據庫存儲部，其中存儲有語音識別數據庫，所述語音識別數據庫包括，表示在預定的語言中所使用的多個音素的頻率成分的分布狀態的標準模式；轉換信息設定部，其將表示成為轉換候選的單詞或者語句的文本...

【專利技術屬性】
技術研發人員：野中勉，
申請(專利權)人：精工愛普生株式會社，
類型：發明
國別省市：日本;JP

全部詳細技術資料下載我是這個專利的主人

相關技術