本發(fā)明專(zhuān)利技術(shù)公開(kāi)了語(yǔ)音識(shí)別裝置、具有語(yǔ)音識(shí)別裝置的車(chē)輛及其控制方法。該語(yǔ)音識(shí)別裝置,包括:上下文模型,通過(guò)為識(shí)別目標(biāo)上下文建模而創(chuàng)建上下文模型;和語(yǔ)音識(shí)別器,語(yǔ)音識(shí)別器被配置為基于聲學(xué)模型和上下文模型創(chuàng)建對(duì)應(yīng)于所接收的語(yǔ)音信號(hào)的候選組,并且將高可靠性權(quán)重值施加給具有對(duì)應(yīng)于講話長(zhǎng)度的音節(jié)的長(zhǎng)度的候選項(xiàng)。
【技術(shù)實(shí)現(xiàn)步驟摘要】
【專(zhuān)利說(shuō)明】相關(guān)申請(qǐng)的交叉引用本申請(qǐng)要求于2014年8月22日提交給韓國(guó)知識(shí)產(chǎn)權(quán)局的韓國(guó)專(zhuān)利申請(qǐng)第2014-0109822號(hào)的權(quán)益,通過(guò)引用將其所公開(kāi)的內(nèi)容結(jié)合于此。
本公開(kāi)的實(shí)施方式涉及一種語(yǔ)音識(shí)別裝置、具有語(yǔ)音識(shí)別裝置的車(chē)輛以及控制車(chē)輛的方法。
技術(shù)介紹
通常,當(dāng)駕駛員在駕駛過(guò)程中使用蜂窩電話打電話時(shí),駕駛員應(yīng)在用其手握持蜂窩電話的同時(shí)執(zhí)行若干次按壓按鈕的操作,并且然后,將蜂窩電話放到其耳朵上以與另一方通話。S卩,當(dāng)駕駛員在駕駛過(guò)程中打電話時(shí),盡管駕駛員不會(huì)同時(shí)使其雙手脫離方向盤(pán),但駕駛員必須使其一只手脫離方向盤(pán)以握持蜂窩電話。在這種情況下,駕駛員的視野變窄并且由此不能看到車(chē)輛周?chē)男腥耍赡艹霈F(xiàn)搖晃,并且踩踏制動(dòng)器的反應(yīng)速度也變慢,從而導(dǎo)致交通事故增加。為了克服這些問(wèn)題,已經(jīng)開(kāi)發(fā)并且廣泛使用了免提設(shè)備或者藍(lán)牙設(shè)備。免提設(shè)備或者藍(lán)牙設(shè)備收集駕駛員的語(yǔ)音,以對(duì)與駕駛員的通信執(zhí)行語(yǔ)音識(shí)別,將識(shí)別的語(yǔ)音傳輸至蜂窩電話,并且通過(guò)揚(yáng)聲器輸出由蜂窩電話接收的另一方的語(yǔ)音。然而,為了撥打或者應(yīng)答電話,駕駛員仍必須手動(dòng)操縱蜂窩電話。因此,用于利用語(yǔ)音應(yīng)答電話或者利用語(yǔ)音進(jìn)行特定電話號(hào)碼的呼叫的語(yǔ)音識(shí)別技術(shù)經(jīng)常應(yīng)用于車(chē)輛。
技術(shù)實(shí)現(xiàn)思路
因此,本公開(kāi)的一方面提供一種用于根據(jù)人的講話長(zhǎng)度施加可靠性權(quán)重值的語(yǔ)音識(shí)別裝置、包括語(yǔ)音識(shí)別裝置的車(chē)輛、以及控制車(chē)輛的方法。本公開(kāi)的其他方面將在下面的描述中進(jìn)行部分闡述,并且部分從所述描述中是顯而易見(jiàn)的或通過(guò)對(duì)本公開(kāi)的實(shí)踐獲悉的。根據(jù)本公開(kāi)的一方面,一種語(yǔ)音識(shí)別裝置包括:上下文模型,通過(guò)為識(shí)別目標(biāo)上下文建模創(chuàng)建上下文模型;和語(yǔ)音識(shí)別器,語(yǔ)音識(shí)別器被配置為基于聲學(xué)模型和上下文模型創(chuàng)建對(duì)應(yīng)于接收的語(yǔ)音信號(hào)的候選組,并且將高可靠性權(quán)重值施加給具有對(duì)應(yīng)于講話長(zhǎng)度的音節(jié)長(zhǎng)度的候選項(xiàng)。語(yǔ)音識(shí)別裝置可進(jìn)一步包括顯示單元,顯示單元被配置為顯示其中根據(jù)可靠性程度排列一個(gè)或者多個(gè)候選項(xiàng)的候選組。語(yǔ)音識(shí)別裝置可進(jìn)一步包括模型創(chuàng)建器,模型創(chuàng)建器被配置為根據(jù)音節(jié)長(zhǎng)度對(duì)識(shí)別目標(biāo)上下文進(jìn)行分類(lèi),并且創(chuàng)建用于各個(gè)音節(jié)長(zhǎng)度的上下文模型。語(yǔ)音識(shí)別器可創(chuàng)建用于為音節(jié)長(zhǎng)度創(chuàng)建的上下文模型的候選組,并且根據(jù)對(duì)應(yīng)于講話長(zhǎng)度的音節(jié)長(zhǎng)度分別將不同的權(quán)重值施加給候選組。如果講話長(zhǎng)度短于或者等于閾值長(zhǎng)度,則語(yǔ)音識(shí)別器可將高可靠性權(quán)重值施加給對(duì)應(yīng)于短于或者等于參考音節(jié)長(zhǎng)度的音節(jié)長(zhǎng)度的候選項(xiàng)。根據(jù)本公開(kāi)的另一方面,一種車(chē)輛包括:上下文模型,通過(guò)為電話簿中包括的每個(gè)名稱(chēng)建模創(chuàng)建上下文模型;和語(yǔ)音識(shí)別器,語(yǔ)音識(shí)別器被配置為基于聲學(xué)模型和上下文模型創(chuàng)建對(duì)應(yīng)于接收的語(yǔ)音信號(hào)的電話號(hào)碼候選組,并且將根據(jù)講話長(zhǎng)度確定的不同可靠性權(quán)重值分別施加給電話號(hào)碼候選組中的電話號(hào)碼候選項(xiàng)。車(chē)輛可進(jìn)一步包括顯示單元,顯示單元被配置為顯示其中根據(jù)可靠性程度排列一個(gè)或者多個(gè)電話號(hào)碼候選項(xiàng)的電話號(hào)碼候選組。語(yǔ)音識(shí)別器可施加可靠性權(quán)重值以使得電話號(hào)碼候選組中具有對(duì)應(yīng)于講話長(zhǎng)度的音節(jié)長(zhǎng)度的電話號(hào)碼候選項(xiàng)具有高度可靠性。如果講話長(zhǎng)度短于閾值長(zhǎng)度,則語(yǔ)音識(shí)別器可施加可靠性權(quán)重值使得電話號(hào)碼候選組中的單音節(jié)的電話號(hào)碼候選項(xiàng)具有高度可靠性。如果講話長(zhǎng)度長(zhǎng)于閾值長(zhǎng)度,則語(yǔ)音識(shí)別器可施加可靠性權(quán)重值使得電話號(hào)碼候選組中的單音節(jié)的電話號(hào)碼候選項(xiàng)具有低度可靠性。車(chē)輛可進(jìn)一步包括模型創(chuàng)建器,模型創(chuàng)建器被配置為根據(jù)每個(gè)名稱(chēng)的音節(jié)長(zhǎng)度對(duì)電話簿進(jìn)行分類(lèi)并且創(chuàng)建用于各個(gè)音節(jié)長(zhǎng)度的上下文模型。模型創(chuàng)建器可將名稱(chēng)分割成名和姓以創(chuàng)建分割的上下文模型。模型創(chuàng)建器可將名稱(chēng)轉(zhuǎn)換成音素并且將名稱(chēng)建模成語(yǔ)音網(wǎng)格形式。語(yǔ)音識(shí)別器可從各個(gè)上下文模型創(chuàng)建對(duì)應(yīng)于語(yǔ)音信號(hào)的電話號(hào)碼候選組,并且將高權(quán)重值施加給具有對(duì)應(yīng)于講話長(zhǎng)度的音節(jié)長(zhǎng)度的電話號(hào)碼候選組。語(yǔ)音識(shí)別器可基于聲學(xué)模型識(shí)別語(yǔ)音信號(hào)的音素串,并且在上下文模型中搜索對(duì)應(yīng)于識(shí)別的音素串的一個(gè)或者多個(gè)電話號(hào)碼候選項(xiàng),以創(chuàng)建電話號(hào)碼候選組。車(chē)輛可進(jìn)一步包括講話長(zhǎng)度測(cè)量單元,講話長(zhǎng)度測(cè)量單元被配置為從語(yǔ)音信號(hào)中檢測(cè)講話開(kāi)始(BoS)和講話結(jié)束(EoS),并且基于BoS和EoS測(cè)量講話長(zhǎng)度。根據(jù)本公開(kāi)的另一方面,一種車(chē)輛的控制方法包括:從通過(guò)為電話簿中包括的每個(gè)名稱(chēng)建模而創(chuàng)建的上下文模型創(chuàng)建對(duì)應(yīng)于接收的語(yǔ)音信號(hào)的電話號(hào)碼候選項(xiàng);并且根據(jù)用戶的講話長(zhǎng)度確定可靠性權(quán)重值;并且根據(jù)電話號(hào)碼候選項(xiàng)的音節(jié)長(zhǎng)度施加可靠性權(quán)重值。確定可靠性權(quán)重值可包括基于講話開(kāi)始(BoS)與講話結(jié)束(EoS)之間的差測(cè)量講話長(zhǎng)度。確定可靠性權(quán)重值可包括確定可靠性權(quán)重值以使得具有對(duì)應(yīng)于講話長(zhǎng)度的音節(jié)長(zhǎng)度的電話號(hào)碼候選項(xiàng)具有高度可靠性。確定可靠性權(quán)重值可包括確定可靠性權(quán)重值以使得如果講話長(zhǎng)度短于或者等于閾值長(zhǎng)度則單音節(jié)的電話號(hào)碼候選項(xiàng)具有高度可靠性。確定可靠性權(quán)重值可包括確定可靠性權(quán)重值以使得如果講話長(zhǎng)度長(zhǎng)于或者等于閾值長(zhǎng)度則單音節(jié)的電話號(hào)碼候選項(xiàng)具有低度可靠性。創(chuàng)建電話號(hào)碼候選組可包括:從語(yǔ)音信號(hào)檢測(cè)特征向量;并且根據(jù)特征向量從聲學(xué)模型識(shí)別語(yǔ)音信號(hào)的音素串。創(chuàng)建電話號(hào)碼候選組可包括:基于關(guān)于音素串的可靠性長(zhǎng)度創(chuàng)建電話號(hào)碼候選組。電話號(hào)碼候選組可具有高于或者等于關(guān)于音素串的預(yù)定標(biāo)準(zhǔn)的可靠性程度。施加可靠性權(quán)重值可包括:根據(jù)可靠性程度排列電話號(hào)碼候選組中的一個(gè)或者多個(gè)電話號(hào)碼候選項(xiàng);并且顯示具有根據(jù)可靠性程度排列的電話號(hào)碼候選項(xiàng)的電話號(hào)碼候選組。控制方法可進(jìn)一步包括:接收對(duì)應(yīng)于用戶講話的語(yǔ)音信號(hào);并且對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)處理。控制方法可進(jìn)一步包括:根據(jù)名稱(chēng)長(zhǎng)度對(duì)電話簿進(jìn)行分類(lèi);并且創(chuàng)建用于各個(gè)名稱(chēng)長(zhǎng)度的上下文模型。創(chuàng)建上下文模型可包括:將每個(gè)名稱(chēng)轉(zhuǎn)換成音素串;并且基于音素串創(chuàng)建語(yǔ)音網(wǎng)格。根據(jù)本公開(kāi)的另一方面,車(chē)輛包括:多個(gè)上下文模型,通過(guò)根據(jù)名稱(chēng)長(zhǎng)度對(duì)電話簿進(jìn)行分類(lèi)而創(chuàng)建多個(gè)上下文模型;候選組搜索單元,候選組搜索單元被配置為從相應(yīng)上下文模型創(chuàng)建對(duì)應(yīng)接收的語(yǔ)音信號(hào)的上下文候選組;權(quán)重施加單元,權(quán)重施加單元被配置為將不同的可靠性權(quán)重值分別施加給上下文候選組,以使得從對(duì)應(yīng)于用戶講話長(zhǎng)度的上下文模型所創(chuàng)建的上下文候選組具有高度可靠性;以及顯示單元,顯示單元被配置為根據(jù)可靠性程度排列并且顯示施加了可靠性權(quán)重值的上下文候選組。【附圖說(shuō)明】從結(jié)合附圖對(duì)實(shí)施方式進(jìn)行的以下描述中,本公開(kāi)的這些方面和/或其他方面將變得更加顯而易見(jiàn)并且更易于理解,附圖中:圖1是根據(jù)本公開(kāi)的實(shí)施方式的語(yǔ)音識(shí)別裝置的控制框圖;圖2是根據(jù)本公開(kāi)的實(shí)施方式的語(yǔ)音識(shí)別裝置的語(yǔ)音識(shí)別器的控制框圖;圖3是根據(jù)本公開(kāi)的實(shí)施方式的包括模型創(chuàng)建器的語(yǔ)音識(shí)別裝置的控制框圖;圖4是示意性示出了根據(jù)本公開(kāi)的實(shí)施方式的車(chē)輛的外觀的立體圖;圖5示意性示出了根據(jù)本公開(kāi)的實(shí)施方式的車(chē)輛的內(nèi)部;圖6是根據(jù)本公開(kāi)的實(shí)施方式的包括語(yǔ)音識(shí)別裝置的車(chē)輛的控制框圖;圖7是用于描述根據(jù)本公開(kāi)的實(shí)施方式的車(chē)輛的語(yǔ)音活動(dòng)檢測(cè)(VAD)裝置的操作的流程圖;圖8示出了用于認(rèn)證用戶終端的畫(huà)面的實(shí)施例;圖9是描述通過(guò)根據(jù)本公開(kāi)的實(shí)施方式的語(yǔ)音識(shí)別裝置進(jìn)行的呼叫連接的流程圖;圖10是用于描述創(chuàng)建電話簿上下文模型的方法的實(shí)例的流程圖;圖11是用于描述對(duì)電話簿中包括的電話號(hào)碼進(jìn)行分類(lèi)的方法的實(shí)例的示圖;圖12示出了用于語(yǔ)音識(shí)別的導(dǎo)向畫(huà)面的實(shí)施例;圖13是用于描述創(chuàng)建電話號(hào)碼候選組的方法的實(shí)例的流程圖;本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
一種語(yǔ)音識(shí)別裝置,包括:上下文模型,通過(guò)對(duì)識(shí)別目標(biāo)上下文進(jìn)行建模來(lái)創(chuàng)建所述上下文模型;和語(yǔ)音識(shí)別器,被配置為基于聲學(xué)模型和所述上下文模型創(chuàng)建對(duì)應(yīng)于所接收的語(yǔ)音信號(hào)的候選組,并且將高可靠性權(quán)重值施加給具有與講話長(zhǎng)度對(duì)應(yīng)的音節(jié)長(zhǎng)度的候選項(xiàng)。
【技術(shù)特征摘要】
...
【專(zhuān)利技術(shù)屬性】
技術(shù)研發(fā)人員:房圭燮,
申請(qǐng)(專(zhuān)利權(quán))人:現(xiàn)代自動(dòng)車(chē)株式會(huì)社,起亞自動(dòng)車(chē)株式會(huì)社,
類(lèi)型:發(fā)明
國(guó)別省市:韓國(guó);KR
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。