The invention provides a voice recognition method for semantic service robot, and includes the following steps: System Modeling: establish thesaurus thesaurus database; establishing semantic database framework; the establishment of lip pattern library; system by speech recognition system to collect user input voice commands and facial video, respectively for voice and video clips for recognition of semantic recognition, according to the two the combination of recognition results, the Chinese semantic judgment through the display interface display. The present invention for different services set noun database and the semantic database framework, the robot through a combination of thesaurus database, semantic frame database and lip pattern library, Chinese meaning to understand the identified voice instructions need to express, make speech recognition more accurate semantic.
【技術實現步驟摘要】
一種服務機器人的語音語義識別方法
本專利技術涉及一種語音語義識別方法,尤其涉及一種服務機器人的語音語義識別方法。
技術介紹
計算機科學領域的一個重要分支就是“人工智能”,它企圖了解智能的實質,并生產出一種新的能以人類智能相似的方式作出反應的智能機器,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統等。在自然語言處理方面,如何讓機器人識別和理解人類的語言,并且模擬人類思維方式去思考、推理問題,是完成“人工智能”這個人類偉大理想的重要舉措。不管是中文,還是英文的語言環境中,除了“你”“我”“他”等這類個別的例外之外,詞組才是人類表達語義的最小單位。什么是語義?語義就是自然語言文本的涵義。對機器人來說,就是當機器人遇到這個文本輸入的時候,應該進行的回答或響應。例如,當用戶問“北京明天什么天氣”,計算機能夠理解這句話的意圖是問天氣信息,且城市是北京,時間是明天,從而執行的操作是從特定數據源中查詢到北京明天的天氣信息并呈現給用戶。語義技術比較適合的應用類型至少有兩種:一是操控類的應用,通過語音可以直接發出指令,如語音撥號,發短信等;二是信息查詢類的應用,特別是查詢條件比較多的情況,傳統的交互方式需要用戶用文字輸入很多查詢條件,這對用戶來說很繁瑣。而語義的交互方式可以讓用戶通過一句話或者多回合的對話方式獲取其所要的信息。中國服務機器人的應用領域包括金融、家庭服務、教育、醫療、物流、國防、住宿餐飲、電子商務等。對于服務型機器人我們現階段主要有的就是餐飲機器人、家居機器人、娛樂機器人以及醫療看護機器人等。而且現在的這種類型的機器人已經逐漸被人們接受,使用 ...
【技術保護點】
一種服務機器人的語音語義識別方法,其特征在于,具體包括如下步驟:S1、系統詞庫建模:S101、建立詞庫數據庫,所述詞庫數據庫包括代詞數據庫、動詞數據庫和名詞數據庫,將中文漢字中為代詞、動詞和名詞屬性的詞語和成語分別存入相應的代詞數據庫、動詞數據庫和名詞數據庫;S102、同時,建立語義框架數據庫,所述語義框架數據庫包括存入的詞語可能的組合方式及組合在一起對應的中文意思;S2、系統通過語音識別系統采集用戶輸入的語音指令和面部視頻,將語音指令識別為中文語句,然后將中文語句進行拆解,拆解形式為:代詞+動詞+名詞,并對應詞庫數據庫和語義框架數據庫,得到該語音指令的中文語義;S3、根據語義解析矯正語音識別結果,并輸出綜合評價概率Pa,其中,Pa為歸一化值;S4、取參數C0,當Pa<C0時,進入S5;否則進入S10;S5、輸出各語義片段識別結果可信概率Ps(1)~Ps(N);S6、取參數C1、K,當某語音片段識別結果可信概率Ps(n)<C1(n=1~N)時,語義識別輸出可信概率最大的K個識別結果(K≥2),否則進入S9;S7、建立唇語模式庫,獲取步驟S6中K個識別結果的唇語模式特征RTs ...
【技術特征摘要】
1.一種服務機器人的語音語義識別方法,其特征在于,具體包括如下步驟:S1、系統詞庫建模:S101、建立詞庫數據庫,所述詞庫數據庫包括代詞數據庫、動詞數據庫和名詞數據庫,將中文漢字中為代詞、動詞和名詞屬性的詞語和成語分別存入相應的代詞數據庫、動詞數據庫和名詞數據庫;S102、同時,建立語義框架數據庫,所述語義框架數據庫包括存入的詞語可能的組合方式及組合在一起對應的中文意思;S2、系統通過語音識別系統采集用戶輸入的語音指令和面部視頻,將語音指令識別為中文語句,然后將中文語句進行拆解,拆解形式為:代詞+動詞+名詞,并對應詞庫數據庫和語義框架數據庫,得到該語音指令的中文語義;S3、根據語義解析矯正語音識別結果,并輸出綜合評價概率Pa,其中,Pa為歸一化值;S4、取參數C0,當Pa<C0時,進入S5;否則進入S10;S5、輸出各語義片段識別結果可信概率Ps(1)~Ps(N);S6、取參數C1、K,當某語音片段識別結果可信概率Ps(n)<C1(n=1~N)時,語義識別輸出可信概率最大的K個識別結果(K≥2),否則進入S9;S7、建立唇語模式庫,獲取步驟S6中K個識別結果的唇語模式特征RTs(k),其中k=1~K;S8、根據語音識別系統截取的對應的面部視頻片段,通過視頻唇部運動模式提取,并形成唇部運動模式特征碼RTs0;S8、使用模式匹配算法,以RTs0和RTs(1)~RTs(k)作為輸入,獲得VP(1)~VP(K),并取最小值,即Vpmin(k)=min//PTs(k)-PT0//(k=1~K),其中////為距離算子;S9、輸出Vpmin對應的結果作為識別結果,進入S5循環直至N片段識別完成,進入S10;S10、所述中文語義通過顯示界面顯示。2.根據權利要求1所述的一種服務機器人的語音語義識別方法,其特征在于,所述步驟S101中所述名詞數據庫中的名詞按不同服務領域進行分類存儲,所述服務領域包括餐飲、醫療、購物、運動、住宿、交通;步驟S102中對應的語音框架...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。