基于聲紋信息對音頻/視頻文件進行操作的方法及裝置制造方法及圖紙

技術編號：8563603 閱讀：209 留言：0更新日期：2013-04-11 05:30

本發明專利技術公開一種基于聲紋信息對音/視頻文件進行操作的方法，包括如下步驟：采集發聲目標的聲紋信息；以及根據所述聲紋信息搜索音/視頻文件。本發明專利技術還提供了一種終端設備。本發明專利技術提出的技術方案，能夠根據特定聯系人的聲紋信息對音/視頻文件進行分類，當用戶想找到包含有特定聯系人的音/視頻文件，不必一個一個文件的播放查看，而是直接進行選擇，從而方便用戶查找含有特定人員聲音的音視頻文件。進一步地，本發明專利技術提供的基于聲紋信息對音/視頻文件進行操作的方法可以直接跳轉到音/視頻中某個聯系人說話的時間節點進行播放，從而提供用戶的搜索效率。

全部詳細技術資料下載

【技術實現步驟摘要】
基于聲紋信息對音頻/視頻文件進行操作的方法及裝置
本專利技術涉及移動設備通信應用領域，尤其涉及根據特定聯系人聲紋對終端設備音視頻操作的方法及裝置。
技術介紹
現有終端設備上的錄音器或攝像器可以方便用戶錄制和拍攝音頻和視頻文件。隨著終端設備的性能提高，存儲容量增大，多媒體應用程序的種類增多等條件，用戶很容易錄制或拍攝大量的音頻/視頻文件。然而，面對著大量音頻/視頻文件，當用戶需要查找所有錄制有某個特定聯系人的音頻/視頻文件，或查找和播放某個特定聯系人在某個音頻/視頻文件中的某一段特定信息時，由于無法快速定位，會遇到無從查找的情況。只有一個一個文件的播放查看，才能得到所需文件或片段。有鑒于此，需要提供一種快速查找和分類目標音頻/視頻文件，并定位特定聯系人在該文件中出現時間點的方法和終端設備，以方便用戶查找錄制有特定人員聲音和視頻的文件。
技術實現思路
為了解決上述技術問題，實現用戶快速查找錄制有特定人員聲音或視頻的文件。本專利技術的目的之一在于提供一種基于聲紋信息對音/視頻文件進行操作的方法，包括如下步驟：采集發聲目標的聲紋信息；以及根據所述聲紋信息搜索音/視頻文件；其中，所述音/視頻文件中的所有被錄制的聲音被分割為多個語音單元，每個語音單元只包含其中一個發聲目標的語音，并記錄所述發聲目標在所述音/視頻文件中的時間點。本專利技術的另一目的在于提供一種終端設備，包括：聲紋提取模塊，用于采集發聲目標的聲紋信息；以及執行模塊，用于根據所述聲紋信息搜索音/視頻文件；其中，所述音/視頻文件中的所有被錄制的聲音被分割為多個語音單元，每個語音單元只包含其中一個發聲目標的語音，并...
基于聲紋信息對音頻/視頻文件進行操作的方法及裝置

【技術保護點】
一種基于聲紋信息對音/視頻文件進行操作的方法，其特征在于，包括如下步驟：采集發聲目標的聲紋信息；以及根據所述聲紋信息搜索音/視頻文件。

【技術特征摘要】
1.一種基于聲紋信息對音/視頻文件進行操作的方法，其特征在于，包括如下步驟：采集發聲目標的聲紋信息；以及根據所述聲紋信息搜索音/視頻文件，終端設備顯示出在文件中標注有發聲目標的聲紋信息出現和/或結束的時間點；其中，所述音/視頻文件中的所有被錄制的聲音被分割為多個語音單元，每個語音單元只包含其中一個發聲目標的語音，并記錄所述發聲目標在所述音/視頻文件中的時間點，通過所述時間點映射所述音/視頻出現在相應文件中的位置。2.根據權利要求1所述的方法，其特征在于，所述采集發聲目標的聲紋信息包括：當選中某個發聲目標時，采集聲紋信息；以及存儲采集的聲紋信息。3.根據權利要求2所述的方法，其特征在于，采集和存儲聲紋信息包括：根據所述聲紋信息生成說話人模型；以及將所述說話人模型存儲在本地存儲模塊中。4.根據權利要求3所述的方法，其特征在于，所述存儲采集的聲紋信息包括：根據所述說話人模型進行分類存儲。5.根據權利要求3所述的方法，其特征在于，根據所述聲紋信息搜索音/視頻文件包括：當打開所述本地存儲模塊時，顯示所述音/視頻文件。6.根據權利要求4所述的方法，其特征在于，所述分類包括：根據所述說話人模型對音/視頻文件進行分類顯示。7.根據權利要求6所述的方法，其特征在于，所述分類包括：根據所述發聲目標的種類對音/視頻文件進行分類搜索。8.根據權利要求6所述的方法，其特征在于，所述時間點包括：當選中分類顯示中的所述時間點時，從該時間點開始播放所述音/視頻文件中含有的所述發聲目標的音頻/視頻。9.根據權利要求1所述的方法，其特征在于，當所述發聲目標為聯系人應用程序中的某個聯系人時，所述采集發聲目標的聲紋信息包括：當與該聯系人進行通話時，記錄所述聯系人的聲紋信息。10.根據權利要求1所述的方法，其特征在于，當所述發聲目標為聯系人應用程序中的某個聯系人時，所述采集發聲目標的聲紋信息包括：用戶手動錄制該聯系人語音，記錄所述聯系人的聲紋信息。11.根據權利要求1所述的方法，其特征在于，當所述發聲目標為聯系人應用程序中的某個聯系人時，所述搜索音/視頻文件包括：當選中該聯系人時，播放映射所述聯系人的音/視頻。12.一種終端設備，其特征在于，包括：聲紋提取模塊，用于采集發聲目標的聲...

【專利技術屬性】
技術研發人員：楊帆，蘇騰榮，李世全，馬永健，
申請(專利權)人：北京三星通信技術研究有限公司，三星電子株式會社，
類型：發明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術