溫馨提示:您尚未登錄,請點 登陸 后下載,如果您還沒有賬戶請點 注冊 ,登陸完成后,請刷新本頁查看技術詳細信息。
本發明提供一種基于大規模語料的提詞方法及裝置,包括步驟:從收集的語料中統計候選詞的凝合度及候選詞的自由度;將所述候選詞的凝合度與候選詞的自由度的乘積獲得成詞得分;提取所述成詞得分超過預先設定閾值的候選詞。在中文沒有標準詞定義和劃分的情況下,...該專利屬于北京捷通華聲科技股份有限公司所有,僅供學習研究參考,未經過北京捷通華聲科技股份有限公司授權不得商用。
溫馨提示:您尚未登錄,請點 登陸 后下載,如果您還沒有賬戶請點 注冊 ,登陸完成后,請刷新本頁查看技術詳細信息。
本發明提供一種基于大規模語料的提詞方法及裝置,包括步驟:從收集的語料中統計候選詞的凝合度及候選詞的自由度;將所述候選詞的凝合度與候選詞的自由度的乘積獲得成詞得分;提取所述成詞得分超過預先設定閾值的候選詞。在中文沒有標準詞定義和劃分的情況下,...