A heterogeneous address standard conversion and matching methods, including positive matching and reverse matching, matching the ownership, including information matching point matching and matching details, combined with the method of administrative completion and standardized field processing to address information standardization processing. The invention adopts the method of multi-stage matching and set back flow, single correlation and multiple associated results are effectively differentiated, fault rate is higher, can adapt to different industries to address requirements, high accuracy.
【技術實現步驟摘要】
一種異構地址標準轉換及匹配方法
本專利技術屬于地理信息領域,涉及一種異構地址標準轉換及匹配方法。
技術介紹
隨著大數據的發展,地址云平臺是基于空間標準地址的對外應用、服務平臺,實現了業務數據的實時抽取、清洗、匹配、上圖,系統通過正向、反向匹配,實現了業務數據全上圖,并對上圖后的業務數據進行專題制圖與發布,服務于各行各業對地圖的個性化需求,打造各行業的專屬地圖。地址匹配是將文字性的描述地址與其空間的地理位置坐標建立起對應關系的過程。地址匹配服務按照特定的步驟為地址查找匹配對象。首先要將地址標準化;然后服務器搜索地址匹配參考數據,查找潛在的位置;根據與地址的接近程度為每個候選位置指定分值,最后用分值最高的來匹配這個地址。CN105005577公開了一種地址匹配方法,其采取分層漸進式的匹配方法,具體包括快速匹配、經緯度匹配、模糊匹配和人工判定四個步驟,快速匹配對高質量目標地址進行精確匹配,運用鏈式補充機制適當補充匹配;經緯度匹配依據地圖服務提供商提供的經緯度信息對目標地址和其鄰近小區進行匹配;模糊匹配運用模糊索引對目標地址和相似小區進行匹配;人工判定機制對匹配的結果進行檢驗和把關。該專利技術其還包括地址分詞技術和地址匹配準確性的信心指數機制。該專利技術雖然運用了多重地址匹配技術復合運用問題,但為對地址進行標準化處理,因此難以適應不同領域對地址的需求。
技術實現思路
本專利技術提供了一種異構地址標準轉換及匹配方法,以解決地址難以標準化、適應性不強、準確率不高的不足。為實現上述目的,本專利技術提供了一種異構地址標準轉換及匹配方法,包括如下步驟:步驟1:驗證數據合法性:若 ...
【技術保護點】
一種異構地址標準轉換及匹配方法,其特征在于,依次包括如下步驟:步驟1:驗證數據合法性:若數據合法則執行步驟2,否則,直接拋出異常,執行結束;步驟2:判斷數據正向匹配,若是則得到匹配行政區劃信息標識,并進行正向匹配;若數據不滿足正向匹配,則進行反向匹配;步驟3:判斷步驟2中的正向匹配或反向匹配的結果是否為空,若匹配結果為空則拋出異常,執行結束;若匹配結果不為空,則得到匹配結果信息數據;步驟4:根據步驟3中的匹配結果信息數據判斷是否匹配管理轄區,若滿足則進行歸屬匹配再返回結果;否則直接返回結果,執行結束。
【技術特征摘要】
1.一種異構地址標準轉換及匹配方法,其特征在于,依次包括如下步驟:步驟1:驗證數據合法性:若數據合法則執行步驟2,否則,直接拋出異常,執行結束;步驟2:判斷數據正向匹配,若是則得到匹配行政區劃信息標識,并進行正向匹配;若數據不滿足正向匹配,則進行反向匹配;步驟3:判斷步驟2中的正向匹配或反向匹配的結果是否為空,若匹配結果為空則拋出異常,執行結束;若匹配結果不為空,則得到匹配結果信息數據;步驟4:根據步驟3中的匹配結果信息數據判斷是否匹配管理轄區,若滿足則進行歸屬匹配再返回結果;否則直接返回結果,執行結束。2.根據權利要求1所述的一種異構地址標準轉換及匹配方法,其特征在于,所述正向匹配的具體步驟依次為:S11:根據傳入的數據詳址信息、省市區縣信息驗證數據的合法性,若數據合法則進行步驟S12;若數據不合法,直接拋出異常,執行結束;S12:將數據進行劃分為信息點、詳址信息數據、省市區縣的信息數據;若數據為省市區縣的信息數據則進行行政區劃補全和標準化字段處理;S13:根據步驟S12判斷傳入的數據是否同時沒有信息點和詳址;若傳入的數據同時沒有信息點和詳址,則執行沒有詳址和信息點處理并返回結果;若傳入的數據為信息點或詳址信息,則相應地執行信息點匹配和詳址匹配。3.根據權利要求2所述的一種異構地址標準轉換及匹配方法,其特征在于,所述行政區劃補全和標準化字段處理的步驟依次為:S121:將傳入數據進行拼接組裝查詢地址,所述地址包括省市區縣、鄉鎮、居委會、街路巷;S122:拆分所述拼接的地址,得到對應詞組;S123:以所選行政區劃為準,解決行政區劃沖突問題;S124:執行Solr地址查詢,對省市區縣字段補全,得到分詞后標準化的詞組列表。4.根據權利要求3所述的一種異構地址標準轉換及匹配方法,其特征在于,所述行政區劃補全和標準化字段處理的步驟還包括重新標準化地址,依次為:首先,獲取標準地址SolrBean;接著根據詞類型標準化行政區劃地址,并返回標準地址Solr對象;若所述Solr對象不存在或存在多條,查詢上一級地址,如果未找到,繼續查詢上一級地址直至Solr對象唯一;最后,判斷標準地址是否存在以及是否匹配最近地址,若是則匹配最近的地址,專門針對門牌、單元、房間進行匹配;若不存在最近地址,則返回得到的標準值SolrBean。5.根據權利要求2或4所述的一種異構地址標準轉換及匹配方法,其特征在于,所述步驟S13中的沒有詳址和信息點的具體步驟為:S131:重新標準化地址,設置并返回最小級別的行政區域標準地址;S132:判斷返回的標準地址是否存在:若存在,設置匹配率得分,接著獲取最小級別行政區劃的標準地址信息,得到最終標準地址信息;若不存在,拋出異常處理,執行結束。6.根據權利要求2所述的一種異構地址標準轉換及匹配方法,其特征在于,所述信息點匹配的步驟依次為:首先判斷信息點標準地址是否存在,若存在,則執行根據信息點的標準地址信息,若不存在,執行詳址匹配;接著根據得到的...
【專利技術屬性】
技術研發人員:張宏利,
申請(專利權)人:廣東精一規劃信息科技股份有限公司,
類型:發明
國別省市:廣東,44
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。