一種數據處理方法和裝置制造方法及圖紙

技術編號：8656006 閱讀：133 留言：0更新日期：2013-05-01 23:41

本發明專利技術提供了一種數據處理方法和裝置，以解決多次遍歷多種不同的文件導致處理時間比較長，效率較低的問題。所述的方法包括：獲取n種目標文件，其中，所述目標文件用于存儲各個目標的描述信息，一種目標文件存儲一種類型的描述信息；對第一種目標文件進行遍歷，并依次獲取所述第一種目標文件中的目標，對應類型的描述信息，以及所述目標在第一種目標文件中的行數；按照在第一種目標文件中的行數確定所述目標在其他目標文件的相應行數，并依次在其他目標文件的相應行數查找所述目標，并獲取對應類型的描述信息，其中，所述其他目標文件是除第一種目標文件以外的n-1種目標文件；將所述目標和對應各類型的描述信息進行關聯，構成總目標文件。

全部詳細技術資料下載

【技術實現步驟摘要】

本專利技術涉及數據處理技術，特別是涉及一種數據處理方法和裝置。
技術介紹
一個目標可能含有多種不同類型的描述信息，而在對目標的數據進行處理時，由于不同類型的描述信息是由不同的處理方法得到的，因此會對各類型的描述信息分別進行存儲。上述的處理方法就使得同一目標的描述信息存儲于多個不同的文件中，因而當要對該目標進行處理時，就需要分別從不同的文件中獲取該目標的描述信息。在這個過程中，需要分別遍歷每一個文件的數據，以查找所述目標的描述信息。例如，針對網絡中不同網站的瀏覽數據，則所述網站的瀏覽數據可以包括訪問量、點擊率、用戶的平均訪問時間等，若將網站作為目標，由于對于不同的瀏覽數據會采用不同的處理方法，因而上述瀏覽數據經過處理后會保存于不同的文件中。當要對網站的瀏覽數據進行綜合分析時，就需要分別獲取每個網站的瀏覽數據，即針對每一個網站，要分別遍歷每一個文件，查找到所述目標再獲取對應的數據。但是，采用上述這種方法獲取數據時，由于要多次遍歷多種不同的文件，因此處理時間比較長,效率較低。
技術實現思路
本專利技術提供了一種數據處理方法和裝置，以解決現有技術多次遍歷多種不同的文件，導致處理時間比較長，效率較低的問題。為了解決上述問題，本專利技術公開了一種數據處理方法，包括:獲取η種目標文件，其中，所述目標文件用于存儲各個目標的描述信息，一種目標文件存儲一種類型的描述信息，η為正整數；對第一種目標文件進行遍歷，并依次獲取所述第一種目標文件中的目標，對應類型的描述信息，以及所述目標在第一種目標文件中的行數；按照在第一種目標文件中的行數確定所述目標在其他目標文件的相應行數，并依次在...

【技術保護點】
一種數據處理方法，其特征在于，包括：獲取n種目標文件，其中，所述目標文件用于存儲各個目標的描述信息，一種目標文件存儲一種類型的描述信息，n為正整數；對第一種目標文件進行遍歷，并依次獲取所述第一種目標文件中的目標，對應類型的描述信息，以及所述目標在第一種目標文件中的行數；按照在第一種目標文件中的行數確定所述目標在其他目標文件的相應行數，并依次在其他目標文件的相應行數查找所述目標，并獲取對應類型的描述信息，其中，所述其他目標文件是除第一種目標文件以外的n?1種目標文件；將所述目標和對應各類型的描述信息進行關聯，構成總目標文件。

【技術特征摘要】
1.一種數據處理方法，其特征在于，包括: 獲取η種目標文件，其中，所述目標文件用于存儲各個目標的描述信息，一種目標文件存儲一種類型的描述信息，η為正整數；對第一種目標文件進行遍歷，并依次獲取所述第一種目標文件中的目標，對應類型的描述信息，以及所述目標在第一種目標文件中的行數；按照在第一種目標文件中的行數確定所述目標在其他目標文件的相應行數，并依次在其他目標文件的相應行數查找所述目標，并獲取對應類型的描述信息，其中，所述其他目標文件是除第一種目標文件以外的η-1種目標文件；將所述目標和對應各類型的描述信息進行關聯，構成總目標文件。2.根據權利要求1所述的方法，其特征在于，所述獲取η種目標文件之后，還包括: 獲取每種目標文件的總行數，并將其他目標文件的總行數，以第一種目標文件的總行數為基準進行歸一化處理，獲取其他目標文件相對應第一種目標文件的行數比。3.根據權利要求2所述的方法，其特征在于，還包括: 當所述目標在第一種目標文件中的行數達到預設條件時，重新計算所述行數比。4.根據權利要求3所述的方法，其特征在于，所述重新計算所述行數比，包括: 將第一種目標文件的總行數減去所述目標在第一種目標文件中的行數，獲取對應的第一行數；獲取所述目標在各其他目標文件中的各相應行數，并將各其他目標文件的總行數減去對應各相應行數，獲取在各其他目標文件中對應的第二行數；將所述在各其他目標文件中對應的第二行數，以所述第一行數為基準進行歸一化處理，獲取重新計算的其他目標文件相對應第一種目標文件的行數比。5.根據權利要求2或4任一所述的方法，其特征在于，所述按照在第一種目標文件中的行數確定所述目標在其他目標文件的相應行數，包括: 按照在第一種目標文件中的行數和對應的行數比，計算所述目標在其他目標文件的相應行數。6.根據權利要求5所述的方法，其特征在于，所述在其他目標文件的相應行數查找所述目標，包括: 查找其他目標文件的相應行數，檢測所述相應行數上存儲的是否是所述目標；若所述相...

【專利技術屬性】
技術研發人員：羅峰，黃蘇支，李娜，
申請(專利權)人：北京億贊普網絡技術有限公司，
類型：發明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術