• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    文件解析方法及裝置制造方法及圖紙

    技術(shù)編號(hào):15690979 閱讀:215 留言:0更新日期:2017-06-24 03:48
    本發(fā)明專利技術(shù)適用于數(shù)據(jù)解析技術(shù)領(lǐng)域,提供了一種文件解析方法及裝置,所述解析方法包括:預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略;讀取待解析文件中的數(shù)據(jù),獲取當(dāng)前的字段解析狀態(tài);從所述預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略中查找出與所述當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略;利用與所述當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略執(zhí)行相應(yīng)的文件解析處理流程。本發(fā)明專利技術(shù)可以快速對(duì)文件進(jìn)行解析,保證解析的高效性,并且具有高容錯(cuò)性,能夠處理不規(guī)范的數(shù)據(jù)。

    File parsing method and apparatus

    The invention is applicable to the technical field of data analysis, and provides a device for document analytic method, the analyzing method comprises the following steps: pre configured in different field analytical condition to read the file parsing strategy execution corresponding to the preset special characters; read the file to be analyzed in the data acquisition, analysis of the current state of the field; from the the pre configured different field analytical condition to read the corresponding file parsing strategy execution to find file parsing strategies match field analytical state of the current default after using special characters; and the file parsing strategy when the field analytical state before matching the implementation of the corresponding process file parsing. The invention can parse files quickly, guarantee the efficiency of parsing, and has high fault tolerance and can handle nonstandard data.

    【技術(shù)實(shí)現(xiàn)步驟摘要】
    文件解析方法及裝置
    本專利技術(shù)屬于數(shù)據(jù)解析
    ,尤其涉及文件解析方法及裝置。
    技術(shù)介紹
    現(xiàn)今,不同文本的格式規(guī)范各不相同,常見的CSV解析方法嚴(yán)重依賴與CSV文件的格式規(guī)范,即只能處理常規(guī)CSV文件,當(dāng)CSV文件稍有不規(guī)范的地方,就會(huì)導(dǎo)致整個(gè)文件解析失敗,容錯(cuò)性低,而為了提高容錯(cuò)性,會(huì)對(duì)一行數(shù)據(jù)進(jìn)行多次掃描分析,降低解析效率。因此,現(xiàn)有技術(shù)中存在著解析文件時(shí)無法處理不規(guī)范數(shù)據(jù),容錯(cuò)性低,且解析效率低的問題。
    技術(shù)實(shí)現(xiàn)思路
    本專利技術(shù)實(shí)施例提供一種文件解析方法及裝置,旨在解決現(xiàn)有技術(shù)中解析文件時(shí)無法處理不規(guī)范數(shù)據(jù),容錯(cuò)性低,且解析效率低的問題。第一方面,本專利技術(shù)實(shí)施例提供了一種文件解析方法,所述解析方法包括:預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略;讀取待解析文件中的數(shù)據(jù),獲取當(dāng)前的字段解析狀態(tài);從所述預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略中查找出與所述當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略;利用與所述當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略執(zhí)行相應(yīng)的文件解析處理流程。第二方面,本專利技術(shù)實(shí)施例提供了一種文件解析裝置,所述解析裝置包括:配置模塊,用于預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略;獲取模塊,用于讀取待解析文件中的數(shù)據(jù),獲取當(dāng)前的字段解析狀態(tài);查找模塊,用于從所述預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略中查找出與所述當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略;執(zhí)行模塊,用于利用與所述當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略執(zhí)行相應(yīng)的文件解析處理流程。本專利技術(shù)實(shí)施例與現(xiàn)有技術(shù)相比存在的有益效果是:本專利技術(shù)實(shí)施例通過預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略;讀取待解析文件中的數(shù)據(jù),獲取當(dāng)前的字段解析狀態(tài);從預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略中查找出與當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略;利用與當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略執(zhí)行相應(yīng)的文件解析處理流程,從而可以快速對(duì)文件進(jìn)行解析,保證解析的高效性,并且具有高容錯(cuò)性,能夠處理不規(guī)范的數(shù)據(jù)。附圖說明圖1為本專利技術(shù)實(shí)施例提供的一種文件解析方法的流程示意圖;圖2為圖1所示實(shí)施例中的步驟S104的細(xì)化步驟流程示意圖;圖3為圖2所示實(shí)施例中的步驟S204的細(xì)化步驟流程示意圖;圖4為圖2所示實(shí)施例中的步驟S204的另一細(xì)化步驟流程示意圖;圖5為圖1所示實(shí)施例中的步驟S104的另一細(xì)化步驟流程示意圖;圖6為本專利技術(shù)實(shí)施例提供的一種文件解析裝置的結(jié)構(gòu)示意圖;圖7為圖6所示實(shí)施例中的執(zhí)行模塊604的細(xì)化結(jié)構(gòu)示意圖。具體實(shí)施方式為了使本專利技術(shù)的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本專利技術(shù)進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本專利技術(shù),并不用于限定本專利技術(shù)。為了使本專利技術(shù)的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本專利技術(shù)進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本專利技術(shù),并不用于限定本專利技術(shù)。為了說明本專利技術(shù)所述的技術(shù)方案,下面通過具體實(shí)施例來進(jìn)行說明。請(qǐng)參閱圖1,圖1為本專利技術(shù)實(shí)施例提供的一種文件解析方法的流程示意圖。本實(shí)施例的執(zhí)行主體為解析裝置。本實(shí)施例提供的文件解析方法包括以下步驟:步驟S101、預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略。在本專利技術(shù)實(shí)施例中,預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略,并將該文件解析策略保存于解析裝置中。其中,文件解析策略為對(duì)待解析文件中的數(shù)據(jù)進(jìn)行讀取、容錯(cuò)處理、保存等處理,并對(duì)字段解析狀態(tài)進(jìn)行狀態(tài)轉(zhuǎn)變的文件解析策略。步驟S102、讀取待解析文件中的數(shù)據(jù),獲取當(dāng)前的字段解析狀態(tài)。在本專利技術(shù)實(shí)施例中,解析裝置在執(zhí)行文件解析的過程中,自動(dòng)獲取當(dāng)前處于何種文件解析狀態(tài),在文件解析狀態(tài)下讀取到預(yù)設(shè)特殊字符之后,根據(jù)文件解析狀態(tài)所對(duì)應(yīng)的文件解析策略解析待解析的文件。步驟S103、從預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略中查找出與當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略。在本專利技術(shù)實(shí)施例中,在某個(gè)字段解析狀態(tài)下,若解析裝置讀取到某個(gè)預(yù)設(shè)特殊字符,則從預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略中查找出與上述某個(gè)字段解析狀態(tài)相匹配的文件解析策略。步驟S104、利用與當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略執(zhí)行相應(yīng)的文件解析處理流程。在本專利技術(shù)實(shí)施例中,在某個(gè)字段解析狀態(tài)下,解析裝置利用與該字段解析狀態(tài)相匹配的文件解析策略對(duì)待解析文件中的數(shù)據(jù)進(jìn)行讀取、容錯(cuò)處理、保存等處理,以及將該字段解析狀態(tài)轉(zhuǎn)變成其他字段解析狀態(tài)。進(jìn)一步地,圖2示出了步驟S104中利用與當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略執(zhí)行相應(yīng)的文件解析處理流程的具體實(shí)現(xiàn)流程,詳述如下:步驟S201、當(dāng)當(dāng)前的字段解析狀態(tài)為行結(jié)束狀態(tài)時(shí),讀取下一個(gè)字符,若下一個(gè)字符為字段包括符,則根據(jù)與行結(jié)束狀態(tài)相匹配的文件解析策略確定當(dāng)前的字段解析狀態(tài)由行結(jié)束狀態(tài)轉(zhuǎn)變成字段開始狀態(tài)。在本專利技術(shù)實(shí)施例中,當(dāng)當(dāng)前的字段解析狀態(tài)為行結(jié)束狀態(tài)時(shí),讀取下一個(gè)字符,并判斷該字符是否為字段包括符,若是字段包括符,則根據(jù)與行結(jié)束狀態(tài)相匹配的文件解析策略確定當(dāng)前的字段解析狀態(tài)由行結(jié)束狀態(tài)轉(zhuǎn)變成字段開始狀態(tài)。若不是字段包括符,則根據(jù)與行結(jié)束狀態(tài)相匹配的文件解析策略確定當(dāng)前的字段解析狀態(tài)由行結(jié)束狀態(tài)轉(zhuǎn)變成字段匹配狀態(tài)。步驟S202、當(dāng)當(dāng)前的字段解析狀態(tài)為字段開始狀態(tài)時(shí),若接下來讀取到的字符不是字段包括符,則根據(jù)與字段開始狀態(tài)相匹配的文件解析策略確定當(dāng)前的字段解析狀態(tài)由字段開始狀態(tài)轉(zhuǎn)變成字段匹配狀態(tài)。在本專利技術(shù)實(shí)施例中,當(dāng)當(dāng)前的字段解析狀態(tài)為字段開始狀態(tài)時(shí),若接下來讀取到的字符是字段包括符,則根據(jù)與字段開始狀態(tài)相匹配的文件解析策略確定當(dāng)前的字段解析狀態(tài)由字段開始狀態(tài)轉(zhuǎn)變成字段結(jié)束狀態(tài)。若接下來讀取到的字符不是字段包括符,則根據(jù)與字段開始狀態(tài)相匹配的文件解析策略確定當(dāng)前的字段解析狀態(tài)由字段開始狀態(tài)轉(zhuǎn)變成字段匹配狀態(tài)。步驟S203、當(dāng)當(dāng)前的字段解析狀態(tài)為字段匹配狀態(tài)時(shí),根據(jù)與字段匹配狀態(tài)相匹配的文件解析策略讀取待解析文件中的數(shù)據(jù),若讀取到當(dāng)前字符為字段包括符,則根據(jù)與字段匹配狀態(tài)相匹配的文件解析策略確定當(dāng)前的字段解析狀態(tài)由字段匹配狀態(tài)轉(zhuǎn)變成字段結(jié)束狀態(tài)。在本專利技術(shù)實(shí)施例中,當(dāng)當(dāng)前的字段解析狀態(tài)為字段匹配狀態(tài)時(shí),根據(jù)與字段匹配狀態(tài)相匹配的文件解析策略讀取待解析文件中的數(shù)據(jù),若讀取到當(dāng)前字符為字段包括符,則根據(jù)與字段匹配狀態(tài)相匹配的文件解析策略確定當(dāng)前的字段解析狀態(tài)由字段匹配狀態(tài)轉(zhuǎn)變成字段結(jié)束狀態(tài)。若讀取到當(dāng)前字符不為字段包括符,則根據(jù)與字段匹配狀態(tài)相匹配的文件解析策略繼續(xù)讀取待解析文件中的數(shù)據(jù),且不轉(zhuǎn)變當(dāng)前的字段解析狀態(tài)。步驟S204、當(dāng)當(dāng)前的字段解析狀態(tài)為字段結(jié)束狀態(tài)時(shí),讀取下一個(gè)字符,若下一個(gè)字符不是字段分隔符或行結(jié)束符,則根據(jù)與字段結(jié)束狀態(tài)相匹配的文件解析策略對(duì)當(dāng)前字符之后的字符進(jìn)行容錯(cuò)處理。進(jìn)一步地,圖3示出了步驟S204中當(dāng)當(dāng)前的字段解析狀態(tài)為字段結(jié)束狀態(tài)時(shí),讀取下一個(gè)字符,若下一個(gè)字符不是本文檔來自技高網(wǎng)...
    文件解析方法及裝置

    【技術(shù)保護(hù)點(diǎn)】
    一種文件解析方法,其特征在于,所述解析方法包括:預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略;讀取待解析文件中的數(shù)據(jù),獲取當(dāng)前的字段解析狀態(tài);從所述預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略中查找出與所述當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略;利用與所述當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略執(zhí)行相應(yīng)的文件解析處理流程。

    【技術(shù)特征摘要】
    1.一種文件解析方法,其特征在于,所述解析方法包括:預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略;讀取待解析文件中的數(shù)據(jù),獲取當(dāng)前的字段解析狀態(tài);從所述預(yù)先配置不同字段解析狀態(tài)下讀取到預(yù)設(shè)特殊字符后所對(duì)應(yīng)執(zhí)行的文件解析策略中查找出與所述當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略;利用與所述當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略執(zhí)行相應(yīng)的文件解析處理流程。2.如權(quán)利要求1所述的解析方法,其特征在于,所述利用與所述當(dāng)前的字段解析狀態(tài)相匹配的文件解析策略執(zhí)行相應(yīng)的文件解析處理流程包括:當(dāng)所述當(dāng)前的字段解析狀態(tài)為行結(jié)束狀態(tài)時(shí),讀取下一個(gè)字符,若所述下一個(gè)字符為字段包括符,則所述當(dāng)前的字段解析狀態(tài)由所述行結(jié)束狀態(tài)轉(zhuǎn)變成字段開始狀態(tài);當(dāng)所述當(dāng)前的字段解析狀態(tài)為所述字段開始狀態(tài)時(shí),若接下來讀取到的字符不是所述字段包括符,則所述當(dāng)前的字段解析狀態(tài)由所述字段開始狀態(tài)轉(zhuǎn)變成字段匹配狀態(tài);當(dāng)所述當(dāng)前的字段解析狀態(tài)為所述字段匹配狀態(tài)時(shí),根據(jù)與所述字段匹配狀態(tài)相匹配的文件解析策略讀取所述待解析文件中的數(shù)據(jù),若讀取到當(dāng)前字符為所述字段包括符,則所述當(dāng)前的字段解析狀態(tài)由所述字段匹配狀態(tài)轉(zhuǎn)變成字段結(jié)束狀態(tài);當(dāng)所述當(dāng)前的字段解析狀態(tài)為所述字段結(jié)束狀態(tài)時(shí),讀取下一個(gè)字符,若所述下一個(gè)字符不是字段分隔符或行結(jié)束符,則對(duì)所述當(dāng)前字符之后的字符進(jìn)行容錯(cuò)處理。3.如權(quán)利要求2所述的解析方法,其特征在于,所述當(dāng)所述當(dāng)前的字段解析狀態(tài)為所述字段結(jié)束狀態(tài)時(shí),讀取下一個(gè)字符,若所述下一個(gè)字符不是字段分隔符或行結(jié)束符,則對(duì)所述當(dāng)前字符之后的字符進(jìn)行容錯(cuò)處理包括:當(dāng)所述當(dāng)前的字段解析狀態(tài)為所述字段結(jié)束狀態(tài)時(shí),讀取所述下一個(gè)字符,若所述下一個(gè)字符為所述字段包括符,檢測(cè)所述待解析文件中是否有出錯(cuò)標(biāo)簽;若有所述出錯(cuò)標(biāo)簽,則關(guān)閉容錯(cuò)標(biāo)記功能,結(jié)束容錯(cuò)處理;若沒有所述出錯(cuò)標(biāo)簽,則打開所述容錯(cuò)標(biāo)記功能,在文件解析出錯(cuò)的地方設(shè)置出錯(cuò)標(biāo)簽,且所述當(dāng)前的字段解析狀態(tài)由所述字段結(jié)束狀態(tài)轉(zhuǎn)變成所述字段匹配狀態(tài)。4.如權(quán)利要求2所述的解析方法,其特征在于,所述當(dāng)所述當(dāng)前的字段解析狀態(tài)為所述字段結(jié)束狀態(tài)時(shí),讀取下一個(gè)字符,若所述下一個(gè)字符不是字段分隔符或行結(jié)束符,則對(duì)所述當(dāng)前字符之后的字符進(jìn)行容錯(cuò)處理還包括:當(dāng)所述當(dāng)前的字段解析狀態(tài)為所述字段結(jié)束狀態(tài)時(shí),讀取所述下一個(gè)字符,若所述下一個(gè)字符為轉(zhuǎn)義字符或普通字符,則檢測(cè)所述待解析文件中是否有出錯(cuò)標(biāo)簽;若有所述出錯(cuò)標(biāo)簽,則延長(zhǎng)所述出錯(cuò)標(biāo)簽的標(biāo)志范圍;若沒有所述出錯(cuò)標(biāo)簽,則打開容錯(cuò)標(biāo)記功能,在文件解析出錯(cuò)的地方設(shè)置所述出錯(cuò)標(biāo)簽,且所述當(dāng)前的字段解析狀態(tài)由所述字段結(jié)束狀態(tài)轉(zhuǎn)變成所述字段匹配狀態(tài)。5.如權(quán)利要求2所述的解析方法,其特征在于,所述解析方法還包括:當(dāng)所述當(dāng)前的字段解析狀態(tài)為所述字段結(jié)束狀態(tài)時(shí),若所述下一個(gè)字符為所述字段分隔符或所述行結(jié)束符,檢測(cè)所述待解析文件中是否有出錯(cuò)標(biāo)簽;若沒有所述出錯(cuò)標(biāo)簽,則所述當(dāng)前的字段解析狀態(tài)由所述字段結(jié)束狀態(tài)轉(zhuǎn)變成所述字段分割狀態(tài)或所述行結(jié)束狀態(tài);若有所述出錯(cuò)標(biāo)簽,則檢測(cè)容錯(cuò)標(biāo)記功能是否打開;若打開,則延長(zhǎng)所述出錯(cuò)標(biāo)簽的標(biāo)志范圍;若沒有打開,則所述當(dāng)前的字段解析狀態(tài)由所述字段結(jié)束狀態(tài)轉(zhuǎn)變...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:陳曉攀,熊志強(qiáng),胡偉梁嘉,
    申請(qǐng)(專利權(quán))人:深圳市漢云科技有限公司,
    類型:發(fā)明
    國(guó)別省市:廣東,44

    網(wǎng)友詢問留言 已有0條評(píng)論
    • 還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。

    1
    主站蜘蛛池模板: 精选观看中文字幕高清无码| 亚洲AV无码成人网站在线观看| 久久精品无码一区二区三区免费 | 无码GOGO大胆啪啪艺术| 亚洲国产精品无码专区在线观看| 97碰碰碰人妻视频无码| 人妻丰满熟妇aⅴ无码| 亚洲AV无码一区二区大桥未久| 无码人妻少妇伦在线电影| 亚洲国产精品成人精品无码区| 亚洲精品无码久久久久久| 亚洲日韩激情无码一区| 日韩毛片免费无码无毒视频观看| 最新中文字幕AV无码不卡| 国产AV无码专区亚洲AV蜜芽 | 亚洲国产精品无码一线岛国| 国产综合无码一区二区色蜜蜜 | 亚洲va成无码人在线观看| 精品韩国亚洲av无码不卡区| 日韩精品无码专区免费播放| 免费a级毛片无码a∨免费软件| 亚洲av中文无码字幕色不卡 | 青春草无码精品视频在线观| 毛片无码免费无码播放| 13小箩利洗澡无码视频网站免费| 无码国模国产在线无码精品国产自在久国产 | 日韩精品无码一区二区三区不卡| yy111111少妇影院里无码| 免费无码婬片aaa直播表情| 亚洲AV无码国产剧情| 亚洲av永久中文无码精品综合| 久久久久亚洲精品无码蜜桃| 久久久无码中文字幕久...| 亚洲国产精品无码专区影院| 亚洲AV无码码潮喷在线观看| 国产三级无码内射在线看| 亚洲AV无码1区2区久久| 无码欧精品亚洲日韩一区| 亚洲国产成AV人天堂无码| 久久精品aⅴ无码中文字字幕不卡 久久精品aⅴ无码中文字字幕重口 | 亚洲国产成AV人天堂无码|