本發(fā)明專利技術(shù)適用于互聯(lián)網(wǎng)技術(shù)領(lǐng)域,提供了一種網(wǎng)頁分割的方法及裝置,所述方法包括:獲取客戶端發(fā)送的超文本傳輸協(xié)議HTTP報文,所述HTTP報文攜帶操作標(biāo)識,所述操作標(biāo)識用于標(biāo)識發(fā)送所述HTTP報文時的點擊操作;判斷所述HTTP報文中源網(wǎng)際協(xié)議IP地址相同的HTTP報文所攜帶的操作標(biāo)識是否相同;若所述源IP地址相同的HTTP報文攜帶的操作標(biāo)識相同,則確定所述源IP地址相同的HTTP報文是同一次點擊操作所生成的報文。通過本發(fā)明專利技術(shù)可有效提高網(wǎng)頁分割的效率和準(zhǔn)確率。
【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)屬于互聯(lián)網(wǎng)
,尤其涉及一種網(wǎng)頁分割的方法及裝置。
技術(shù)介紹
網(wǎng)頁分割技術(shù)是指將一次網(wǎng)頁點擊操作產(chǎn)生的多個HTTP (Hypertext TransportProtocol,超文本傳送協(xié)議)報文(GET報文或POST報文)關(guān)聯(lián)起來的技術(shù),通過這種技術(shù),可以區(qū)分對不同網(wǎng)頁所進(jìn)行的點擊操作或者對同一網(wǎng)頁所進(jìn)行的不同的點擊操作。現(xiàn)有技術(shù)一般通過時間戳對網(wǎng)頁進(jìn)行分割。具體地,監(jiān)控中心通過采集探針獲取客戶端發(fā)送的HTTP報文后,把所述HTTP報文中源IP地址相同的HTTP報文按照時間戳(例如,獲取HTTP報文時的時間戳)進(jìn)行排序,若兩個相鄰的HTTP報文之間的時間差(即兩個HTTP報文的時間戳之間的時間間隔)小于第一預(yù)設(shè)閾值(例如,2秒),則確定這兩個相鄰的HTTP報文是同一次點擊操作生成的報文;若這兩個相鄰的HTTP報文之間的時間差大于第二預(yù)設(shè)閾值(例如,5秒),則確定這兩個相鄰的HTTP報文不是同一次點擊操作所生成的報文;若這兩個相鄰的HTTP報文之間的時間差在第一預(yù)設(shè)閾值與第二預(yù)設(shè)閾值之間,則需要進(jìn)一步判斷這兩個相鄰的HTTP報文的參考(Reference)地址、主機(jī)(Host)地址以及通用資源標(biāo)識符(Uniform Resource Identifier,URI)地址是否相同,如果相同,則確定這兩個相鄰的HTTP報文是同一次點擊操作所生成的報文。然而,現(xiàn)有技術(shù)存在以下問題:1)采用時間差的方式判斷HTTP報文是否是同一次點擊操作所生產(chǎn)的報文是不準(zhǔn)確的,現(xiàn)在很多的智能終端(例如四核智能手機(jī)等)都可以并行打開多個瀏覽器窗口,用戶有可能在相距很短的時間進(jìn)行多次點擊操作,根據(jù)時間差來判斷是否為同一次點擊操作生成的網(wǎng)頁不夠準(zhǔn)確;2)現(xiàn)有技術(shù)中,同一網(wǎng)頁中的各個關(guān)系對象(例如圖片、音視頻等)的Reference地址、Host地址或URI地址有可能是不同的,因此通過Reference地址、Host地址以及URI地址來判斷HTTP報文是否是同一次點擊操作所生成的報文也不夠準(zhǔn)確。
技術(shù)實現(xiàn)思路
本專利技術(shù)實施例的目的在于提供一種網(wǎng)頁分割的方法,以便監(jiān)控中心能夠準(zhǔn)確地對網(wǎng)頁進(jìn)行分割。第一方面,一種網(wǎng)頁分割的方法,所述方法包括:獲取客戶端發(fā)送的超文本傳輸協(xié)議HTTP報文,所述HTTP報文攜帶操作標(biāo)識,所述操作標(biāo)識用于標(biāo)識發(fā)送所述HTTP報文時的點擊操作;判斷所述HTTP報文中源網(wǎng)際協(xié)議IP地址相同的HTTP報文所攜帶的操作標(biāo)識是否相同;若所述源IP地址相同的HTTP報文攜帶的操作標(biāo)識相同,則確定所述源IP地址相同的HTTP報文是同一次點擊操作所生成的報文。在第一方面的第一種可能的實現(xiàn)方式中,所述方法還包括:若所述源IP地址相同的HTTP報文攜帶的操作標(biāo)識不同,則確定所述源IP地址相同的HTTP報文不是同一次點擊操作所生成的報文。結(jié)合第一方面或第一方面的第一種可能的實現(xiàn)方式,在第二種可能的實現(xiàn)方式中,在所述判斷所述HTTP報文中源IP地址相同的HTTP報文所攜帶的操作標(biāo)識是否相同之前,所述方法還包括:根據(jù)源IP地址,對所述客戶端發(fā)送的HTTP報文進(jìn)行分類。結(jié)合第一方面的第二種可能的實現(xiàn)方式,在第三種可能的實現(xiàn)方式中,在所述根據(jù)源IP地址,對所述客戶端發(fā)送的HTTP報文進(jìn)行分類之后,所述方法還包括:按照時間戳的大小,對分類后的HTTP報文進(jìn)行排序,其中,所述時間戳為獲取所述HTTP報文時的時間戳或所述客戶端發(fā)送所述HTTP報文時的時間戳。結(jié)合第一方面或第一方面的第一種可能的實現(xiàn)方式或第一方面的第二種可能的實現(xiàn)方式或第一方面的第三種可能的實現(xiàn)方式,在第四種可能的實現(xiàn)方式中,所述HTTP報文包括GET報文或POST報文。第二方面,一種網(wǎng)頁分割的裝置,所述裝置包括:報文獲取單元,用于獲取客戶端發(fā)送的超文本傳輸協(xié)議HTTP報文,所述HTTP報文攜帶操作標(biāo)識,所述操作標(biāo)識用于標(biāo)識發(fā)送所述HTTP報文時的點擊操作;判斷單元,用于判斷所述報文獲取單元獲取的HTTP報文中源網(wǎng)際協(xié)議IP地址相同的HTTP報文所攜帶的操作標(biāo)識是否相同;確定單元,用于在所述判斷單元判斷結(jié)果為是時,確定所述源IP地址相同的HTTP報文是同一次點擊操作所生成的報文。在第二方面的第一種可能的實現(xiàn)方式中,所述確定單元還用于在所述判斷單元判斷結(jié)果為否時,確定所述源IP地址相同的HTTP報文不是同一次點擊操作所生成的報文。結(jié)合第二方面或第二方面的第一種可能的實現(xiàn)方式,在第二方面的第二種可能的實現(xiàn)方式中,所述裝置還包括:分類單元,用于在所述判斷單元進(jìn)行判斷之前,根據(jù)源IP地址,對所述客戶端發(fā)送的HTTP報文進(jìn)行分類。結(jié)合第二方面的第二種可能的實現(xiàn)方式,在第三種可能的實現(xiàn)方式中,所述裝置還包括:排序單元,用于按照時間戳的大小,對所述分類單元分類后的HTTP報文進(jìn)行排序,其中,所述時間戳為獲取所述HTTP報文時的時間戳或所述客戶端發(fā)送所述HTTP報文時的時間戳。結(jié)合第二方面或第二方面的第一種可能的實現(xiàn)方式或第二方面的第二種可能的實現(xiàn)方式或第二方面的第三種可能的實現(xiàn)方式,在第四種可能的實現(xiàn)方式中,所述HTTP報文包括GET報文或POST報文。本專利技術(shù)實施例與現(xiàn)有技術(shù)相比存在的有益效果是:本專利技術(shù)實施例根據(jù)HTTP報文攜帶的操作標(biāo)識,即可判斷源IP地址相同的HTTP報文是否為同一次點擊操作所生成的報文。本專利技術(shù)實施例無需分析相鄰兩個HTTP報文的時間差,不用根據(jù)時間差來判斷是否為同一次點擊操作生成的頁面;也不用根據(jù)Reference地址、Host地址、URI地址是否相同來判斷是否為同一次點擊操作生成的頁面;減少了判斷的步驟,提高了網(wǎng)頁分割的效率。而且,由于每次不同的點擊操作,所產(chǎn)生的操作標(biāo)識都不同,通過比較操作標(biāo)識可以準(zhǔn)確確定當(dāng)前網(wǎng)頁是否為同一次點擊操作生成的網(wǎng)頁,從而可以有效保證網(wǎng)頁分割的準(zhǔn)確性。附圖說明為了更清楚地說明本專利技術(shù)實施例中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本專利技術(shù)的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1是本專利技術(shù)一實施例提供的網(wǎng)頁分割的系統(tǒng)架構(gòu)圖;圖2是本專利技術(shù)一實施例提供的網(wǎng)頁分割方法的實現(xiàn)流程圖;圖3是本專利技術(shù)一實施例提供的網(wǎng)頁分割方法的具體流程圖;圖4是本專利技術(shù)一實施例提供的網(wǎng)頁分割裝置的組成結(jié)構(gòu)圖;圖5是本專利技術(shù)一實施例提供的網(wǎng)頁分割裝置的組成結(jié)構(gòu)圖。具體實施例方式以下描述中,為了說明而不是為了限定,提出了諸如特定系統(tǒng)結(jié)構(gòu)、接口、技術(shù)之類的具體細(xì)節(jié),以便透切理解本專利技術(shù)實施例。然而,本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)清楚,在沒有這些具體細(xì)節(jié)的其它實施例中也可以實現(xiàn)本專利技術(shù)。在其它情況中,省略對眾所周知的裝置、電路以及方法的詳細(xì)說明,以免不必要的細(xì)節(jié)妨礙本專利技術(shù)的描述。本專利技術(shù)實施例中術(shù)語“系統(tǒng)”和“網(wǎng)絡(luò)”在本文中常可被互換使用。圖1為本專利技術(shù)實施例提供的一種網(wǎng)頁分割的系統(tǒng)架構(gòu)圖。其中,所述系統(tǒng)包括客戶端1、探針2以及監(jiān)控中心3;所述客戶端1、探針2以及監(jiān)控中心3通過有線或者無線的方式連接通信。其中,所述客戶端I可以是任意具有網(wǎng)絡(luò)接入功能的終端設(shè)備,包括但不限于手機(jī)、平板電腦、臺式機(jī)、筆記本電腦等。所述探針2為具有數(shù)據(jù)采集和數(shù)據(jù)處理能力的接口探針,例如本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點】
一種網(wǎng)頁分割的方法,其特征在于,所述方法包括:獲取客戶端發(fā)送的超文本傳輸協(xié)議HTTP報文,所述HTTP報文攜帶操作標(biāo)識,所述操作標(biāo)識用于標(biāo)識發(fā)送所述HTTP報文時的點擊操作;判斷所述HTTP報文中源網(wǎng)際協(xié)議IP地址相同的HTTP報文所攜帶的操作標(biāo)識是否相同;若所述源IP地址相同的HTTP報文攜帶的操作標(biāo)識相同,則確定所述源IP地址相同的HTTP報文是同一次點擊操作所生成的報文。
【技術(shù)特征摘要】
1.一種網(wǎng)頁分割的方法,其特征在于,所述方法包括: 獲取客戶端發(fā)送的超文本傳輸協(xié)議HTTP報文,所述HTTP報文攜帶操作標(biāo)識,所述操作標(biāo)識用于標(biāo)識發(fā)送所述HTTP報文時的點擊操作; 判斷所述HTTP報文中源網(wǎng)際協(xié)議IP地址相同的HTTP報文所攜帶的操作標(biāo)識是否相同; 若所述源IP地址相同的HTTP報文攜帶的操作標(biāo)識相同,則確定所述源IP地址相同的HTTP報文是同一次點擊操作所生成的報文。2.如權(quán)利要求1所述的方法,其特征在于,所述方法還包括: 若所述源IP地址相同的HTTP報文攜帶的操作標(biāo)識不同,則確定所述源IP地址相同的HTTP報文不是同一次點擊操作所生成的報文。3.如權(quán)利要求1或2所述的方法,其特征在于,在所述判斷所述HTTP報文中源IP地址相同的HTTP報文所攜帶的操作標(biāo)識是否相同之前,所述方法還包括: 根據(jù)源IP地址,對所述客戶端發(fā)送的HTTP報文進(jìn)行分類。4.如權(quán)利要求3所述的方法,其特征在于,在所述根據(jù)源IP地址,對所述客戶端發(fā)送的HTTP報文進(jìn)行分類之后,所述方法還包括: 按照時間戳的大小,對分類后的HTTP報文進(jìn)行排序,其中,所述時間戳為獲取所述HTTP報文時的時間戳或所述客戶端發(fā)送所述HTTP報文時的時間戳。5.如權(quán)利要求1至4任一項所述的方法,其特征在于,所述客戶端發(fā)送的HTT...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:鄭國東,黃龍,
申請(專利權(quán))人:華為技術(shù)有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。