【技術(shù)實(shí)現(xiàn)步驟摘要】
一種基于權(quán)重的時(shí)間序列數(shù)據(jù)降維與多分辨率表示方法
本專利技術(shù)涉及一種基于權(quán)重的時(shí)間序列數(shù)據(jù)降維與多分辨率表示方法,尤其涉及了一種基于分段線性表示(Piecewiselinearrepresentation,PLR)的“高維”時(shí)間序列數(shù)據(jù)的數(shù)據(jù)降維與多分辨率數(shù)據(jù)可視化方法,屬于數(shù)據(jù)分析與數(shù)據(jù)挖掘的
技術(shù)介紹
隨著“互聯(lián)網(wǎng)+”時(shí)代的到來(lái),各種基于網(wǎng)絡(luò)技術(shù)、移動(dòng)通信技術(shù)、物聯(lián)網(wǎng)技術(shù)的應(yīng)用層出不窮,在各種電子商務(wù)活動(dòng)以及各種工業(yè)信息化交互中都產(chǎn)生了大量的、基于時(shí)間序列的業(yè)務(wù)數(shù)據(jù)信息,被稱為時(shí)間序列數(shù)據(jù)(TimeSeriesData)。時(shí)間序列數(shù)據(jù)不僅反映了數(shù)據(jù)在某一時(shí)刻的狀態(tài)信息,時(shí)序數(shù)據(jù)整體也反映了一定的數(shù)據(jù)變化規(guī)律和趨勢(shì)。過(guò)去幾年隨著社交網(wǎng)絡(luò)的不斷發(fā)展壯大、工業(yè)4.0概念的提出,社會(huì)已經(jīng)進(jìn)入了大數(shù)據(jù)時(shí)代(2013年也被稱為大數(shù)據(jù)元年),這就意味著大數(shù)據(jù)開(kāi)始進(jìn)入商用階段,因此,針對(duì)時(shí)間序列數(shù)據(jù)的分析與挖掘的相關(guān)研究工作也愈演愈烈,逐漸成為大數(shù)據(jù)分析與挖掘的熱點(diǎn)問(wèn)題之一。目前,傳統(tǒng)的數(shù)據(jù)分析與數(shù)據(jù)可視化技術(shù)無(wú)法直接應(yīng)用于時(shí)間序列數(shù)據(jù)的研究,主要包括以下幾方面的原因:1、數(shù)據(jù)存儲(chǔ)成本大、數(shù)據(jù)分析代價(jià)高時(shí)間序列數(shù)據(jù)一般具有“海量”、“高維”、“連續(xù)”等特點(diǎn),與傳統(tǒng)的靜態(tài)數(shù)據(jù)有很大的不同,受制于相應(yīng)的計(jì)算代價(jià)與存儲(chǔ)成本的限制,無(wú)法對(duì)時(shí)間序列原始數(shù)據(jù)直接開(kāi)展相應(yīng)的數(shù)據(jù)分析與挖掘研究工作。因此,需要在分析之前進(jìn)行相應(yīng)的數(shù)據(jù)降維與簡(jiǎn)化表示操作。2、數(shù)據(jù)降維與數(shù)據(jù)簡(jiǎn)化表示思路相對(duì)局限目前,基于時(shí)間序列的降維操作,往往僅局限于時(shí)序數(shù)據(jù)中的極值點(diǎn),并以極值點(diǎn)的權(quán)重作為數(shù)據(jù) ...
【技術(shù)保護(hù)點(diǎn)】
1.一種基于權(quán)重的時(shí)間序列數(shù)據(jù)降維與多分辨率表示方法,其特征在于,該方法以基于“自頂向下”的分段線性表示為基準(zhǔn),包括步驟如下:S1,預(yù)設(shè)數(shù)據(jù)壓縮率DCR閾值ρ;S2,將時(shí)間序列數(shù)據(jù)TS的起始點(diǎn)vt1和終止點(diǎn)vtn選定為初始數(shù)據(jù)分段點(diǎn),計(jì)算時(shí)間序列數(shù)據(jù)TS的任意數(shù)據(jù)點(diǎn)權(quán)重和當(dāng)前數(shù)據(jù)分段權(quán)重,并將vt1、vt2轉(zhuǎn)換成相應(yīng)的鏈表節(jié)點(diǎn)存入MRISL中;S3,根據(jù)S2的處理結(jié)果,從此步驟開(kāi)始,利用TS分段表示策略,從當(dāng)前分段中選擇具有mw_es的數(shù)據(jù)分段,并從該分段中選擇具有mw_sp的數(shù)據(jù)點(diǎn)vtk,作為新的數(shù)據(jù)分段點(diǎn),并對(duì)當(dāng)前數(shù)據(jù)分段進(jìn)行再次細(xì)分;S4,判斷當(dāng)前MRSIL中的數(shù)據(jù)點(diǎn)個(gè)數(shù)numcur是否已經(jīng)超過(guò)了ρ的限制,如果沒(méi)有超過(guò),則繼續(xù)執(zhí)行步驟S3,否則,步驟S3終止,相應(yīng)的MRSI建立完畢;S5,通過(guò)基于TS建立的MRSI以及相應(yīng)的DCR,實(shí)現(xiàn)(0,ρ)范圍內(nèi)的,任意數(shù)據(jù)壓縮率DCR下的數(shù)據(jù)多分辨率簡(jiǎn)化表示。
【技術(shù)特征摘要】
1.一種基于權(quán)重的時(shí)間序列數(shù)據(jù)降維與多分辨率表示方法,其特征在于,該方法以基于“自頂向下”的分段線性表示為基準(zhǔn),包括步驟如下:S1,預(yù)設(shè)數(shù)據(jù)壓縮率DCR閾值ρ;S2,將時(shí)間序列數(shù)據(jù)TS的起始點(diǎn)vt1和終止點(diǎn)vtn選定為初始數(shù)據(jù)分段點(diǎn),計(jì)算時(shí)間序列數(shù)據(jù)TS的任意數(shù)據(jù)點(diǎn)權(quán)重和當(dāng)前數(shù)據(jù)分段權(quán)重,并將vt1、vt2轉(zhuǎn)換成相應(yīng)的鏈表節(jié)點(diǎn)存入MRISL中;S3,根據(jù)S2的處理結(jié)果,從此步驟開(kāi)始,利用TS分段表示策略,從當(dāng)前分段中選擇具有mw_es的數(shù)據(jù)分段,并從該分段中選擇具有mw_sp的數(shù)據(jù)點(diǎn)vtk,作為新的數(shù)據(jù)分段點(diǎn),并對(duì)當(dāng)前數(shù)據(jù)分段進(jìn)行再次細(xì)分;S4,判斷當(dāng)前MRSIL中的數(shù)據(jù)點(diǎn)個(gè)數(shù)numcur是否已經(jīng)超過(guò)了ρ的限制,如果沒(méi)有超過(guò),則繼續(xù)執(zhí)行步驟S3,否則,步驟S3終止,相應(yīng)的MRSI建立完畢;S5,通過(guò)基于TS建立的MRSI以及相應(yīng)的DCR,實(shí)現(xiàn)(0,ρ)范圍內(nèi)的,任意數(shù)據(jù)壓縮率DCR下的數(shù)據(jù)多分辨率簡(jiǎn)化表示。2.根據(jù)權(quán)利要求1所述的一種基于權(quán)重的時(shí)間序列數(shù)據(jù)降維與多分辨率表示方法,其特征在于,所述步驟S2,計(jì)算時(shí)間序列數(shù)據(jù)TS的任意數(shù)據(jù)點(diǎn)權(quán)重,包括:設(shè)時(shí)間序列數(shù)據(jù)TS的擬合直線為連接起始點(diǎn)vt1和終止點(diǎn)vtn的線段,即TSline=(vt1,vtn),則TS上任意數(shù)據(jù)點(diǎn)vti的權(quán)重fe_spi為數(shù)據(jù)點(diǎn)vti到TSline的垂直距離,具體計(jì)算如公式(Ⅰ)所示式(Ⅰ)中,時(shí)序點(diǎn)vt1包括具體的時(shí)刻t1及該時(shí)刻的實(shí)測(cè)數(shù)據(jù)值v1,vt1=(v1,t1);時(shí)序點(diǎn)vtn包括具體的時(shí)刻tn及該時(shí)刻的實(shí)測(cè)數(shù)據(jù)值vn,vtn=(vn,tn);時(shí)序點(diǎn)vti包括具體的時(shí)刻ti及該時(shí)刻的實(shí)測(cè)數(shù)據(jù)值vi,vti=(vi,ti);起始點(diǎn)vt1的權(quán)重、終止點(diǎn)vtn的權(quán)重均為0。3.根據(jù)權(quán)利要求1所述的一種基于權(quán)重的時(shí)間序列數(shù)據(jù)降維與多分辨率表示方法,其特征在于,所述步驟S2,計(jì)算時(shí)間序列數(shù)據(jù)TS的當(dāng)前數(shù)據(jù)分段權(quán)重,包括:a、選取時(shí)間序列數(shù)據(jù)TS上權(quán)重最大的對(duì)應(yīng)的數(shù)據(jù)點(diǎn),設(shè)定為vtk,數(shù)據(jù)點(diǎn)vtk的權(quán)重fe_spk被稱為時(shí)間序列數(shù)據(jù)TS中的最大單點(diǎn)權(quán)重mw_sp,計(jì)算如公式(Ⅱ)所示:b、假設(shè)將當(dāng)前時(shí)間序列數(shù)據(jù)TS看成一個(gè)數(shù)據(jù)分段,時(shí)間序列數(shù)據(jù)TS的w_es的計(jì)算如公式(Ⅲ)所示:c、假設(shè)時(shí)間序列數(shù)據(jù)TS當(dāng)前的分段數(shù)目為K,即TS={S1,S2,…,SK},通過(guò)公式(Ⅰ)、公式(Ⅱ)分別計(jì)算當(dāng)前K個(gè)數(shù)據(jù)分段的分段權(quán)重,并利用公式(Ⅳ)獲取時(shí)間序列數(shù)據(jù)TS的當(dāng)前最大分段權(quán)重mw_es:4.根據(jù)權(quán)利要求1所述的一種基于權(quán)重的時(shí)間序列數(shù)據(jù)降維與多分辨率表示方法,其特征在于,所述步驟S2,將vt1、vt2轉(zhuǎn)換成相應(yīng)的鏈表節(jié)點(diǎn)存入數(shù)據(jù)分段點(diǎn)列表MRISL中,數(shù)據(jù)分段點(diǎn)列表MRISL為一個(gè)存儲(chǔ)數(shù)據(jù)分段點(diǎn)的數(shù)據(jù)鏈表,包括步驟如下:d.根據(jù)時(shí)間序列數(shù)據(jù)TS分段策略所獲取的數(shù)據(jù)分段點(diǎn)定義為相應(yīng)的鏈表節(jié)點(diǎn)(listnode,LN),時(shí)間序列數(shù)據(jù)TS分段策略所獲取的數(shù)據(jù)分段點(diǎn)是指當(dāng)前具有mw_es的數(shù)據(jù)分段中被標(biāo)記為mw_sp的數(shù)據(jù)點(diǎn),并將此LN依次存入數(shù)據(jù)分段點(diǎn)列表MRISL中,LN的數(shù)據(jù)結(jié)構(gòu)包括index、value、rank、weightL、weightR、mes、ets,index是指數(shù)據(jù)分段點(diǎn)在TS中的原始位置,value是指數(shù)據(jù)分段點(diǎn)的原始數(shù)據(jù)值,rank是指數(shù)據(jù)分段點(diǎn)的選出次序;weightL是指分段點(diǎn)左側(cè)的數(shù)據(jù)分段的權(quán)重值;weightR是指分段點(diǎn)右側(cè)的數(shù)據(jù)分段的權(quán)重值;mes是指當(dāng)前TS的mw_es值;ets是指當(dāng)前TS的整體權(quán)重值。5.根據(jù)權(quán)利要求1所述的一種基于權(quán)重的時(shí)間序列數(shù)據(jù)降維與多分辨率表示方法,其特征在于,ets表示當(dāng)某個(gè)具體的數(shù)據(jù)分段點(diǎn)被選取出來(lái),對(duì)當(dāng)前時(shí)間序列...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:胡宇鵬,趙新曉,李學(xué)慶,秦東,黃剛?cè)~,
申請(qǐng)(專利權(quán))人:山東大學(xué),
類型:發(fā)明
國(guó)別省市:山東,37
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。