• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種基于DTW的時間序列相似性預測方法技術

    技術編號:15501000 閱讀:136 留言:0更新日期:2017-06-03 22:34
    本發明專利技術涉及一種基于DTW的時間序列相似性預測方法,屬于時間序列數據挖掘技術領域。該方法將目前已知的對DTW進行加速的方法,如LB_Kim、LB_Keogh、逆LB_Keogh和傳統的DTW方法等進行級聯,在不同階段利用不同方法對查詢集進行過濾。同時,為了提高查詢準確性,我們引入z?score標準化,在計算DTW距離之前對查詢序列進行標準化,在讀取數據的過程中,同步進行標準化,進一步提高算法效率。然后,將改進的DTW方法應用到時間序列的類比合成預測方法中,從而提高預測的速度與精度。本方法充分利用不同方法的優點,有效的提高了時間序列的查詢速度,繼而提高了類比合成預測方法的速度和準確性。

    A method for similarity prediction of time series based on DTW

    The invention relates to a time series similarity prediction method based on DTW, which belongs to the technical field of time series data mining. The method cascaded the currently known methods for speeding up DTW, such as LB_Kim, LB_Keogh, inverse LB_Keogh, and traditional DTW methods, and filtering the query set at different stages using different methods. At the same time, in order to improve the query accuracy, we introduce Z score standardization, standardization of the query sequence before the calculation of DTW distance, in the process of reading data, synchronization of standardization, further improve the efficiency of the algorithm. Then, the improved DTW method is applied to the analog synthesis prediction of time series, so as to improve the prediction speed and accuracy. This method makes full use of the advantages of different methods, effectively improves the query speed of time series, and then improves the speed and accuracy of analog synthesis prediction method.

    【技術實現步驟摘要】
    一種基于DTW的時間序列相似性預測方法
    本專利技術屬于數據挖掘
    ,特別是時間序列數據挖掘
    ,涉及一種基于DTW的時間序列相似性預測方法。
    技術介紹
    動態時間規整(DynamicTimeWarping,DTW)是時間序列的一個強大的相似性度量方法。雖然我們常見的歐氏距離計算簡單、容易理解,但它要求兩條時間序列的長度必須相等,且對時間軸伸縮和彎曲問題無能為力。DTW距離定義了序列之間的最佳對齊匹配關系,支持不同長度時間序列的相似性度量,支持時間軸的伸縮和彎曲。由于DTW距離比歐式距離有更好的魯棒性,因此被廣泛用于時間序列的相似性度量,這是很多時間序列數據挖掘問題的基礎,比如分類和聚類以及預測等。然而,DTW的時間和空間復雜度較高,導致基于DTW的數據挖掘效率很低。因此,如何降低DTW時空復雜度成為了當前的研究重點和難點。DTW最早是用于語音識別中的一項技術,目前在金融、生物、化學以及機器人等領域都有廣泛的應用,特別是在多媒體數據領域。目前,對DTW進行加速的方法主要有以下兩種:1)添加全局約束。這種方法的目的是對DTW中的規整路徑進行全局約束,即限定一個序列中的點只能同另一序列中位置相近的某些點進行匹配。然而,該方法由于只針對查詢空間進行約束,并未從實質上降低DTW方法的復雜度,且在查詢時,由于查詢范圍的限制,存在誤報情況。2)利用下界距離進行過濾。該方法的主要思想是尋找一種計算更簡單的距離度量來粗略地估計DTW距離,稱為DTW下界距離,通過它可以過濾掉大部分不滿足相似性要求的序列,從而提高查詢效率。然而,該類方法,如果下界距離選取復雜度較高,則會降低整體查詢效率;如果下界距離選取比較簡單,又會降低過濾效果,增大候選集,產生誤報。傳統的時間序列分析預測方法將時間序列數據匹配到某些數學模型中,然后再對其整體進行分析和預測。但這些數據模型往往對數據有必要的限制,而現實中許多數據不能滿足模型參數要求。基于時間序列相似性的類比合成方法是一種典型的非參數回歸方法,其非參數回歸特性使得它能夠很好的規避上述問題,所以該方法日漸成為時間序列預測領域的研究焦點,然而,傳統的類比合成方法在選取距離度量方法時,大多使用的是歐式距離,由于該方法不能處理時間序列的伸縮,平移等。所以,利用該方法得到的相似序列具有一定的局限性,其用于后期合成預報的參考模式數據質量不高,從而會影響后期預測的準確性。因此,如何綜合考慮下界距離復雜度與下界距離過濾能力,從而實現時間序列快速而且準確的查詢,進而將其應用到類比合成預測方法中目前來說很少有人進行研究,但具有重要的研究意義。
    技術實現思路
    有鑒于此,本專利技術的目的在于提供一種基于DTW的時間序列相似性預測方法,該方法將目前已知的對DTW進行加速的方法,如LB_Kim、LB_Keogh、逆LB_Keogh和傳統的DTW方法等進行級聯,在不同階段利用不同方法對查詢集進行過濾。同時,為了提高查詢準確性,我們引入z-score標準化,在計算DTW距離之前對查詢序列進行標準化,在讀取數據的過程中,同步進行標準化,進一步提高算法效率。然后,將改進的DTW方法應用到時間序列的類比合成預測方法中,從而提高預測的速度與精度。為達到上述目的,本專利技術提供如下技術方案:一種基于DTW的時間序列相似性預測方法,該方法包括以下步驟:S1:生成類比模式和參考模式:假設一個一維時間序列為T={x1,x2,…,xm,…xm+k},先假定已有合適的模式長度k,則生成類比模式C={x1,x2,…,xm}和參考模式Q={xm+1,xm+2,…,xm+k},其中類比模式為時間序列T中的歷史數據,參考模式為時間序列最近的發展趨勢;S2:構造類比模式C的封帶,所述封帶指的是利用全局約束條件得到序列的上下邊界,其邊界所包含的部分;對C進行z-score標準化,z-score標準化是基于原始數據的均值(mean)和標準差(standarddeviation)進行數據的標準化,定義如下:其中,x為X中的數據點,μ為X的均值,σ為X的標準差;選擇z-score標準化的原因是利用z-score標準化方法得到的標準化時間序列的形狀與原始時間序列較為接近,因此其經常被用于時間序列數據挖掘任務中。S3:利用LB_kimFL方法對類比模式C進行過濾,所述LB_kimFL方法為LB_kim方法的改進,具體如下:LB_kim方法通過提取四元組特征向量,包括序列第一個元素、最后一個元素和序列的最大值和最小值,該下界利用提取四元組中個向量之間平方差最大值最為下界,其算法復雜度為O(N),特征提取的計算公式如下:由于進行標準化后的時間序列數據的最大和最小值對于整個下界距離貢獻較小,因此,去除原來LB_kim方法中提取的四個特征點中的最大和最小值,只保留起始點和終止點,稱為LB_kimFL方法,其算法復雜度降為O(1),定義如下:S4:利用LB_keogh方法對查詢集進行過濾;由于LB_kim方法的過濾能力有限,因此還有一大部分的非候選集序列需要過濾,因此選擇過濾效果較好的LB_keogh方法對序列進行再次過濾;S5:利用LB_rkeogh方法進行過濾,當步驟S4中的方法計算得到的下界距離還未超出預定閾值時,利用LB_rkeogh方法進行進一步判斷;S6:經過步驟S5得到與參考模式相似的序列候選集S,那么得到的相似序列結果為S={Q1,Q2,…,Qn};接下來從S中的相似序列按照相似性大小進行排序,得到S’={Q1’,Q2’,…,Qn’};根據實驗,從中選取p個最相似序列,最為合成預報的參考模式,最終的得到整合的參考模式Q,={Q,Q1’,Q2’,…,QP’},將其用于下一步的合成預報;S7:將得到的參考模式利用加權平均法進行合成預報。進一步,在所述步驟S2中,利用的全局約束條件是Sakoe-Chiba約束,該方法是通過參數r來限制彎曲路徑偏離對角線的帶狀約束。進一步,在所述步驟S4中,引入Sakoe-Chiba約束條件,將其用于構造參考模式Q的封帶EQ:設Q封帶的上下邊界分別為U={um+1,um+2,…,um+i,…,um+k}和L={lm+1,lm+2,…,lm+i,…,lm+k},則基于DTW的下界函數LB_keogh定義如下:進一步,在所述步驟S5中,LB_rkeogh是將LB_keogh中的Q和C進行調換,構造C的封帶,這意味著Q要和C的封帶Ec進行比較;C封帶的上下邊界為U={u1,u2,…,um}和L={l1,l2,…,lm},那么其定義如下:當該方法不能再進一步過濾查詢集時,便計算Q和C的DTW距離,將其放入候選集,其計算公式如下:Ddtw(Q,C)=f(M,N)(8)其中,Dbase(ci,qi)表示向量點ci和qi之間的基距離,可以根據情況進行選擇。為不失一般性,在本專利技術中使用歐式距離作為基距離,即Dbase(ci,qi)=|ci-qi|。本專利技術的有益效果在于:本專利技術提供的方法針對當前查詢方法的準確性和查詢效率不高的情況,利用目前已知的對DTW進行加速的方法,如LB_kim、LB_keogh、LB_rkeogh和傳統的DTW方法等進行級聯,在不同階段利用不同方法對查詢集進行過濾。同時,引入z-score標準化,在計算DTW距離之前對查本文檔來自技高網
    ...
    一種基于DTW的時間序列相似性預測方法

    【技術保護點】
    一種基于DTW的時間序列相似性預測方法,其特征在于:該方法包括以下步驟:S1:生成類比模式和參考模式:假設一個一維時間序列為T={x

    【技術特征摘要】
    1.一種基于DTW的時間序列相似性預測方法,其特征在于:該方法包括以下步驟:S1:生成類比模式和參考模式:假設一個一維時間序列為T={x1,x2,…,xm,…xm+k},先假定已有合適的模式長度k,則生成類比模式C={x1,x2,…,xm}和參考模式Q={xm+1,xm+2,…,xm+k},其中類比模式為時間序列T中的歷史數據,參考模式為時間序列最近的發展趨勢;S2:構造類比模式C的封帶,所述封帶指的是利用全局約束條件得到序列的上下邊界,其邊界所包含的部分;對C進行z-score標準化,z-score標準化是基于原始數據的均值(mean)和標準差(standarddeviation)進行數據的標準化,定義如下:其中,x為X中的數據點,μ為X的均值,σ為X的標準差;S3:利用LB_kimFL方法對類比模式C進行過濾,所述LB_kimFL方法為LB_kim方法的改進,具體如下:LB_kim方法通過提取四元組特征向量,包括序列第一個元素、最后一個元素和序列的最大值和最小值,該下界利用提取四元組中個向量之間平方差最大值最為下界,其算法復雜度為O(N),特征提取的計算公式如下:由于進行標準化后的時間序列數據的最大和最小值對于整個下界距離貢獻較小,因此,去除原來LB_kim方法中提取的四個特征點中的最大和最小值,只保留起始點和終止點,稱為LB_kimFL方法,其算法復雜度降為O(1),定義如下:S4:利用LB_keogh方法對查詢集進行過濾;S5:利用LB_rkeogh方法進行過濾,當步驟S4中的方法計算得到的下界距離還未超出預定閾值時,利用LB_rkeogh方法進行進一步判斷;S6:經過步驟S5得到與參考模...

    【專利技術屬性】
    技術研發人員:陶洋李鵬亮熊炫睿沈敬紅
    申請(專利權)人:重慶郵電大學
    類型:發明
    國別省市:重慶,50

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 午夜无码国产理论在线| 无码国产精品一区二区免费式直播| 久久精品中文字幕无码| 无码视频一区二区三区在线观看| 亚洲成av人片天堂网无码】| 日韩av无码中文无码电影| 日韩精品无码一区二区中文字幕| 国产av无码久久精品| 丰满日韩放荡少妇无码视频| 中文无码热在线视频| 国产V亚洲V天堂无码| 国产午夜无码片在线观看| 国产乱妇无码大片在线观看| 国产精品亚洲а∨无码播放| 亚洲人成无码网WWW| 九九在线中文字幕无码| 91久久九九无码成人网站| 久久无码av三级| 亚洲日韩精品A∨片无码| 久久精品无码专区免费| 亚洲精品久久无码| 亚洲AV日韩AV高潮无码专区| 精品久久久无码中文字幕边打电话| 久久精品国产亚洲AV无码麻豆| 国产AV无码专区亚洲AV男同 | 免费A级毛片无码专区| 日韩精品无码免费专区午夜不卡| 97无码免费人妻超级碰碰夜夜| 精品久久久久久无码不卡| 人妻精品久久无码专区精东影业| 亚洲桃色AV无码| 亚洲AV无码成人精品区天堂| 亚洲av无码一区二区三区网站| 潮喷失禁大喷水无码| 东京热人妻无码人av| 一本大道东京热无码一区| 无码成A毛片免费| 亚洲AV无码专区在线亚| 无码中文字幕人妻在线一区二区三区 | 无码免费午夜福利片在线| 人妻无码αv中文字幕久久琪琪布 人妻无码第一区二区三区 |