• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>
    當前位置: 首頁 > 專利查詢>復旦大學專利>正文

    一種根據閾值快速篩選重要區間的方法技術

    技術編號:15690988 閱讀:84 留言:0更新日期:2017-06-24 03:49
    本發明專利技術屬于關系數據庫技術領域,具體一種根據閾值快速篩選重要區間的方法。本發明專利技術方法包括:給定數據集

    A method of rapidly selecting important intervals based on threshold

    The invention belongs to the technical field of relational database, in particular to a method for rapidly selecting important intervals according to a threshold value. The method of the invention comprises: a given data set;

    【技術實現步驟摘要】
    一種根據閾值快速篩選重要區間的方法
    本專利技術屬于關系數據庫
    ,具體涉及一種在多維數據集根據閾值快速篩選重要區間的方法。
    技術介紹
    數據探索是近年來研究較多的領域。當用戶對于數據內容缺乏了解時,需要有一個不斷嘗試并修改查詢的過程,才能最終得到想要的結果,數據探索即在這一過程中對用戶進行引導,以減小所需的時間與精力開銷。傳統的數據探索方式都要求冗長的交互過程,但在服務器端本身已經具有所有數據的情況下,可以幫助用戶完成大量粗略的工作,給用戶提供一個較優的探索起點,但這一操作需要以增加計算資源為代價。多維數據集的容量一般較大,為了節約計算資源,需要更加高效的算法。尤其是對于重要區間的篩選,在查詢中十分常見頻繁,對其進行優化能夠有效提高整個流程的執行效率。
    技術實現思路
    本專利技術的目的是提出一種從多維數據集中快速篩選出符合給定閾值的重要區間的方法,以協助整體上的數據探索工作。本專利技術提出的根據閾值快速篩選重要區間的方法,包括:給定數據集D中的數據分布于維度A,對于A上任一區間[l,r],可以得到D在其上的相關程度score([l,r])。要解決的問題可以嚴格描述如下:給定閾值k,找出所有的區間[l,r]滿足如下條件:score([l,r])≥k∧score([l-1,r])<k∧score([l,r+1])<k計算方法如下:對于每一個右邊界r,計算出符合條件的左邊界LBr,以確保score([LBr,r])≥k且score([LBr-1,r])<k。根據上一步計算得到的數組LB,將右邊界r從大到小遍歷,如果對應的左邊界LBr比之前輸出過的所有值都小,就將[LBr,r]作為結果輸出。這里,數組LB用于根據右邊界直接定位到滿足條件的相應左邊界,從而根據邊界確定重要區間的位置,使得整體計算中的這一子操作可以直接查表得到,以達到較優的時間復雜度。具體說來,圖5中每一行左邊界的求解就是通過數組LB得到。對于數組LB的求解,一種方案如下:(2.1)將右邊界r從小到大遍歷來依次計算相應的LBr數值;(2.2)對于當前已經訪問過的數據,將其位置和值記錄下來成為<p,v>的格式,說明當前到達左邊界p且超過閾值所需要的最小的數值為v,對于LBr的計算即轉化為傳統的二分查找問題,從而在O(logn)時間內完成;(2.3)于步驟(2.2)中的<p,v>的數組,應當確保其單調性使得二分查找的條件成立,即對于相應的<pi,vi>,<pi+1,vi+1>應當滿足:(pi<pi+1)∧(vi<vi+1)(2.4)每當右邊界r改變時<p,v>數組也作相應更新;作為線段樹的一種退化情形,為所有數組中的值維護一個基底,對全部值的同時加減操作在基底進行,即可在O(1)時間內完成更新。當僅改變閾值k而不改變數據集D時,計算LB的更快速方法如下:(3.1)在預處理階段,計算讓區間[l,r]能夠被選出的最大閾值MT([l,r]),將其作為二維數組記錄下來;(3.2)將數組MT中必定不會停留的地點去掉,以維持單調性,在該處加入指向左邊第一個停留點的指針以防止重復經過。滿足如下性質的區間[l,r]稱為不停留點:MT([l,r])<MT([l-1,r])(3.3)每次用戶給出一個閾值k時,將右邊界r從大到小遍歷,同時在數組MT中從上次輸出的左邊界l′開始尋找最靠左的滿足MT([l,r])≥k的區間[l,r],若l<l′就將[l,r]輸出,由于左右邊界都只會不斷減小,其運算總時間為O(n)。附圖說明圖1為前一種數組LB計算的樣例數組。圖2為原始數組不具備單調性的演示。圖3為修改后的位置和值記錄。圖4為后一種計算的樣例數組。圖5為給出閾值后一次詳細的計算過程。具體實施方式本專利技術所描述的方法用于快速篩選出重要區間,下面將通過兩個例子詳細描述本專利技術所述方法的具體實施方式。對于前一種數組LB的計算,圖1給出一個數組作為例子,其中選取0為閾值。圖2展示了圖1原始的數組不具備單調性,因此無法直接進行二分。經過修改后的位置和值記錄由圖3可見,部分記錄被劃去以滿足單調性進行后續操作。對于后一種計算方式,圖4給出一個數組作為例子。對于圖4中的數組,圖5展示了閾值為4.45時的計算過程,左右邊界均由右向左進行移動。此時最終得到的區間即為[0,1],[1,4]。本文檔來自技高網...
    一種根據閾值快速篩選重要區間的方法

    【技術保護點】
    一種根據閾值快速篩選重要區間的方法,其特征在于,具體步驟如下:(1.1)給定數據集

    【技術特征摘要】
    1.一種根據閾值快速篩選重要區間的方法,其特征在于,具體步驟如下:(1.1)給定數據集D中的數據分布于維度A,對于A上任一區間,得到D在其上的相關程度,根據閾值k篩選區間即為找出所有且無法再擴展的區間;(1.2)首先計算數組LB,對于每一個右邊界r,確保且;(1.3)根據步驟(1.2)中計算得到的,將右邊界從大到小遍歷,如果對應的左邊界比之前輸出過的所有值都小,就將作為結果輸出。2.根據權利要求1所述的方法,其特征在于,步驟(1.2)中所述計算LB的一種方法如下:(2.1)將右邊界r從小到大遍歷來依次計算相應的數值;(2.2)對于當前已經訪問過的數據,將其位置和值記錄下來成為的格式,說明當前到達左邊界且超過閾值所需要的最小的數值為,對于的計算即轉化為傳統的二分查找問題,從而在時間內完成;(2.3)于步驟(2.2)中的的數組...

    【專利技術屬性】
    技術研發人員:馬會心楊智慧,何震瀛,王曉陽,
    申請(專利權)人:復旦大學
    類型:發明
    國別省市:上海,31

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 精品无码久久久久国产动漫3d| 亚洲国产精品无码一线岛国| 亚洲综合无码一区二区| 久久久久琪琪去精品色无码| 2024你懂的网站无码内射| 老司机无码精品A| 中文字幕丰满乱子无码视频| 人妻av无码一区二区三区| 国产精品亚洲一区二区无码| 久久久久琪琪去精品色无码| 国产精品成人无码久久久久久| 亚洲毛片无码专区亚洲乱| 在线精品免费视频无码的| 亚洲国产AV无码专区亚洲AV | 久久亚洲精品中文字幕无码| 色欲A∨无码蜜臀AV免费播| 精品无码中文视频在线观看| 孕妇特级毛片WW无码内射| 亚洲Av永久无码精品三区在线| 国产午夜鲁丝片AV无码免费| 日日摸夜夜添无码AVA片 | 亚洲国产精品无码一线岛国| 一本大道无码日韩精品影视| 亚洲日韩AV无码一区二区三区人| 午夜无码A级毛片免费视频| 国产丝袜无码一区二区三区视频| 日韩美无码五月天| 无码国产精品一区二区高潮| 亚洲视频无码高清在线| 亚洲成av人片天堂网无码】| 亚洲Av无码一区二区二三区| 日韩爆乳一区二区无码| 无码欧精品亚洲日韩一区| 国产在线无码不卡影视影院| 永久免费无码日韩视频| 国产亚洲精品无码拍拍拍色欲| 中文字幕无码日韩专区| 亚洲AV无码国产丝袜在线观看 | 日韩av无码免费播放| 亚洲精品人成无码中文毛片 | 亚洲综合无码AV一区二区|