The invention relates to a data warehouse for storage memory ranks database machine conversion method, which comprises the following steps: constructing data warehouse machine memory storage model in database machine architecture, using the dimension table for centralized storage, distribution of the fact table storage strategy; storage engine; set up the ranks of the storage model conversion strategy; real-time OLAP one machine database query processing on the task decomposition for the master node in fact table rows, columns of data cache and cache shadow storage server node fact table OLAP main block distributed query processing tasks, to achieve real-time data processing based on OLAP analysis. The invention realizes the conversion of the row storage record of the transaction processing engine into the column storage record of the analysis engine efficiently, and supports the OLAP analysis processing on the real-time data. The invention is suitable for the memory storage data warehouse integrated machine, and the row and column storage structure in the updating operation converts the application scene.
【技術實現步驟摘要】
面向數據庫一體機的內存數據倉庫行列存儲轉換實現方法
本專利技術涉及一種內存數據倉庫存儲轉換方法,特別是關于一種面向數據庫一體機的內存數據倉庫行列存儲轉換實現方法。
技術介紹
隨著大內存、多核處理器等硬件技術和內存數據庫技術的發展,內存OLAP處理性能不斷提高,大數據內存實時分析處理成為主流的技術。傳統的事務處理引擎通常采用行存儲模型,優化更新操作性能,而分析處理則通常采用列存儲引擎,優化數據訪問和處理性能。當前主流數據庫開始支持事務處理引擎和分析處理引擎集成技術,如OracleDatabasein-memory,SQLserver2016等既支持事務處理,也支持分析處理。但當前主要的實現技術是為事務處理引擎增加一個列存儲引擎加速分析處理性能,列存儲引擎可以看作是事務處理引擎的影子數據(shadowdata),支持或不支持數據同步更新,主要技術難點是事務處理引擎的行存儲結構數據如何高效地轉換為列存儲結構數據。列存儲引擎不僅要按列存儲數據,還需要通過數據壓縮技術進一步提高列存儲引擎的數據存儲和處理效率。當前代表性的技術,如SAPHANA采用L1行存儲引擎、L2非壓縮列存儲引擎和采用數據壓縮的主存儲列引擎來支持實時OLAP分析處理,在事務型行數據轉換為分析型列數據時還需要解決列壓縮以及字典表更新等問題,需要處理復雜的數據轉換問題。在面向數據庫一體機架構的內存數據倉庫系統中,少量高端服務器組成的高性能服務器集群和大量中低端服務器組成的存儲服務器集群提供了不對稱的存儲和計算性能,不僅需要解決實時更新數據的行列存儲結構轉換任務,還需要根據數據庫一體機的硬件架構特點將事 ...
【技術保護點】
一種面向數據庫一體機的內存數據倉庫行列存儲轉換實現方法,其特征在于包括以下步驟:1)構建內存數據倉庫一體機存儲模型:在數據庫一體機架構上,采用維表集中存儲,事實表分布存儲策略;2)設置存儲引擎;3)設置行列存儲模型轉換策略;4)在數據庫一體機上的實時OLAP查詢處理任務分解為在主節點事實表行緩存中未進行列轉換的行組、影子數據列緩存以及存儲服務器節點事實表主分片上的分布式OLAP查詢處理任務,實現基于實時數據上的OLAP分析處理。
【技術特征摘要】
1.一種面向數據庫一體機的內存數據倉庫行列存儲轉換實現方法,其特征在于包括以下步驟:1)構建內存數據倉庫一體機存儲模型:在數據庫一體機架構上,采用維表集中存儲,事實表分布存儲策略;2)設置存儲引擎;3)設置行列存儲模型轉換策略;4)在數據庫一體機上的實時OLAP查詢處理任務分解為在主節點事實表行緩存中未進行列轉換的行組、影子數據列緩存以及存儲服務器節點事實表主分片上的分布式OLAP查詢處理任務,實現基于實時數據上的OLAP分析處理。2.如權利要求1所述的面向數據庫一體機的內存數據倉庫行列存儲轉換實現方法,其特征在于:所述步驟1)中,數據倉庫中的維表集中存儲于數據庫一體機高性能服務器集群,維表采用多維關系模型,即維表記錄映射為維度成員,維表主鍵映射為維度坐標。3.如權利要求2所述的面向數據庫一體機的內存數據倉庫行列存儲轉換實現方法,其特征在于:在維表增加一個刪除標志列D_Flag,邏輯標識刪除的維記錄,該維記錄對應的主鍵值能分配給新插入的維記錄。4.如權利要求1所述的面向數據庫一體機的內存數據倉庫行列存儲轉換實現方法,其特征在于:所述步驟1)中,事實表在數據庫一體機架構中采用分布式存儲策略,事實表以水平分片方式存儲在存儲服務器集群節點,事實表分片采用列存儲,列按照優化的行數劃分為列分片,列分片作為列數據壓縮存儲單位。5.如權利要求1所述的面向數據庫一體機的內存數據倉庫行列存儲轉換實現方法,其特征在于:所述步驟2)中,具體設置方法如下:2.1)維表采用行存儲引擎,利用成熟的事務型內存數據庫系統支持插入、修改或刪除的更新操作;維表上的查詢為選擇和投影操作,當維表較大且查詢選擇率較低時,為維屬性創建位圖索引;2.2)事實表存儲分為兩種類型:2.2.1)在數據庫一體機高性能服務器集群維表存儲引擎中設置事實表緩存,用于緩存插入的行存儲結構事實表記錄,同時設置一個內存列存儲結構事實表緩存,用于實現事實表記錄的內存行列轉換;2.2.2)主要事實表數據以水平分片方式存儲于存儲服務器集群;事實表存儲采用列存儲,事實表列按優化配置參數劃分為列分片,每個列分片是一個獨立的列數據壓縮存儲單位,獨立設置列分片壓縮算法及相關壓縮元數據。6.如權利要求1所述的面向數據庫一體機的內存數據倉庫行列存儲轉換實現方法,其特征在于:所述步驟3)中,具體設置方法如下:3.1)維表映射為維度,在OLAP查詢處理時維表映射為一個向量列,表示OLAP查詢在維表上的選擇和投影操作結果;當維表用數據庫存儲時,設置維表主鍵列為AUTO_INCREMENT類型,自動為維表分配連續的主鍵值,刪除的記錄產生缺失的主鍵值;3.2)事實表數據的行列轉換包括從高性能服務器集群事實表緩存到列緩存,從列緩存到閃存,從高性能服務器集群閃存到存儲服務器集群閃存,從存儲服務器閃存到內存,從內存行組到內存壓縮列分片。7.如權利要求6所述的面向數據庫一體機的內存數據倉...
【專利技術屬性】
技術研發人員:張延松,王珊,杜小勇,
申請(專利權)人:中國人民大學,
類型:發明
國別省市:北京,11
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。