• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>
    當前位置: 首頁 > 專利查詢>龔如賓專利>正文

    基于索引的版式可回流文件建立和繪制方法技術

    技術編號:8131128 閱讀:257 留言:0更新日期:2012-12-27 03:22
    本發明專利技術涉及一種基于索引的版式可回流文件建立方法,通過使用基于索引的方式來描述版式文件的邏輯結構和閱讀順序并對各個索引進行描述,不必記錄可回流對象中包含的每個像素,只需記錄每個可回流對象的邊界在版式文件中的包圍邊界,從而大幅提高壓縮率和網絡傳輸率。另外通過記錄每個可回流文字對象在版式文件中所屬行或列對準線參數,就可以通過預測的方法從行內前一個包圍區域的坐標值預算下一個包圍區域的坐標值,通過計算并壓縮差分值可提高壓縮效果。在顯示樣式上,本發明專利技術能夠提供更豐富的顯示式樣,可以將可回流文字對象按照原來版式中的縮進方式來重新動態排列版面,也可以對原版中的文字和插圖的浮動對齊式樣進行版面動態重排。

    【技術實現步驟摘要】

    本專利技術涉及一種計算機文件信息結構技木,特別涉及一種。
    技術介紹
    目前很多數字書籍以版式文件格式和圖像文件格式存在,比如roF,TIFF, PNG和CEB等。這類電子書籍主要適合于大屏幕閱讀和打印/印刷閱讀應用。然而版式數字書籍卻不適合在不同屏幕或窗ロ尺寸的終端或媒體上閱讀和使用。比如為了在小屏幕終端上閱讀A4版面的版式數字書籍,由于缺乏文字行/列的可回流功能,需要把頁面縮小到屏幕尺寸才能表示ー完整行/列。但是當大版面書籍縮小到屏幕尺寸時,文字卻小得看不清楚。或者需要根據閱讀位置來不停地滾動數字書籍頁面,以完成各行/列的完整閱讀。· 為了支持在不同尺寸終端或媒體上閱讀版式數字書籍,需要分析和理解數字書籍的版面邏輯結構并確定各邏輯區域間的閱讀優先次序。閱讀程序將按照閱讀優先次序來顯示各個邏輯區域,同時根據屏幕尺寸和邏輯區域的類型來對各邏輯區域進行不同處理。比如對寫真區域和線畫區域進行放大和縮小處理,而對文字段落區域進行可回流轉換處理。以便為用戶提供更好的閱讀體驗。目前的屏幕自適應技術,主要適用于以文字為主的數字書籍。比如HTML、TXT和EPUB文件中的文字段落可以根據閱讀窗ロ的寬度,自動進行換行,以可回流的形式在閱讀軟件上進行閱讀。而對于版式數字書籍圖,特別是掃描的版式數字書籍等,需要通過進行版面邏輯結構分析,把文本區域、寫真和線畫區域區分開來。并把文本區域按照字或詞為單位進行切割,生成字和詞的子圖像。最終使用HTML、XHTML和XML語言來進行數字書籍的版面邏輯表示,以便在瀏覽器上閱讀起來具有類似文字格式TXT、HTML和WORD文件的可回流閱讀效果。這種方法的缺點在于由于直接在HTML、XHTML等文件中直接嵌入了很多字或單詞的圖像,不僅需要花大量的存儲空間來保存很多子圖像,而且在網絡上進行閱讀的時候會受到影響。相關的技術文獻主要包括以下四篇 一、非專利又件 I: Paper to PDA. In International Conference On PatternRecognition (ICPR) 2002, T. M. Breuel, W. C. Janssen, K. Popat, and H. S. Baird ; ニ、專利文件2:中國專利版式文件邏輯結構信息的表示方法和系統申請號200710123338. 6 ; 三、專利文件3:日本專利特開2006-350867文書處理裝置,文書處理方法,程序和信息記錄媒體; 四、專利文4:美國專利PUB NO 2007/0234203 GENERATING IMAGE-BASEDREFLOffABLE FILES FOR RENDERING ON VARIOUS SIZED DISPLAYS ; 五、專利文5:美國專利 PUB NO 2007/0237428 Al, EFFICIENTG PROCESSING OFNON-REFLOW CONTENT IN A DIGITAL IMAGE ;在非專利文件I中美國施樂帕洛阿爾托研究中心(palo alto research center)的Thomas M. Breuel等人提出了根據顯示屏幕或窗ロ的大小來重新排列各個可回流圖像區域來進行動態版面排版。此處可回流圖像區域可以是單個字符,單詞,寫真圖像,表格圖像,或者圖形所對應的圖像區域。這些小圖像元素同時和版面控制信息相關聯,以支持按照版面邏輯結構和閱讀順序來顯示各個圖元。這樣的優點是由于使用標準的HTML等來表示數字書籍圖像,能夠實現跨平臺的閱讀。缺點是由于需要大量的子圖像,造成存儲空間的浪費和影響網絡流暢閱讀。非專利文件I中也提到了通過記錄可回流區域的矩形邊框來索引原版式圖像中的對應圖像區域,以避免直接保存很多小的可回流圖像區域。本技術和在非專利文件I中的區別在于不是直接記錄可回流區域的矩形邊框,而是通過記錄可回流文字區域所對應的文本行的基線、文本行的平均線、可回流區域邊界框等方式來索引原來版式圖像中的可回流區域。可以進ー步提高壓縮率,以提高文字圖像區域描述信息的壓縮率。 在專利文件2中提到對內容參考子序列使用ー個編號,這樣在邏輯單元描述中使用此標號來索引各個內容參考子序列,而使用內容參考子序列將可以本子序列在內容參考序列中的起始位置和序列長度,獲得基本繪制信息。版面重排系統將讀入邏輯單元描述文件和內容參考子序列文件,來實現屏幕自適應重排。此方法的優點在于由于使用編號來索引內容參考子序列,再由內容參考子序列來查找在內容參考序列中的起始位置和序列長度,獲得基本繪制信息,這樣可以有效、靈活地表示版式文件的邏輯結構信息,不需要對原有版式文件進行修改。而且不需要把各個基本繪制圖元序列單獨存放,可以節省了存儲空間。此方法的缺點在于由于必須生成內容參考序列,同時使用偏移位置和長度來索引內容參考序列,更適合于文字格式的版式文件,如H)F、CEB文件等。而對于圖像格式的版式文件,比如掃描的TIFF、PNG和掃描PDF文件等,由于各行的基線參數值不同,不適合通過生成內容參考序列并使用參考序列中的偏移來劃分內容參考子序列。本專利技術直接使用可回流區域邊界信息來索引原來頁面圖像的子區域,不僅可以對應PDF等文字格式的版式文件,還可以進ー步對應PNG,TIFF等圖像格式的版式文件。專利文件3中提出使用XML來表示文檔的邏輯結構和閱讀優先次序。通過記錄版式文檔中各邏輯區域的位置和大小,可以來索引原來版式文檔中的各邏輯區域。但此專利技術不支持文本段落區域的可回流閱讀功能,對各邏輯區域使用單個圖像來進行記錄和表示。本專利技術在專利文件3基礎上,對文本段落區域將進行處理,使用層次式索引技術來支持文本段落區域內文字的可回流顯示問題。專利文件4中提出通過記錄數字書籍圖像中回流對象的邊界框位置、大小和形狀、回流對象的基線等來生成對版式數字書籍進行轉換。本專利技術和專利文件4的不同點在于不是記錄每個可回流對象的基線,而是對原來數字書籍圖像的每一行文本,通過精確提取行的基線(Base Line),以行為單位來記錄行基線參數。此外對于彎曲文字行的情況,本專利技術提出使用參數化曲線或者多段線段來逼近文字行的基線,只記錄多段線段的參數和參數化曲線的參數。這樣可以減少記錄的數據量,提高壓縮率。專利文件5中提出了可回流對象和非可回流對象的概念,提出了如何通過版面分析和版面理解獲得可回流對象和不可回流對象,并針對可回流對象和不可回流對象進行不同的處理,以便在不同尺寸的媒體上進行顯示。本專利技術在此基礎上,提出了基于索引的版面邏輯結構描述和壓縮方法,在提高表達的便利性基礎上同時提高了壓縮性能。
    技術實現思路
    本專利技術是針對目前的屏幕版式文件格式自適應技術存儲空間、數據量大的問題,提出了一種,通過使用基于索引的方式來描述數字書籍圖像的邏輯結構并對各個索引進行描述,不必記錄可回流對象中包含的每個像素,只需記錄每個可回流對象的邊界在數字書籍圖像中的坐標,從而大幅提高壓縮率和網絡傳輸率。本專利技術的技術方案為一種基于索引的版式可回流文件建立方法,包括如下具體步驟 1)建立基于索引的版式可回流文件存儲設備,可回流文件轉換服務器讀入版式文件;· 2)可回流文件轉換服務器對版式文件中的每個可回流對象和非可回流對象本文檔來自技高網
    ...

    【技術保護點】
    一種基于索引的版式可回流文件建立方法,其特征在于,包括如下具體步驟:1)建立基于索引的版式可回流文件存儲設備,可回流文件轉換服務器讀入版式文件;2)可回流文件轉換服務器對版式文件中的每個可回流對象和非可回流對象計算出一個包圍區域;3)對版式文件中的同行或同列的可回流對象,計算同行或同列可回流對象的對準線;4)計算每個包圍區域在對版式文件中坐標位置,同時計算每個可回流區域相對于其所屬行或列對準線的相對位置;5)計算每個包圍區域的大小;6)對每個包圍區域建立一個索引,對每個索引,記錄下索引對應的包圍區域的位置和大小、每個可回流包圍區域與其對應對準線的相對位置,以及使用索引來表示版式文件頁面邏輯結構、各包圍區域間的閱讀優先次序和排列關系和可回流文字包圍區域的縮進信息;7)可回流文件轉換服務器生成基于索引的版式可回流文件并儲存到基于索引的版式可回流文件存儲設備中,可回流文件轉換服務器與基于索引的版式可回流文件存儲設備互相傳輸數據,閱讀系統讀入可回流文件存儲設備中或可回流文件轉換服務器中的基于索引的版式可回流文件用于顯示。

    【技術特征摘要】
    1.一種基于索引的版式可回流文件建立方法,其特征在于,包括如下具體步驟 1)建立基于索引的版式可回流文件存儲設備,可回流文件轉換服務器讀入版式文件; 2)可回流文件轉換服務器對版式文件中的每個可回流對象和非可回流對象計算出一個包圍區域; 3)對版式文件中的同行或同列的可回流對象,計算同行或同列可回流對象的對準線; 4)計算每個包圍區域在對版式文件中坐標位置,同時計算每個可回流區域相對于其所屬行或列對準線的相對位置; 5)計算每個包圍區域的大小; 6)對每個包圍區域建立ー個索引,對每個索引,記錄下索引對應的包圍區域的位置和大小、每個可回流包圍區域與其對應對準線的相對位置,以及使用索引來表示版式文件頁面邏輯結構、各包圍區域間的閱讀優先次序和排列關系和可回流文字包圍區域的縮進信息; 7)可回流文件轉換服務器生成基于索引的版式可回流文件并儲存到基于索引的版式可回流文件存儲設備中,可回流文件轉換服務器與基于索引的版式可回流文件存儲設備互相傳輸數據,閱讀系統讀入可回流文件存儲設備中或可回流文件轉換服務器中的基于索引的版式可回流文件用于顯示。2.根據權利要求I所述基于索引的版式可回流文件建立方法,其特征在于,所述步驟1)中所述版式文件可以通過掃描儀成像設備來生成,也可以通過程序來轉換和生成,或者通過調用模塊文件獲得或生成。3.根據權利要求I所述基于索引的版式可回流文件建立方法,其特征在于,所述步驟2)中所述包圍區域可以是長方形、圓、曲線、橢圓、三角形任意可定義的幾何形狀。4.根據權利要求I所述基于索引的版式可回流文件建立方法,其特征在于,所述步驟3)中所述同行或同列可回流對象的對準線可以是文字類型可回流對象的基線、可以是文字類型可回流對象的平均線、也可以是行內文字類型可回流對象的上邊緣線或下邊緣線,可以是列內文字類型可回流對象的左邊緣線或右邊緣線,也可以是參數化曲線。5.根據權利要求I所述基于索引的版式可回流文件建立方法,其特征在于,所述步驟4)中所述計算每個包圍區域的大小,可用數學模型定義。6.根據權利要求I所述基于索引的版式可回流文件建立方法,...

    【專利技術屬性】
    技術研發人員:龔如賓
    申請(專利權)人:龔如賓
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 中文人妻无码一区二区三区| 亚洲中文字幕无码中文字在线| 18禁免费无码无遮挡不卡网站 | 97免费人妻无码视频| 亚洲AV无码一区二区二三区软件 | 无码人妻精品一区二区三区久久久| 成人无码精品一区二区三区| 无码午夜人妻一区二区三区不卡视频| 无码熟妇人妻AV在线影院| 亚洲国产精品无码专区在线观看| 国产成人精品无码专区| 无码毛片AAA在线| 色爱无码AV综合区| 中文字幕无码精品三级在线电影| 国产成人无码A区精油按摩| 91无码人妻精品一区二区三区L| 一本一道av中文字幕无码| 亚洲av无码天堂一区二区三区| 亚洲AV永久无码精品一百度影院| 亚洲精品国产日韩无码AV永久免费网| 久久无码人妻一区二区三区午夜| 国产成人无码av| 中文无码乱人伦中文视频在线V| 国产成年无码久久久久下载| 亚洲日韩av无码中文| 亚洲av永久无码嘿嘿嘿| 国产三级无码内射在线看| 免费a级毛片无码a∨免费软件 | 国产精品99精品无码视亚| 精品无码久久久久久久动漫| 曰韩无码无遮挡A级毛片| 国产精品无码一本二本三本色| 亚洲av中文无码字幕色不卡| 久久无码AV一区二区三区| 免费看又黄又无码的网站| 久久精品亚洲AV久久久无码| 婷婷四虎东京热无码群交双飞视频| 人妻少妇偷人精品无码 | 青青草无码免费一二三区| 无码国产精品一区二区免费式芒果| 久久久久亚洲AV成人无码网站 |