一種基于CUDA并行環(huán)境的GPU程序優(yōu)化方法技術(shù)

技術(shù)編號：8452783 閱讀：417 留言：0更新日期：2013-03-21 13:17

本發(fā)明專利技術(shù)涉及一種基于CUDA并行環(huán)境的GPU并行程序優(yōu)化方法，定義了GPU程序內(nèi)核的性能瓶頸，根據(jù)級別包括全局儲存器訪問延遲、共享存儲器訪問沖突、指令流水線沖突、指令瓶頸。并為每個性能瓶頸提出實際可操作的判定標準和瓶頸優(yōu)化解決方法：全局儲存器訪問延遲優(yōu)化方法：轉(zhuǎn)存共享存儲器、訪問歸并、提高線程級并行度、提高指令級并行度；共享存儲器訪問沖突和指令流水線沖突優(yōu)化方法：解決bank?conflict，轉(zhuǎn)存寄存器、提高線程級并行度、提高指令級并行度；指令瓶頸：指令替換和減少分支。本發(fā)明專利技術(shù)為CUDA程序編寫和優(yōu)化提供依據(jù)，幫助程序編寫者方便得找到CUDA程序中的性能瓶頸，并針對性能瓶頸做出高效有針對性的優(yōu)化，使得CUDA程序可以更大限度的發(fā)揮GPU設(shè)備的計算能力。

全部詳細技術(shù)資料下載

【技術(shù)實現(xiàn)步驟摘要】

本專利技術(shù)涉及一種圖形、動畫、科學(xué)計算、地質(zhì)、生物、物理模擬等諸多領(lǐng)域的并行計算與數(shù)據(jù)處理方法，特別涉及一種基于CUDA架構(gòu)的GPU內(nèi)核程序優(yōu)化方法，屬于高性能計算領(lǐng)域。
技術(shù)介紹
CUDA 架構(gòu)(Compute Unified Device Architecture)是面向 GPU (Graphic Processing Unit)圖形處理器等設(shè)備的并行計算架構(gòu),是一套在GPU上完成高性能計算的解決方案，在CUDA環(huán)境上并行編程的接口 API有CUDA C，C++，OpenCL, RapidMind等。CUDA C是基于CUDA架構(gòu)的C語言擴展，程序編寫者可以方便的利用這套API進行GPU編程。而程序的效果實現(xiàn)則依賴于程序員編寫性能高效、功能穩(wěn)定和可移植性強的CUDA內(nèi)核程序， CUDA內(nèi)核程序又被稱為kernel函數(shù)，是在GPU上運行的并行計算函數(shù)，內(nèi)核程序的性能直接反映了程序?qū)υO(shè)備計算資源的利用情況。目前針對CUDA內(nèi)核程序的優(yōu)化存在一些較為成熟的技術(shù)，本專利技術(shù)重點整理了以下內(nèi)容
技術(shù)介紹
一 CUDA的技術(shù)手冊(CUDA的技術(shù)手冊以NVIDIA. CUDA C Best Practices Guide. January 2012.為主)上公布了對存儲器訪問、處理器資源利用以及指令優(yōu)化的一些技術(shù)。在這套手冊中，強調(diào)了兩部分內(nèi)容一是通過提高以SM設(shè)備占有率為指標的程序并行度來掩蓋指令執(zhí)行時遇到的延遲問題；二是對以全局存儲器訪問為代表的存儲器訪問模式進行較深入的優(yōu)化。但是，這些優(yōu)化技術(shù)的不足在于過多的考慮設(shè)備占有率對程序性能的影響，其提出的程序并行度也主...

【技術(shù)保護點】
一種基于CUDA并行環(huán)境的GPU程序優(yōu)化方法，其步驟包括：1）根據(jù)CUDA上的程序分析工具對GPU程序進行檢測，得到程序需求占有率并判斷此時程序是否存在全局存儲器訪問瓶頸，同時對所述全局存儲器訪問瓶頸進行消除,進入步驟2）；2）根據(jù)共享存儲器中bank?conflicts訪問沖突的數(shù)目判斷所述步驟1）的GPU程序中是否存在共享存儲器訪問瓶頸，同時消除所述共享存儲器訪問瓶頸和新生成的全局存儲器訪問瓶頸，進入步驟3）；3）使用CUDA的程序分析工具在所述步驟2）的GPU程序提取出性能參數(shù)，判斷是否存在流水線指令執(zhí)行依賴瓶頸并消除該指令流水線沖突，得到實際IPC可達到指令瓶頸IPC的GPU程序進入步驟4）；4）在所述步驟3）中若GPU程序?qū)嶋HIPC達到指令瓶頸IPC,則進行指令瓶頸優(yōu)化處理；5)重復(fù)遍歷以上步驟1）—4），直至所述GPU程序不存在上述步驟2）?4）中的任意一項瓶頸，完成GPU程序優(yōu)化。

【技術(shù)特征摘要】

【專利技術(shù)屬性】
技術(shù)研發(fā)人員：孟洋，李勝，汪國平，
申請(專利權(quán))人：北京大學(xué)，
類型：發(fā)明
國別省市：

全部詳細技術(shù)資料下載我是這個專利的主人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條評論

還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

發(fā)布您的意見

相關(guān)領(lǐng)域技術(shù)

cuda并行程序設(shè)計技術(shù)

并行程序設(shè)計導(dǎo)論技術(shù)

并行程序設(shè)計技術(shù)

程序的并行配置技術(shù)

程序并行配置不正確技術(shù)