一種識別文檔代碼的方法和裝置制造方法及圖紙

技術編號：15691351 閱讀：490 留言：0更新日期：2017-06-24 04:29

本申請提出一種識別文檔代碼的方法和裝置，涉及文檔惡意代碼分析領域，所述方法包括：對目標文檔滿足預設格式字節位置進行定位；對所述滿足預設格式字節的起始位置至結束位置進行模擬中央處理器CPU指令執行，獲得執行結果；對所述執行結果進行特征提取，獲得特征提取結果；根據所述特征提取結果，識別所述目標文檔是否包含惡意代碼。可以結合文件結構分析及惡意特征打分機制，快速定位代碼，并且效果良好。

Method and device for identifying document code

The invention provides a method and a device for identifying code document, the document related malicious code analysis, the method includes: to meet the preset target document format byte position location; the format meets the preset byte start point to the end position of simulated CPU CPU instruction execution, execution of the obtained results; to perform feature extraction results are obtained according to the results of feature extraction; feature extraction results, whether the identification of the target document contains malicious code. You can combine file structure analysis and malicious feature scoring mechanism to quickly locate the code and achieve good results.

全部詳細技術資料下載

【技術實現步驟摘要】
一種識別文檔代碼的方法和裝置
本專利技術涉及文檔惡意代碼分析領域，具體涉及一種識別文檔代碼的方法和裝置。
技術介紹
基于文檔型漏洞的惡意代碼是入侵者通過各種方式將具有漏洞的文檔先植入到用戶計算機中，再引導用戶進行打開操作，這樣通過已設置好的漏洞利用代碼shellcode進行惡意代碼的釋放或者下載。而這些惡意代碼往往經過了入侵者的層層反信息安全產品操作：加殼、反虛擬機、免殺、驅動保護、條件執行等等各種保護。最重要的問題在于入侵者往往針對要入侵的用戶或網絡十分了解，目的性是竊取特定用戶的信息，且進行長期潛伏，所以入侵者還會針對用戶的固定信息安全產品進行單獨的研究與免殺、繞過技術等處置，所以針對文檔型漏洞的惡意代碼查殺檢測率幾乎為零。目前，信息安全廠商針對文檔型漏洞的自動化惡意文檔識別方案，主要采用虛擬機沙盒分析的方法，其中，沙盒主要是指一個模擬的或者真實的操作系統環境，或者文件執行環境，這種方法首先要保證沙盒中存在文檔能夠正確執行的相關應用程序，相關技術對某些檢測沙箱環境的惡意文檔無法分析。一般主要用于概念性驗證。
技術實現思路
本專利技術提供一種識別文檔代碼的方法和裝置，解決了惡意文件的自動化分析的問題。為了實現上述專利技術目的，本專利技術采取的技術方案如下：一種識別文檔代碼的方法，包括：對目標文檔滿足預設格式字節位置進行定位；對所述滿足預設格式字節的起始位置至結束位置進行模擬中央處理器CPU指令執行，獲得執行結果；對所述執行結果進行特征提取，獲得特征提取結果；根據所述特征提取結果，識別所述目標文檔是否包含惡意代碼。可選地，所述對目標文檔的滿足預設格式字節位置進...
一種識別文檔代碼的方法和裝置

【技術保護點】
一種識別文檔代碼的方法，其特征在于，包括：對目標文檔滿足預設格式字節位置進行定位；對所述滿足預設格式字節的起始位置至結束位置進行模擬中央處理器CPU指令執行，獲得執行結果；對所述執行結果進行特征提取，獲得特征提取結果；根據所述特征提取結果，識別所述目標文檔是否包含惡意代碼。

【技術特征摘要】
1.一種識別文檔代碼的方法，其特征在于，包括：對目標文檔滿足預設格式字節位置進行定位；對所述滿足預設格式字節的起始位置至結束位置進行模擬中央處理器CPU指令執行，獲得執行結果；對所述執行結果進行特征提取，獲得特征提取結果；根據所述特征提取結果，識別所述目標文檔是否包含惡意代碼。2.如權利要求1所述的方法，其特征在于，所述對目標文檔的滿足預設格式字節位置進行定位，包括：對所述目標文檔進行格式化解析，識別出所述目標文檔的格式；根據識別出的所述目標文檔的格式，在所述目標文檔對應的位置進行惡意代碼定位。3.如權利要求1所述的方法，其特征在于：對所述滿足預設格式字節的起始位置至結束位置進行模擬中央處理器CPU指令執行包括:從所述滿足預設格式字節的起始位置開始，每次調整偏移量，逐次進行模擬CPU指令執行，獲得執行結果，直到所述滿足預設格式字節的結束位置。4.如權利要求1所述的方法，其特征在于：對所述執行結果進行特征提取，獲得特征提取結果包括：逐一比較從所述執行結果提取出的特征是否符合預設的惡意代碼特征，如果符合，則記錄所述特征。5.如權利要求1所述的方法，其特征在于：根據所述特征提取結果給出分析結論包括：對特征提取獲得的每個特征提取結果按照預設標準進行評分，根據特征提取獲得的所有特征提取結果的評分結果與預設閾值進行比較，獲得所述目標文檔的滿足預設格式字節是否為惡意代碼的分析結論。6.一種識別文檔代碼的裝置，其特征在于，包括：定位模塊，設置為對目標文檔的滿足預設格式字節位置進行定位；指令模塊，設置為對所述滿足預設格式字節的起始位置至結束位置進行模擬中央處理器CPU指令執行，獲得執行結果；特征提取模塊，設置為對所述執行結果進行特征提取，獲得特...

【專利技術屬性】
技術研發人員：王龍，
申請(專利權)人：阿里巴巴集團控股有限公司，
類型：發明
國別省市：開曼群島,KY

全部詳細技術資料下載我是這個專利的主人

相關技術