先將當(dāng)前軟件樣本件的二進(jìn)制可執(zhí)行文件轉(zhuǎn)換為十六進(jìn)制字節(jié)碼序列,然后采用n-grams方法在十六進(jìn)制字節(jié)碼序列中滑動(dòng),產(chǎn)生大量的連續(xù)部分重疊的短序列特征,提取得到當(dāng)前軟件樣本的二進(jìn)制可執(zhí)行文件的字節(jié)碼n-grams的特征表示。生成軟件樣本的dll和api信息特征視圖,是先統(tǒng)計(jì)所有類(lèi)別已知的軟件樣本的pe可執(zhí)行文件引用的dll和api信息,從中選取引用頻率**高的多個(gè)dll和api信息;然后判斷當(dāng)前的軟件樣本的導(dǎo)入節(jié)里是否存在選擇出的某個(gè)引用頻率**高的dll和api信息,如存在,則將當(dāng)前軟件樣本的該dll或api信息以1表示,否則將其以0表示,從而對(duì)當(dāng)前軟件樣本的所有dll和api信息進(jìn)行表示形成當(dāng)前軟件樣本的dll和api信息特征視圖。生成軟件樣本的格式信息特征視圖,是從當(dāng)前軟件樣本的pe格式結(jié)構(gòu)信息中選取可能區(qū)分惡意軟件和良性軟件的pe格式結(jié)構(gòu)特征,形成當(dāng)前軟件樣本的格式信息特征視圖。從當(dāng)前軟件樣本的pe格式結(jié)構(gòu)信息中選取可能區(qū)分惡意軟件和良性軟件的pe格式結(jié)構(gòu)特征,是從當(dāng)前軟件樣本的pe格式結(jié)構(gòu)信息中確定存在特定格式異常的pe格式結(jié)構(gòu)特征以及存在明顯的統(tǒng)計(jì)差異的格式結(jié)構(gòu)特征。特定格式異常包括:(1)代碼從**后一節(jié)開(kāi)始執(zhí)行,(2)節(jié)頭部可疑的屬性,。創(chuàng)新光譜分析技術(shù)賦能艾策檢測(cè),實(shí)現(xiàn)食品藥品中微量有害物質(zhì)的超痕量檢測(cè)。北京軟件評(píng)測(cè)公司
嘗試了前端融合、后端融合和中間融合三種融合方法對(duì)進(jìn)行有效融合,有效提高了惡意軟件的準(zhǔn)確率,具備較好的泛化性能和魯棒性。實(shí)驗(yàn)結(jié)果顯示,相對(duì)**且互補(bǔ)的特征視圖和不同深度學(xué)習(xí)融合機(jī)制的使用明顯提高了檢測(cè)方法的檢測(cè)能力和泛化性能,其中較優(yōu)的中間融合方法取得了%的準(zhǔn)確率,對(duì)數(shù)損失為,auc值為。有效解決了現(xiàn)有采用二進(jìn)制可執(zhí)行文件的單一特征類(lèi)型進(jìn)行惡意軟件檢測(cè)的檢測(cè)方法檢測(cè)結(jié)果準(zhǔn)確率不高、可靠性低、泛化性和魯棒性不佳的問(wèn)題。另外,惡意軟件很難同時(shí)偽造良性軟件的多個(gè)抽象層次的特征以逃避檢測(cè),本發(fā)明實(shí)施例同時(shí)融合軟件的二進(jìn)制可執(zhí)行文件的多個(gè)抽象層次的特征,可準(zhǔn)確檢測(cè)出偽造良性軟件特征的惡意軟件,解決了現(xiàn)有采用二進(jìn)制可執(zhí)行文件的單一特征類(lèi)型進(jìn)行惡意軟件檢測(cè)的檢測(cè)方法難以檢測(cè)出偽造良性軟件特征的惡意軟件的問(wèn)題。附圖說(shuō)明為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖**是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1是前端融合方法的流程圖。賽維軟件測(cè)評(píng)中心可靠性評(píng)估連續(xù)運(yùn)行72小時(shí)出現(xiàn)2次非致命錯(cuò)誤。
程序利用windows提供的接口(windowsapi)實(shí)現(xiàn)程序的功能。通過(guò)一個(gè)可執(zhí)行程序引用的動(dòng)態(tài)鏈接庫(kù)(dll)和應(yīng)用程序接口(api)可以粗略的預(yù)測(cè)該程序的功能和行為。統(tǒng)計(jì)所有樣本的導(dǎo)入節(jié)中引用的dll和api的頻率,留下引用頻率**高的60個(gè)dll和500個(gè)api。提取特征時(shí),每個(gè)樣本的導(dǎo)入節(jié)里存在選擇出的dll或api,該特征以1表示,不存在則以0表示,提取的560個(gè)dll和api特征作為***個(gè)特征視圖。提取格式信息特征視圖pe是portableexecutable的縮寫(xiě),初衷是希望能開(kāi)發(fā)一個(gè)在所有windows平臺(tái)上和所有cpu上都可執(zhí)行的通用文件格式。pe格式文件是封裝windows操作系統(tǒng)加載程序所需的信息和管理可執(zhí)行代碼的數(shù)據(jù)結(jié)構(gòu),數(shù)據(jù)**是大量的字節(jié)碼和數(shù)據(jù)結(jié)構(gòu)的有機(jī)融合。pe文件格式被**為一個(gè)線(xiàn)性的數(shù)據(jù)流,由pe文件頭、節(jié)表和節(jié)實(shí)體組成。惡意軟件或被惡意軟件***的可執(zhí)行文件,它本身也遵循格式要求的約束,但可能存在以下特定格式異常:(1)代碼從**后一節(jié)開(kāi)始執(zhí)行;(2)節(jié)頭部可疑的屬性;(3)pe可選頭部有效尺寸的值不正確;(4)節(jié)之間的“間縫”;(5)可疑的代碼重定向;(6)可疑的代碼節(jié)名稱(chēng);(7)可疑的頭部***;(8)來(lái)自;(9)導(dǎo)入地址表被修改;(10)多個(gè)pe頭部;(11)可疑的重定位信息;。
optimizer)采用的是adagrad,batch_size是40。深度神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練基本都是基于梯度下降的,尋找函數(shù)值下降速度**快的方向,沿著下降方向迭代,迅速到達(dá)局部**優(yōu)解的過(guò)程就是梯度下降的過(guò)程。使用訓(xùn)練集中的全部樣本訓(xùn)練一次就是一個(gè)epoch,整個(gè)訓(xùn)練集被使用的總次數(shù)就是epoch的值。epoch值的變化會(huì)影響深度神經(jīng)網(wǎng)絡(luò)的權(quán)重值的更新次數(shù)。本次實(shí)驗(yàn)使用了80%的樣本訓(xùn)練,20%的樣本驗(yàn)證,訓(xùn)練50個(gè)迭代以便于找到較優(yōu)的epoch值。隨著迭代數(shù)的增加,前端融合模型的準(zhǔn)確率變化曲線(xiàn)如圖5所示,模型的對(duì)數(shù)損失變化曲線(xiàn)如圖6所示。從圖5和圖6可以看出,當(dāng)epoch值從0增加到5過(guò)程中,模型的驗(yàn)證準(zhǔn)確率和驗(yàn)證對(duì)數(shù)損失有一定程度的波動(dòng);當(dāng)epoch值從5到50的過(guò)程中,前端融合模型的訓(xùn)練準(zhǔn)確率和驗(yàn)證準(zhǔn)確率基本不變,訓(xùn)練和驗(yàn)證對(duì)數(shù)損失基本不變;綜合分析圖5和圖6的準(zhǔn)確率和對(duì)數(shù)損失變化曲線(xiàn),選取epoch的較優(yōu)值為30。確定模型的訓(xùn)練迭代數(shù)為30后,進(jìn)行了10折交叉驗(yàn)證實(shí)驗(yàn)。前端融合模型的10折交叉驗(yàn)證的準(zhǔn)確率是%,對(duì)數(shù)損失是,混淆矩陣如圖7所示,規(guī)范化后的混淆矩陣如圖8所示。前端融合模型的roc曲線(xiàn)如圖9所示,該曲線(xiàn)反映的是隨著檢測(cè)閾值變化下檢測(cè)率與誤報(bào)率之間的關(guān)系曲線(xiàn)。數(shù)據(jù)安全與合規(guī):艾策科技的最佳實(shí)踐。
本發(fā)明屬于惡意軟件防護(hù)技術(shù)領(lǐng)域::,涉及一種基于多模態(tài)深度學(xué)習(xí)的惡意軟件檢測(cè)方法。背景技術(shù):::惡意軟件是指在未明確提示用戶(hù)或未經(jīng)用戶(hù)許可的情況下,故意編制或設(shè)置的,對(duì)網(wǎng)絡(luò)或系統(tǒng)會(huì)產(chǎn)生威脅或潛在威脅的計(jì)算機(jī)軟件。常見(jiàn)的惡意軟件有計(jì)算機(jī)**(簡(jiǎn)稱(chēng)**)、特洛伊木馬(簡(jiǎn)稱(chēng)木馬)、計(jì)算機(jī)蠕蟲(chóng)(簡(jiǎn)稱(chēng)蠕蟲(chóng))、后門(mén)、邏輯**等。惡意軟件可能在用戶(hù)不知情的情況下竊取計(jì)算機(jī)用戶(hù)的信息和隱私,也可能非法獲得計(jì)算機(jī)系統(tǒng)和網(wǎng)絡(luò)資源的控制,破壞計(jì)算機(jī)和網(wǎng)絡(luò)的可信性、完整性和可用性,從而為惡意軟件控制者謀取非法利益。騰訊安全發(fā)布的《2017年度互聯(lián)網(wǎng)安全報(bào)告》顯示,2017年騰訊電腦管家pc端總計(jì)攔截**近30億次,平均每月攔截木馬**近,共發(fā)現(xiàn)**或木馬***。這些數(shù)目龐大、名目繁多的惡意軟件侵蝕著我國(guó)的***、經(jīng)濟(jì)、文化、***等各個(gè)領(lǐng)域的信息安全,帶來(lái)了前所未有的挑戰(zhàn)。當(dāng)前的反**軟件主要采用基于特征碼的檢測(cè)方法,這種方法通過(guò)對(duì)代碼進(jìn)行充分研究,獲得惡意軟件特征值(即每種惡意軟件所獨(dú)有的十六進(jìn)制代碼串),如字節(jié)序列、特定的字符串等,通過(guò)匹配查找軟件中是否包含惡意軟件特征庫(kù)中的特征碼來(lái)判斷其是否為惡意軟件。艾策檢測(cè)以智能算法驅(qū)動(dòng)分析,為工業(yè)產(chǎn)品提供全生命周期質(zhì)量管控解決方案!軟件檢測(cè)收費(fèi)標(biāo)準(zhǔn)
對(duì)比分析顯示資源占用率高于同類(lèi)產(chǎn)品均值26%。北京軟件評(píng)測(cè)公司
生成取值表。3把取值表與選擇的正交表進(jìn)行映射控件數(shù)Ln(取值數(shù))3個(gè)控件5個(gè)取值5的3次冪混合正交表當(dāng)控件的取值數(shù)目水平不一致時(shí)候,使用allp**rs工具生成1等價(jià)類(lèi)劃分法劃分值2邊界值分析法邊界值3錯(cuò)誤推斷法經(jīng)驗(yàn)4因果圖分析法關(guān)系5判定表法條件和結(jié)果6流程圖法流程路徑梳理7場(chǎng)景法主要功能和業(yè)務(wù)的事件8正交表先關(guān)注主要功能和業(yè)務(wù)流程,業(yè)務(wù)邏輯是否正確實(shí)現(xiàn),考慮場(chǎng)景法需要輸入數(shù)據(jù)的地方,考慮等價(jià)類(lèi)劃分法+邊界值分析法,發(fā)現(xiàn)程序錯(cuò)誤的能力**強(qiáng)存在輸入條件的組合情況,考慮因果圖判定表法多種參數(shù)配置組合情況,正交表排列法采用錯(cuò)誤推斷法再追加測(cè)試用例。需求分析場(chǎng)景法分析主要功能輸入的等價(jià)類(lèi)邊界值輸入的各種組合因果圖判定表多種參數(shù)配置正交表錯(cuò)誤推斷法經(jīng)驗(yàn)軟件缺陷軟件產(chǎn)品中存在的問(wèn)題,用戶(hù)所需要的功能沒(méi)有完全實(shí)現(xiàn)。北京軟件評(píng)測(cè)公司