軟件檢測(cè)報(bào)告 時(shí)間

來源: 發(fā)布時(shí)間:2025-04-23

    每一種信息的來源或者形式,都可以稱為一種模態(tài)。例如,人有觸覺,聽覺,視覺,嗅覺。多模態(tài)機(jī)器學(xué)習(xí)旨在通過機(jī)器學(xué)習(xí)的方法實(shí)現(xiàn)處理和理解多源模態(tài)信息的能力。多模態(tài)學(xué)習(xí)從1970年代起步,經(jīng)歷了幾個(gè)發(fā)展階段,在2010年后***步入深度學(xué)習(xí)(deeplearning)階段。在某種意義上,深度學(xué)習(xí)可以被看作是允許我們“混合和匹配”不同模型以創(chuàng)建復(fù)雜的深度多模態(tài)模型。目前,多模態(tài)數(shù)據(jù)融合主要有三種融合方式:前端融合(early-fusion)即數(shù)據(jù)水平融合(data-levelfusion)、后端融合(late-fusion)即決策水平融合(decision-levelfusion)以及中間融合(intermediate-fusion)。前端融合將多個(gè)**的數(shù)據(jù)集融合成一個(gè)單一的特征向量空間,然后將其用作機(jī)器學(xué)習(xí)算法的輸入,訓(xùn)練機(jī)器學(xué)習(xí)模型,如圖1所示。由于多模態(tài)數(shù)據(jù)的前端融合往往無法充分利用多個(gè)模態(tài)數(shù)據(jù)間的互補(bǔ)性,且前端融合的原始數(shù)據(jù)通常包含大量的冗余信息。因此,多模態(tài)前端融合方法常常與特征提取方法相結(jié)合以剔除冗余信息,基于領(lǐng)域經(jīng)驗(yàn)從每個(gè)模態(tài)中提取更高等別的特征表示,或者應(yīng)用深度學(xué)習(xí)算法直接學(xué)習(xí)特征表示,然后在特性級(jí)別上進(jìn)行融合。后端融合則是將不同模態(tài)數(shù)據(jù)分別訓(xùn)練好的分類器輸出決策進(jìn)行融合,如圖2所示。代碼質(zhì)量評(píng)估顯示注釋覆蓋率不足30%需加強(qiáng)。軟件檢測(cè)報(bào)告 時(shí)間

軟件檢測(cè)報(bào)告 時(shí)間,測(cè)評(píng)

    本發(fā)明屬于惡意軟件防護(hù)技術(shù)領(lǐng)域::,涉及一種基于多模態(tài)深度學(xué)習(xí)的惡意軟件檢測(cè)方法。背景技術(shù):::惡意軟件是指在未明確提示用戶或未經(jīng)用戶許可的情況下,故意編制或設(shè)置的,對(duì)網(wǎng)絡(luò)或系統(tǒng)會(huì)產(chǎn)生威脅或潛在威脅的計(jì)算機(jī)軟件。常見的惡意軟件有計(jì)算機(jī)**(簡稱**)、特洛伊木馬(簡稱木馬)、計(jì)算機(jī)蠕蟲(簡稱蠕蟲)、后門、邏輯**等。惡意軟件可能在用戶不知情的情況下竊取計(jì)算機(jī)用戶的信息和隱私,也可能非法獲得計(jì)算機(jī)系統(tǒng)和網(wǎng)絡(luò)資源的控制,破壞計(jì)算機(jī)和網(wǎng)絡(luò)的可信性、完整性和可用性,從而為惡意軟件控制者謀取非法利益。騰訊安全發(fā)布的《2017年度互聯(lián)網(wǎng)安全報(bào)告》顯示,2017年騰訊電腦管家pc端總計(jì)攔截**近30億次,平均每月攔截木馬**近,共發(fā)現(xiàn)**或木馬***。這些數(shù)目龐大、名目繁多的惡意軟件侵蝕著我國的***、經(jīng)濟(jì)、文化、***等各個(gè)領(lǐng)域的信息安全,帶來了前所未有的挑戰(zhàn)。當(dāng)前的反**軟件主要采用基于特征碼的檢測(cè)方法,這種方法通過對(duì)代碼進(jìn)行充分研究,獲得惡意軟件特征值(即每種惡意軟件所獨(dú)有的十六進(jìn)制代碼串),如字節(jié)序列、特定的字符串等,通過匹配查找軟件中是否包含惡意軟件特征庫中的特征碼來判斷其是否為惡意軟件。信息系統(tǒng) 安全測(cè)評(píng)數(shù)字化轉(zhuǎn)型中的挑戰(zhàn)與應(yīng)對(duì):艾策科技的經(jīng)驗(yàn)分享。

軟件檢測(cè)報(bào)告 時(shí)間,測(cè)評(píng)

    optimizer)采用的是adagrad,batch_size是40。深度神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練基本都是基于梯度下降的,尋找函數(shù)值下降速度**快的方向,沿著下降方向迭代,迅速到達(dá)局部**優(yōu)解的過程就是梯度下降的過程。使用訓(xùn)練集中的全部樣本訓(xùn)練一次就是一個(gè)epoch,整個(gè)訓(xùn)練集被使用的總次數(shù)就是epoch的值。epoch值的變化會(huì)影響深度神經(jīng)網(wǎng)絡(luò)的權(quán)重值的更新次數(shù)。本次實(shí)驗(yàn)使用了80%的樣本訓(xùn)練,20%的樣本驗(yàn)證,訓(xùn)練50個(gè)迭代以便于找到較優(yōu)的epoch值。隨著迭代數(shù)的增加,前端融合模型的準(zhǔn)確率變化曲線如圖5所示,模型的對(duì)數(shù)損失變化曲線如圖6所示。從圖5和圖6可以看出,當(dāng)epoch值從0增加到5過程中,模型的驗(yàn)證準(zhǔn)確率和驗(yàn)證對(duì)數(shù)損失有一定程度的波動(dòng);當(dāng)epoch值從5到50的過程中,前端融合模型的訓(xùn)練準(zhǔn)確率和驗(yàn)證準(zhǔn)確率基本不變,訓(xùn)練和驗(yàn)證對(duì)數(shù)損失基本不變;綜合分析圖5和圖6的準(zhǔn)確率和對(duì)數(shù)損失變化曲線,選取epoch的較優(yōu)值為30。確定模型的訓(xùn)練迭代數(shù)為30后,進(jìn)行了10折交叉驗(yàn)證實(shí)驗(yàn)。前端融合模型的10折交叉驗(yàn)證的準(zhǔn)確率是%,對(duì)數(shù)損失是,混淆矩陣如圖7所示,規(guī)范化后的混淆矩陣如圖8所示。前端融合模型的roc曲線如圖9所示,該曲線反映的是隨著檢測(cè)閾值變化下檢測(cè)率與誤報(bào)率之間的關(guān)系曲線。

    且4個(gè)隱含層中間間隔設(shè)置有dropout層。用于輸入合并抽取的高等特征表示的深度神經(jīng)網(wǎng)絡(luò)包含2個(gè)隱含層,其***個(gè)隱含層的神經(jīng)元個(gè)數(shù)是64,第二個(gè)神經(jīng)元的隱含層個(gè)數(shù)是10,且2個(gè)隱含層中間設(shè)置有dropout層。且所有dropout層的dropout率等于。本次實(shí)驗(yàn)使用了80%的樣本訓(xùn)練,20%的樣本驗(yàn)證,訓(xùn)練50個(gè)迭代以便于找到較優(yōu)的epoch值。隨著迭代數(shù)的增加,中間融合模型的準(zhǔn)確率變化曲線如圖17所示,模型的對(duì)數(shù)損失變化曲線如圖18所示。從圖17和圖18可以看出,當(dāng)epoch值從0增加到20過程中,模型的訓(xùn)練準(zhǔn)確率和驗(yàn)證準(zhǔn)確率快速提高,模型的訓(xùn)練對(duì)數(shù)損失和驗(yàn)證對(duì)數(shù)損失快速減少;當(dāng)epoch值從30到50的過程中,中間融合模型的訓(xùn)練準(zhǔn)確率和驗(yàn)證準(zhǔn)確率基本保持不變,訓(xùn)練對(duì)數(shù)損失緩慢下降;綜合分析圖17和圖18的準(zhǔn)確率和對(duì)數(shù)損失變化曲線,選取epoch的較優(yōu)值為30。確定模型的訓(xùn)練迭代數(shù)為30后,進(jìn)行了10折交叉驗(yàn)證實(shí)驗(yàn)。中間融合模型的10折交叉驗(yàn)證的準(zhǔn)確率是%,對(duì)數(shù)損失是,混淆矩陣如圖19所示,規(guī)范化后的混淆矩陣如圖20所示。中間融合模型的roc曲線如圖21所示,auc值為,已經(jīng)非常接近auc的**優(yōu)值1。(7)實(shí)驗(yàn)結(jié)果比對(duì)為了綜合評(píng)估本實(shí)施例提出融合方案的綜合性能。安全掃描確認(rèn)軟件通過ISO 27001標(biāo)準(zhǔn),無高危漏洞記錄。

軟件檢測(cè)報(bào)告 時(shí)間,測(cè)評(píng)

    這樣做的好處是,融合模型的錯(cuò)誤來自不同的分類器,而來自不同分類器的錯(cuò)誤往往互不相關(guān)、互不影響,不會(huì)造成錯(cuò)誤的進(jìn)一步累加。常見的后端融合方式包括**大值融合(max-fusion)、平均值融合(averaged-fusion)、貝葉斯規(guī)則融合(bayes’rulebased)以及集成學(xué)習(xí)(ensemblelearning)等。其中集成學(xué)習(xí)作為后端融合方式的典型**,被廣泛應(yīng)用于通信、計(jì)算機(jī)識(shí)別、語音識(shí)別等研究領(lǐng)域。中間融合是指將不同的模態(tài)數(shù)據(jù)先轉(zhuǎn)化為高等特征表達(dá),再于模型的中間層進(jìn)行融合,如圖3所示。以深度神經(jīng)網(wǎng)絡(luò)為例,神經(jīng)網(wǎng)絡(luò)通過一層一層的管道映射輸入,將原始輸入轉(zhuǎn)換為更高等的表示。中間融合首先利用神經(jīng)網(wǎng)絡(luò)將原始數(shù)據(jù)轉(zhuǎn)化成高等特征表達(dá),然后獲取不同模態(tài)數(shù)據(jù)在高等特征空間上的共性,進(jìn)而學(xué)習(xí)一個(gè)聯(lián)合的多模態(tài)表征。深度多模態(tài)融合的大部分工作都采用了這種中間融合的方法,其***享表示層是通過合并來自多個(gè)模態(tài)特定路徑的連接單元來構(gòu)建的。中間融合方法的一大優(yōu)勢(shì)是可以靈活的選擇融合的位置,但設(shè)計(jì)深度多模態(tài)集成結(jié)構(gòu)時(shí),確定如何融合、何時(shí)融合以及哪些模式可以融合,是比較有挑戰(zhàn)的問題。字節(jié)碼n-grams、dll和api信息、格式結(jié)構(gòu)信息這三種類型的特征都具有自身的優(yōu)勢(shì)。第三方實(shí)驗(yàn)室驗(yàn)證數(shù)據(jù)處理速度較上代提升1.8倍。cnas 軟件 安全 測(cè)試 認(rèn)證

深圳艾策信息科技:賦能中小企業(yè)的數(shù)字化未來。軟件檢測(cè)報(bào)告 時(shí)間

    在不知道多長的子序列能更好的表示可執(zhí)行文件的情況下,只能以固定窗口大小在字節(jié)碼序列中滑動(dòng),產(chǎn)生大量的短序列,由機(jī)器學(xué)習(xí)方法選擇可能區(qū)分惡意軟件和良性軟件的短序列作為特征,產(chǎn)生短序列的方法叫n-grams?!?80074ff13b2”的字節(jié)碼序列,如果以3-grams產(chǎn)生連續(xù)部分重疊的短序列,將得到“080074”、“0074ff”、“74ff13”、“ff13b2”四個(gè)短序列。每個(gè)短序列特征的權(quán)重表示有多種方法。**簡單的方法是如果該短序列在具體樣本中出現(xiàn),就表示為1;如果沒有出現(xiàn),就表示為0,也可以用。本實(shí)施例采用3-grams方法提取特征,3-grams產(chǎn)生的短序列非常龐大,將產(chǎn)生224=(16,777,216)個(gè)特征,如此龐大的特征集在計(jì)算機(jī)內(nèi)存中存儲(chǔ)和算法效率上都是問題。如果短序列特征的tf較小,對(duì)機(jī)器學(xué)習(xí)可能沒有意義,選取了tf**高的5000個(gè)短序列特征,計(jì)算每個(gè)短序列特征的,每個(gè)短序列特征的權(quán)重是判斷其所在軟件樣本是否為惡意軟件的依據(jù),也是區(qū)分每個(gè)軟件樣本的依據(jù)。(4)前端融合前端融合的架構(gòu)如圖4所示,前端融合方式將三種模態(tài)的特征合并,然后輸入深度神經(jīng)網(wǎng)絡(luò),隱藏層的***函數(shù)為relu,輸出層的***函數(shù)是sigmoid,中間使用dropout層進(jìn)行正則化,防止過擬合,優(yōu)化器。軟件檢測(cè)報(bào)告 時(shí)間

標(biāo)簽: 測(cè)評(píng)