當(dāng)一臺開啟了Open Relay的郵件服務(wù)器被垃圾郵件發(fā)送者發(fā)現(xiàn)時,它也會被加入一些公開的RBL(實時黑洞名單)當(dāng)中,郵件服務(wù)器接受郵件時,可以檢查這些郵件的發(fā)信地址和域是否在這些RBL當(dāng)中。但是RBL有時也會包含一些合法的郵件服務(wù)器。因此,使用RBL的同時把常用的一些合法的郵件服務(wù)器加入到白名單當(dāng)中。
二、指紋分析
從理論上來說,如果一個收件人收到垃圾郵件之后,提取其中的指紋特征并分享給其他收件人,那么其他收件人就可以根據(jù)這些數(shù)字指紋拒絕接收具有同樣指紋特征的郵件。不幸的是,這些大批量發(fā)送的郵件也會包含細微的變化。例如,垃圾郵件一般都包括一個“退訂(Unsubscribe)”鏈接。另外,收集指紋特征是一項極其耗費資源的工作,尤其是在郵件流量巨大的企業(yè)環(huán)境當(dāng)中。
經(jīng)過認真細致的分析,找到這些郵件當(dāng)中共同的特征點,就可以把這些指紋特征收集整理成一個規(guī);睦]件特征庫。
三、語義分析
垃圾郵件制造者的另一種辦法就是使用以往常用的詞匯。語義分析會根據(jù)這些詞語出現(xiàn)的位置和環(huán)境分配一個權(quán)重。一旦整封郵件的內(nèi)容分析完畢,這些權(quán)重將會相加得到一個最終的分值,如果這個分值超過某一個預(yù)設(shè)的閾值,這封郵件將被判斷為垃圾郵件。
四、人工智能
神經(jīng)網(wǎng)絡(luò)是人工智能技術(shù)在軟件中的實現(xiàn),用來識別變化模式匹配。一個神經(jīng)網(wǎng)絡(luò)存在輸入、輸出和兩者之間的連接。輸入/輸入節(jié)點代表那些需要分析的源數(shù)據(jù)。輸入是郵件當(dāng)中的所有詞語,輸出是電子郵件的分類。神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確性依賴于它是如何被“訓(xùn)練”的。在“訓(xùn)練”過程中,會有大量的輸入/輸出被送入網(wǎng)絡(luò),網(wǎng)絡(luò)通過持續(xù)調(diào)整節(jié)點之間的連接權(quán)重來增加準(zhǔn)確性。
五、統(tǒng)計分析
統(tǒng)計分析是通過分析大量已經(jīng)正確分類的垃圾郵件和正常郵件,統(tǒng)計其中詞語出現(xiàn)的頻率從而生成一個關(guān)于可能性的權(quán)重數(shù)據(jù)庫。通過分析累加一封郵件中出現(xiàn)的所有的詞語的權(quán)重值,可以得到這封郵件的權(quán)重值,從而判斷這封郵件是垃圾郵件的可能性有多大。盡管統(tǒng)計數(shù)據(jù)庫中可能不會包含所有的詞語,但是經(jīng)過精確的“訓(xùn)練”,貝葉斯算法可以得到相當(dāng)?shù)臏?zhǔn)確率。
六、啟發(fā)式分析
啟發(fā)式分析是對郵件進行一系列的測試分析,然后將這些測試分析的結(jié)果綜合和一個閾值比較,超過這個閾值就判斷為垃圾郵件。啟發(fā)式分析可以包括上面提到的所有方法,也會檢查郵件的內(nèi)容和屬性。垃圾郵件也是不斷變化的,需要更多的分析判斷方法結(jié)合起來。因此執(zhí)行多個分析過程對提高準(zhǔn)確率非常重要。整個啟發(fā)式分析的準(zhǔn)確性依賴于組成它的多個分析過程的權(quán)重打分有效性和閾值機制。
七、中文的特殊性
由于中文的特殊性,使得郵件是由多個漢字而不是“詞語+空格”組成的,在中文郵件的處理上,需要對這些方法做一些改革。首先,需要一個非常高效的機制對詞語進行分隔和識別;其次,還需要有一個能夠理解中文的辭典;同時,漢字還存在“簡體”和“繁體”,存在GB2312、GB18030等多種編碼方式。最好的辦法就是把這些編碼統(tǒng)一轉(zhuǎn)換到一個統(tǒng)一的格式,然后進行統(tǒng)一處理。
基于業(yè)界最完整、精確的相關(guān)內(nèi)容數(shù)據(jù)庫以及用于精確內(nèi)容識別的適應(yīng)性推理技術(shù),美訊智是信息安全領(lǐng)域惟一能夠真正提供整體內(nèi)容安全解決方案的公司,方案包括網(wǎng)頁過濾、電子郵件過濾、即時信息過濾和間諜軟件過濾。美訊智的整體內(nèi)容安全解決方案具有配置靈活、功能豐富、可擴展性強的特點,能夠滿足來自信息安全市場的多種需求,業(yè)務(wù)延伸至世界的每一個角落。
美訊智的安全信息網(wǎng)關(guān)RiskFilter/SMG使用15層過濾措施,嚴格過濾垃圾郵件。美訊智的垃圾郵件過濾策略和指紋特征庫由內(nèi)容安全專家小組維護并每日更新,過濾效果達到準(zhǔn)確率高于98%,誤判率低于0.1%。在中國,每天有超過3千萬個郵件賬戶正得到美訊智RiskFilter/SMG的有效保護。
計算機世界網(wǎng)(www.ccw.com.cn)