企業建網站特征知識庫的建立

日期 : 2021-09-02 21:28:28
       特征知識庫的建立。機器學習中最重要的是特征選擇。只有選擇合適的特征,訓練有素的分類器才能具有良好的分類效果。

       特征集合是網頁掛馬特征值的集合,當網頁被掛馬之后,將網頁源碼中一處或者多處掛馬特征提取出來,作為網頁漏洞的特征,加入待檢測特征知識庫便于后續模塊的檢測。

       特征提取模板是整個系統的核心,它的實現由兩部分組成,分別是HTML unit和Rhino,特征提取是由Rhino模塊負責進行提取。然后對提取到的HTML頁面中的腳本代碼進行解析,是通過HTML unit模塊實現對DOM樹形結構的訪問,將提取的待檢測網頁的所有特征,形成完整的特征記錄,并加入待檢測特征知識庫中,為檢測模塊提供使用。

相關文章