skip to main content
資源種類 顯示結果: 顯示結果: 查詢種類 索引

欺诈网页检测中基于遗传算法的特征优选

王嘉卿;朱焱;陈同孝;张真诚

计算机应用, 2018, Vol.38 (1), p.295-299

可取得全文

引用 被引用
  • 題名:
    欺诈网页检测中基于遗传算法的特征优选
  • 著者: 王嘉卿; 朱焱; 陈同孝; 张真诚
  • 主題: 信息增益 ; 欺诈网页检测 ; 特征选择 ; 遗传算法 ; 随机森林算法
  • 所屬期刊: 计算机应用, 2018, Vol.38 (1), p.295-299
  • 描述: 针对网页欺诈检测中特征的高维、冗余问题,提出一个基于信息增益和遗传算法的改进特征选择算法(IFS—BIGGA)。首先,通过信息增益(IG)给出特征重要性排序,设定动态阈值减少冗余特征;其次,改进遗传算法(CA)中染色体编码函数和选择算子,并结合随机森林(at)的受试者工作特征曲线面积(AUC)作为适应度函数,选择高辨识度特征;最后,增加实验迭代次数避免算法随机性,产生最佳最小的特征集合(OMFS)。实验验证表明,应用IFS-BIGGA生成的OMFS与高维特征集合相比,尽管RF下的AUC减小了2%,但是真阳性率(Tea)提高了21%,并且特征维度减少了92%;同时多个常用分类器的平均检测时间减少了83%;另外,IFS-BIGGA的F1值相比传统的遗传算法(TGA)和帝国主义竞争算法(ICA)分别提高了4.2%和3.5%。实验结果表明,IFS-BIGGA可以进行高效特征降维,在实际的网页检测工程中,有效减少计算代价,提高检测效率。
  • 出版者: 西南交通大学信息科学与技术学院,成都,611756%台中科技大学资讯工程系,台湾台中404%逢甲大学资讯工程系,台湾台中407
  • 語言: 中文
  • 識別號: ISSN: 1001-9081
    DOI: 10.11772/j.issn.1001-9081.2017061560
  • 資源來源: Alma/SFX Local Collection

正在檢索遠程資料庫,請稍等

  • 查詢:
  • scope:("NUTN"),scope:(NUTN_ALEPH),scope:(NUTN_IR),scope:(NUTN_SFX),primo_central_multiple_fe
  • 顯示現有記錄