基于特征選擇與改進的Tri-training的半監督網絡流量分類
摘要: 網絡流量分類對網絡管理意義重大,目前基于機器學習的流量分類方法存在標注瓶頸、樣本不平衡的問題。針對這兩個問題,提出一種基于特征選擇與改進的Tri-training算法結合的半監督網絡流量分類模型。根據最大信息系數、皮爾遜系數選擇出與類高度相關但彼此不相關的特征,利用改進的Relief F選擇出有利于少數類分類的特征,并將選擇出的特征組合成最優特征子集緩解不平衡數據對分類的影響。... (共11頁)
開通會員,享受整站包年服務