《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 基于強化學習的特征工程算法研究
基于強化學習的特征工程算法研究
2021年電子技術應用第7期
謝 斌1,2,林珊玲2,3,林志賢1,2,郭太良1,2
1.福州大學 物理與信息工程學院,福建 福州350116; 2.中國福建光電信息科學與技術創新實驗室,福建 福州350116;3.福州大學 先進制造學院,福建 泉州362200
摘要: 特征工程可以自動地處理和生成那些判別性高的特征,而無需人為的操作。特征工程在機器學習中是不可避免的一環,也是至關重要的一環。提出一種基于強化學習(RL)的方法,將特征工程作為一個馬爾可夫決策過程(MDP),在上限置信區間算法(UCT)的基礎上提出一個近似的方法求解二分類數值數據的特征工程問題,來自動獲得最佳的變換策略。在5個公開的數據集上驗證所提出方法的有效性,FScore平均提高了9.032%,同時與其他用有限元變換進行特征工程的方法進行比較。該方法確實可以得到判別性高的特征,提高模型的學習能力,得到更高的精度。
中圖分類號: TP391
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.201173
中文引用格式: 謝斌,林珊玲,林志賢,等. 基于強化學習的特征工程算法研究[J].電子技術應用,2021,47(7):29-32,43.
英文引用格式: Xie Bin,Lin Shanling,Lin Zhixian,et al. Research on feature engineering algorithm based on reinforcement learning[J]. Application of Electronic Technique,2021,47(7):29-32,43.
Research on feature engineering algorithm based on reinforcement learning
Xie Bin1,2,Lin Shanling2,3,Lin Zhixian1,2,Guo Tailiang1,2
1.School of Physics and Information Engineering,Fuzhou University,Fuzhou 350116,China; 2.China Fujian Optoelectronic Information Science and Technology Innovation Laboratory,Fuzhou 350116,China; 3.School of Advanced Manufacturing, Fuzhou University,Quanzhou 362200,China
Abstract: Feature engineering can automatically process and generate those highly discriminative features without human operation. Feature engineering is an inevitable and crucial part of machine learning. The article proposes a method based on reinforcement learning(RL), taking feature engineering as a Markov decision process(MDP), and proposes an approximate method based on the upper limit confidence interval algorithm(UCT) to solve the feature engineering of binary numerical data problem to automatically obtain the best transformation strategy. The effectiveness of the proposed method is verified on five public data sets. The FScore of the five public data sets is improved by an average of 9.032%. It is also compared with other papers that use finite element transformation for feature engineering. This method can indeed obtain highly discriminative features, improve the learning ability of the model, and obtain higher accuracy.
Key words : feature engineering;reinforcement learning;machine learning

0 引言

    機器學習廣泛應用于人們的日常生活中,其中預測分析廣泛應用于多個領域的決策,包括欺詐檢測[1-2]、在線廣告[3-4]、風險管理、市場營銷等。預測模型是采用監督學習算法來進行預測,通過歷史數據進行訓練分類或者回歸模型來預測未知的結果,以起到決策的作用。數據的表示方法對于模型的準確度十分重要,原始的數據空間往往難以表達數據。因此,在模型構建之前對數據進行適當的處理及轉換是必不可少的。

    特征工程的主要目的就是改變預測建模的特征以更好地適應算法的訓練,通過生成那些判別性高的特征來提高模型訓練的準確度。在現實中,特征工程是由數據科學家手動和根據領域知識來進行的,這一過程往往是十分繁瑣且耗時的[5],而且很容易產生錯誤和偏差。




本文詳細內容請下載:http://www.cdfla.com/resource/share/2000003649




作者信息:

謝  斌1,2,林珊玲2,3,林志賢1,2,郭太良1,2

(1.福州大學 物理與信息工程學院,福建 福州350116;

2.中國福建光電信息科學與技術創新實驗室,福建 福州350116;3.福州大學 先進制造學院,福建 泉州362200)




wd.jpg

此內容為AET網站原創,未經授權禁止轉載。
蜜糖直播官网_蜜糖直播软件下载_蜜糖直播苹果