特征选择法,特征选择方法的互信息法的原理

特征选择方法

摘要：

特征选择在数据预处理完成后，我们需要选择有意义的特征输入到机器学习算法和模型中进行训练。根据特征选择的形式，特征选择方法可分为三种类型：过滤器：过滤器方法，根据差异或相关性对每个特征进行评分，设置要选择的阈值或阈值数量，并选择特征。嵌入式：嵌入方法，首先使用一些机器学习算法和模型进行训练，得到每个特征的权重系数，并根据系数从大到小选择特征。机器学习中用于特征选择和mRMR算法分析的特征选择的工程方法是什么？

特征选择

当数据预处理完成后，我们需要选择有意义的特征输入机器学习的算法和模型进行训练。通常来说，从两个方面考虑来选择特征：

特征是否发散：如果一个特征不发散，例如方差接近于0，也就是说样本在这个特征上基本上没有差异，这个特征对于样本的区分并没有什么用。
特征与目标的相关性：这点比较显见，与目标相关性高的特征，应当优选选择。除方差法外，本文介绍的其他方法均从相关性考虑。

根据特征选择的形式又可以将特征选择方法分为3种：

Filter：过滤法，按照发散性或者相关性对各个特征进行评分，设定阈值或者待选择阈值的个数，选择特征。
Wrapper：包装法，根据目标函数（通常是预测效果评分），每次选择若干特征，或者排除若干特征。
Embedded：嵌入法，先使用某些机器学习的算法和模型进行训练，得到各个特征的权值系数，根据系数从大到小选择特征。类似于Filter方法，但是是通过训练来确定特征的优劣。

我们使用sklearn中的feature_selection库来进行特征选择。

特征选择方法第1张

特征选择方法第2张

【特征工程】特征选择及mRMR算法解析
 机器学习中，有哪些特征选择的工程方法？

简单而清晰：https://wlypku.github.io/2017/08/12/feature-selection/

免责声明：文章转载自《特征选择方法》仅用于学习参考。如对内容有疑问，请及时联系本站处理。

特征选择方法

相关文章

在Mac OSX EI Capitan下安装xgboost的吐血经历

机器学习之类别不平衡问题 (3) —— 采样方法

动手学深度学习13-权重衰减

3层-CNN卷积神经网络预测MNIST数字

自然语言处理入门何晗读书笔记第1章新手上路

keras使用word2vec pretrained vector注意事项

最新文章

随机推荐

思享工具箱导航

JSON工具

格式化转换

加解密编码

文本数字

网络

站长

计算

其他

对照列表

特征选择方法

相关文章

在Mac OSX EI Capitan下安装xgboost的吐血经历

机器学习之类别不平衡问题 (3) —— 采样方法

动手学深度学习13-权重衰减

3层-CNN卷积神经网络预测MNIST数字

自然语言处理入门 何晗 读书笔记 第1章 新手上路

keras使用word2vec pretrained vector注意事项

最新文章

随机推荐

思享工具箱导航

JSON工具

格式化转换

加解密编码

文本数字

网络

站长

计算

其他

对照列表

自然语言处理入门何晗读书笔记第1章新手上路