集成算法stacking

摘要:
积分算法——什么是堆叠##堆叠?堆栈是各种算法模型的融合堆栈。假设有四个算法A、B、C和D,您使用三个算法A,B和C来训练训练集和测试集,生成三组新的预测训练集和试验集,然后使用算法D来训练它们,最后生成最终结果。① 以算法A为例。此时,加载数据、训练集训练和测试集。

集成算法--stacking##

  1. stacking是什么
    stacking是各类算法模型的融合堆叠。假设有四种算法A、B、C、D, 你用A、B、C三种算法,分为对训练集和测试集训练,生成三组被预测了的新的train和test集,然后在用算法D对其训练,最终生成最终的结果。

  2. 细解流程:如何生成新的预测了的pred_train。

  • ①以算法A为例,此时加载了数据,训练集train和测试集test。先对训练集train进行五折交叉,生成五组 train_part和valid验证集,且保证valid集的index不重合
  • ②对每组的train_part进行训练,然后预测valid,生成pred_valid,五组验证完后,正好五个pred_valid对应train中所有数据的预测值,五个pred_valid合并后即pred_train_A
  • ③而在对每组train_part训练的过程中,生成的模型,不仅对valid进行预测,同时也对test进行预测,生成五组pred_mid_test, 因为test并没有分成五份,所以对五组pred_mid_test取中位数,生成最终的pred_test_A
  • ④ 同样对算法B、C重复以上步骤1,2,3, 生成pred_train_B, pred_test_B, pred_train_C, pred_test_C
  • ⑤ 最后将pred_train_A, pred_train_B, pred_train_C组成新的一个三列的train_DataFrame,三个test则再组成一个新的test_DataFrame,然后用算法D来训练和生成最终的结果

3.图解:
1.暂时没找到

  1. 其他可读文章
    1.待更新

免责声明:文章转载自《集成算法stacking》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇MFC中Carray的使用京东全渠道零售数智化迭代实践下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

idea运行main方法或Test避免编译整个应用的方法

在idea,我常常会遇到这样的问题,我写个main或者Test,明明就想运行一个简单的函数测试下某个简单的方法,但一运行就需要编译整个项目,非常的耗时 这里我给出一个idea简单的修改配置就可以解决问题,我的idea版本是2021.2,其它版本可以参考也是类似的 如下所示: 把Do not build before run勾上 自动编译勾上(PS:juni...

RedisTemplate访问Redis数据结构(五)——ZSet

Redis 有序集合和无序集合一样也是string类型元素的集合,且不允许重复的成员。不同的是每个元素都会关联一个double类型的分数。有序集合的成员是唯一的,但分数(score)却可以重复。redis正是通过分数来为集合中的成员进行从小到大的排序。 ZSetOperations提供了一系列方法对有序集合进行操作。首先初始化spring工厂获得redis...

Mysql系列(三)—— Mysql主从复制配置

一.前言 主从复制是Mysql知识体系中非常重的要一个模块。学习主从复制和后续的读写分离是完善只是知识体系的重要环节。且主从复制读写分离的思想并不仅仅局限于Mysql,在很多存储系统中都有该方案,如:redis。 从应用的角度思考,主从复制有如下优点: 可以备份数据,容灾 可以做读写分离,分担单机Mysql节点的压力。master只做write,slav...

基于tensorflow的CNN卷积神经网络对Fasion-MNIST数据集的分类器(1)

写一个基于tensorflow的cnn,分类fasion-MNIST数据集 这个就是fasion-mnist数据集 这张图片是CNN的一般结构 先上代码,在分析: import tensorflow as tf import pandas as pd import numpy as np config = tf.ConfigProto() confi...

使用git克隆项目、从dev分支上更新代码以及将代码提交到Coding(或GitHub)上面

本教程的目的: 这是个crm项目中,有两个分支一个是master和dev ,master主分支,不允许提交代码,我要拉去dev分支上最新的代码,并将修改后的项目,在推送到dev分支上。 一、 1.首先需要下载一个git,并安装。 2.关联本地和git网站(如果不是第一次使用git,已经配置过,请忽略) 这里是你github的不是coding的 命令:g...

Unity Job System

  参考链接 :    http://esprog.hatenablog.com/entry/2018/05/19/150313   https://blogs.unity3d.com/2018/10/22/what-is-a-job-system/   Job系统作为一个多线程系统, 它因为跟ECS有天生的融合关系所以比较重要的样子, 我也按照使用类型的...