关于crossvalind函数(转)

摘要:
交叉验证是交叉验证的缩写。每个行为指标的一个观察样本=交叉对齐;%生成10次折叠,即1-10次,i=1:10测试=;%逻辑判断,每个循环选择一个折叠作为测试集序列=~test;%将测试的补码作为训练集,即剩余的9个folddata_train=data;%以上获得的数字均为逻辑值,与样本集label_train=label;%的选择相关标签是样本类别标签,同时选择相应的训练集数据d_test=data;%类似地,选择测试集的样本和标签_测试=标签;终止② [Train,Test]=crossalign:此命令返回逻辑值的标记向量,并从N个观察样本中随机选择P*N个样本作为测试集。

crossvalind是cross-valindation的缩写,意即交叉检验。 常用的形式有: 

①   Indices =crossvalind('Kfold', N, K) 

②   [Train, Test] = crossvalind('HoldOut',N, P) 

③   [Train, Test] = crossvalind('LeaveMOut',N, M) 

④   [Train, Test] = crossvalind('Resubstitution',N, [P,Q])  

①indices =crossvalind('Kfold', N, K): 

该命令返回一个对于N个观察样本的K个fold(意为折,有“层”之类的含义,感觉还是英文意思更形象)的标记(indices)。该标记中含有相同(或者近似相同)比例的1—K的值,将样本分为K个相斥的子集。在K-fold交叉检验中,K-1个fold用来训练,剩下的一个用来测试。此过程循环K次,每次选取不同的fold作为测试集。K的缺省值为5。 使用程序: 

[m n]=size(data); %data为样本集合。每一行为一个观察样本 

indices = crossvalind('Kfold',m,10); %产生10个fold,即indices里有等比例的1-10 

for i=1:10 

test=(indices==i); %逻辑判断,每次循环选取一个fold作为测试集 train=~test; 

%取test的补集作为训练集,即剩下的9个fold 

data_train=data(trian,:); %以上得到的数都为逻辑值,用与样本集的选取

      label_train=label(train,:); %label为样本类别标签,同样选取相应的训练集 

data_test=data(test,:); %同理选取测试集的样本和标签 label_test=label(test,:); 

end 

②[Train, Test] = crossvalind('HoldOut',N, P): 

该命令返回一个逻辑值的标记向量,从N个观察样本中随机选取(或近似于)P*N个样本作为测试集。故P应为0-1,缺省值为0.5。 使用程序: 

groups=ismenber(label,1); %label为样本类别标签,生成一个逻辑矩阵groups,1用来逻辑判断筛选 

[train, test] = crossvalind('holdOut',groups); %将groups分类,默认比例1:1,即P=0.5 

③[Train, Test] = crossvalind('LeaveMOut',N, M): 

该命令返回一个逻辑值的标记向量,从N个观察样本中随机选取M个样本作为测试集。M的缺省值为1。值得注意的是,LeaveMOut在循环中使用不能保证产生的是互补集合,即每次循环的随机选取是独立的。如果要用互补的话还是使用Kfold命令。 使用程序:

[m,n]=size(data); 

[train,test]=crossvalind('LeaveMOut',m,10) 

svmStruct = svmtrain(data(train,:),groups(train)); 

classes = svmclassify(svmStruct,data(test,:));  

cp=classperf(groups); 

cr=cp.CorrectRate  

⑤   [Train, Test] = crossvalind('Resubstitution',N, [P,Q]): 

本函数为②的一个特殊情况。当我不想把P*N剩下的部分全部作为训练集的时候使用该函数,用Q指定一个比例,选取Q*N作为训练集。两个集合的选取以最小化交集为原则。

http://wenku.baidu.com/link?url=0CT9ku1OCeqomT-iWTaiy6nEXxyU_TGv9txwDk3uIDe80dn1D-9LCiEsV-d1PHeoYoibpROA4MysEAEtN00aXiSXlxZe7Nvq3-VZWbMdv4K

免责声明:文章转载自《关于crossvalind函数(转)》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇结合AndServer,实现抖音X-Gorgon算法,设备id生成接口python爬虫之短信报警下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

使用TPU在PyTorch中实现ResNet50

作者|DR. VAIBHAV KUMAR 编译|VK 来源|Analytics In Diamag PyTorch通过提供大量强大的工具和技术,一直在推动计算机视觉和深度学习领域的发展。 在计算机视觉领域,基于深度学习的执行需要处理大量的图像数据集,因此需要一个加速的环境来加快执行过程以达到可接受的精度水平。 PyTorch通过XLA(加速线性代数)提供了...

elixir mix开发入门

备注:  简单使用mix 进行项目的生成,同时添加docker 构建支持 1. 生成项目 mix new mydemoproject 输出信息如下: * creating README.md * creating .formatter.exs * creating .gitignore * creating mix.exs * cre...

软件测试课程学习总结

一、知识结构 介绍: 1.Definition of Software testing: Software testing is any activity aimed at evaluating an attribute or capability of a program or system and determining that it meets i...

Sql多条件排序

多条件排序可以通过在order by语句后面使用case when then条件语句来实现。 select * from 表名 ORDER BY case when 条件 then 0 else 1 end 例子: 1.创建表case_test 共有id,case_type,case_location,case_way四个字段。 2.导入数据: INSER...

带你由浅入深探索webpack4(一)

 相信你或多或少也听说过webpack、gulp等这些前端构建工具。近年来webpack越来越火,可以说成为了前端开发者必备的工具。如果你有接触过vue或者react项目,我想你应该对它有所了解。 这几天我重新整理了一下webpack中知识点,把一些常用到的总结出来,希望能帮助到大家以及加深自己对webpack的理解。 (由于我在写这篇文章的时候webpa...

DockerFile与镜像(Image)仓库

深入Docker 之 Image: 当我们使用docker pull mysql 这个命令获取镜像的时候,到底他是怎么做的?我们登录官方提供的仓库看一下 https://github.com/docker-library. 我们搜索mysql并且选择对应的版本,比如 5.7 我们会看到改目录下只有两个文件,其中最重要的则是这个Dockerfile 文件了...