R语言中duplicated函数:去重复,取重复

摘要:
duplicated,]##提取唯一行x1x2x311aa22bb33cc44dd55ee73bc˃duplicated##仅利用2、3列返回重复逻辑值[1]FALSEFALSEFALSEFALSEFALSETRUEFALSETRUE˃test[duplicated,]##利用2、3列中的重复逻辑值返回重复行x1x2x361aa85ee˃test[!

1、创建测试数据

> test <- c(1,2,3,1,1,2,5) ##创建向量测试数据
> test
[1] 1 2 3 1 1 2 5
> duplicated(test) ## 基本用法,返回逻辑值,非重复为F,重复为T
[1] FALSE FALSE FALSE TRUE TRUE TRUE FALSE
>

2、对向量去重复、取重复

> test[!duplicated(test)] ##对向量test取唯一值,去重复
[1] 1 2 3 5
>test[duplicated(test)]  ##取向量test中的重复值
[1] 1 1 2

3、duplicated在数据框中的操作 参考 :https://blog.csdn.net/xxzhangx/article/details/52369174

> test <-data.frame(x1 = c(1,2,3,4,5,1,3,5),x2 = c("a","b","c","d","e","a","b","e"), x3 = c("a","b","c","d","e","a","c","e"))  ##创建测试数据
>test
  x1 x2 x3
1  1a  a
2  2b  b
3  3c  c
4  4d  d
5  5e  e
6  1a  a
7  3b  c
8  5e  e
>duplicated(test)  ## 可以对数据框直接返回逻辑值,以行为单位
[1] FALSE FALSE FALSE FALSE FALSE  TRUE FALSE  TRUE
>test[duplicated(test),]  ## 提取重复行
  x1 x2 x3
6  1a  a
8  5e  e
> test[!duplicated(test),]  ## 提取唯一行
  x1 x2 x3
1  1a  a
2  2b  b
3  3c  c
4  4d  d
5  5e  e
7  3b  c
> duplicated(test[,c(2:3)])   ## 仅利用2、3列返回重复逻辑值
[1] FALSE FALSE FALSE FALSE FALSE  TRUE FALSE  TRUE
> test[duplicated(test[,c(2:3)]),]  ## 利用2、3列中的重复逻辑值返回重复行
  x1 x2 x3
6  1a  a
8  5e  e
> test[!duplicated(test[,c(2:3)]),] ## 利用2、3列中的重复逻辑值返回非重复行
  x1 x2 x3
1  1a  a
2  2b  b
3  3c  c
4  4d  d
5  5e  e
7  3b  c
>duplicated(test$x1)  ## 利用单列返回重复逻辑值 
[1] FALSE FALSE FALSE FALSE FALSE  TRUE  TRUE  TRUE
>test[duplicated(test$x1),] ##利用单列返回重复逻辑值取重复行
  x1 x2 x3
6  1a  a
7  3b  c
8  5e  e
> test[!duplicated(test$x1),]  ## 取非重复行
  x1 x2 x3
1  1a  a
2  2b  b
3  3c  c
4  4d  d
5  5  e  e

免责声明:文章转载自《R语言中duplicated函数:去重复,取重复》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇DBGridEh全部属性设置详解C# windows service Timer控件不起作用的问题下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

MySQL 千万 级数据量根据(索引)优化 查询 速度

一、索引的作用索引通俗来讲就相当于书的目录,当我们根据条件查询的时候,没有索引,便需要全表扫描,数据量少还可以,一旦数据量超过百万甚至千万,一条查询sql执行往往需要几十秒甚至更多,5秒以上就已经让人难以忍受了。 提升查询速度的方向一是提升硬件(内存、cpu、硬盘),二是在软件上优化(加索引、优化sql;优化sql不在本文阐述范围之内)。 能在软件上解决的...

Ubuntu 12.04上安装R语言

Ubuntu 12.04上安装R语言 作者:凯鲁嘎吉 - 博客园http://www.cnblogs.com/kailugaji/ R的安装 sudo gedit /etc/apt/sources.list 在sources.list文件后面添加一行 deb http://ftp.ctex.org/mirrors/CRAN/bin/linux/ub...

jieba gensim 相似度实现

博客引自:https://www.cnblogs.com//DragonFire/p/9220523.html 简单的问答已经实现了,那么问题也跟着出现了,我不能确定问题一定是"你叫什么名字",也有可能是"你是谁","你叫啥"之类的,这就引出了人工智能中的另一项技术: 自然语言处理(NLP) : 大概意思就是 让计算机明白一句话要表达的意思,NLP就相当...

KVM安装搭建

一 安装KVM 环境:Centos7.3 首先检查自己服务器或者虚拟机CPU是否支持 egrep '(vmx|svm)' /proc/cpuinfo 安装阿里云镜像站 wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo 安装KVM y...

Centos下堡垒机Jumpserver V3.0环境部署完整记录(2)-配置篇

前面已经介绍了Jumpserver V3.0的安装,基于这篇安装文档,下面说下Jumpserver安装后的的功能使用: 一、jumpserver的启动 Jumpserver的启动和重启 [root@test-vm001 install]# /opt/jumpserver/service.sh start/restart 二、按照Jumpserver部署过...

dpdk test + dpdk-procinfo

https://www.geek-share.com/detail/2586671676.html ABI_VERSION buildtools devtools GNUmakefile MAINTAINERS mk app config...