R语言学习——数据框

摘要:
˃#数据帧可以包含不同模式的数据,这是R中处理频率最高的数据结构。示例如下:˃#创建数据帧˃patientID年龄菱形状态patientdatapatientdatapatientIDagediabetestatus1125Type1Poor2234Type2Improved 3328Type1Excellent4452Type1Poor˃#每列中的数据模块必须是唯一的,多个模式的不同列可以放在一起形成数据帧#有几种方法可以选择数据帧中的元素。可以使用下标或直接指定列名。当R遇到变量名时,它会检查搜索路径中的数据帧。然而,with()函数也有一个限制,即赋值仅在辅助函数的括号内生效。

> #数据框可以包含不同模式(数值型、字符型、逻辑型等)的数据,是R中最常处理的数据结构。数据框可以通过函数data.frame()创建:mydata<-data.frame(coll,col2,col3,...)
> #其中的列向量col1、col2、col3等可以为任何类型(如数值型、字符型或者逻辑型)每一列的名称可由函数names指定。实例如下:
> #创建一个数据框
> patientID<-c(1,2,3,4)
> age<-c(25,34,28,52)
> diabetes<-c("Type1","Type2","Type1","Type1")
> status<-c("Poor","Improved","Excellent","Poor")
> patientdata<-data.frame(patientID,age,diabetes,status)#创建数据框patientdata
> patientdata
patientID age diabetes status
1 1 25 Type1 Poor
2 2 34 Type2 Improved
3 3 28 Type1 Excellent
4 4 52 Type1 Poor

> #每一列数据的模必须唯一,可以将多个模式的不同列放到一起组成数据框。、
> #选取数据框中元素的方式有若干种,可以使用下标记号,也可直接指定列名。实例如下:
> patientdata[1:2]#选取第1、2列数据
patientID age
1 1 25
2 2 34
3 3 28
4 4 52
> patientdata[c("diabetes","status")]
diabetes status
1 Type1 Poor
2 Type2 Improved
3 Type1 Excellent
4 Type1 Poor
> patientdata[2:3,1:2]#选取第2、3行,第1、2列的数据
patientID age
2 2 34
3 3 28
> patientdata$age#记号$用来选取一个给定数据框中的某一特定变量
[1] 25 34 28 52
> #例如,如果想生成糖尿病类型变量diabetes和病情变量status的列联表,可使用如下代码:
> table(patientdata$diabetes,patientdata$status)
Excellent Improved Poor
Type1 1 0 2
Type2 0 1 0

> #每个变量前都键入patientdata$可能会比较麻烦,联合使用函数attach()和detach()或单独使用函数with()可以简化代码。函数attach()可将数据框添加到R的搜索路径中。R遇到一个变量名后,将检查搜索路径中的数据框。上述例子也可使用如下代码实现:

> attach(patientdata)

> table(diabetes,status)

> #以数据框mtcars为例

> summary(mtcars$mpg)#获取每加仑行驶英里数(mpg)变量的描述性统计量
Min. 1st Qu. Median Mean 3rd Qu. Max.
10.40 15.43 19.20 20.09 22.80 33.90
> plot(mtcars$mpg,mtcars$disp)#每加仑行驶英里数(mpg)与发动机排量(disp)的散点图

R语言学习——数据框第1张

> plot(mtcars$mpg,mtcars$wt)#每加仑行驶英里数(mpg)与车身重量(wt)的散点图

R语言学习——数据框第2张

> #以上代码也可以写成如下形式:
> attach(mtcars)#将数据框mtcars添加到R的搜索路径
> summary(mpg)
Min. 1st Qu. Median Mean 3rd Qu. Max.
10.40 15.43 19.20 20.09 22.80 33.90
> plot(mpg,disp)

R语言学习——数据框第3张

> plot(mpg,wt)

R语言学习——数据框第4张

> detach(mtcars)#将数据框mtcars从R的搜索路径中移除
> #需要注意的是当数据框被绑定(attach)前,环境中已经存在了相同的变量时该方法便会有很明显的局限性,例如:
> mpg<-c(25,36,47)
> attach(mtcars)
The following object is masked _by_ .GlobalEnv:

mpg

> plot(mpg,wt)
Error in xy.coords(x, y, xlabel, ylabel, log) :
'x' and 'y' lengths differ
> mpg
[1] 25 36 47
> #因为这种情况下原始对象获得优先权,因此attach()和detach()最好在分析一个单独的数据框,并且不太可能有多个同名对象时使用,任何情况下都应该当心那些告知某个对象已被屏蔽(masked)的警告
> #而with()函数无需担心名称冲突

> with(mtcars,{print(summary(mpg))})
Min. 1st Qu. Median Mean 3rd Qu. Max.
10.40 15.43 19.20 20.09 22.80 33.90

> with(mtcars,{print(summary(mpg))
+ plot(mpg,disp)
+ plot(mpg,wt)})
Min. 1st Qu. Median Mean 3rd Qu. Max.
10.40 15.43 19.20 20.09 22.80 33.90

 R语言学习——数据框第5张

R语言学习——数据框第6张

> #使用with(vector,{})时,花括号{}中的语句都是针对所载入的数据框(上述例子为数据框mtcars)执行,因此无需担心名称冲突,如果仅有一条语句(例如summary(mpg)),那么花括号{}也可以省略。但with()函数也有局限性,即赋值仅在次函数的括号内生效。如下代码:
> with(mtcars,{
+ stats<-summary(mpg)
+ stats})
Min. 1st Qu. Median Mean 3rd Qu. Max.
10.40 15.43 19.20 20.09 22.80 33.90
> stats
Error: object 'stats' not found

> #那么怎么在with()中创建with()结构以外存在的对象呢,其实,使用特殊赋值符<<-替代标准赋值符<-即可,它可以将对象保存到with()之外的全局环境中。如下代码:
> with(mtcars,{
+ nokeepstats<-summary(mpg)
+ keepstats<<-summary(mpg)
+ nokeepstats
+ keepstats
+ })
Min. 1st Qu. Median Mean 3rd Qu. Max.
10.40 15.43 19.20 20.09 22.80 33.90
> nokeepstats
Error: object 'nokeepstats' not found
> keepstats
Min. 1st Qu. Median Mean 3rd Qu. Max.
10.40 15.43 19.20 20.09 22.80 33.90
> with(mtcars,{
+ nokeepstats<-summary(mpg)
+ keepstats<<-summary(mpg)
+ nokeepstats
+ })
Min. 1st Qu. Median Mean 3rd Qu. Max.
10.40 15.43 19.20 20.09 22.80 33.90
> with(mtcars,{
+ nokeepstats<-summary(mpg)
+ keepstats<<-summary(mpg)
+ keepstats
+ })
Min. 1st Qu. Median Mean 3rd Qu. Max.
10.40 15.43 19.20 20.09 22.80 33.90

免责声明:文章转载自《R语言学习——数据框》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇Mac下启动和停止Mysql服务记录uniapp的APP端分享到微信好友,链接为小程序页面,分享失败的BUG下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

VS2015调用matlab Plot函数

最近经常采用Matlab仿真,然后C语言实现,最后需要将计算结果使用Qt的qwt或者matlab中的plot函数绘图。 因此想借用matlab的plot函数接口,使用VS2015来编写信号处理代码,最后通过绘图来验证。 参考博客: https://blog.csdn.net/shouzang/article/details/80795945 https:/...

matlab绘图

MatLab绘图 作为一个功能强大的工具软件,Matlab具有很强的图形处理功能,提供了大量的二维、三维图形函数。由于系统采用面向对象的技术和丰富的矩阵运算,所以在图形处理方面方便又高效。 一般来说,一个命令行输入一条命令,命令行以回车结束。但一个命令行也可以输入若干条命令,各命令之间以逗号分隔,若前一命令后带有分号,则逗号可以省略。 如果一个命令行很长...

Python--matplotlib

无论你工作在什么项目上,IPython都是值得推荐的。利用ipython --pylab,可以进入PyLab模式,已经导入了matplotlib库与相关软件包(例如Numpy和Scipy),额可以直接使用相关库的功能。 本文作为学习过程中对matplotlib一些常用知识点的整理,方便查找。 这样IPython配置为使用你所指定的matplotlib GU...

Matplotlib 绘图

Matplotlib 提供非常全面的数据可视化功能。 安装 非常简单,直接 执行 pip install matplotlib 即可 简单示例 下面的代码,运行一下看看 import matplotlib.pyplot as plt # 如果只传入一个数组作为参数, matplotlib 认为是 Y 轴的坐标 # 并自动产生 从 0 开始的 对应 X 轴...

python下matplotlib的subplot的多图显示位置的问题

1.说明 1.1 多图: 221,222 212 ------------附最后讲解,这下更清楚了吧,取个名字:颠倒一下--- 1.2 多图 211 223,224 ------------附最后讲解,这下更清楚了吧----- 2.图 3.代码 import numpy as np import matplotlib.pyplot as plt def...

R语言学习——图形初阶之折线图与图形参数控制

plot()是R中为对象作图的一个泛型函数(它的输出将根据所绘制对象类型的不同而变化);plot(x,y,type="b")表示将x置于横轴,y置于纵轴,绘制点集(x,y),然后使用线段将其连接;type="b"表示同时绘制点和线,使用help(plot)可以查看其它选项。 实例: > dev.new() # 打开一个新的图形窗口NULL> d...