提示:点击上方"R语言中文网"↑掌握更多资源
上期内容回顾上期介绍了对数据进行预处理的一些内容,主要包括选取数据、删除数据以及随机抽样,一起回顾一下吧:
选取数据:两种方法:一种是使用“[]”,可以通过行列下标和变量名称来提取数据或替换数据中的变量;另一种使用subset( )函数,可以添加比较特殊的筛选条件,来对数据进行选取。
删除数据:同样可以使用“[]”,用法与选取数据大致相同。
随机抽样:调用sample( )函数,可以选择对数据是否有放回的抽取等。
温馨提示 :如果感到有些陌生,那就赶快翻开公众号历史消息温习一下~温故而知新哦~
本期内容导读前几期,我们知道了如何导入数据,选择变量,接下来在介绍统计检验之前,先介绍几种常见分布在R中的应用,作为铺垫。
一、各种统计分布在R中的名称
这张表取自《An Introduction to R》中概率分布一章,基本涵盖了R中所有的概率函数
二、概率函数介绍
在R中各种概率函数都有统一的形式,即一套统一的前缀+分布函数名:
以指数分布(R中函数名为exp)为例进行示范
密度函数调用形式:
dexp(x,rate)
参数解释:x随机变量,rate为指数概率密度函数的参数λ
例1:绘制0到4上,参数为1的指数分布的概率密度函数图像
生成图像如下:
分布函数调用形式:
pexp(x,rate, lower.tail =TRUE)
参数解释:x随机变量,rate同上,参数lower.tail为一个逻辑值,TURE表示P(X ≤ x),也是默认值。
例:求取上图中x=2左侧的概率密度函数曲线下方面积
分位数函数调用形式:
qexp(p,rate, lower.tail =True )
参数解释:p为概率值,其他同上
例:求取参数为1的指数分布函数的85%分位数
分位数函数调用形式:
qexp(n,rate)
参数解释:n为生成随机数的数量,rate同上
例:生成5个指数分布随机数
延伸拓展
本期主要为介绍,相应的函数应用比较简单,建议读者可以试着尝试其他分布的图像绘制。其他函数应用方法大致相同,例如正态分布的dnorm、pnorm、qnorm、rnorm。
鉴于延伸拓展比较简单,就在这里加上关于R帮助界面的介绍。 R具有强大的帮助界面,便于使用者解决问题,使用R帮助有几种常用的方法,下面介绍三种。
方法一:前几期中提到过输入?+函数名的求助方法,这种方法可以看到函数的具体介绍;
方法二:几种运算符的求助方法,如“%in%”,只需要在R中输入?”%in%”,即可看到该运算符的具体解释及使用方法。
方法三:这种方法受限于版本,方式为输入??+查找的名称,此法会返回带有查找名称的包、函数名等很多结果以供查看。
最后,大家可以在R界面的帮助栏中点击Html帮助(如图),查看R在线帮助界面的各种信息。
本期就介绍完了,本周五将继续介绍常见分布,欢迎大家围观!!