找回密码
 立即注册
查看: 7013|回复: 0

生物统计专题:R语言与常见统计分布函数

[复制链接]
发表于 2015-1-6 11:16:18 | 显示全部楼层 |阅读模式
本帖最后由 R语言微信号 于 2015-1-6 11:21 编辑




2015-01-06 Bgstn R语言中文网

 提示:点击上方"R语言中文网"↑掌握更多资源


上期内容回顾
上期介绍了对数据进行预处理的一些内容,主要包括选取数据删除数据以及随机抽样,一起回顾一下吧:
  • 选取数据:两种方法:一种是使用“[]”,可以通过行列下标和变量名称来提取数据或替换数据中的变量;另一种使用subset( )函数,可以添加比较特殊的筛选条件,来对数据进行选取。
  • 删除数据:同样可以使用“[]”,用法与选取数据大致相同。
  • 随机抽样:调用sample( )函数,可以选择对数据是否有放回的抽取等。

温馨提示如果感到有些陌生,那就赶快翻开公众号历史消息温习一下~温故而知新哦~
本期内容导读

前几期,我们知道了如何导入数据,选择变量,接下来在介绍统计检验之前,先介绍几种常见分布在R中的应用,作为铺垫。

一、各种统计分布在R中的名称

这张表取自《An Introduction to R》中概率分布一章,基本涵盖了R中所有的概率函数

二、概率函数介绍

在R中各种概率函数都有统一的形式,即一套统一的前缀+分布函数名:

  • d 表示密度函数(density);

  • p 表示分布函数;
  • q 表示分位数函数,能够返回特定分布的分位数(quantile);
  • r 表示随机函数,生成特定分布的随机数(random).


以指数分布(R中函数名为exp)为例进行示范
密度函数调用形式:

dexp(xrate
参数解释:x随机变量,rate为指数概率密度函数的参数λ
例1:绘制0到4上,参数为1的指数分布的概率密度函数图像
生成图像如下:


分布函数调用形式:

pexp(xrate, lower.tail =TRUE
参数解释:x随机变量,rate同上,参数lower.tail为一个逻辑值,TURE表示P(X ≤ x),也是默认值。
例:求取上图中x=2左侧的概率密度函数曲线下方面积

分位数函数调用形式:

qexp(prate, lower.tail =True
参数解释:p为概率值,其他同上
例:求取参数为1的指数分布函数的85%分位数

分位数函数调用形式:

qexp(nrate
参数解释:n为生成随机数的数量,rate同上
例:生成5个指数分布随机数

延伸拓展
本期主要为介绍,相应的函数应用比较简单,建议读者可以试着尝试其他分布的图像绘制。其他函数应用方法大致相同,例如正态分布的dnorm、pnorm、qnorm、rnorm。
鉴于延伸拓展比较简单,就在这里加上关于R帮助界面的介绍。 R具有强大的帮助界面,便于使用者解决问题,使用R帮助有几种常用的方法,下面介绍三种。
  • 方法一:前几期中提到过输入?+函数名的求助方法,这种方法可以看到函数的具体介绍;
  • 方法二:几种运算符的求助方法,如“%in%”,只需要在R中输入?”%in%”,即可看到该运算符的具体解释及使用方法。
  • 方法三:这种方法受限于版本,方式为输入??+查找的名称,此法会返回带有查找名称的包、函数名等很多结果以供查看。

最后,大家可以在R界面的帮助栏中点击Html帮助(如图),查看R在线帮助界面的各种信息。
本期就介绍完了,本周五将继续介绍常见分布,欢迎大家围观!!


微信扫一扫
获得更多内容





回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|R语言中文网

GMT+8, 2024-11-25 16:29 , Processed in 0.025656 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表