山海路研
因为热爱,所以想奔赴山海
内容
箱式图是什么?
箱式图: 箱式图( box plot ) 是使用5 个统计量反映原始数据的分布特征, 即数据分布中心位置、分布、偏度、变异范围和离群值。箱式图的箱子两端分别是上四分位数和下四分位数,中间横线是中位数,两端连线分别是除离群值外的最小值和最大值,另外标记可能的离群值。显然箱子越长,数据变异程度越大。若中间横线在箱子中点,则表明分布对称,否则不对称。
箱式图用来干什么?
①描述数据的分布
②直观明了地识别批量数据中地异常值。箱式图提供了识别异常值的一个标准:异常值被定义为小于Q1-1.5IQR或大于Q3+1.5IQR。
箱式图什么时候用?
箱式图将数据经验分布的重要特征展示出来,给人们一个直观的印象,由于使用的是中位数和四分位数,因此比均数和标准差更为稳健,箱式图特别适合于多组数据分布的比较。
在R里如何实现?
数据如何整理(示例数据)
代码展示
getwd()
rm(list=ls()) #清空环境
library(ggplot2)
library("readxl")
new_data <- read_excel("E:\桌面\箱式图数据.xls",sheet=1)
View(new_data)
library(ggplot2)
tiff(filename = "Rplot%03d.bmp",
width = 7,height = 10, units = "cm",res = 300)
new_data$Type <- factor(Type,levels = c(0,1,2),labels = c("净化","非净化","粉类"))
p1<-ggplot(new_data,aes(Type,Dust))+
stat_boxplot(geom = "errorbar",width=0.15)+geom_boxplot(width=0.3,size=0.8)
p1
dev.off()
图片展示
上面展示的是最简单的箱式图绘制方法,如果你想让你的相似图是这样的可以参考[3]
如果你希望你的图是下面这样的,你可以参考[4]
【1】颜艳,王彤, 等. 医学统计学[M]. 第5版. 北京: 人民卫生出版社, 2020: 163.
【2]】Zhang J . Beautiful Data Visualization with R (《R语言数据可视化之美》)[M]. 2019.
【3】https://mp.weixin.qq.com/s/zcE9I5JikLLGdCZU9Nxwpg
[4]https://mp.weixin.qq.com/s/6QIVrprcrxiIcW528Qi3-w
-END-