在R语言中,缺失值用 NA 表示,空值用 NULL 表示。初学者在学习R语言时,一般都会被这两者弄糊涂,常常错误地把这两者视为等价的。
下面,通过代码演示来说明它们的不同:
首先看 NA :
x <- vector(length=3); x
[1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
x <-c(NA,NA,NA); x
[1] NA NA NA
length(x)
[1] 3
再看NULL:
x <- vector(length=3); x
[1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
x <- c(NULL,NULL,NULL);x
NULL
length(x)
[1] 0
从上面可以看出,NA与NULL的差别还是非常明显的。用一个比喻来讲,NA是已经挖好了一些坑,只是里面没有萝卜而已,这就是所谓的“缺失值”。而NULL则指的是“压根连坑都没有”。一个元素值全为NA的向量,它的长度是存在的,就等于元素的个数。而如果把一个向量的所有元素的值都设为NULL,这个向量就变成了“空值”,其长度为0,表明“空无一物”。
所以说,NULL比NA更悲剧。
【参考资料】
薛毅,R语言与统计建模