BS выборки в ГС
Бутстрэп (англ. BootStrap, сокращенно BS) в статистике — практический компьютерный метод исследования распределения статистик вероятностных распределений, основанный на многократной генерации выборок методом Монте-Карло на базе имеющейся выборки. Позволяет просто и быстро оценивать самые разные статистики (доверительные интервалы, дисперсию, корреляцию и так далее) для сложных моделей.
Применим бутстреп для генерации искусственной Генеральной совокупности из выборки малого объема. Будем условно считать что малая выборка исходит из генеральной совокупности которая подчинена закону нормального распределения. Ниже приводим скрипт который выполнит поставленную задачу.
# превращение малой выборки в ГС с помощью бутстрепа
#install.packages("rcompanion")
# load library rcompanion
library(rcompanion)
# исходные данные
data = c(14.9, 15.7, 18.0, 15.3, 15.9)
# создадим бутстреп выборку из исходных данных
# средних значений Mbts и стандартных отклонений SDbts
Mbts = function(data){
n = length(data)
boot = sample(n, replace=TRUE)
data_boot = mean(data[boot])
return(data_boot)
}
SDbts = function(data){
n = length(data)
boot = sample(n, replace=TRUE)
data_boot = sd(data[boot])
return(data_boot)
}
Rn = 1000
Bmean = mean(as.vector(replicate(Rn, (Mbts(data = data)))))
Bsd = sd(as.vector(replicate(Rn, (SDbts(data = data)))))
# создание модели ГС
GS = rnorm(5000, mean = Bmean, sd = Bsd)
# draw plot using plotNormalHistogram() function
# use colour and size arguments for formatting plot
plotNormalHistogram( GS, prob = FALSE, col="grey60", border="black",
main = "Normal Distribution overlay on Histogram",
length = 10000, linecol="red", lwd=4 )
summary(data)
summary(GS)
> summary(data) Min. 1st Qu. Median Mean 3rd Qu. Max. 14.90 15.30 15.70 15.96 15.90 18.00 > summary(GS) Min. 1st Qu. Median Mean 3rd Qu. Max. 14.13 15.67 15.96 15.96 16.25 17.50 |
