ЛР анализ малой выборки

Сначала приведу полный скрипт в котором пошагово проведем статистический анализ небольшой выборки. Для начала загрузите с нашего сайта скрипт Rsummary который поместите папку "R myFunction": C:/R myFunction. Сам скрипт на вход принимает вектор данных
и возвращает (округленные) значения большинства описательных статистик

# Rsummary русифицированный скрипт (функция) на вход принимает вектор
# и возвращает (округленные) значения большинства описательных статистик
setwd('C:/R myFunction')
source('Rsummary.R')

data = c(14.9, 15.7, 18.0, 15.3, 15.9)
Rsummary(x = data)
# hist(data,freq = F)
# lines(density(data), lwd=2, col='red')

#создадим бутстреп выборку из исходных данных

bts = function(data){
n = length(data)
boot = sample(n, replace=TRUE)
data_boot = data[boot]
return(data_boot)
}
Rn = 10
Bdata = as.vector(replicate(Rn, (bts(data = data))))
Rsummary(x = Bdata)
Rsummary(x = data)
# создадим генеральную совокупность
Rn = 5000
Gs = rnorm(Rn, mean(Bdata), sd(Bdata))
Rsummary(Gs)
hist(Gs,freq = F)
lines(density(Gs), lwd=2, col='blue')
abline(v = min(data), lwd = 2, col = 'red')
abline(v = max(data), lwd = 2, col = 'red')
grid(col='black',nx = NA,ny = NULL)
#плотность вероятности в пределах границ измеряемой величины
# Случайная величина X имеет нормальное распределение с
# математическим ожиданием Mean и SD
# Найти вероятность попадания
# этой случайной величины на интервал(min(data) и max(data))
# sd = sqrt(D) # σ = sqrt(D)
abs(pnorm(min(data),mean=Mean,sd=SD)-pnorm(max(data),mean=Mean,sd=SD))
# второй способ интеграл
integrate(function(Gs) dnorm(Gs, mean = Mean, sd = SD), min(data), max(data))
# Calculate the confidence interval
result <- t.test(data,conf.level = 0.95)
# Extract the confidence interval
confidence_interval <- result$conf.int
# Print the confidence interval
confidence_interval

> setwd('C:/R myFunction') 
> source('Rsummary.R')
> data = c(14.9, 15.7, 18.0, 15.3, 15.9)
> Rsummary(x = data)
--------------------------------------------------------------------
 N Mean SD Disp R Min Max Me CV Cs As Ex
1 5 15.96 1.2 1.45 3.1 14.9 18 15.7 7.54 3.37 0.8 -1.21

Выполнив первую часть скрипта (до бутстреп анализа данных, что такое бутстреп можно узнать перейдя по этой ссылке) мы получили описательную статистику исходных данных. Далее с помощью алгоритма бутстрепа мы попытаемся создать модель гораздо большей выборки и затем просто сравним описательные статистики исходных данных с бутсреп выборкой.

> bts = function(data){
+ n = length(data) 
+ boot = sample(n, replace=TRUE)
+ data_boot = data[boot]
+ return(data_boot)
+ }
> Rn = 10
> Bdata = as.vector(replicate(Rn, (bts(data = data))))
> Rsummary(x = Bdata)
--------------------------------------------------------------------
 N Mean SD Disp R Min Max Me CV Cs As Ex
1 50 15.79 1.03 1.06 3.1 14.9 18 15.3 6.51 0.92 1.41 0.55
> Rsummary(x = data)
--------------------------------------------------------------------
 N Mean SD Disp R Min Max Me CV Cs As Ex
1 5 15.96 1.2 1.45 3.1 14.9 18 15.7 7.54 3.37 0.8 -1.21

Следующим шагом создается выборка генеральной совокупности и строится ее гистограмма на которой постараемся максимально наглядно показать анализ нашей выборки графическим способом (одним словом выжать из замечательной среды программирования R максимум возможностей)

И наконец рассчитаем доверительный интервал

> confidence_interval
[1] 14.46587 17.45413
attr(,"conf.level")
[1] 0.95

Суббота, 04.04.2026, 19:38	Приветствуем вас Гость \| RSS
Решение задач в среде R
Главная \| ЛР анализ малой выборки \| Регистрация \| Вход