Многофакторный дисперсионный анализ
Многофакторный дисперсионный анализ — метод в математической статистике, который применяется в случае двух и более метрических зависимых переменных и одновременно проверяет групповые различия в отношении нескольких зависимых переменных.
Этот анализ позволяет:
- сравнивать две или несколько выборочных средних;
- одновременно изучать действие нескольких независимых факторов, при этом можно определить как эффект каждого фактора в изменчивости изучаемого признака, так и их взаимодействие;
- правильно планировать научный эксперимент.
Например, если в многофакторном опыте изучают одновременно влияние удобрений и орошения на урожайность какой-либо культуры, то общее варьирование вариантов, вызванное применением этих агротехнических приёмов, раскладывают на варьирование урожайности, происходящее под действием орошения, варьирование урожайности, обусловленное действием удобрений, и варьирование урожайности, обусловленное взаимодействием этих двух факторов.
Подбор двухфакторной модели ANOVA
Общий синтаксис для подбора двухфакторной модели ANOVA в R:
aov(переменная ответа ~predictor_variable1 *predictor_variable2, data = набор данных)
Обратите внимание, что знак * между двумя переменными-предикторами указывает на то, что мы также хотим проверить эффект взаимодействия между двумя переменными-предикторами.
Применение двухфакторного дисперсионного анализа
Воспользуемся встроенными данными npk, иллюстрирующими влияние применения различных удобрений на урожайность гороха (yield). Нашей задачей будет выяснить, существенно ли одновременное применение азота (фактор N) и фосфата (фактор P) повлияет на урожайность гороха. Примените дисперсионный анализ, где будет проверяться влияние фактора применения азота (N), влияние фактора применения фосфата (P) и их взаимодействие. В ответе укажите p-value для взаимодействия факторов N и P. Обратите внимание, что знак * между двумя переменными-предикторами указывает на то, что мы также хотим проверить эффект взаимодействия между двумя переменными-предикторами.
fit <- aov(yield ~ N * P, data=npk)
summary(fit)
cat("Оценка влияния фактора взаимодействия Pr(>F):",
summary(fit)[[1]]["N:P", "Pr(>F)"])
|
Видим что влияние азота 0.0263 наиболее эффективно влияет на урожайность гороха (yield). Так же проведя ДА мы выяснили что одновременное применение азота (фактор N) и фосфата (фактор P) эффективно не влияет на урожайность гороха N:P Pr(>F): 0.4304878
Трехфакторный дисперсионный анализ
Теперь проведите трехфакторный дисперсионный анализ, где зависимая переменная - это урожайность (yield), а три фактора - типы удобрений (N, P, K). После проведения данного анализа вы получите три значения p - уровня значимости (о значимости каждого из факторов).
Соотнесите названия факторов и значения p - уровня значимости.
fit1 <- aov(yield ~ N + P +K, data=npk)
summary(fit1)
|
