Статистика. Lab3. Регрессионный анализ

Исследование статической зависимости Вес-Рост

Постановка задачи

В первой лабораторной работе были собраны статистические данные измерения веса и роста студентов соответствующих групп. Результаты измерений должные быть сведены в одну общую таблицу. Найти уравнение регрессии, описывающей вес студента в зависимости от его роста. Статистические выводы обосновать.

Таблица с исходными данными

statisticslab3img1

Оценка корректности условий проведения регрессионного анализа

Корректность выводов при регрессионном анализе обеспечивается при выполнении следующих условий:

  1. Результаты наблюдений y1, y2…являются независимыми, нормально распределенными случайными величинами.
  2. Ошибки измерения независимых переменных x1, x2… пренебрежительно малы по сравнению с ошибкой определения y
  3. Переменные x1, x2… — линейно-независимые переменные

Statistica Scatterplot

Предполагаемая модель линейная.

Проведение регрессионного анализа

Statistica составная регрессия

Здесь коэффициент детерминизации RI=0,9148. Значит построенная регрессия объясняет 91% разброса значений Вес относительно среднего.

F-критерий и его уровень значимости p. F-критерий используется для проверки значимости регрессии. В данном случае для проверки гипотезы, утверждающей, что между зависимой переменной Вес и независимой переменной Рост нет линейной зависимости, т. е. b1=0, против альтернативы b1 не равен 0. В данном примере большое значение F критерия 193.2762 и даваемый в окне уровень значимости p=0.00000 показывают, что построенная регрессия достаточно значима.

Точечные оценки параметров модели:

b0=-140.443

b1=1,205

Statistica regression summary

Значит искомая модель зависимости Веса от Роста имеет вид:

Вес=1,205*Рост-140,443

statisticslab3img5

Оценка адекватности модели. Исследование остатков

Statistica оценка адекватности модели. Исследование остатков

Рассмотрим график остатков на нормальной вероятностной бумаге:

График остатков на нормальной вероятностной бумаге

Остатки достаточно хорошо ложатся на прямую которая соответствует нормальному закону. Поэтому предположение о нормальном распределении ошибок выполнено.

Теперь посмотрим зависимость остатков от наблюдаемых и от предсказанных значений. Поскольку остатки хаотично разбросаны относительно прямой, в их поведении нет закономерностей. Это значит, что модель достаточно адекватно описывает данные.

Predicted vs Residual Scores

Observed values vs Residuals

Скачать архив с файлами Statistica для лабораторной работы №3

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *