Статистика. Lab1. Ввод и предварительный анализ данных в Statistic

Проверка значения данных.

Заданные условия:

statisticslab1img1

Результат: Ошибок не обнаружено. условия сохранены в файле «Conditions.ini»

3. Функциональные преобразования.

Была создана дополнительная таблица с помощью команды «Замер подмножества/Случайный замер». Затем выполнен переход к переменной ln(РОСТ) и обратно:

statisticslab1img2

Нормировка количественных признаков используется для приведения их к стандартному виду, удобному для обработки. Обычно при расчёте расстояния между объектами нормируют признаки, измеренные в разнородных физический единицах.

В Statistica значения переменных изменяются по формуле:

Новое значение = (Старое значение — Среднее)/Стандартное отклонение

Результат:

statisticslab1img3

  1. Сортировка данных. Команда «Сортировка».

Данные, отсортированные по полу и внутри пола по убыванию роста:

statisticslab1img4

Работа с данными в системе Statistica

NТаблица с переменной СРБАЛЛ:

statisticslab1img5

Предварительный анализ данных. Визуализация данных.

  1. Проекция данных на один признак

Гистограмма Рост:

statisticslab1img6

Гистограмма Вес:

statisticslab1img7

Выводы

Средний рост человека между 176 и 178.

Средний вес человека между 60 и 65.

3. Проекция на плоскость двух признаков – двумерная диаграмма рассеяния.

Рост – вес:

statisticslab1img8

Сомнительные точки 178,62 и 179, 93.

Вес-объем талии:

statisticslab1img9

Сомнительная тачка: 75,71.

  1. проекция на плоскость трех признаков – объемная диаграмма рассеяния.

statisticslab1img10

Генерация случайных чисел в Statistica

Исследование зависимости стандартной ошибки выборочного среднего и выборочной дисперсии от объёма выборки:

statisticslab1img11

Как видно стандартное ошибка среднего в √N=10 раз меньше стандартного отклонения

Гистограммы выборочного среднего и выборочного стандартного отклонения:

statisticslab1img12

Выборочное стандартное отклонение

Исследование влияния объёма выборки на достоверность результатов статистического анализа:

Значение ошибки L при оценивании расположения центра генеральной совокупности, имеющей стандартизованное p-мерное нормальное распределение от объёма выборки N для p=10

Значение ошибки L при оценивании расположения центра генеральной совокупности, имеющей стандартизованное p-мерное нормальное распределение от объёма выборки N для p=150

Значение ошибки L от числа признаков для N=10

Значение ошибки L от числа признаков для N=100

Выводы:

Как видно из графиков при увеличении объёма выборки значение ошибки уменьшается, а при увеличении числа признаков увеличивается.

Файлы Statistica

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *