Проверка значения данных.
Заданные условия:
Результат: Ошибок не обнаружено. условия сохранены в файле «Conditions.ini»
3. Функциональные преобразования.
Была создана дополнительная таблица с помощью команды «Замер подмножества/Случайный замер». Затем выполнен переход к переменной ln(РОСТ) и обратно:
Нормировка количественных признаков используется для приведения их к стандартному виду, удобному для обработки. Обычно при расчёте расстояния между объектами нормируют признаки, измеренные в разнородных физический единицах.
В Statistica значения переменных изменяются по формуле:
Новое значение = (Старое значение — Среднее)/Стандартное отклонение
Результат:
- Сортировка данных. Команда «Сортировка».
Данные, отсортированные по полу и внутри пола по убыванию роста:
Работа с данными в системе Statistica
NТаблица с переменной СРБАЛЛ:
Предварительный анализ данных. Визуализация данных.
- Проекция данных на один признак
Гистограмма Рост:
Гистограмма Вес:
Выводы
Средний рост человека между 176 и 178.
Средний вес человека между 60 и 65.
3. Проекция на плоскость двух признаков – двумерная диаграмма рассеяния.
Рост – вес:
Сомнительные точки 178,62 и 179, 93.
Вес-объем талии:
Сомнительная тачка: 75,71.
- проекция на плоскость трех признаков – объемная диаграмма рассеяния.
Генерация случайных чисел в Statistica
Исследование зависимости стандартной ошибки выборочного среднего и выборочной дисперсии от объёма выборки:
Как видно стандартное ошибка среднего в √N=10 раз меньше стандартного отклонения
Гистограммы выборочного среднего и выборочного стандартного отклонения:
Исследование влияния объёма выборки на достоверность результатов статистического анализа:
Выводы:
Как видно из графиков при увеличении объёма выборки значение ошибки уменьшается, а при увеличении числа признаков увеличивается.