[МУЗЫКА] [МУЗЫКА]
Уважаемые слушатели!
В прошлых уроках мы рассмотрели параметрические и непараметрические
критерии сравнения двух и более групп и научились реализовывать эти критерии,
проводить подобный анализ в пакете R.
А сейчас на тех же самых примерах мы рассмотрим,
как эти критерии реализованы в пакете SPSS.
Рассмотрим первый пример с показателями пульса.
Напомню, у нас были вот такие данные: проводились
измерения пульса для двух групп — контрольной и экспериментальной.
Замеры проводились до начала лечения и после проведения лечения.
Нужно проверить,
произошли ли статистически значимые отличия в этих группах.
Нам нужно импортировать эти данные в пакет SPSS,
но для начала мы немножко преобразуем исходную таблицу.
Для того чтобы работать с этими данными в разделе сравнения выборок,
мы должны определить их следующим образом.
Эти данные представлены на Листе 2.
Например, если мы хотим сравнить показатели контрольной и экспериментальной
группы, мы можем расположить данные следующим образом: в первом столбце
мы соберем всю информацию о показателях пульса для обеих групп.
И создадим дополнительную переменную, которая будет определять группировку,
то есть, к какой группе относится то или иное наблюдение.
Соответственно, здесь: первое наблюдение у нас относится к контрольной группе,
а вторая часть наблюдений относится к экспериментальной группе.
Вот в таком виде мы сейчас импортируем эти данные.
Напомню, что мы проверяли уже для этих двух выборок гипотезу о нормальности
— они обе удовлетворяют нормальному распределению, соответственно, в данном
случае, мы должны выбрать T-критерий Стьюдента для двух независимых групп.
Для начала импортируем данные в пакет SPSS.
Чтобы нам было удобнее работать дальше и мы могли быстро
импортировать данные из внешнего файла, укажем для начала путь.
Для этого нам нужно зайти в пункт «Правка», «Параметры».
Далее — «Местоположение файлов».
И вот здесь мы укажем путь, откуда будут выбираться наши таблицы.
Сейчас они у меня находятся на диске C, в папке Stat.
Отсюда теперь будут импортироваться данные.
Нажимаем ОК, сохраняем этот путь.
Как видите, у нас сразу появляется журнал с первыми нашими действиями.
Свернем пока журнал и в исходную рабочую таблицу импортируем данные с
показателями пульса.
«Файл» — «Открыть» — «Данные».
Вот видите, наша рабочая папка Stat, которую мы только что установили.
Но здесь сейчас она пустая, потому что в ней не содержится файлов и проектов,
созданных непосредственно в пакете SPSS, нам нужно импортировать таблицу Excel.
Для этого в графе «Тип файла» мы выберем, что нам нужно импортировать Excel файл.
В данной папке хранится сейчас пять файлов — это те примеры,
с которыми мы с вами работали.
И мы выберем из них файл под названием «Пульс»,
который я только что показывала, и нажмем «Открыть».
Обращаю ваше внимание на то, что сейчас вот эти
немного преобразованные данные находятся у нас на Листе 2.
Именно отсюда мы будем их импортировать.
Это нужно указать при импорте файла.
То есть, во-первых, мы указываем, что у нас имеются имена переменных в первой
строке, а во-вторых, мы указываем второй лист.
Нажимаем OK.
И вот у нас появились наши данные в том виде,
как они были только что в Excel таблице.
В первом столбце у нас находятся показатели пульса для обеих групп,
а во второй переменной, собственно, указатель группы.
Посмотрим, что представляют собой эти переменные.
Первая переменная — «Пульс» — у нас числовая,
соответственно, в количественной шкале.
Вторая переменная — «Группа» — у нас текстовая, естественно,
она является переменной номинальной.
Здесь все в порядке.
Давайте теперь применим критерий Стьюдента для того,
чтобы сравнить эти две группы по среднему показателю.
Заходим в раздел «Анализ», «Сравнение средних».
Наши выборки независимы, поэтому нам нужен T-критерий для независимых выборок.
Далее нужно задать переменные.
В первом окне мы должны ввести информацию, содержащую количественную переменную
для обеих групп — это переменная «Пульс», она у нас выбрана, вносим ее сюда.
А во второй переменной должна быть группирующая переменная,
то есть группировать мы будем по контрольной и экспериментальной группе
соответственно, то есть данные выбираем из переменной группы.
Обратите внимание, переменная у нас текстовая,
и здесь она была не совсем корректно записана.
Нам нужно указать, какие конкретно группы у нас в этом случае будут.
T-критерий у нас используется для сравнения двух групп, поэтому,
если мы нажмем вот здесь на кнопку «Задать группы»,
нам необходимо ввести информацию для этих двух групп.
В первом случае у нас будет группа контрольная — это значение,
которое у нас имеется, как раз, во втором столбце.
Вторая группа — это группа экспериментальная,
такие же значения у нас содержатся в этой таблице ниже.
Теперь мы можем продолжить, и, как видите, у нас теперь группировка
будет по этим двум текстовым переменным, можно нажимать OK.
Перед нами открывается журнал с выполненным анализом.
Мы исследовали переменную «Пульс» по двум группам — контрольной и экспериментальной.
Количество наблюдений в контрольной группе у нас 30,
количество наблюдений в экспериментальной группе — 50.
Среднее значение по первой группе — 83,07,
по второй группе — 82,04.
Также имеется информация о среднеквадратичном отклонении,
об ошибке среднего.
И, собственно, вот эти вот средние,
отсутствие их статистически значимых отличий проверяет критерий Стьюдента.
Для корректного применения критерия Стьюдента нам необходимо,
чтобы дисперсии в группах были равны.
Поэтому в начале у нас идет проверка с помощью статистики Фишера о равенстве
дисперсий, и мы видим, что при проверке гипотезы об отсутствии статистически
значимых отличий мы получили значение p-value = 0,752,
что существенно превышает уровень значимости 0,05.
Соответственно, мы можем сделать вывод о том, что дисперсии в данном случае равны,
и применение критерия Стьюдента корректно.
Следовательно, мы можем дальше работать со строкой «Предполагаются равные дисперсии»,
«Значение статистики Стьюдента», «Число степеней
свободы» и «Значение p-value» для проверки гипотезы
об отсутствии статистически значимых отличий, то есть о равенстве средних.
Как мы видим, также значение этой вероятности существенно больше уровня
значимости, то есть, мы получили 0,652, соответственно, нулевая
гипотеза об отсутствии статистически значимых отличий принимается.
Также мы здесь можем видеть значение разности, которое, по сути,
сравнивается с нулем.
95%-ный доверительный интервал накрывает значение ноль,
и также гипотеза об отсутствии значимого отличия в нашем случае принимается.
Отсюда мы можем сделать вывод о том, что до проведения эксперимента
показатели контрольной и экспериментальной группы существенно не отличались.
Теперь проверим, произошли ли статистически значимые отличия в
экспериментальной группе после лечения.
Для этого нам нужно сравнить две группы — это показатели для одних
и тех же пациентов экспериментальной группы, значения пульса «до» и «после».
В данном случае, выборки являются зависимыми, так как, по сути,
являются одними и теми же наблюдениями, только сделанными в разных условиях.
Для проведения подобного анализа данные должны быть представлены
следующим образом: они должны быть собраны по наблюдениям в два столбца, один
столбец соответствует замерам «до», другой столбец соответствует замерам «после».
Вот в таком виде мы сейчас импортируем эти данные в пакет SPSS.
Откроем исходную таблицу данных и импортируем файл.
«Файл» — «Открыть» — «Данные».
У нас по-прежнему наша рабочая папка Stat, где содержится этот файл Excel,
единственное, что нам нужно — задать тип файла.
То есть мы выбираем тип «Таблицы Excel».
Вот появляется наш файл «Пульс».
«Открыть».
Так же читаем имена переменных из первой строки.
Лист выбираем теперь третий.
И импортируем данные.
Посмотрим, что представляют собой импортированные данные.
У нас две числовые переменные в количественной шкале.
Поскольку эти выборки являются зависимыми, нам нужен критерий для зависимых выборок.
Напомню, что показатели для контрольной и экспериментальной группы до
проведения эксперимента подчинялись нормальному закону,
а вот после — гипотеза о нормальности у нас отклонилась.
Соответственно, первая выборка подчиняется нормальному распределению,
а вот вторая — уже нет.
Соответственно, мы не можем применять параметрический критерий, то есть критерий
Стьюдента, а нам нужен непараметрический критерий сравнения двух зависимых выборок.
Это критерий Уилкоксона.
Идем: «Анализ» — «Непараметрические
критерии» — «Устаревшие диалоговые
окна» — «Критерии для двух связанных выборок».
У нас появляется окно, куда мы должны ввести наши переменные.
Итак, это у нас первая переменная и вторая переменная.
Вот он, первый критерий — Уилкоксона, этот критерий уже выбран, сразу нажимаем OK.
При расчете статистики Уилкоксона у нас вычисляются разности,
подсчитываются знаки в положительном и отрицательном направлении.
Данная табличка как раз содержит эту информацию.
Значение статистики приведено вот здесь.
Значение p-value существенно меньше, чем 0,05, соответственно,
гипотеза об отсутствии статистически значимых отличий в данном случае
отклоняется, и мы можем вынести решение о том, что имеются статистически значимые
изменения в показателях «до» и «после» лечения в экспериментальной группе.
[МУЗЫКА]
[МУЗЫКА] [МУЗЫКА]