0:00
[МУЗЫКА]
[МУЗЫКА] [МУЗЫКА] Особым случаем
анализа таблиц сопряженности является изучение связи двух бинарных переменных.
В этом случае описательной моделью является таблица сопряженности 2 x 2,
то есть содержащая 4 клеточки.
Рассмотрим пример.
Предположим, для изучения влияния двух условий запоминания 100 испытуемых были
случайным образом разделены на две группы — по 50 человек для каждого из условий
запоминания.
После обучения количество усвоивших этот материал в первой группе составило
24 человека, а во второй — 34 человека.
Можно ли утверждать,
что различия в условиях влияют на результативность обучения?
Как видим, в данных имеются две номинальные переменные.
Одна переменная — условие, другая переменная — усвоение материала.
Для каждого из испытуемых имеются два значения, таким образом, — в каком условии
он проходил обучение и усвоил материал или не усвоил.
Результаты представлены в таблице сопряженности.
Как видите, в условии 2 доля усвоивших материал выше, чем для условия 1.
Но вопрос, как обычно, стоит иначе.
Является ли это различие статистически достоверным?
В этом случае тоже используется критерий хи-квадрат,
но обязательно с поправкой на непрерывность.
Поправка на непрерывность такая же,
как для критерия хи-квадрат для бинарной переменной.
Ограничение.
Объем выборки должен быть не менее 20,
а численность каждой ячейки должна быть не менее 5.
Точно так же, как и для таблицы сопряженности большей размерности,
для каждой ячейки необходимо рассчитать теоретическую частоту.
Собственно говоря, таким же образом, как мы с вами рассматривали,
для таблиц большей размерности.
Надо отметить, что хи-квадрат с поправкой на
непрерывность несколько завышает вероятность ошибки второго рода.
И поэтому более адекватным для таблиц 2 x 2 будет применение точного
критерия Фишера.
Рассмотрим следующий пример.
Проверялась гипотеза о влиянии природы родства на преступность близнеца.
Данные относятся к 30 преступникам мужского пола,
каждый из которых имел брата-близнеца.
30 человек были классифицированы, во-первых,
по природе родства — однояйцевые или разнояйцевые близнецы,
и, во-вторых, — по виновности или невиновности брата-близнеца.
На экране представлена таблица сопряженности для
результатов этого исследования.
Как видите, в таблице содержатся эмпирические значения частот,
теоретически рассчитанные значения частот,
и произведен расчет эмпирического значения критерия хи-квадрат.
Значение критерия хи-квадрат эмпирического значения составило 10,46,
что для числа степеней свободы 1
меньше критического значения для α = 0,01.
Таким образом, мы делаем вывод о том,
что p-уровень значимости меньше 0,01, то есть получен статистически
достоверный результат по высокому уровню статистической значимости.
Сейчас на экране вы видите результат анализа таблицы 2 x 2,
той же самой, в программе SPSS.
[БЕЗ_ЗВУКА] Основным результатом
является таблица «Критерии хи-квадрат», где представлен хи-квадрат Пирсона, далее,
критерий хи-квадрат Пирсона с поправкой на непрерывность и точный критерий Фишера.
Как уже было сказано,
хи-квадрат Пирсона в обычном его виде для таблиц 2 x 2 непригоден.
Необходимо принимать во внимание хи-квадрат с поправкой на непрерывность,
то есть вторую строчку.
Но более точным, более корректным будет применение точного критерия Фишера.
Как уже говорилось, хи-квадрат с поправкой на непрерывность несколько преувеличивает
вероятность ошибки второго рода, то есть является менее чувствительным.
В отличие от него, точный критерий Фишера дает точную значимость и
является более чувствительным критерием для таблиц сопряженности 2 x 2.
Точный критерий Фишера может быть использован при помощи статистического
калькулятора.
На экране вы видите результат применения статистического калькулятора для
расчета точного критерия Фишера.
Задается значение частот для строки Row1.
Задается также значение частот для строки Row2.
И необходимо обращать внимание на строку,
которая называется two sided p-values.
В данном случае для данного соотношения частот p-уровень значимости меньше 0,001.
Отдельным случаем является также таблица 2 x 2,
но для повторных измерений бинарной переменной в том случае,
когда бинарная переменная измерена дважды на одной и той же выборке.
В этом случае критерий хи-квадрат, который мы с вами рассматривали, неприменим.
Рассмотрим пример.
Исследовалось влияние телепередачи о террористических актах
на поддержку зрителями снятия моратория на смертную казнь.
Число респондентов составило 60 человек.
Подсчитывалось число тех, кто за и тех, кто против смертной казни,
до и после телепередачи.
Таким образом, одна переменная — до передачи «за-против»,
другая переменная — после передачи «за-против».
В данном случае, как вы видите из таблицы сопряженности,
интерес представляет изменение мнения — сопоставление тех,
кто до передачи был за, а после передачи — против, ячейка c, с теми,
кто после передачи был против, а после передачи — за, ячейка b.
В этом случае применяют критерий Мак-Немара.
Он тоже очень прост.
Как видите формулу на экране, подсчитывается z-значение,
в числителе — разность частот,
а в знаменателе — корень квадратный из суммы этих же частот.
В данном случае z-критерий равен 2,67.
По таблицам нормальных вероятностей можем определить площадь под
кривой нормального распределения, находящуюся правее этого значения.
Эта площадь составляет 0,004.
Но, поскольку у нас критерий, как обычно, двусторонний,
это значение необходимо умножить на 2.
И, таким образом, мы получаем p-уровень значимости 0,008,
то есть результат статистически достоверен.
Мы можем, таким образом, утверждать,
что после террористического акта число сторонников смертной
казни увеличилось.