0:00
[МУЗЫКА]
[МУЗЫКА] Здравствуйте,
дорогие друзья.
Мы продолжаем наши занятия по практике по курсу «Математические методы психологии.
Основы применения».
Сейчас мы с вами рассмотрим несколько вариантов расчётов,
измерений, которые были произведены в номинальных шкалах.
Один из самых распространённых критериев,
которые применяются в данном случае, это критерий хи-квадрат Пирсона.
Критерий достаточно универсален, подходит для большинства
решаемых задач для анализа шкал номинальных,
но не является абсолютно единственным.
Мы посмотрим также и несколько других критериев по ходу наших расчётов.
Итак, основные задачи, которые решаются с применением хи-квадрат Пирсона,
вы можете видеть на экране.
Это задачи анализа классификации, то есть ситуации, когда у нас
присутствует лишь одна номинальная переменная, и мы с вами сопоставляем форму
распределения этой номинальной переменной с некоторой теоретической моделью.
Ситуация вторая — это анализ таблиц сопряженности,
когда мы сопоставляем друг с другом две номинальные переменные, два измерения,
осуществленных в номинальных шкалах, выясняя, насколько связаны эти переменные
друг с другом, насколько сильно их взаимодействие.
Сейчас на экране можете видеть расчётную формулу χ²-Пирсона, это общий вид формулы.
Самое главное, что в этой формуле нас должно интересовать.
Во-первых, это обозначение буквами f-эмпирическое
и f-теоретическое, это частоты, которые мы подсчитываем по выборке.
Эмпирические частоты, то есть результаты измерений, и теоретические частоты,
то есть некая модель, с которой мы будем сравнивать наши эмпирические частоты.
Суть этого критерия заключается в том,
что мы сопоставляем именно эти две группы частот: эмпирические и теоретические.
Чем существеннее разница между ними, тем достовернее мы будем получать
результаты подтверждения альтернативной гипотезы о наличии некой закономерности.
Чем меньше будет разница между теоретическими и эмпирическими частотами,
тем вероятнее мы будем с вами подтверждать гипотезу нулевую об
отсутствии каких-либо связей, различий или взаимодействий переменных.
Кроме того, обратите внимание на специфичность
подсчета числа степеней свободы.
В данном случае k и m — это число градаций наших переменных,
которые участвуют в анализе.
Если у нас две переменных, то, соответственно,
число градаций первой переменной обозначается одной буквой, k, например.
Число градаций другой переменной обозначается другой буквой, m.
Чуть позже мы посмотрим, как это рассчитывается на практике.
Нам обязательно нужно поговорить о нескольких ограничениях на
использование χ²-Пирсона.
Обратите внимание на экран, они перечислены.
Прежде всего, нам нужно следовать тому ограничению,
которое присутствует на объем выборки.
χ²-Пирсона достаточно чувствителен к объему выборки.
Чем больше вы сможете измерить случаев, тем лучше для расчета χ²-Пирсона.
На маленьких выборках численностью меньше 30 случаев его применять не рекомендуется.
Ограничение второе, связанное с процедурой расчётов.
Арифметически будут возникать большие ошибки, если наши теоретические
частоты для каждой градации будут величиной меньше пяти,
то есть мы стараемся добиваться такой численности нашей выборки,
чтобы при подсчете теоретических частот для нашего распределения,
для каждой градации номинальной переменной, это число было пять и более.
Чем больше, тем лучше.
Наконец, еще одно ограничение, которое встречается довольно-таки часто.
Распространяется оно на специфические случаи анализа номинальных переменных,
когда у нас номинальные переменные классифицируют наших испытуемых или наши
случаи всего на две градации, на две группы.
Как правило, это встречается не так уж и редко, и в этих случаях
применяется специальная модифицированная формула с поправкой на непрерывность.
Обратите внимание, эта формула представлена на экране.
Итак, рассмотрим первый вариант расчётов.
Это анализ классификации по номинальной переменной с числом градации больше двух.
При этом обязательно нужно учитывать,
что для этого вида расчетов нам нужна одна номинальная эмпирическая переменная.
Задачи, которые применяются, которые рассматриваются при применении данного
критерия, вы можете видеть на экране.
Обратите внимание на изменение расчетной формулы,
которая применяется в текущей ситуации.
Она практически идентична формуле общего вида,
за исключением варианта расчета числа степеней свободы.
Обратите внимание, что у нас сопоставляются только два распределения,
соответственно, формула расчета числа степеней свободы упрощается.
Нам необходимо знать лишь число градаций нашей одной номинальной переменной.
Давайте рассмотрим пример расчета подобного рода задачек.
Сам пример вы можете видеть на экране, я зачитаю его для вас.
Исследователи предложили группе испытуемых решить сложную математическую задачу,
фиксируя специальность тех, кому это удалось сделать.
Всего в исследовании приняло участие 80 человек.
Исследователи предполагали, что инженерам удастся решить задачи в два раза чаще,
чем социологам или психологам или врачам, а представители
остальных специальностей будут решать задачи примерно одинаково часто.
Необходимо проверить гипотезу об отличии эмпирического
распределения частот от представленной исследовательской модели.
При этом нам также известно, что уровень ошибки альфа зафиксирован в виде 0,05.
Первое, что нам необходимо сделать в наших расчетах,
это преобразовать таблицу исходных данных в таблицу частот.
Мы будем производить расчёты вручную, поэтому это сделать нужно обязательно.
При расчетах с помощью специализированных компьютерных
программ эти компьютерные программы рассчитывают и строят таблицы частот
самостоятельно в автоматическом режиме.
На втором этапе мы формулируем статистические гипотезы,
нулевую и альтернативную.
Результат подобного рода формулировок вы видите сейчас на экране.
Наконец, на третьем этапе мы приступаем к расчету теоретических частот.
Если помните, они нам необходимы для применения формулы χ²-Пирсона.
При этом обязательно нам нужно учитывать три важных правила.
Правило первое: суммы эмпирических и теоретических частот равны,
это обязательное условие для сопоставления этих самых частот.
Второе правило мы уже озвучивали: это количество частот для каждой градаций
номинальной переменной должно быть пять и более.
Наконец, нужно помнить о том, что теоретические частоты,
которые мы с вами выстраиваем, строятся на основании теоретической модели,
которая указана либо в задаче, либо в модели,
которую вы указываете в своём собственном исследовании.
Итак, первый шаг расчёта теоретических частот — это расшифровка нашей модели.
Обратите внимание на экран,
там произведена запись в виде элементов будущего линейного уравнения.
На втором шаге расчета теоретических частот мы высчитываем доли в
соответствии с указанной выше теоретической моделью.
Наконец, на третьем шаге мы рассчитываем теоретические частоты с учетом тех долей,
которые мы только что посчитали, по моделям и сумм частот.
Итак, нам известны эмпирические частоты,
мы рассчитали теоретические частоты, можно приступать к расчёту критерия χ²-Пирсона.
На экране представлена таблица с последовательными действиями
при расчётах вручную χ²-Пирсона.
Обратите внимание, чему равен у нас в нашем примере χ².
Также мы можем посчитать и число степеней свободы.
В нашем случае число градаций номинальной переменной равно четырём.
У нас всего четыре группы специалистов,
соответственно число степеней свободы 4 − 1 не случайный элемент.
Число степеней свободы равно трём.
Нам известно значение эпического критерия χ²-Пирсона, и мы можем приступить
к пятому этапу, а именно: определение уровня значимости этого критерия.
Для этого точно так же, как и в предыдущих наших задачах, мы будем сопоставлять
значение эмпирического критерия с критическими точками.
На экране вы видите таблицу с критическими точками,
где в строках мы находим число степеней свободы по нашей выборке,
в столбцах мы находим p-уровень значимости в виде критических точек.
Соответственно, на пересечении столбцов и строки,
соответствующих нашему распределению, мы видим критические значения χ²-Пирсона.
Нам необходимо сопоставить значение нашего эмпирического критерия с критическими.
В итоге мы видим, что значение нашего эмпирического критерия
χ²-Пирсона не превышает критические точки.
Это означает, что p-уровень значимости нашего критерия, к сожалению,
оказывается больше, чем установленное нами пороговое значение ошибки α = 0,05.
И, соответственно, мы будем вынуждены принять нулевую гипотезу о том,
что достоверных различий мы не обнаружили.
Переходим к выводам.
Сейчас на экране вы можете видеть краткий вывод, вы можете видеть полный
содержательный вывод, который включает в себя и краткий вывод в том числе,
описывающий непосредственно вывод о том, что мы не обнаружили достоверных
различий между формой нашего распределения и теоретической моделью.
То есть по сути своей то, что мы хотели с вами обнаружить,
равенство нашего распределения модели, то мы и увидели, и можем с вами видеть
частотную диаграмму, которая позволяет судить о том,
грамотно или не очень грамотно мы произвели наши измерения,
или визуализировать результаты наших расчетов.