[МУЗЫКА] [МУЗЫКА] [МУЗЫКА] Сейчас мы рассмотрим с вами несколько таблиц и диаграмм, которые наиболее часто применяются для анализа метрических переменных. Напомню вам, что метрические переменные — это переменные, измеренные в абсолютных и интервальных шкалах. Структура таблиц исходных данных для этих переменных аналогична структуре таблиц исходных данных для переменных номинальных, которые мы рассмотрели ранее. При попытке построения частотных таблиц для метрических переменных мы иногда можем сталкиваться с трудностями. Такую трудность вы можете видеть сейчас на экране. Как видите, из-за малого объема выборки и из-за небольшой вариативности признака у нас каждый элемент нашей выборки встречается всего лишь один раз. В этом случае таблица частот для метрической переменной теряет свою важность. Однако встречаются случаи, когда нам очень важно применять таблицу частот для метрической переменной. Например, в ситуации, когда мы с вами ищем или обнаруживаем выбросы, то есть нетипичные значения переменной. Сейчас на экране вы можете видеть таблицу, в которой представлено очень большое значение нашей выборки. Оно является нетипичным. И за счет таблицы частот метрической переменной мы с вами можем обнаружить это единственное значение, которое является выбросом по нашей переменной. Если вернуться к таблице частот нашей метрической переменной, можем с вами попробовать осуществить процедуру оптимизации этой таблицы, то есть преобразование исходной таблицы частот метрической переменной в специальную таблицу интервалов. За счет создания этих интервалов мы можем сократить большой объем возможных вариантов измерений метрической переменной и тем самым оптимизировать и интерпретировать лучше те распределения, которые у нас имеются. Рассмотрим основные правила создания таблиц интервалов и выделения интервалов метрической переменной. Правило первое — число интервалов должно быть оптимальным. Оптимальное число интервалов мы можем с вами выделить с помощью специальных способов. Один из таких вариантов можете видеть сейчас на экране. Он представлен в виде формулы, в которой N является объемом нашей выборки, то есть числом всех измерений по выборке, а k является оптимальным числом наших интервалов. Можно строго не придерживаться правила создания интервалов. Вы можете выделять больше интервалов, можете выделять меньше интервалов. Стоит только помнить о том, что увеличение или уменьшение числа интервалов будет сказываться либо на оценке информативности вашего распределения, либо на оценке точности вашего распределения, то есть может сильно страдать оценочная ценность той таблицы интервалов, которую вы создаете. Второе правило — нужно обязательно помнить, что разделение на интервалы достаточно условно, то есть те интервалы, которые вы получаете в итоге, являются по сути своей схематичным отображением непрерывного распределения метрической переменной. Они связаны друг с другом и переходят один в другой. Каждый предыдущий интервал является предшественником последующего интервала. Они все связаны. И это нужно обязательно учитывать при интерпретации. В этом отношении гистограмма, которая строится на основании таблицы интервалов метрической переменной, довольно сильно отличается от столбиковой диаграммы частот, которую мы рассмотрели ранее, когда описывали номинальные переменные. Наконец, третье правило. Оно достаточно очевидное, но иногда его невнимательно используют. Нужно обращать внимание на то, что площадь при построении гистограммы того столбца, который у вас имеется для каждого интервала, должна соответствовать абсолютно точно сумме частот тех переменных, тех элементов, тех конкретных измерений, которые включены в ваш интервал по результатам отбора конкретных результатов измерений вашей метрической переменной. По итогам проведенных расчетов, после того как вы создали подобного рода таблицу интервалов, по ней достаточно просто можно создать гистограмму, то есть специальная диаграмма, описывающая распределение непрерывной метрической переменной. Гистограмма очень удобна в использовании. Она позволяет нам предпринимать некоторый первичный анализ нашего распределения и выдвигать варианты дальнейшего анализа. Гистограмма оптимальным образом описывает все наше распределение метрической переменной. Кроме того, в некоторых случаях гистограмма позволяет оценивать выбросы, то есть нетипичные случаи для нашего распределения метрической переменной.