Частотные таблицы

6.1 Частотные таблицы

Сначала загрузите файл Studium.sav, выбрав команды меню File (Файл) Open... (Открыть...) Появится диалог Open File (Открыть файл).

Выберите указанный выше файл Studium.sav и подтвердите выбор кнопкой Open (Открыть). Файл появится в Редакторе данных.

Выберите в меню команды Analyze (Анализ) Descriptive Statistics (Дескриптивные статистики) Frequencies (Частоты) Появится диалоговое окно Frequencies (см. рис. 6.1).

Кнопкой с треугольником перенесите переменную psyche в список выходных переменных и подтвердите операцию кнопкой ОК.

Вывод статистических характеристик

6.2 Вывод статистических характеристик

Чтобы получить описательную статистику числовых переменных, можно щелкнуть в диалоге Frequencies на кнопке Statistics... (Статистика). Откроется диалоговое окно Frequencies: Statistics (Частоты: Статистика).

В группе Percentile Values (Значения процентилей) можно выбрать следующие варианты:

Quartiks (Квартили): Будут показаны первый, второй и третий квартили. Первый квартиль (Q,) — это точка на шкале измеренных значений, ниже (левее) которой располагаются 25 % измеренных значений. Второй квартиль (Q2) — это точка, ниже которой располагаются 50 % измеренных значений. Второй квартиль также называется медианой. Третий квартиль (Q3) — это точка на шкале измеренных значений, ниже которой располагаются 75 % значений. Если данные имеются только в форме порядкового отношения, то качестве меры разброса используется межквартильная широта. Она определяется как

Медиана для концентрированных данных

Для данных, имеющих форму частотной таблицы, определение медианы и остальных процентилей обычным методом будет слишком неточным. В таких случаях есть возможность вычислить медиану и любые другие процентили более точным методом. Мы поясним это на примере стоматологических данных.

Загрузите файл cpitn.sav, содержащий результаты стоматологического исследования.

Кроме переменных schule и mhfreq, которые определяют уровень образования и то, сколько раз в день обследуемый чистит зубы, этот файл содержит шесть переменных cpitnl—cpitn6, которые указывают степень пародонтального заболевания каждой из шести частей челюсти — так называемый параметр CPITN, задаваемый с помощью следующей кодировочной таблицы:

С помощью команд меню Analyze (Анализ) Descriptive Statistics (Дескриптивные статистики) Frequencies (Частоты) создайте частотную таблицу, к примеру, для переменной cpitnl. Если задать вычисление среднего значения и медианы, мы получим следующий результат:

При определении медианы обычным методом ее значение равно 2. Это значение, хотя формально и правильное, но дает совершенно неудовлетворительный, недостаточно значимый результат. В данном случае, когда данные являются концентрированным, для уточнения медианы применяется следующая расчетная формула:

Следовательно, решающее значение имеет правильный выбор границ классов; их следует выбирать так, чтобы значения кодовых чисел соответствовали середине каждого класса. В данном примере для границ классов следует выбрать значения

m = 3 (так как медиана находится в третьем классе)

Если сравнить это значение со средним значением (2,24), то можно установить следующее правило — оказывается, что при распределении со сдвигом вправо (как в данном случае) медиана больше среднего значения.

Описанный точный метод вычисления медианы будет использован в SPSS, если в диалоге Frequencies: Statistics установить флажок Values are group midpoints.

В этом случае мы получим точное значение медианы (2,32).

По определению, медиана — это значение, выше и ниже (правее и левее) которого расположено по 50 % всех значений, если они упорядочены по величине. Обобщая эту характеристику, мы приходим к определению так называемых процентилей. Эти характеристики позволяют, например, указать значение, ниже которого лежит 10 % всех значений (а выше расположено 90 % значений). Чаше всего применяются процентили 25 % и 75 %, называемые также соответственно первым и третьим квартилями.

В диалоге Frequencies: Statistics можно последовательно задать любые значения процентилей. Если данные концентрированы, снова следует установить флажок Values are group midpoints.

Формула вычисления процентиля для любого значения:

Для процентиля 50 % (Р = 50) после некоторых преобразований получается формула для медианы, приведенная выше.

В столбчатых, линейных, круговых диаграммах и диаграммах с областями, на которых предусмотрено отображение медианы и других процентилей, при наличии концентрированных данных используется модифицированный способ расчета (см. раздел 22.1.1).

Форматы частотных таблиц

Сейчас мы попробуем вывести частотную таблицу переменной fach, отсортированную по убыванию частоты. Поступите следующим образом:

Выберите в меню команды Analyze (Анализ) Descriptive Statistics (Дескриптивные статистики) Frequencies... (Частоты)

Перенесите переменную fach (специальность) в список выходных переменных.

Щелкните на кнопке Format.... Откроется диалоговое окно Frequencies: Format (Частоты: Формат).

Графическое представление

Результаты частотного распределения можно представить графически. Для примера мы создадим столбчатую диаграмму для частотного распределения основных специальностей. Поступите следующим образом:

Выберите в меню команды Analyze (Анализ) Descriptive Statistics (Дескриптивные статистики) Frequencies (Частоты)

Перенесите переменную fach в список выходных переменных.

Щелкните на кнопке Charts... (Диаграммы). Откроется диалоговое окно Frequencies: Charts (Частоты: Диаграммы).

Выберите в группе Chart Type (Тип диаграммы) пункт Bar charts (Столбчатая диаграмма), а в группе Chart Values (Значения диаграммы) — пункт Percentages (Проценты). Подтвердите выбор кнопкой Continue (Продолжить). Вы вернетесь в диалог Frequencies.

В диалоговом окне Frequencies снимите флажок Display frequency tables (Показывать частотные таблицы). — Щелкните на кнопке ОК. Диаграмма будет показана в окне просмотра (см. рис. 6.5).

Частотный анализ

Первым этапом статистического анализа данных, как правило, является частотный анализ. В этой главе мы проведем частотный анализ на примере файла Studium.sav. Этот файл находится на компакт-диске примеров или в рабочем каталоге \SPSSBOOK. Он содержит результаты опроса студентов об их психическом состоянии и социальном положении. Опрос касался таких предметов, как социальное положение, психическая ситуация и успеваемость. Кроме того, затрагивались такие данные, как изучаемый предмет, пол, возраст и национальность.

Диалоговое окно Fill Patterns

Столбцы будут заполнены выбраннои заливкой.

0	Здоровый пародонт
1	Кровоточивость
2	Зубные отложения
3	Глубина десенных карманов 3,5-5,5 мм
4	Глубина десенных карманов 6 мм и более

CPITN1
N	Допустимые	2548
	Утерянные	0
Среднее значение		2,24
Медиана		2,00

	Частота	Проценты	допустимые проценты	накопленные проценты
Допустимые здоровый	109	4,3	4,3	4,3
кровоточивость	389	15,3	15,3	19,5
отложения	921	36,1	36,1	55,7
глубина карманов	1042	40,9	40,9	96,6
3,5-5,5 глубина карманов >=6	87	3,4	3,4	100,0
Всего	2548	100,0	100,0

n	Количество измеренных значений
m	Класс, в котором находится медиана
u	Нижняя граница класса m
fm	Абсолютная частота в классе m
Fm-1	Накопленная частота вплоть до предыдущего класса m — 1
B	Ширина класса

n	Класс, в котором находится процентиль
m	Нижняя граница класса т
P	Процентное значение процентиля
Нm	Процентная частота в классе m-1
Hm-1	Процентная накопленная частота в классе m-1
b	Ширина класса

Частотные таблицы

Вывод статистических характеристик

Медиана для концентрированных данных

Форматы частотных таблиц

Графическое представление

Частотный анализ

Диалоговое окно Fill Patterns

Диалоговое окно Frequencies: Charts

Диалоговое окно Frequencies (Частоты)

Диалоговое окно Frequencies: Format

Диалоговое окно frequencies: Statistics

Диалоговое окно Tirles

Гистограмма

Частотный анализ

Отредактированная диаграмма

Столбчатая диаграмма в средстве просмотра

		Частота	Проценты	Допус- тимые проценты	Нако- пленные проценты
	Крайне неустой- чивое	20	18,5	18,7	18,7
	Неустой- чивое	40	37,0	37,4	56,1
Допус- тимые	Устойчивое	41	38,0	38,3	94,4
	Очень устойчивое	6	5,6	5,6	100,0
	Всего	107	99,1	100,0
Отсут-ствующие	нет данных	1	,9
Всего		108	100,0

Alter
N	Допустимые	106
	Утерянные	2
Среднее значение		22,24
Стандартная ошибка среднего значения		21
Медиана		22,00
Мода		21
Стандартное отклонение		2,19
Дисперсия		4,79
Асимметрия		,859
Стандартная ошибка асимметрии		,235

Эксцесс		1,042
Стандартная ошибка эксцесса		,465

Размах		11
Минимум		18
Максимум		29
Процентили	25	21,00
	50	22,00
	75	23,00

		Частота	Проценты	Допустимые проценты	Накоплен- ные проценты
Допус-тимые	Гуманитар- ные науки	25	23,1	23,1	23,1
	Юриспру- денция	22	20,4	20,4	43,5
	Экономика	19	17,6	17,6	61,1
	Психология	11	10,2	10,2	71,3
	Медицина	10	9,3	9,3	80,6
	Теология	9	8,3	8,3	88,9
	Естествен- ные науки	9	8,3	8,3	97,2
	Техника	2	1,9	1,9	99,1
	Прочие	1	,9	,9	100,0
	Всего	108	100,0	100,0