Математическая статистика для психологов 1 курс. Основы математической статистики для психологов

Слово «статистика» часто ассоциируется со словом «математика», и это пугает студентов, связывающих это понятие со сложными формулами, требующими высокого уровня абстрагирования.

Однако, как говорит Мак-Коннелл, статистика - это прежде всего способ мышления, и для ее применения нужно лишь иметь немного здравого смысла и знать основы математики. В нашей повседневной жизни мы, сами о том не догадываясь, постоянно занимаемся статистикой. Хотим ли мы спланировать бюджет, рассчитать потребление бензина автомашиной, оценить усилия, которые потребуются для усвоения какого-то курса, с учетом полученных до сих пор отметок, предусмотреть вероятность хорошей и плохой погоды по метеорологической сводке или вообще оценить, как повлияет то или иное событие на наше личное или совместное будущее, — нам постоянно приходится отбирать, классифицировать и упорядочивать информацию, связывать ее с другими данными так, чтобы можно было сделать выводы, позволяющие принять верное решение.

Все эти виды деятельности мало отличаются от тех операций, которые лежат в основе научного исследования и состоят в синтезе данных, полученных на различных группах объектов в том или ином эксперименте, в их сравнении с целью выяснить черты различия между ними, в их сопоставлении с целью выявить показатели, изменяющиеся в одном направлении, и, наконец, в предсказании определенных фактов на основании тех выводов, к которым приводят полученные результаты. Именно в этом заключается цель статистики в науках вообще, особенно в гуманитарных. В последних нет ничего абсолютно достоверного, и без статистики выводы в большинстве случаев были бы чисто интуитивными и не могли бы составлять солидную основу для интерпретации данных, полученных в других исследованиях.

Для того чтобы оценить огромные преимущества, которые может дать статистика, мы попробуем проследить за ходом расшифровки и обработки данных, полученных в эксперименте. Тем самым, исходя из конкретных результатов и тех вопросов, которые они ставят перед исследователем, мы сможем разобраться в различных методиках и несложных способах их применения. Однако, перед тем как приступить к этой работе, нам будет полезно рассмотреть в самых общих чертах три главных раздела статистики.

1. Описательная статистика , как следует из названия, позволяет описывать, подытоживать и воспроизводить в виде таблиц или графиков

данные того или иного распределения , вычислять среднее для данного распределения и его размах и дисперсию .

2. Задача индуктивной статистики - проверка того, можно ли распространить результаты, полученные на данной выборке , на всю популяцию , из которой взята эта выборка. Иными словами, правила этого раздела статистики позволяют выяснить, до какой степени можно путем индукции обобщить на большее число объектов ту или иную закономерность, обнаруженную при изучении их ограниченной группы в ходе какого-либо наблюдения или эксперимента. Таким образом, при помощи индуктивной статистики делают какие-то выводы и обобщения, исходя из данных, полученных при изучении выборки.

3. Наконец, измерение корреляции позволяет узнать, насколько связаны между собой две переменные, с тем чтобы можно было предсказывать возможные значения одной из них, если мы знаем другую.

Существуют две разновидности статистических методов или тестов, позволяющих делать обобщение или вычислять степень корреляции. Первая разновидность - это наиболее широко применяемые параметрические методы , в которых используются такие параметры, как среднее значение или дисперсия данных. Вторая разновидность - это непараметрические методы , оказывающие неоценимую услугу в том случае, когда исследователь имеет дело с очень малыми выборками или с качественными данными; эти методы очень просты с точки зрения как расчетов, так и применения. Когда мы познакомимся с различными способами описания данных и перейдем к их статистическому анализу, мы рассмотрим обе эти разновидности.

Как уже говорилось, для того чтобы попытаться разобраться в этих различных областях статистики, мы попробуем ответить на те вопросы, которые возникают в связи с результатами того или иного исследования. В качестве примера мы возьмем один эксперимент, а именно - изучение влияния потребления марихуаны на глазодвигательную координацию и на время реакции. Методика, используемая в этом гипотетическом эксперименте, а также результаты, которые мы могли бы в нем получить, представлены ниже.

При желании вы можете заменить какие-то конкретные детали этого эксперимента на другие - например, потребление марихуаны на потребление алкоголя или лишение сна, - или, что еще лучше, подставить вместо этих гипотетических данных те, которые вы действительно получили в вашем собственном исследовании. В любом случае вам придется принять «правила нашей игры» и выполнять те расчеты, которые здесь от вас потребуются; только при этом условии до вас «дойдет» существо предмета, если это уже не случилось с вами раньше.

Важное примечание. В разделах, посвященных описательной и индуктивной статистике, мы будем рассматривать только те данные эксперимента, которые имеют отношение к зависимой переменной «поражаемые мишени». Что касается такого показателя, как время реакции, то мы обратимся к нему только в разделе о вычислении корреляции. Однако само собой разумеется, что уже с самого начала значения этого показателя надо обрабатывать так же, как и переменную «поражаемые мишени». Мы предоставляем читателю заняться этим самостоятельно с помощью карандаша и бумаги.

Некоторые основные понятия. Популяция и выборка

Одна из задач статистики состоит в том, чтобы анализировать данные, полученные на части популяции, с целью сделать выводы относительно популяции в целом.

Популяция в статистике не обязательно означает какую-либо группу людей или естественное сообщество; этот термин относится ко всем существам или предметам, образующим общую изучаемую совокупность, будь то атомы или студенты, посещающие то или иное кафе.

Выборка - этонебольшое количество элементов, отобранных с помощью научных методов так, чтобы она была репрезентативной, т.е. отражала популяцию в целом.

отечественной литературе более распространены термины соответственно «генеральная совокупность» и «выборочная совокупность». - Прим. перев. )

Данные и их разновидности

Данные в статистике - это основные элементы, подлежащие анализу. Данными могут быть какие-то количественные результаты, свойства, присущие определенным членам популяции, место в той или иной последовательности - в общем любая информация, которая может быть классифицирована или разбита на категории с целью обработки.

Не следует смешивать «данные» с теми «значениями», которые эти данные могут принимать. Для того чтобы всегда различать их, Шатийон (Chatillon, 1977) рекомендует запомнить следующую фразу: «Данные часто принимают одни и те же значения» (так, если мы возьмем, например, шесть данных - 8, 13, 10, 8, 10 и 5, то они принимают лишь четыре разных значения - 5, 8, 10 и 13).

Построение распределения - это разделение первичных данных, полученных на выборке, на классы или категории с целью получить обобщенную упорядоченную картину, позволяющую их анализировать.

Существуют три типа данных:

1. Количественные данные , получаемые при измерениях (например, данные о весе, размерах, температуре, времени, результатах тестирования и т. п.). Их можно распределить по шкале с равными интервалами.

2. Порядковые данные , соответствующие местам этих элементов в последовательности, полученной при их расположении в возрастающем порядке (1-й, ..., 7-й, ..., 100-й, ...; А, Б, В. ...).

3. Качественные данные , представляющие собой какие-то свойства элементов выборки или популяции. Их нельзя измерить, и единственной их количественной оценкой служит частота встречаемости (число лиц с голубыми или с зелеными глазами, курильщиков и не курильщиков, утомленных и отдохнувших, сильных и слабых и т.п.).

Из всех этих типов данных только количественные данные можно анализировать с помощью методов, в основе которых лежат параметры (такие, например, как средняя арифметическая). Но даже к количественным данным такие методы можно применить лишь в том случае, если число этих данных достаточно, чтобы проявилось нормальное распределение. Итак, для использования параметрических методов в принципе необходимы три условия: данные должны быть количественными, их число должно быть достаточным, а их распределение - нормальным. Во всех остальных случаях всегда рекомендуется использовать непараметрические методы.

О. А. ШУШЕРИНА

математическая статистика

для психологов

Учебное пособие

Красноярск 2012

Часть 1. Описательная статистика

Тема 1. Генеральная совокупность. Выборка. Выбор…………….....

Тема 2. Вариационный и статистический ряды………………………

Тема 3. Числовые характеристики выборки……………………….....

Часть 2. Статистические оценки параметров распределения генеральной совокупности

Тема 1. Точечные оценки параметров генеральной совокупности….

Тема 2. Интервальные оценки параметров генеральной совокупности……………………………………………………………

Часть 3. Проверка статистических гипотез

Тема 1. Основные понятия теории принятия статистического решения………………………………………………………………….

Тема 2. Поверка гипотез о различии в уровне проявления исследуемого признака (критерий Манна-Уитни)…………………...

Тема 3. Проверка гипотезы о равенстве генеральных средних (независимые выборки)……………………………………………….

Тема 4. Проверка гипотезы о равенстве генеральных средних (зависимые выборки)……………………………………….

Часть 4. Корреляционный анализ

Тема 1. Корреляционная связь и ее статистическое изучение…………………………………………………………………

Тема 2. Значимость выборочного коэффициента линейной корреляции………………………………………………………………

Тема 3. Коэффициенты ранговой корреляции и ассоциации………………………………………………………………

Литература ……………………………………………………………

Приложения. Таблицы …………………………………………….


Часть 1. описательная статистика

Тема 1. генеральная совокупность. выборка. выбор.

Математическая статистика – это наука, разрабатывающая методы регистрации, описания и анализа данных наблюдений и экспериментов с целью получения вероятностно-статистических моделей изучаемых явлений. Ее методы применимы для обработки наблюдений и экспериментов любой природы.

Методы и способы математико-статистической обработки у студентов гуманитарных факультетов , в том числе и психологических, вызывают значительные затруднения и, как следствие, боязнь и предубеждение в возможности ими овладения. Однако, как показывает практика, это ложные заблуждения.

В современной психологии, в практической деятельности психолога любого уровня, без использования аппарата математической статистики все выводы могут восприниматься с известной долей субъективности.

1. Задачи математической статистики

Основная цель математической статистики – получение и обработка данных для статистически значимой поддержки процесса принятия решений , например, при решении задач планирования, правления, прогнозирования.

Задачей математической статистики является изучение массовых явлений в обществе, природе, технике методами теории вероятностей и их научное обоснование.

В теории вероятностей мы, зная природу некоторого явления, выясняем, как будут себя вести те или иные изучаемые нами характеристики, которые можно наблюдать в экспериментах.

В математической статистике , наоборот, исходными данными являются экспериментальные данные (наблюдения над случайными величинами), а требуется вынести то или иное суждение о природе изучаемого явления.

Основными задачами математической статистики являются:

§ Оценивание числовых характеристик или параметров распределения случайной величины по данным экспериментов.

§ Проверка статистических гипотез о свойствах изучаемого случайного явления.

§ Определение эмпирической зависимости между переменными, описывающими случайное явление, на основе экспериментальных данных.

Рассмотрим типичную схему исследований при решении указанных задач. Эти исследования естественно делятся на две части .

Часть 1. Сначала путем наблюдений и экспериментов собираются, регистрируются статистические данные, составляющие выборку, - это числа, называемые также выборочными данными . Затем они упорядочиваются, представляются в компактной, наглядной или функциональной форме. Вычисляются различного рода средние величины, характеризующие выборку. Часть математической статистики, обеспечивающая эту работу, называется описательной статистикой .

Часть 2. Вторая часть работы исследователя состоит в получении на основе найденных сведений о выборке достаточно обоснованных выводов о свойствах исследуемого случайного явления. Эта часть работы обеспечивается статистическими методами, составляющими статистику выводов.

2. Выборочный метод исследования

Виды деятельности" href="/text/category/vidi_deyatelmznosti/" rel="bookmark">вид деятельности , требующий высокой профессиональной компетентности и часто достаточно много времени для работы с каждым испытуемым. На помощь приходит выборочный метод исследования , в этом случае из всей совокупности отбирают случайным образом ограниченное число объектов и изучают их.

Генеральная совокупность – это совокупность объектов (любая группа людей), которую психолог изучает по выборке. Теоретически считается, что объем генеральной совокупности не ограничен. Практически же считают, что этот объем ограничен в зависимости от объекта наблюдения и решаемой задачи.

Из всей совокупности людей, которую называют генеральной совокупностью, случайно отбирают ограниченное число людей (испытуемых, респондентов). Совокупность случайно отобранных объектов для изучения называют выборочной совокупностью , или просто выборкой .

Объемом выборки называют число входящих в нее людей. Объем выборки обозначается буквой . Он может быть различным, но не меньшим чем два респондента. В статистике различают:

малую выборку ();

среднюю выборку ();

большую выборку ().

Процесс составления выборки называется выбором .

При образовании выборки можно поступить следующими способами:

1) после отбора и изучения испытуемого его «возвращают» в генеральную совокупность; такую выборку называют повторной. Психологу нередко приходится тестировать несколько раз одних и тех же испытуемых при помощи одной и той же методики, но всякий раз испытуемые будут иметь различия, обусловленные функциональной и возрастной изменчивостью, присущей каждому человеку;

2) после отбора и изучения испытуемого его не возвращают в генеральную совокупность; такую выборку называют бесповторной .

К выборке предъявляются требования , определенные целями и задачами исследования.

1. Организованная выборка должна быть репрезентативной для того, чтобы правильно представлять в той же пропорции и той же частотой основные признаки в генеральной совокупности. Выборка будет репрезентативной, если ее осуществлять случайно : каждый испытуемый отобран случайно из генеральной совокупности, если все объекты имеют одинаковую вероятность попасть в выборку. Репрезентативная выборка – это меньшая, но точная модель генеральной совокупности.

В научных исследованиях по части (отдельной выборке) никогда не удается полностью охарактеризовать целое (генеральную совокупность, популяцию). Такие ошибки, при обобщении, переносе результатов, полученных при изучении отдельной выборки, на всю генеральную совокупность, называются ошибками репрезентативности .

2. Выборка должна быть однородной , т. е. каждый испытуемый должен обладать теми характеристиками, которые являются для исследования критериальными: возраст, пол, образование и так далее. Условия проведения экспериментов не должны меняться, причем выборка должна быть получена из одной генеральной совокупности.

Выборки называют независимыми (несвязными ), если процедура эксперимента и полученные результаты измерения некоторого свойства у испытуемых одной выборки не оказывают влияния на особенности протекания этого же эксперимента и результаты измерения этого же свойства у испытуемых другой выборки.

Выборки называют зависимыми (связными ), если процедура эксперимента и полученные результаты измерения некоторого свойства, проведенные на одной выборке, оказывают влияние на результаты измерения этого же свойства в другом эксперименте. Обратим внимание, что одна и та же группа испытуемых , на которой дважды проводилось психологическое обследование (пусть даже разных психологических качеств, признаков, особенностей), считается зависимой, или связной выборкой .

Основным этапом работы психолога с выборкой является выявление результатов статистического анализа и распространение полученных выводов на всю генеральную совокупность.

Выбор наиболее приемлемого объема выборки зависит от:

1) степени однородности изучаемого явления (чем более однородно явление, тем меньше может быть объем выборки);

2) статистических методов, которые использует психолог. Одни методы требуют большое количество испытуемых (более 100 человек), другие допускают малое количество (5-7 человек).

Статистическое исследование

1. Сбор эмпирических данных Выборочный метод исследования

2. Первичная обработка Вариационный ряд

результатов наблюдений

Эмпирическое распределение

Полигон частот Гистограмма частот

3. Математическая обработка

статистических данных Оценка параметров

распределения

Методы корреляционного Методы факторного Методы регрессионного

анализа анализа анализа

Этапы статистического исследования

Контрольные вопросы

1. Каковы основные задачи математической статистики?

2. Что называется генеральной и выборочной совокупностями для исследуемой случайной величины?

3. В чем сущность выборочного метода?

4. Какая выборка называется репрезентативной, однородной?

1. Таблицы сгруппированных данных

Обработка экспериментального материала начинается с систематизации и группировки результатов по некоторому признаку.

Таблицы . Основное содержание таблицы должно быть отражено в названии .

Простая таблица – это перечень, список отдельных единиц испытания с количественной или качественной характеристикой. Используется группировка по одному признаку (например, по полу).

Сложная таблица применяется для выяснения причинно-следственных связей между признаками и позволяет выявить тенденцию, обнаружить разные аспекты между признаками.

№ испытуемых

Баллы, полученные за задание

2. Дискретный статистический ряд

Последовательность данных, расположенная в порядке их получения в эксперименте , называется статистическим рядом .

Результаты наблюдений, в общем случае ряд чисел, расположенных в беспорядке, необходимо упорядочить (проранжировать ). Ранжировать можно как по возрастанию, так и по убыванию признака. После операции ранжирования опытные данные можно сгруппировать так, чтобы в каждой группе признак принимал одно и то же значение, которое называется варианта (обозначено ).

Число элементов в каждой группе называется частотой варианты (). Частота показывает , сколько раз встречается данное значение в исходной совокупности. Общая сумма частот равна объему выборки: .

Упорядоченный ряд распределения, в котором указана повторяемость вариант, принадлежащих к данной совокупности, называется вариационным рядом .

Варианты (значения признака)

Как известно, связь психологии и
математики в последние годы становится
все более тесной и многоплановой.
Современная практика показывает, что
психолог должен не только оперировать
методами математической статистики, но и
представлять предмет своей науки с точки
зрения ""царицы наук"", в противном случае
он будет носителем тестов, выдающих
готовые результаты без их осмысления.

Математические методы – это
обобщающее название комплекса
математических дисциплин, объединенных
для изучения социальных и
психологических систем и процессов.

Основные математические методы, рекомендуемые к
преподаванию студентам-психологам:
Методы математической статистики. Сюда
входят корреляционный анализ, однофакторный
дисперсионный анализ, двухфакторный дисперсионный анализ, регрессионный анализ и факторный
анализ.
Математическое моделирование.
Методы теории информации.
Системный метод.

Психологические измерения

В основе применения математических
методов и моделей в любой науке лежит
измерение. В психологии объектами
измерения являются свойства системы
психики или ее подсистем, таких, как
восприятие, память, направленность
личности, способности и т.д.
Измерение - это приписывание
объектам числовых значений, отражающих
меру наличия свойства у данного объекта.

Назовем три важнейших свойства
психологических измерений.
1. Существование семейства шкал,
допускающих различные группы
преобразований.
2. Сильное влияние процедуры измерения на
значение измеряемой величины.
3. Многомерность измеряемых
психологических величин, т. е. существенная
их зависимость от большого числа
параметров.

СТАТИСТИЧЕСКИЙ АНАЛИЗ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

Вопросы:
1. Методы первичной статистической

2. Методы вторичной статистической
обработки результатов эксперимента

МЕТОДЫ ПЕРВИЧНОЙ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА

Методами статистической обработки
результатов эксперимента называются
математические приемы, формулы,
способы количественных расчетов, с
помощью которых показатели,
получаемые в ходе эксперимента, можно
обобщать, приводить в систему, выявляя
скрытые в них закономерности.

Некоторые из методов математикостатистического анализа позволяют вычислять
так называемые элементарные
математические статистики,
характеризующие выборочное распределение
данных, например
*выборочное среднее,
*выборочная дисперсия,
*мода,
*медиана и ряд других.

10.

Иные методы математической статистики,
например:
дисперсионный анализ,
регрессионный анализ,
позволяют судить о динамике изменения
отдельных статистик выборки.

11.

С
помощью третьей группы методов:
корреляционного анализа,
факторного анализа,
методов сравнения выборочных данных,
можно достоверно судить о
статистических связях,существующих
между переменными величинами, которые
исследуют в данном эксперименте.

12.

Все методы математико-статистического анализа условно
делятся на первичные и вторичные
Первичными называют методы, с помощью
которых можно получить показатели,
непосредственно отражающие результаты
производимых в эксперименте измерений.
Вторичными называются методы
статистической обработки, с помощью
которых на базе первичных данных выявляют
скрытые в них статистические
закономерности.

13. Рассмотрим методы вычисления элементарных математических статистик

Выборочное среднее значение как
статистический показатель представляет
собой среднюю оценку изучаемого в
эксперименте психологического качества.
Выборочное среднее определяется при помощи
следующей формулы:
n
1
x k
n k 1

14.

Пример. Допустим, что в результате
применения психодиагностической методики
для оценки некоторого психологического
свойства у десяти испытуемых мы получили
следующие частные показатели степени
развитости данного свойства у отдельных
испытуемых:
х1= 5, х2 = 4, х3 = 5, х4 = 6, х5 = 7, х6 = 3, х7 = 6, х8=
2, х9= 8, х10 = 4.
10
1
50
х xi
5.0
10 k 1
10

15.

Дисперсия как статистическая, величина
характеризует, насколько частные
значения отклоняются от средней
величины в данной выборке.
Чем больше дисперсия, тем больше
отклонения или разброс данных.
2
S
1
2
(xk x)
n k 1
n

16. СТАНДАРТНОЕ ОТКЛОНЕНИЕ

Иногда вместо дисперсии для выявления
разброса частных данных относительно
средней используют производную от
дисперсии величину, называемую
стандартное отклонение. Оно равно
квадратному корню, извлекаемому из
дисперсии, и обозначается тем же
самым знаком, что и дисперсия, только без
квадрата
n
S
S
2
2
x
k x)
k 1
n

17. МЕДИАНА

Медианой называется значение изучаемого
признака, которое делит выборку, упорядоченную
по величине данного признака, пополам.
Справа и слева от медианы в упорядоченном ряду
остается по одинаковому количеству признаков.
Например, для выборки 2, 3,4, 4, 5, 6, 8, 7, 9
медианой будет значение 5, так как слева и справа
от него остается по четыре показателя.
Если ряд включает в себя четное число признаков,
то медианой будет среднее, взятое как полусумма
величин двух центральных значений ряда. Для
следующего ряда 0, 1, 1, 2, 3, 4, 5, 5, 6, 7 медиана
будет равна 3,5.

18. МОДА

Модой называют количественное
значение исследуемого признака,
наиболее часто встречающееся в выбор
К примеру, в последовательности значений
признаков 1, 2, 5, 2, 4, 2, 6, 7, 2 модой
является значение 2, так как оно
встречается чаще других значений -
четыре раза.

19. ИНТЕРВАЛ

Интервалом называется группа упорядоченных по
величине значений признака, заменяемая в процессе
расчетов средним значением.
Пример. Представим следующий ряд частных
признаков: О, 1, 1, 2, 2, 3, 3, 3, 4, 4, 5, 5, 5, 5, 6, 6, 6, 7,
7, 8, 8, 8, 9, 9, 9, 10, 10, 11, 11, 11. Этот ряд включает в
себя 30 значений.
Разобьем представленный ряд на шесть подгрупп
по пять признаков в каждом
Вычислим средние значения для каждой из пяти
образованных подгрупп чисел. Они соответственно
будут равны 1,2; 3,4; 5,2; 6,8; 8,6; 10,6.

20. Контрольное задание

Для следующих рядов вычислить среднее,
моду, медиану, стандартное отклонение:
1) {3, 4, 5, 4, 4, 4, 6, 2}
2) {10, 40, 30, 30, 30, 50, 60, 20}
3) {15, 15, 15, 15, 10, 10, 20, 5, 15}.

21. МЕТОДЫ ВТОРИЧНОЙ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА

С помощью вторичных методов
статистической обработки
экспериментальных данных непосредственно
проверяются, доказываются или
опровергаются гипотезы, связанные с
экспериментом.
Эти методы, как правило, сложнее, чем
методы первичной статистической обработки,
и требуют от исследователя хорошей
подготовки в области элементарной
математики и статистики.

22.

Регрессионное исчисление -
это метод математической
статистики, позволяющий
свести частные, разрозненные
данные к некоторому
линейному графику,
приблизительно отражающему
их внутреннюю взаимосвязь, и
получить возможность по зна
чению одной из переменных
приблизительно оценивать
вероятное значение другой
переменной.

Глава 1. КОЛИЧЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ СОБЫТИЙ
1.1. СОБЫТИЕ И МЕРЫ ВОЗМОЖНОСТИ ЕГО ПОЯВЛЕНИЯ
1.1.1. Понятие о событии
1.1.2. Случайные и неслучайные события
1.1.3. Частота частость и вероятность
1.1.4. Статистическое определение вероятности
1.1.5. Геометрическое определение вероятности
1.2. СИСТЕМА СЛУЧАЙНЫХ СОБЫТИЙ
1.2.1. Понятие о системе событий
1.2.2. Совместное появление событий
1.2.3. Зависимость между событиями
1.2.4. Преобразования событий
1.2.5. Уровни количественного определения событий
1.3. КОЛИЧЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ СИСТЕМЫ КЛАССИФИЦИРОВАННЫХ СОБЫТИЙ
1.3.1. Распределения вероятностей событий
1.3.2. Ранжирование событий в системе по вероятностям
1.3.3. Меры связи между классифицированными событиями
1.3.4. Последовательности событий
1.4. КОЛИЧЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ СИСТЕМЫ УПОРЯДОЧЕННЫХ СОБЫТИЙ
1.4.1. Ранжирование событий по величине
1.4.2. Распределение вероятностей ранжированной системы упорядоченных событий
1.4.3. Количественные характеристики распределения вероятностей системы упорядоченных событий
1.4.4. Меры корреляции рангов
Глава 2. КОЛИЧЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНОЙ ВЕЛИЧИНЫ
2.1. СЛУЧАЙНАЯ ВЕЛИЧИНА И ЕЕ РАСПРЕДЕЛЕНИЕ
2.1.1. Случайная величина
2.1.2. Распределение вероятностей значений случайной величины
2.1.3. Основные свойства распределений
2.2. ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ РАСПРЕДЕЛЕНИЯ
2.2.1. Меры положения
2.2.2. Меры асимметрии и эксцесса
2.3. ОПРЕДЕЛЕНИЕ ЧИСЛОВЫХ ХАРАКТЕРИСТИК ПО ЭКСПЕРИМЕНТАЛЬНЫМ ДАННЫМ
2.3.1. Исходные положения
2.3.2. Вычисление мер положения рассеивания асимметрии и эксцесса по несгруппированным данным
2.3.3. Группировка данных и получение эмпирических распределений
2.3.4. Вычисление мер положения рассеивания асимметрии и эксцесса по эмпирическому распределению
2.4. ВИДЫ ЗАКОНОВ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНОЙ ВЕЛИЧИНЫ
2.4.1. Общие положения
2.4.2. Нормальный закон
2.4.3. Нормализация распределений
2.4.4. Некоторые другие законы распределения важные для психологии
Глава 3. КОЛИЧЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ ДВУМЕРНОЙ СИСТЕМЫ СЛУЧАЙНЫХ ВЕЛИЧИН
3.1. РАСПРЕДЕЛЕНИЯ В СИСТЕМЕ ИЗ ДВУХ СЛУЧАЙНЫХ ВЕЛИЧИН
3.1.1. Система из двух случайных величин
3.1.2. Совместное распределение двух случайных величин
3.1.3. Частные безусловные и условные эмпирические распределения и взаимосвязь случайных величин в двумерной системе
3.2. ХАРАКТЕРИСТИКИ ПОЛОЖЕНИЯ РАССЕИВАНИЯ И СВЯЗИ
3.2.1. Числовые характеристики положения и рассеивания
3.2.2. Простые регрессии
3.2.3. Меры корреляции
3.2.4. Совокупные характеристики положения рассеивания и связи
3.3. ОПРЕДЕЛЕНИЕ КОЛИЧЕСТВЕННЫХ ХАРАКТЕРИСТИК ДВУМЕРНОЙ СИСТЕМЫ СЛУЧАЙНЫХ ВЕЛИЧИН ПО ДАННЫМ ЭКСПЕРИМЕНТА
3.3.1. Аппроксимация простой регрессии
3.3.2. Определение числовых характеристик при небольшом количестве экспериментальных данных
3.3.3. Полный расчет количественных характеристик двумерной системы
3.3.4. Расчет совокупных характеристик двумерной системы
Глава 4. КОЛИЧЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ МНОГОМЕРНОЙ СИСТЕМЫ СЛУЧАЙНЫХ ВЕЛИЧИН
4.1. МНОГОМЕРНЫЕ СИСТЕМЫ СЛУЧАЙНЫХ ВЕЛИЧИН И ИХ ХАРАКТЕРИСТИКИ
4.1.1. Понятие о многомерной системе
4.1.2. Разновидности многомерных систем
4.1.3. Распределения в многомерной системе
4.1.4. Числовые характеристики в многомерной системе
4.2. НЕСЛУЧАЙНЫЕ ФУНКЦИИ ОТ СЛУЧАЙНЫХ АРГУМЕНТОВ
4.2.1. Числовые характеристики суммы и произведения случайных величин
4.2.2. Законы распределения линейной функции от случайных аргументов
4.2.3. Множественные линейные регрессии
4.3. ОПРЕДЕЛЕНИЕ ЧИСЛОВЫХ ХАРАКТЕРИСТИК МНОГОМЕРНОЙ СИСТЕМЫ СЛУЧАЙНЫХ ВЕЛИЧИН ПО ДАННЫМ ЭКСПЕРИМЕНТА
4.3.1. Оценка вероятностей многомерного распределения
4.3.2. Определение множественных регрессий и связанных с ними числовых характеристик
4.4. СЛУЧАЙНЫЕ ФУНКЦИИ
4.4.1. Свойства и количественные характеристики случайных функций
4.4.2. Некоторые классы случайных функций важные для психологии
4.4.3. Определение характеристик случайной функции из эксперимента
Глава 5. СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ
5.1. ЗАДАЧИ СТАТИСТИЧЕСКОЙ ПРОВЕРКИ ГИПОТЕЗ
5.1.1. Генеральная совокупность и выборка
5.1.2. Количественные характеристики генеральной совокупности и выборки
5.1.3. Погрешности статистических оценок
5.1.4. Задачи статистической проверки гипотез в психологических исследованиях
5.2. СТАТИСТИЧЕСКИЕ КРИТЕРИИ ОЦЕНИВАНИЯ И ПРОВЕРКИ ГИПОТЕЗ
5.2.1. Понятие о статистических критериях
5.2.2. х-критерий Пирсона
5.2.3. Основные параметрические критерии
5.3. ОСНОВНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ПРОВЕРКИ ГИПОТЕЗ
5.3.1. Метод максимального правдоподобия
5.3.2. Метод Бейеса
5.3.3. Классический метод определения параметра функции с заданной точностью
5.3.4. Метод проектирования репрезентативной выборки по модели совокупности
5.3.5. Метод последовательной проверки статистических гипотез
Глава 6. ОСНОВЫ ДИСПЕРСИОННОГО АНАЛИЗА И МАТЕМАТИЧЕСКОГО ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТА
6.1. ПОНЯТИЕ О ДИСПЕРСИОННОМ АНАЛИЗЕ
6.1.1. Сущность дисперсионного анализа
6.1.2. Предпосылки дисперсионного анализа
6.1.3. Задачи дисперсионного анализа
6.1.4. Виды дисперсионного анализа
6.2. ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ
6.2.1. Схема расчета при одинаковом количестве повторных испытаний
6.2.2. Схема расчета при разном количестве повторных испытаний
6.3. ДВУХФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ
6.3.1. Схема расчета при отсутствии повторных испытаний
6.3.2. Схема расчета при наличии повторных испытаний
6.4. Трехфакторный дисперсионный анализ
6.5. ОСНОВЫ МАТЕМАТИЧЕСКОГО ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТА
6.5.1. Понятие о математическом планировании эксперимента
6.5.2. Построение полного ортогонального плана эксперимента
6.5.3. Обработка результатов математически спланированного эксперимента
Глава 7. ОСНОВЫ ФАКТОРНОГО АНАЛИЗА
7.1. ПОНЯТИЕ О ФАКТОРНОМ АНАЛИЗЕ
7.1.1. Сущность факторного анализа
7.1.2. Разновидности методов факторного анализа
7.1.3. Задачи факторного анализа в психологии
7.2. ОДНОФАКТОРНЫЙ АНАЛИЗ
7.3. МУЛЬТИФАКТОРНЫЙ АНАЛИЗ
7.3.1. Геометрическая интерпретация корреляционной и факторной матриц
7.3.2. Центроидный метод факторизации
7.3.3. Простая латентная структура и ротация
7.3.4. Пример мультифакторного анализа с ортогональной ротацией
Приложение 1. ПОЛЕЗНЫЕ СВЕДЕНИЯ О МАТРИЦАХ И ДЕЙСТВИЯХ С НИМИ
Приложение 2. МАТЕМАТИКО-СТАТИСТИЧЕСКИЕ ТАБЛИЦЫ
РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА

Статистика в психологии (statistics in psychology)

Первое применение С. в психологии часто связывают с именем сэра Фрэнсиса Гальтона. В психологии под «статистикой» понимается применение количественных мер и методов для описания и анализа результатов психол. исслед. Психологии как науке С. необходима. Регистрация, описание и анализ количественных данных позволяют проводить обоснованные сравнения, опирающиеся на объективные критерии. Применяемая в психологии С. обычно состоит из двух разделов: описательной (дескриптивной) статистики и теории статистического вывода.

Описательная статистика.

Описательная С. включает в себя методы орг-ции, суммирования и описания данных. Дескриптивные показатели позволяют быстро и эффективно представлять большие совокупности данных. К наиболее часто используемым описательным методам относятся частотные распределения, меры центральной тенденции и меры относительного положения. Регрессия и корреляции применяются для описания связей между переменными.

Частотнее распределение показывает, сколько раз каждый качественный или количественный показатель (либо интервал таких показателей) встречается в массиве данных. Кроме того, нередко приводятся относительные частоты - процент ответов каждого типа. Частотное распределение обеспечивает быстрое проникновение в структуру данных, к-рого было бы трудно достичь, работая непосредственно с первичными данными. Для наглядного представления частотных данных часто используются разнообразные виды графиков.

Меры центральной тенденции - это итоговые С., описывающие то, что яв-ся типичным для распределения. Мода определяется как наиболее часто встречающееся наблюдение (значение, категория и т. д.). Медиана - это значение, к-рое делит распределение пополам, так что одна его половина включает все значения выше медианы, а другая - все значения ниже медианы. Среднее вычисляется как среднее арифметическое всех наблюденных значений. Какая из мер - мода, медиана или среднее - будет лучше всего описывать распределение, зависит от его формы. Если распределение симметричное и унимодальное (имеющее одну моду), среднее медиана и мода будут просто совпадать. На среднее особенно влияют «выбросы», сдвигая его величину в сторону крайних значений распределения, что делает среднее арифметическое наименее полезной мерой сильно скошенных (асимметричных) распределений.

Др. полезными описательными характеристиками распределений служат меры изменчивости, т. е. того, в какой степени различаются значения переменной в вариационном ряду. Два распределения могут иметь одинаковые средние, медианы и моды, но существенно различаться по степени изменчивости значений. Изменчивость оценивается двумя С.: дисперсией и стандартным отклонением.

Меры относительного положения включают в себя процентили и нормированные оценки, используемые для описания местоположения конкретного значения переменной относительно остальных ее значений, входящих в данное распределение. Велковиц с соавторами определяют процентиль как «число, показывающее процент случаев в определенной референтной группе с равными или меньшими оценками». Т. о., процентиль дает более точную информ., чем просто сообщение о том, что в данном распределении некое значение переменной попадает выше или ниже среднего, медианы или моды.

Нормированные оценки (обычно называемые z-оценками) выражают отклонение от среднего в единицах стандартного отклонения (σ). Нормированные оценки полезны тем, что их можно интерпретировать относительно стандартизованного нормального распределения (z-распределения) - симметричной колоколообразной кривой с известными свойствами: средним, равным 0, и стандартным отклонением, равным 1. Так как z-оценка имеет знак (+ или -), она сразу показывает, лежит ли наблюденное значение переменной выше или ниже среднего (m). А поскольку нормированная оценка выражает значения переменной в единицах стандартного отклонения, она показывает, насколько редким яв-ся каждое значение: примерно 34% всех значений попадает в интервал от т до т + 1σ и 34% - в интервал от т до т - 1σ; по 14% - в интервалы от т + 1σ до т + 2σ и от т - 1σ до т - 2σ; и по 2% - в интервалы от т + 2σ до т + 3σ и от т - 2σ до т - 3σ.

Связи между переменными. Регрессия и корреляция относятся к тем способам, к-рые чаще всего используются для описания связей между переменными. Два разных измерения, полученных по каждому элементу выборки, можно отобразить в виде точек в декартовой системе координат (х, у) - диаграммы рассеяния, являющейся графическим представлением связи между этими измерениями. Часто эти точки образуют почти прямую линию, свидетельствующую о линейной связи между переменными. Для получения линии регрессии - мат. уравнения линии наилучшего соответствия множеству точек диаграммы рассеяния - используются численные методы. После выведения линии регрессии появляется возможность предсказывать значения одной переменной по известным значениям другой и, к тому же, оценивать точность предсказания.

Коэффициент корреляции (r) - это количественный показатель тесноты линейной связи между двумя переменными. Методики вычисления коэффициентов корреляции исключают проблему сравнения разных единиц измерения переменных. Значения r изменяются в пределах от -1 до +1. Знак отражает направление связи. Отрицательная корреляция означает наличие обратной зависимости, когда с увеличением значений одной переменной значения др. переменной уменьшаются. Положительная корреляция свидетельствует о прямой зависимости, когда при увеличении значений одной переменной увеличиваются значения др. переменной. Абсолютная величина r показывает силу (тесноту) связи: r = ±1 означает прямолинейную зависимость, а r = 0 указывает на отсутствие линейной связи. Величина r2 показывает процент дисперсии одной переменной, к-рый можно объяснить вариацией др. переменной. Психологи используют r2, чтобы оценить полезность конкретной меры для предсказания.

Коэффициент корреляции Пирсона (r) предназначен для интервальных данных, полученных в отношении предположительно нормально распределенных переменных. Для обработки др. типов данных имеется целый ряд др. корреляционных мер, напр. точечно-бисериальный коэффициент корреляции, коэффициент j и коэффициент ранговой корреляции (r) Спирмена. Корреляции часто используются в психологии как источник информ. для формулирования гипотез эксперим. исслед. Множественная регрессия, факторный анализ и каноническая корреляция образуют родственную группу более современных методов, ставших доступными практикам благодаря прогрессу в области вычислительной техники. Эти методы позволяют анализировать связи между большим числом переменных.

Теория статистического вывода

Этот раздел С. включает систему методов получения выводов о больших группах (фактически, генеральных совокупностях) на основе наблюдений, проведенных в группах меньшего размера, называемых выборками. В психологии статистический вывод служит двум главным целям: 1) оценить параметры генеральной совокупности по выборочным статистикам; 2) оценить шансы получения определенного паттерна результатов исследования при заданных характеристиках выборочных данных.

Среднее является наиболее часто оцениваемым параметром генеральной совокупности. В силу самого способа вычисления стандартной ошибки, выборки большего объема обычно дают меньшие стандартные ошибки, что делает статистики, вычисленные по большим выборкам, несколько более точными оценками параметров генеральной совокупности. Пользуясь стандартной ошибкой среднего и нормированными (стандартизованными) распределениями вероятностей (такими как t-распределение), можно построить доверительные интервалы - области значений с известными шансами попадания в них истинного генерального среднего.

Оценивание результатов исследования. Теорию статистического вывода можно использовать для оценки вероятности того, что частные выборки принадлежат известной генеральной совокупности. Процесс статистического вывода начинается с формулирования нулевой гипотезы (H0), состоящей в предположении, что выборочные статистики получены из определенной совокупности. Нулевая гипотеза сохраняется или отвергается в зависимости от того, насколько вероятным яв-ся полученный результат. Если наблюдаемые различия велики относительно величины изменчивости выборочных данных, исследователь обычно отвергает нулевую гипотезу и делает вывод о крайне малых шансах того, что наблюдаемые различия обязаны своим происхождением случаю: результат является статистически значимым. Вычисляемые критериальные статистики с известными распределениями вероятностей выражают отношение между наблюдаемыми различиями и изменчивостью (вариабельностью).

Параметрические статистики. Параметрические С. могут использоваться в тех случаях, когда удовлетворяются два требования: 1) в отношении изучаемой переменной известно или, по крайней мере, можно предположить, что она имеет нормальное распределение; 2) данные представляют собой интервальные измерения или измерения отношений.

Если среднее и стандартное отклонение генеральной совокупности известно (хотя бы предположительно), можно определить точное значение вероятности получения наблюдаемого различия между известным генеральным параметром и выборочной статистикой. Нормированное отклонение (z-оценку) можно найти путем сравнения со стандартизованной нормальной кривой (называемой также z-распределением).

Поскольку исследователи часто работают с малыми выборками и поскольку параметры генеральной совокупности редко известны, стандартизованные t-распределения Стьюдента обычно используются чаще нормального распределения. Точная форма t-распределения варьирует в зависимости от объема выборки (точнее, от числа степеней свободы, т. е. числа значений, к-рые можно свободно изменять в данной выборке). Семейство t-распределений можно использовать для проверки нулевой гипотезы, состоящей в том, что две выборки были извлечены из одной и той же совокупности. Такая нулевая гипотеза типична для исследований с двумя группами испытуемых, напр. эксперим. и контрольной.

Когда в исслед. задействовано больше двух групп, можно применить дисперсионный анализ (F-критерий). F - это универсальный критерий, оценивающий различия между всеми возможными парами исследуемых групп одновременно. При этом сравниваются величины дисперсии внутри групп и между группами. Существует множество post hoc методик выявления парного источника значимости F-критерия.

Непараметрические статистики. Когда не удается соблюсти требования адекватного применения параметрических критериев или когда собираемые данные являются порядковыми (ранговыми) или номинальными (категориальными), используют непараметрические методы. Эти методы параллельны параметрическим в том, что касается их применения и назначения. Непараметрические альтернативы t-критерию включают U-критерий Манна-Уитни, критерий Уилкоксона (W) и критерий с2 для номинальных данных. К непараметрическим альтернативам дисперсионного анализа относятся критерии Краскела - Уоллеса, Фридмана и с2. Логика применения каждого непараметрического критерия остается той же самой: соответствующая нулевая гипотеза отвергается в том случае, если расчетное значение критериальной статистики выходит за пределы заданной критической области (т. е. оказывается менее вероятным, чем предполагалось).

Так как все статистические выводы основаны на оценках вероятности, возможны два ошибочных исхода: ошибки I рода, при к-рых отвергается истинная нулевая гипотеза, и ошибки II рода, при к-рых сохраняется ложная нулевая гипотеза. Первые имеют следствием ошибочное подтверждение гипотезы исслед., а последние - неспособность распознать статистически значимый результат.

См. также Дисперсионный анализ, Меры центральной тенденции, Факторный анализ, Измерение, Методы многомерного анализа, Проверка нулевой гипотезы, Вероятность, Статистический вывод

А. Майерс

Смотреть что такое "Статистика в психологии (statistics in psychology)" в других словарях:

    Содержание 1 Биомедицина и науки о жизни (Biomedical and Life Sciences) 2 З … Википедия

    Эта статья содержит незавершённый перевод с иностранного языка. Вы можете помочь проекту, переведя её до конца. Если вы знаете, на каком языке написан фрагмент, укажите его в этом шаблоне … Википедия