|
какие модели нужно подобрать) для того, чтобы получить остатки, соответствующие
белому шуму. Нек-рые временные ряды требуют очень сложных моделей для получения
остатков, относящихся к белому шуму. Это часто имеет место в тех случаях, когда
ряд не является стационарным, т. е. когда среднее, дисперсия и/или структура
автокорреляции изменяются во времени.
Модели вмешательства
В психол. исслед. часто возникает необходимость оценить эффективность
вмешательства. Если данные собирались через равные интервалы до и после
воздействия на некий элемент выборки, напр. чел., группу или округ, нередко
представляется полезным статистически описать наблюдаемый эффект и проверить
его статистическую значимость. Есть две осн. стратегии анализа таких эффектов.
Первый подход дает легко интерпретируемый результат и потому весьма полезен.
Он предполагает идентифицирование общепринятой модели временного ряда на
полученных до вмешательства данных. Производится оценка параметров модели, а
затем делаются предсказания относительно поведения, ожидаемого после
вмешательства. Эти предсказания осн. на предположении, что характер процесса до
вмешательства не изменится и после вмешательства. Когда после вмешательства
обнаруживается несоответствие между предсказываемыми и наблюдаемыми значениями,
различие можно статистически оценить. Если различие статистически значимо, это
служит доказательством того, что наблюдаемое изменение связано с вмешательством.
Поскольку статистический критерий различия можно вычислить для каждой точки
временного ряда после вмешательства, нетрудно определить тот момент, когда
данное вмешательство начинает вызывать эффект.
Второй — гораздо чаще используемый подход — предполагает оценивание и
проверку эффекта вмешательства. Связанная с применением этого подхода трудность
заключается в том, что «эффект» вмешательства часто бывает комплексным; поэтому
в данном случае целесообразно рассматривать паттерн эффекта, а не его среднее
различие.
Двумерный анализ
А. в. р. можно использовать при изучении связей между двумя или большим
числом временных рядов. Существует неск. видов корреляции между временными
рядами (наз. иногда кросс-корреляцией), поскольку существует множество
вариантов временного запаздывания изменений двух рядов. Цель исслед. таких
корреляций — выяснение того, какой из двух рядов будет «ведущим».
См. также Корреляционные методы
Б. И. Хьютема
Анализ заданий (item analysis)
Осн. цель А. з. — предоставить информ. о том, насколько адекватно
функционируют составляющие тест задания (или пункты). Эта информ. может затем
использоваться для повышения надежности и валидности теста путем редактирования
или удаления слабых заданий. А. з. теста достижений может тж предоставлять
диагностическую информ. о том, что знают и чего не знают экзаменуемые, и потому
быть основой планирования обучения и пересмотра учеб. программ.
Информ., получаемая в рез-те А. з., м. б. рациональной (оценочной) или
эмпирической (статистической). Рациональный А. з. предполагает тщательное
изучение каждого задания для определения того, является ли его содержание
точным, соотв. спецификациям к тесту, свободным от культурных или др.
предубеждений и отвечающим стандартным требованиям, к-рые предъявляются к
составлению тестовых заданий. Этот подход характерен для А. з. критериальных
тестов достижений, но может применяться и к тестам, осн. на статистических
нормах.
Эмпирический А. з. состоит в вычислении одной или неск. статистических мер
функционирования задания, включая индекс трудности задания, индекс
различительной способности (валидности) задания и ряд мер функционирования
дистракторов. Индекс трудности (p) задания рассчитывается довольно просто — как
доля тестируемых, давших правильный ответ на данное задание. Оптимальный индекс
трудности варьирует в зависимости от цели теста и типа задания.
Процедура определения индекса способности задания различать испытуемых на
основе получения ими различных оценок по критериальной переменной зависит от
характера критерия и типа теста. Типичными внутренними критериями для теста
достижений являются суммарные показатели по этому тесту, к-рые ранжируются и
делятся на верхнюю (U) и нижнюю (L) группы. В случае, если тест ориентирован на
статистические нормы, эти две группы обычно состоят из испытуемых,
представляющих верхние 27% и нижние 27% распределения суммарных показателей по
данному тесту. Затем для каждого задания по формуле D = рU — pL рассчитывается
индекс различительной способности (D), где рU и рL — доли испытуемых, правильно
выполнивших данное задание, в верхней и нижней группах соответственно. При
внешнем критерии, таком как оценки выполнения работы или школьные отметки,
индекс различительной способности задания рассчитывается по формуле для
точечно-бисериального коэффициента корреляции (rpb) между оценкой выполнения
задания (0 или 1) и оценками критериального континуума. Очевидно, что чем ближе
или D или rpb к 1,00, тем более валидным является данное задание как
дискриминатор между высокими и низкими показателями по выбранному критерию. В
зависимости от размера группы, по рез-там тестирования к-рой вычисляются
индексы D или rpb, уже такая их величина, как 0,20, может оказаться достаточной
для сохранения заданий в тесте. Следует, однако, заметить, что отбор заданий на
основе D, в общем, приводит к созданию внутренне согласованного, однородного
теста. В противоположность этому отбор заданий на основе rpb обычно будет
|
|