Определение достоверности различий величин
Статистические методы рассматриваются как методы обработки результатов наблюдений. Соответственно их используют весьма однообразно и часто неадекватно. Между тем статистику правильно определить как науку, изучающую теорию принятия решений в условиях неопределенности. Психологические решения - это всегда решения, принимаемые в условиях неопределенности. Теория принятия решений быстро совершенствуется. В большинстве психологических исследований для подтверждения диагностической значимости теста рассчитываются статистические критерии достоверности различий, которая является обязательным критерием диагностической эффективности теста.Уровень значимости различий или сходства между выборками по изучаемому показателю имеет практическое значение при оценке статистической значимости разности величин. После проведения обследования необходимо получить подтверждение истинности выявленных различий в средних оценках по тесту в различных выборках. Достоверность различий показывает вероятность перекрытия доверительных интервалов, в которые с определенной наперед заданной вероятностью могут попадать переменные в сопоставимых выборках. Различия результатов измерений в двух выборках испытуемых А и Б или двух методов оценивается с помощью t-критерий Стъюдента, значение которого вычисляется по формуле:
Видео: Достоверность статистической величины
где М1, М2 - средние в сравниваемых выборках: м, м - ошибки средних величин вычисленные по формуле 1 2
Видео: Воронов И.А. Критерий t-Стьюдента (для гуманитариев)
где N - объем выборки- ? - среднеквадратическое отклонение. Разность средних считается статистически значимой, если t > tкр (для доверительной вероятности p = 0,05), не значимой гипотезой о сходстве t < tкр. Критическое значение критериев определяется для каждой выборки по таблице с учетом ее объема и числа степеней свободы N, N= N1 + N2 - 2.
Различие с истинным значением (правильность) также оценивается с помощью t-критерия. Абсолютная величина t-критерия сопоставляется с таблицей плотности нормального распределения (см.приложение 1). Чем больше t и больше число n выполненных измерений, тем меньше вероятность p - ошибочного заключения о различии результатов, полученных в разных условиях. При большом числе изменений, когда t > 1,96, p < 0,05 ограничиваются как правило, 5% допустимого риска ошибочного утверждения о различии величин, т.е. если t - критерий превышает пороговое значение, то с установленной вероятностью ошибки (достоверностью) можно утверждать, что различия в правильности измерения существуют и ошибка не превышает 5%.
Значение t кр в приложении представлены для трех порогов доверительной вероятности ( p =0.05, 0.01, 0.001 )
ПРИМЕР: предположим в сопоставляемых контрастных группах получены следующие данные М1 = 108,1-
м1 = 10,44- М2 =89,2- м2 = 9,07, число обследованных в первой выборке - 106, во второй - 94 (N = 106 + 94 - 2 = 198). Эмпирическое значение t критерия
Видео: Достоверность разности средних двух выборок
Критическое значение по таблице - 1,97 получается t < tкр, т.е. гипотеза о различии результатов в сравниваемых выборках отвергается.
Чем больше абсолютная величина t и больше n, тем ниже вероятность ошибки заключения о различии групп по изучаемому признаку. Критерий Стъюдента не может быть критерием диагностической эффективности потому, что на его величину оказывает влияние размер исследованной выборки. Диагностическая сила теста не зависит от числа испытаний.
Для оценки согласия исследования могут применятся и другие индексы и критерии, основными из которых являются: Колмогорова - Смирнова, Х2, коэффициент корреляции. Они как правило сложнее и не обладают существенными достоинствами. Для случаев альтернативных решений лучшим является индекс КАППА, но наиболее велики его преимущества в случае номинативных данных, например при исследовании согласия диагнозов. Поправка на случайное согласие (коррекция на случайный успех) введена в индексе Каппа: К = ( po - pe ) / ( 1 - pe ) -
где po - вероятность общего согласия.
Поделиться в соцсетях:
Похожие