На основании полученных сведений эксперт по статистике может:
a) сохранить на данный момент результаты лаборатории;
b) попросить лабораторию выполнить измерение заново (если это возможно);
c) исключить данные лаборатории из анализа.
7.3.1.4 В диаграммах для можно увидеть различные проявления. В одном случае все лаборатории могут иметь как положительные, так и отрицательные значения на различных уровнях эксперимента. В другом случае отдельные лаборатории могут иметь тенденцию к представлению либо только положительных, либо только отрицательных значений , и количество лабораторий, дающих отрицательные значения, приблизительно равно количеству лабораторий, дающих положительные значения. Ни одно из этих проявлений не является необычным или требующим изучения, хотя во втором случае может возникнуть мысль о существовании в лаборатории некоего общего источника систематической погрешности. Однако если все значения для одной лаборатории имеют один знак, а для прочих лабораторий - другой, то в этом случае необходимо попытаться найти причину. Также нужно искать причины расхождений, если значения для лаборатории, во-первых, являются сравнительно большими и, во-вторых, неким систематическим образом зависят от уровня эксперимента. На диаграммах для проводят линии, соответствующие индикаторам, представленным в 8.3 (таблицы 6 и 7). Эти индикаторные линии служат ориентирами при анализе диаграмм.
7.3.1.5 Если одна из лабораторий выделяется по статистике , имея при этом много больших значений, то должна быть установлена причина этого, указывающая на худшую повторяемость по сравнению с другими лабораториями. Например, лаборатория могла бы иметь последовательно меньшие значения , если бы не влияли такие факторы, как завышение при округлении своих данных или недостаточная чувствительность в диапазоне измерений. На диаграммах для также проводятся линии в соответствии с индикаторами, представленными в 8.3 (таблицы 6 и 7), служащие ориентирами при анализе диаграмм.
7.3.1.6 Когда из части диаграммы для или , относящейся к некоей лаборатории, видно, что некоторые значения близки к критическим, т.е. соответствующим индикаторным линиям, нужно рассмотреть всю диаграмму для уровня. Нередко значение, представляющееся большим в части диаграммы, относящейся к лаборатории, оказывается в разумных пределах совместимым со значениями для других лабораторий на том же уровне. Однако если обнаруживается, что оно сильно отличается от значений для других лабораторий, то необходимо попытаться выяснить причину.
7.3.1.7 В дополнение к диаграммам и гистограммы средних значений и расхождений для базовых элементов могут показать наличие, например, двух несовпадающих подмножеств результатов измерений. Такой случай потребовал бы специального подхода, поскольку общий основной принцип, лежащий в основе методов, описываемых здесь, предполагает единственное множество с унимодальным распределением.
7.3.2 Статистическое тестирование выбросов
7.3.2.1 Для анализа данных на наличие выбросов рекомендуется следующая методика.
a) Для идентификации выбросов применяют критерии, приведенные в 7.3.3 и 7.3.4:
- если значение меры, определяемой статистическим критерием (значением тестовой статистики), меньше (или равно) 5%-ного критического значения тестовой статистики (критического значения при 5%-ном уровне значимости), то тестируемую позицию признают корректной;
- если значение тестовой статистики больше 5%-ного критического значения и меньше (или равно) 1%-ного критического значения, то тестируемую позицию называют квазивыбросом и отмечают одной звездочкой;
- если значение тестовой статистики больше 1%-ного критического значения, то тестируемую позицию называют статистическим выбросом и отмечают двумя звездочками.
b) Далее проводят исследование с целью выяснения, могут ли квазивыбросы и/или статистические выбросы быть объяснены какой-либо технической ошибкой, например:
- ошибкой при выполнении измерения;
- ошибкой в расчетах;
- элементарной опиской при переписывании результата измерений;
- анализом не той пробы (образца).
В случае, когда ошибка появилась при расчетах или переписывании, сомнительный результат должен быть заменен правильным значением; когда ошибка являлась следствием анализа не той пробы, результат должен быть помещен в соответствующий ему базовый элемент. После того, как такого рода коррекция будет произведена, исследование на предмет квазивыбросов или выбросов должно быть повторено. В случае, если объяснение технической ошибки таково, что оно свидетельствует о невозможности замены сомнительного результата измерений, он должен быть исключен как "подлинный" выброс, не имеющий отношения к правильно проводимому эксперименту.
c) Когда какие-либо квазивыбросы и/или статистические выбросы остаются необъясненными или исключенными в качестве принадлежащих к выпадающей лаборатории, квазивыбросы сохраняют в качестве корректных позиций, а статистические выбросы исключают, если только эксперт по статистике не решит оставить их, имея на это соответствующие основания.
d) В случае, когда после вышеописанной процедуры данные для базового элемента были исключены для формы В на рисунке 2, то тогда должны быть также исключены соответствующие данные для формы С на рисунке 2 и наоборот.
7.3.2.2 В 7.3.3 и 7.3.4 представлены два типа критериев. Критерий Кохрена предназначен для обработки внутрилабораторных расхождений результатов измерений и должен применяться в первую очередь, после чего должны быть приняты корректирующие меры, в случае необходимости, с повторением измерений (испытаний). Другой критерий (Граббса) главным образом предназначен для обработки межлабораторных расхождений, а также может использоваться (если > 2) в случаях, когда проверка с применением критерия Кохрена вызвала подозрение в том, что высокая внутрилабораторная вариация обусловлена только одним из результатов измерений в базовом элементе.
7.3.3 Критерий Кохрена
7.3.3.1 В настоящем стандарте предполагается, что между лабораториями существуют лишь небольшие различия во внутрилабораторных расхождениях. Опыт, однако, показывает, что дело обстоит не всегда так, поэтому для проверки справедливости этого предположения нужна количественная оценка. Для данной цели могли бы быть использованы несколько критериев, но был выбран критерий Кохрена.
7.3.3.2 Для совокупности из стандартных отклонений , рассчитанных исходя из одного и того же количества ( ) результатов испытаний в базовых элементах, тестовая статистика Кохрена имеет вид
,(8)
где - наивысшее значение стандартного отклонения в совокупности.
a) В случае, если значение тестовой статистики меньше (или равно) 5%-ного критического значения, тестируемую позицию признают корректной.
b) В случае, если значение тестовой статистики больше 5%-ного критического значения и меньше (или равно) 1%-ного значения, тестируемую позицию называют квазивыбросом и отмечают одной звездочкой.
c) В случае, если значение тестовой статистики больше 1%-ного критического значения, тестируемую позицию называют статистическим выбросом и отмечают двумя звездочками.
Критические значения для критерия Кохрена представлены в 8.1 (таблица 4).
Критерий Кохрена должен применяться для формы С (рисунок 2) на каждом уровне раздельно.
7.3.3.3 Строго говоря, критерий Кохрена применяют лишь в случаях, когда все стандартные отклонения исходят из одного и того же количества ( ) результатов измерений, полученных в условиях повторяемости. В фактических случаях это количество может меняться за счет недостающих или исключенных данных. В настоящем стандарте тем не менее предполагается, что в должным образом организованном эксперименте такие изменения в количестве результатов измерений из расчета на базовый элемент будут ограничены и ими можно пренебречь, то есть критерий Кохрена можно использовать применительно к количеству результатов измерений , имеющих место в большинстве базовых элементов.
7.3.3.4 При помощи критерия Кохрена проверяют только наивысшее значение в совокупности стандартных отклонений, и поэтому такая проверка является односторонней. Разброс в дисперсиях может также, разумеется, проявляться в наинизших значениях стандартных отклонений. Однако на малые значения стандартного отклонения может оказывать очень сильное влияние степень округления исходных данных, и поэтому они не очень надежны. Кроме того, представляется нецелесообразным отвергать данные лаборатории из-за того, что ею достигнута более высокая прецизионность в результатах измерений по сравнению с другими лабораториями. Поэтому критерий Кохрена считают адекватным.
7.3.3.5 При критическом рассмотрении формы С (рисунок 2) иногда может обнаружиться, что значения стандартных отклонений для определенной лаборатории на всех или на большинстве уровней ниже значений стандартных отклонений для других лабораторий. Это может указывать на то, что лаборатория работает с более низким значением стандартного отклонения повторяемости по сравнению с другими лабораториями, которое, в свою очередь, может быть обусловлено либо лучшей техникой выполнения анализов и лучшим оборудованием, либо модифицированным или неправильным применением стандартного метода измерений. В случае, если это имеет место, об этом необходимо сообщить совету экспертов, который должен решить, заслуживает ли данный вопрос более детального изучения. (Примером этого является лаборатория N 2 в эксперименте, подробно описанном в B.1 приложения В).
7.3.3.6 Если наивысшее значение стандартного отклонения классифицировано как выброс, то оно должно быть исключено, а проверка с использованием критерия Кохрена может быть повторена на оставшихся значениях. Следует заметить, что процедура повторения может привести к излишним исключениям данных в случаях, когда нормальное распределение, принятое за основу, не является достаточно хорошей аппроксимацией. Повторное применение критерия Кохрена предлагается здесь лишь в качестве полезного средства ввиду отсутствия статистического критерия, разработанного для проверки нескольких выбросов вместе. Критерий Кохрена не разрабатывался для данной цели, и выводы при его повторном применении необходимо делать с большой осторожностью. Так же осторожно нужно использовать критерий Кохрена в случаях, когда результаты, характеризующиеся высокими значениями стандартных отклонений (в особенности если они имеют место в пределах лишь одного из уровней), представлены двумя или тремя лабораториями. С другой стороны, если на различных уровнях в пределах одной лаборатории обнаруживается несколько квазивыбросов и/или статистических выбросов, то это может быть веским указанием на то, что внутрилабораторная дисперсия слишком высока, и данные этой лаборатории должны быть полностью исключены.
7.3.4 Критерий Граббса
7.3.4.1 Проверка на один выброс
Для проверки, не является ли выбросом наибольшая величина из расположенных в порядке возрастания совокупности данных ( = 1, 2, ..., ), вычисляют статистику Граббса по формуле
, (9)
где
; (10)
. (11)
Для проверки значимости наименьшего результата наблюдения вычисляют тестовую статистику
.
a) В случае, если значение тестовой статистики меньше (или равно) 5%-ного критического значения, тестируемую позицию признают корректной.
b) В случае, если значение тестовой статистики больше 5%-ного критического значения и меньше (или равно) 1%-ного критического значения, тестируемую позицию называют квазивыбросом и отмечают одной звездочкой.
c) В случае, если значение тестовой статистики больше 1%-ного критического значения, тестируемую позицию называют статистическим выбросом и отмечают двумя звездочками.
7.3.4.2 Проверка на два выброса