Критерий Неймана-Пирсона применяется в двоичных системах в ситуациях, когда невозможно определить априорные вероятности отдельных сообщений, а последствия ошибок разного рода неодинаковы. Такая ситуация типична для радиолокации, где осуществляется зондирование пространства узким радиолучом и прием отраженного от цели сигнала. При этом имеют место две ситуации: 1) наличие цели – колебание на входе приемника содержит сигнал в аддитивной смеси с помехой (с неизвестной априорной вероятностью P (b 1)), 2) отсутствие цели – на входе приемника действует одна помеха (с вероятностью P (b 0) = 1 – P (b 1)). Задача приема – обнаружение сигнала на фоне помех. При ее реализации возможны два вида ошибок:

1) пропуск цели (цель есть, но отраженный сигнал не обнаружен) с условной вероятностью ;

2) ложная тревога (цель отсутствует, но принято решение о наличии отраженного сигнала) с условной вероятностью .

Очевидно, что последствия этих ошибок сильно различаются.

В таком случае целесообразно стремиться к уменьшению условной вероятности ошибки, вызывающей особо тяжелые последствия (пропуск цели), что можно сделать только за счет увеличения вероятности ошибки другого вида (ложной тревоги). Ясно, что это можно делать до определенной степени, т. к. слишком большая вероятность ложной тревоги приведет к ощутимым экономическим потерям и к подрыву доверия к системе в целом. Разумный выход – зафиксировать вероятность ложной тревоги на выбранном уровне ε

, (6.8)

и затем минимизировать вероятность пропуска цели

Минимизация (6.9) при заданной величине (6.8) достигается, если решение о наличии цели принимается при выполнении неравенства

,

где λ(ε) – пороговый уровень, определяемый заданной вероятностью ложной тревоги.

Контрольные вопросы

1. Сформулируйте задачу оптимального приема дискретных сообщений.

2. Дайте геометрическую трактовку задаче оптимального приема дискретных сообщений.

3. Что называют правилом решения (решающей схемой) демодулятора?

4. Что такое идеальный (оптимальный) приемник дискретных сообщений?

5. Что понимают под потенциальной помехоустойчивостью приема дискретных сообщений?

6. В чем суть теории потенциальной помехоустойчивости? Когда и кем были заложены ее основы?

7. Какой смысл вкладывают в понятие критерия качества приема дискретных сообщений? Перечислите известные Вам критерии.

8. В чем суть критерия идеального наблюдателя (критерия Котельникова)?

9. Укажите особенности критерия Котельникова.

10. Что представляет собой критерий максимального правдоподобия? Как он соотносится с критерием Котельникова?

Критерий Неймана-Пирсона

Пусть Зададимся допустимым значением вероятности, после чего будем искать такую границу между образами, при которой достигается минимум.

Пусть требуется. Нужно решить задачу нахождения

Ясно, что решение удовлетворяет условию Действительно, при возрастает, то есть становится не минимально возможным, а при нарушается ограничение. Как и в минимаксном методе, найти аналитически удаётся лишь в простейших случаях.

Последовательные процедуры распознавания

Если в ранее рассмотренных методах распознавания принятие решения о принадлежности объекта тому или иному образу осуществлялось сразу по всей совокупности признаков, то в данном разделе мы обсудим случай последовательного их измерения и использования.

Пусть. Сначала у объекта измеряется и на основании этой информации решается вопрос об отнесении этого объекта к одному из образов. Если это можно сделать с достаточной степенью уверенности, то другие признаки не измеряются и процедура распознавания заканчивается. Если же такой уверенности нет, то измеряется признак и решение принимается по двум признакам: и. Далее процедура либо прекращается, либо измеряется признак, и так до тех пор, пока либо будет принято решение об отнесении объекта к какому-либо образу, либо будут исчерпаны все признаков.

Такие процедуры чрезвычайно важны в тех случаях, когда измерение каждого из признаков требует существенных затрат ресурсов (материальных, временных и пр.).

Пусть и известны где Заметим, что если известно распределение то известны и все распределения меньшей размерности (так называемые маргинальные распределения). Например,

Пусть измерено признаков. Строим отношение правдоподобия Если, то объект относим к образу, если, то к образу. Если же, то измеряется признак и вычисляется отношение правдоподобия и т.д.

Понятно, что пороги и связаны с допустимыми вероятностями ошибок распознавания. Добиваясь выполнения неравенства, мы стремимся к тому, чтобы вероятность правильного отнесения объекта первого образа к была в раз больше, чем ошибочное отнесение объекта второго образа к, то есть или. Поскольку, то (верхний порог). Аналогичные рассуждения проводим для определения. Добиваясь выполнения неравенства, мы стремимся к тому, чтобы вероятность правильного отнесения объекта второго образа к была в раз больше, чем неправильного отнесения объекта первого образа к, то есть

(нижний порог).

В последовательной процедуре измерения признаков очень полезным свойством этих признаков является их статистическая независимость. Тогда и нет необходимости в хранении (а главное - в построении) многомерных распределений. К тому же есть возможность оптимизировать порядок следования измеряемых признаков. Если их ранжировать в порядке убывания классификационной информативности (количество различительной информации) и последовательную процедуру организовать в соответствии с этой ранжировкой, можно уменьшить в среднем количество измеряемых признаков.

Мы рассмотрели случай с (два образа). Если, то отношений правдоподобия может строиться, например такого вида: Останавливающая граница (порог) для -го образа выбирается равной Если, то -й образ отбрасывается и строится отношений правдоподобия и порогов. Процедура продолжается до тех пор, пока останется неотвергнутым только один образ или будут исчерпаны все признаков. Если в последнем случае остались неотвергнутыми более чем один образ, решение принимается в пользу того из них, для которого отношение правдоподобия максимально.

Если образов два () и число признаков не ограничено, то последовательная процедура с вероятностью 1 заканчивается за конечное число шагов. Доказано также, что при заданных и рассмотренная процедура при одинаковой информативности различных признаков даст минимум среднего числа шагов. Для последовательную процедуру ввёл Вальд и назвал её последовательным критерием отношения вероятностей (п.к.о.в.).

Для оптимальность процедуры не доказана.

При известных априорных вероятностях можно реализовать байесовскую последовательную процедуру, а если известны затраты на измерения признаков и матрица штрафов за неверное распознавание, то последовательную процедуру можно остановить по минимуму среднего риска. Суть здесь заключена в сравнении потерь, вызванных ошибками распознавания при прекращении процедуры, и ожидаемых потерь после следующего измерения плюс затраты на это измерение. Такая задача решается методом динамического программирования, если последовательные измерения статистически независимы. Более подробные сведения об оптимизации байесовской последовательной процедуры можно почерпнуть в рекомендованной литературе .

Ситуация, в которой практически невозможно определить априорную вероятность передачи отдельных элементарных сообщений, а последствия ошибок разного рода неодинаковы, типична для радиолокации, когда приёмник, анализируя принимаемое колебание z (t ) (отражённый сигнал плюс помеха), должен определить, имеется в данном направлении и на данном расстоянии объект наблюдения (цель) или нет. Как правило, априорная вероятность наличия отражённого от цели сигнала (передачи 1) заранее не известна. Последствия двух родов ошибок - ложной тревоги (приемник фиксирует, что цель существует, в то время как в действительности её нет) и пропуска цели (приёмник отмечает отсутствие цели, в то время как фактически она имеется) - неравноценны.

В этой и других сходных ситуациях чаще всего пользуются критерием приёма, известным под названием критерия Неймана-Пирсона. Суть его заключается в том, что решающая схема считается оптимальной, если при заданной вероятности ложной тревоги р ЛТ обеспечивается минимальная вероятность пропуска цели р прц . Введём в рассмотрение функции правдоподобия гипотезы об отсутствии цели w (z|0)и о наличии цели w (z|1)

Очевидно, что можно различными способами разбить пространство принимаемых колебаний z(t ) на две области: B 0 (область решения об отсутствии цели) и B 1 , (о наличии цели) -так, чтобы вероятность ложной тревоги

равнялась заданной величине. Поскольку в локации символ 0 (отсутствие цели) передаётся паузой, то w (z |о) - это плотность распределения помехи. Следовательно, вероятность ложной тревоги определяется вероятностными характеристиками помехи и выбором области B 1 . Но от выбора этой области зависит и вероятность правильного обнаружения цели:

где p прц - вероятность пропуска цели.

Интегралы в (16), (17) и в аналогичных других формулах, взятые по векторной переменной, очевидно, многократные.

Максимизация (17) при заданной величине (16) достигается, если решение о наличии цели принимается при выполнении неравенства

где l - пороговый уровень, определяемый заданной вероятностью ложной тревоги р ЛТ.

Существуют и другие критерии качества приёма, не требующие знания априорных вероятностей символов.

В технике связи преимущественно применяют правило максимального правдоподобия (12), (13). В том случае, когда все символы передаются равновероятно, правило максимального правдоподобия реализует критерий идеального наблюдателя. Однако очень часто это правило решения применяют и при неизвестных или известных, но не одинаковых априорных вероятностях символов. Конечно, оно не обеспечивает в этих случаях максимума вероятности правильного приёма. Изменив решающую схему на схему, построенную по правилу максимальной апостериорной вероятности (6), реализующему критерий идеального наблюдателя, можно было бы уменьшить вероятность ошибок. При этом, очевидно, пришлось бы сократить области приёма маловероятных и расширить области высоко вероятных символов. В результате редко передаваемые символы принимались бы менее надёжно, нежели часто передаваемые. Но редкие символы несут больше информации, чем частые. Поэтому переход от правила максимального правдоподобия к правилу максимальной апостериорной вероятности, хотя и уменьшает безусловную вероятность ошибки, может привести к увеличению потери информации при демодуляции. Легко показать, что правило максимального правдоподобия, реализует критерий минимума среднего риска (15), если положить L ij = 0 при i=j и L ij = 1/p (b i ) при j¹i.

Заключение

Выбор критерия качества приема определяет порядок разбиения пространства принимаемых сигналов, т.е. выбор оптимальной решающей схемы приёмного устройства.

В технике связи преимущественно применяют правило максимального правдоподобия, решающую схему которого называют оптимальной.

Разработал

Доктор военных наук, профессор

Обычно в приёмных устройствах демодулятору предшествуют усилители и преобразователи частоты. Здесь все они считаются включёнными в состав канала. В ряде случаев именно они являются основными источниками аддитивных помех канала.

Начало этого отрезка для удобства совместим с началом координат. В принципе интервал анализа на приёме не всегда совпадает с тактовым интервалом Т (см. ниже). Сигналы на тактовом интервале часто будем называть элементом сигнала.

В математической теории связи это разбиение и называют решающей схемой. Заметим, что в некоторых случаях пользуются решающей схемой со стиранием, или отказом от решения. Это значит, что m областей не охватывают всего пространства сигналов и если приходящий сигнал не попадает ни в одну из этих областей, то принимается решение о стирании либо о невозможности определить передаваемый символ.

Вместо неравенств (12) можно было бы просто записать w (z|b i )> w (z|b j ) Сравнение отношений правдоподобия вместо сравнения условных плотностей вероятностей вызвано тем, что понятие отношения правдоподобия можно распространить и на сигналы из бесконечномерного гильбертова пространства, для которых понятие плотностей вероятности w (z|b i ,), w (z|b j ) теряет смысл.

В ряде случаев разные ошибки могут приводить к разным последствиям.

Например: в системах автоматической пожарной сигнализации значительно опаснее пропустить сигнал о «пожаре», чем сыграть «ложную» тревогу, когда на самом деле пожар отсутствует.

Такого рода последствиями характеризуются системы радиолокации и гидроакустики. Гораздо большие последствия будет иметь пропуск воздушной или подводной цели, которая может применить оружие по объекту. Объявление ложной тревоги не повлечет за собой ровным счетом ничего.

Итак, в ситуациях, когда невозможно определить априорную вероятность передачи отдельных сообщений, а последствия возникновения различных ошибок неодинаковы, применяют критерий Неймана-Пирсона .

Согласно критерию Неймана-Пирсона приемник является оптимальным в том случае, если при заданной вероятности ложной тревоги (ошибочное обнаружение цели, когда она фактически отсутствует), он обеспечивает минимальную вероятность пропуска цели . Заметим, что хотя здесь речь идет об обнаружении или необнаружении цели, на самом деле следует говорить о приеме или неприеме соответствующего сигнала.

Введем в рассмотрение функции правдоподобия гипотез о наличии цели и отсутствии цели . В соответствии с этим все пространство принимаемых решений можно разделить различными способами на две области: - область решения об отсутствии цели и – область о ее наличии. При этом найдется оптимальный способ разделения, который обеспечит равенство вероятности ложной тревоги при некоторой наперед заданной величине (эпсилон), т.е.

; (3.1)

где: – плотность распределения помехи, так как символ « » соответствует в данном случае отсутствию сигнала о цели.

Иными словами, вероятность ложной тревоги определяется вероятностными характеристиками помехи и выбора области . С другой стороны задание этой области определяет вероятность правильного обнаружения цели:

Если величина известна, то максимум вероятности правильного обнаружения цели достигается при выполнении неравенства

Критерий Неймана - Пирсона

Одним из недостатков критерия Жака - Бера является го, что он ориентирован на решение вопроса о нормальности

распределения на основе только внешних статистических характеристик выборки моментного типа. На практике значительный интерес представляет изучение внутренней структуры выборки. Для этой цели используется аппарат частотных характеристик, включающий в себя определение и анализ значений абсолютных, относительных и накопленных эмпирических частот.

Исследование внутренней структуры выборки начинается с выделения классов однородности, количество которых может быть определено с помощью формулы Стёр- джеса (8.4). Количество элементов выборки, попадающих в каждый из К классов, определяет значения абсолютных эмпирических частот В., i = 1,К.

Каждому классу соответствует интервал выборочных значений, ширина которого (одинаковая для всех интервалов) определяется следующим образом:

где Д = (x max - x min ) - размах варьирования фактора X.

Границы интервалов }