Критерии определения естественностиСамым простым на первый взгляд критерием, который может прийти в голову, является
использованием алфавита фрагмента сообщения. Учитывая то, что в нем теоретически
могут встречаться только знаки препинания, числа, заглавные и строчные
русские буквы, в тексте фрагмента сообщения может встретится не больше
половины комплекта кодовой таблицы ASCII.
Это означает, что встретив в фрагменте
текста недопустимый знак компьютеру можно определенно заявить о том, что он
не является осмысленным - ошибки второго рода при этом практически исключены при хорошо функционирующем канале связи.
Для того, чтобы уменьшить теоретическую возможность
"ложных тревог" до обозначенной в предыдущей статье величины, нам необходимо, чтобы фрагмент сообщения
состоял не меньше чем из двадцати трех знаков. Вопрос усложняется, в том случае,
если используемый код букв не является избыточным, как представление в
ASCII русского текста, а содержит в себе ровно столько знаков, сколько
их существует в алфавите.
В таком случае нам придется ввести оценку по теоретическим возможностям попадания символов в тексте. Для того, чтобы обеспечить принятые нами возможности ошибок
первого и второго рода, при оценивании максимально возможной правдоподобности,
нужно проанализировать уже около 100 знаков, а анализ возможности встречи биграмм всего лишь немного уменьшает эту величину.
Поэтому, короткие фрагменты сообщений при большой величине ключа вообще практически
невозможно раскодировать однозначно, поскольку проявляющиеся
случайные фрагменты текста вполне могут совпасть с имеющими смысл фразами. Такую же задачу необходимо решать и при контроле качества криптографии. В данном случае, правда, возможность ложной тревоги
вполне можно увеличить, сделав ее не свыше одной тысячной, при такой же
самой возможности игнорирования фрагмента сообщения. Что позволит нам ограничиваться
для проверки текстов лишь двадцатью-тридцатью знаками.
|