Теорема шифрацииЛюбой, кто когда-либо использовал в работе на персональном компьютере, программы-архиваторы, отлично знает, как легко они способны ужать текстовые файлы, не теряя при этом ни бита информации. Их работа наилучшим образом подтверждает теорему
шифрации в действии. Поскольку для русского текста, транслиремого только прописными буквами, Н=4.43, это значит, что по большому счету
в русском алфавите вполне возможно было бы обойтись всго навсего 22 буквами и на
45% уменьшить размер файлов в формате ASCII.
В связи с эим, сообщения языка занимают места гораздо больше, чем это на самом деле необходимо. Такое
явление принято называть избыточностью языка. Благодаря ему изменения
отдельных знаков сообщения чаще всего не меняют содержания,
что произошло бы при отсутствии такой избыточности. Заметим, что у персонального
компьютера наиболее регулярно встречающиеся знаки - ETOANIRSHDLU (даны здесь
в порядке уменьшения частот в английском языке) размещены в центре
клавиатуры, для того чтобы при печати текстов движение пальцев человека было бы наименьшим.
Подобное размещение клавиш было предложено автором линотипа Оттомаром Мергенталером, который воспользовался избыточностью языка для облегчения печати. Заявление, что вероятность проявления буквы в связном
тексте никак не зависит от его истории, является неправильным и статистически, и филологически. Уже давно давно графоманы заметили, что чаще всего за
согласной буквой идет гласная и наоборот. Из-за этого
в конце 19 века российский математик Марков выдвинул предложение
рассматривать текст как цепь знаков, в которой вероятность проявления символа зависит от предыстории.
|