Структура текстаЯзык существенно влияет на структуру текста и его понимание.
Однако, даже определившись языком сообщения, бывает подчас трудно
решить сколько букв будет составлять алфавит: латинский
насчитывает 24-25 букв, а русский 31-32. Неоднозначность
возникает потому, что при письме часть букв заменяют другими,
сходными по звучания или написанию. Обычно русскую букву Е в
письме заменяют на букву Е, а букву Й на И. Каждый язык имеет
свой специфический алфавит, но, увы не единственный. Так, хотя
болгарский и русский алфавиты, происшедшие от кириллицы, почти
одинаковы, но в болгарском нет букв Е, Ы, Э. Поэтому, набирая
попеременно то русский, то болгарский тексты, обычно держатся
лишь русского алфавита, включающего в себя болгарский.
Сложнее всего дело с алфавитом обстоит в Европе на территории
эксреспублики Югославии, где для сербохорватского языка давно
используются сразу две основные системы письменности. Одна из
них, вуковица, названная по имени Вуко Кароджича, является
подвидом кириллицы и употребляется главным образом сербами,
другая же, гаевица, представляет подвид латиницы и используется
хорватами. Соответствие между буквами вуковицы и гаевицы
неоднозначно, поскольку сербской букве, обозначающей звук ДЬ,
отвечают две, или даже три хорватские. Но это еще не все. Есть,
как минимум, два варианта сербохорватского произношения: екавский
и экавский, которые различно отображаются на письме. Из этого
примера хорошо видно, что справиться с неопределенностью языка
сообщения без его знания вовсе непросто. По этому поводу Герман
Вейль удачно привел двустишие Готфрида Келлера: "Что это значит -
каждый знает, кто во сне верхом скакал без коня." По этой причине
язык сообщений криптологи считают заранее известным и алфавит его
фиксированным. Интересно заметить, во время Второй мировой войны
сделать свои шифровки нечитаемыми для японцев американцы смогли
довольно простым путем: они набирали криптографов из небольшого
индейского племени Навахо и те вели секретную связь только на
своем родном языке.
|