Сергей.Мишенёв.блог

Теория информации помогла лингвистам ответить на вопросы, которые ранее считались некорректными

У нас существуют субъективные представления о сложности языков. Если спросить человека на улице, какие языки самые сложные, то, скорее всего, получим в ответ стандартный набор: китайский, японский, арабский. В первую очередь такой ответ обусловлен тем, что это языки с непривычной нам письменностью. Но это малоинтересно лингвисту, потому что письменность по отношению к устному языку вторична.

Кроме того, стереотипы о сложности языков часто связаны с представлениями о том, что языки, близкородственные нашему — простые, а далекие от него — сложные. Например, носитель русского языка будет считать, что сербский язык — это очень просто, а эстонский язык — это очень сложно. Но финнам, для которых эстонский язык является близкородственным, потому что это тоже один из финно-угорских языков, он наоборот покажется простым, а сербский — сложным.

Однако лингвистическое изучение языковой сложности ставит перед собой задачу найти объективные критерии. Данная область науки начала активно развиваться только в последние 20-25 лет. Раньше же лингвисты просто принимали за аксиому мнение, что все языки имеют равную сложность. В каком-то смысле это было полезно, потому что позволяло не превозносить одни языки над другими, то есть не выносить ценностных суждений.

Как измерять сложность, не вполне понятно. И здесь лингвистика пользуется идеями, которые пришли из теории информации. Отечественный математик Андрей Николаевич Колмогоров ввел формальное определение сложности (так называемая колмогоровская сложность).

Сложность некоторого объекта — это длина наиболее экономного описания этого объекта на каком-то формализованном языке.

Например, если у нас есть последовательность символов АББВАББВБВБАБА, то эту последовательность никак экономно описать нельзя. Если у нас есть последовательность АБАБАБАБАБАБ, она описывается так: АБ х 6. И, соответственно, первая последовательность сложная, вторая — более простая. Но к реальности это плохо применимо, и приходится искать какие-то корреляты языковой сложности, которые можно измерить, чтобы вычислить, какие языки все-таки сложнее, а какие проще.

Таких коррелятов сложности можно найти довольно много. Во-первых, это разнообразие элементов. Например, если в одном языке 8 согласных, а в другом — 60, то очевидно, что первый язык по системе согласных проще, чем второй. Во-вторых, важная вещь — это невзаимнооднозначное соответствие между формой и значением на уровне грамматики. Например, если одна и та же форма в некотором языке образуется десятью разными способами, то это сложнее, чем если эта форма образуется только одним способом. Скажем, в английском языке множественное число у 99% существительных образуется при помощи одного и того же окончания -s, а в немецком имеется несколько моделей склонения: например, Turm «башня» во множественном числе выглядит как Türme, а Wurm «червяк» — как Würmer, и эту разницу никак не объяснить.

Еще один коррелят сложности — это невзаимнооднозначность соответствия между формой и значением на уровне текста, то есть, если одно и то же значение выражается в тексте несколько раз. Скажем, как устроено в языках согласование. Если мы возьмем по-английски словосочетание «новый компьютер», оно выглядит как the new computer, а «новые компьютеры» — the new computers. Здесь множественное число выражается один раз в окончании существительного. А в русском языке значение множественного числа выражается два раза: и в окончании прилагательного, и в окончании существительного. То есть русский язык в этом отношении сложнее английского, потому что в нем нет взаимнооднозначного соответствия между значением множественного числа и его выражением в тексте.

Зачем все это нужно? Ведь язык — это продукт эволюции, ему уже примерно 100 000 лет, и если бы это все были какие-то избыточные переусложнения, то они бы уже давно устранились.

Но этого не происходит, потому что языковая сложность бывает так или иначе выгодна либо говорящему, либо слушающему, либо им обоим.

Например, разнообразие элементов позволяет продуцировать более короткие тексты. Скажем, если в языке 8 согласных, то в нем слова в среднем будут длиннее, чем в языке, в котором 60 согласных. А согласование создает избыточность, которая выгодна слушающему: если он не расслышал окончание существительного, окончание прилагательного поможет ему понять, какое число имелось в виду.

Общепризнанная количественная мера сложности пока не выработана. Обычно берут разные параметры: количество звуков, количество падежей, количество глагольных времен и так далее — и пытаются найти меру, которая все это учтет. Шкалы такого рода обычно позволяют довольно легко (поскольку данные про количество звуков, падежей и глагольных времен уже собраны) хотя бы в первом приближении понять, какие языки проще, какие сложнее. А иногда сложность пытаются мерить по текстам.

Интересный метод предложил в 1998 году американский исследователь Патрик Юола. Поскольку к оценке колмогоровской сложности хорошо приближаются программы-архиваторы, он предложил пропустить через архиватор переводы одного и того же текста на несколько языков (проделав над ними небольшие преобразования) и сравнить результаты. Языков в его выборке было шесть, и рейтинг сложности получился такой: маори < английский < нидерландский < французский < русский < финский.

Но упорядоченный по сложности список языков не самоцель. Интереснее скоррелировать сложность с другими параметрами. Недавние исследования, например работы британца Питера Традгилла, показывают, что абсолютная сложность языка очень тесно связана с ситуацией бытования этого языка, с социолингвистикой. Оказалось, что более простые языки — это обычно языки с бОльшим количеством носителей, языки международного общения, а вот более сложные языки — это как раз языки, круг носителей которых ограничен.

Когда лингвисты попытались понять, с чем это может быть связано, было высказано такое предположение: широко распространенные языки, например английский, многими людьми изучаются уже во взрослом возрасте.

Естественно, эти люди что-то недовыучивают, потому что сложные языковые явления взрослыми обычно усваиваются плохо.

И вот если такие взрослые передают выученный язык своим детям, то он будет передаваться уже в некоторой упрощенной форме. Именно так, по-видимому, происходило и происходит упрощение крупных языков межнационального общения.

Взято отсюда

Сергей.Мишенёв.блог

Какой язык самый сложный?

Какой язык самый сложный?