ЧАСТЬ II
ЛИНГВИСТИЧЕСКИЕ МОДЕЛИ
Глава 1
ПОНЯТИЕ ЛИНГВИСТИЧЕСКОЙ МОДЕЛИ
В предыдущей части книги мы уже использовали, правда без каких-либо пояснений, термин «лингвистическая модель». Теперь мы должны будем рассмотреть это понятие гораздо более подробно, так как оно является центральным в современной структурной лингвистике, которую можно определить как науку о моделях языка по преимуществу.
Необходимость в моделировании возникает во всех тех научных областях, где объект науки недоступен непосредственному наблюдению. В таких случаях он обычно уподобляется некоему «черному ящику» о котором известно только, какие начальные материалы он получает «на входе» и какие конечные продукты он выдает «на выходе». Задача состоит в том, чтобы узнать содержимое «черного ящика» — тот скрытый от исследователя механизм, который осуществляет переработку исходных материалов в конечные продукты. Поскольку невозможно разобрать «черный ящик», не нарушив одновременно его функционирования, остается единственный путь к познанию нашего объекта: мы должны на основе сопоставления исходных и конечных данных построить исходный образ объекта, то есть выдвинуть гипотезу о6 его возможном устройстве и реализовать ее в виде логической машины, способной перерабатывать некоторый материал точно так же, как это делает сам «черный ящик». Если наше логическое устройство действительно функционирует аналогичным образом, оно является аппроксимацией, или моделью объекта, и мы можем считать, что заложенный в него механизм во всех существенных деталях совпадает с механизмом, содержащимся в «черном ящике». Мы добиваемся понимания механизма, недоступного нашему наблюдению, уподобляя его механизму, устройство которого нам хорошо известно. Таким образом, смысл моделирования состоит в том, чтобы вместо скрытых от нас свойств объекта изучить заданные в явном виде свойства модели и распространить на объект все те законы, которые выведены для модели.
Первоначально проблема «черного ящика» возникла в электротехнике, но аналогичная ситуация имеет место во многих других областях, например в физиологии высшей нервной деятельности и атомной физике: мы не можем наблюдать непосредственно ни деятельности мозга, ни процессов, протекающих в атоме. В этом отношении положение лингвиста ничем не отличается от положения физиолога или физика: единственной реальностью, с которой лингвист непосредственно имеет дело, является текст, а интересующие его механизмы языка, лежащие в основе речевой деятельности человека, не даны ему в прямом наблюдении. Поэтому и в лингвистике одним из основных средств познания объекта является построение моделей.
Рассмотрим некоторые наиболее важные свойства моделей, в том числе лингвистических.
1.Моделировать можно только такие явления, существенные свойства которых исчерпываются их структурными (функциональными) характеристиками и никак не связаны с их физической природой. Круг таких явлений, по-видимому, гораздо более широк, чем думали раньше. Некоторые авторитетные исследователи относят к их числу даже процессы жизни и мышления.
Если верно соссюровское понимание языка, то к числу явлений, существенные признаки которых сводятся к их функциональным, или структурным, свойствам, относится и язык.
Моделью объекта для которого существенными являются только его функциональные свойства, должно считаться любое устройство, функционально похожее на него. Иными словами, от модели требуется только, чтобы ее поведение было похоже на поведение объекта: материал, в котором она может отличаться (и практически почти всегда отличается) от материала, из которого построен объект. «Моделирование способа организации материальной системы,— пишет по этому поводу А. Н. Колмогоров,— не может заключаться ни в чем ином, как в создании из других материальных элементов новой системы, обладающей в существенных чертах той же организацией, что и система моделируемая». С этой точки зрения совершенно не обязательно было бы требовать, чтобы, например, модель русского спряжения была непременно реализована в той же субстанции, что и сам объект (русское спряжение), т. е. закодирована состояниями нервных клеток мозга; она с равным успехом может быть записана карандашом на бумаге или набита на перфокарты и реализована в виде импульсов в электронной вычислительной машине. Во всех этих случаях содержащиеся в ней правила должны быть признаны правилами русского спряжения, если результаты ее работы во всех существенных деталях совпадают с соответствующими результатами деятельности человеческого мозга.
Функциональная точка зрения интересна потому, что делает задачу научного описания мира задачей конечной сложности. Выделение структурных свойств объекта в качестве наиболее существенных его свойств позволяет создать теорию данной структуры, равно применимую к объектам любой физической природы, если в их основе лежит та же структура. Таким образом, исследователь избавляется от необходимости придумывать новую теорию всякий раз, когда он сталкивается с реализацией той же структуры в новой субстанции. Установив, что в каких-то отношениях еще не изученный объект ведет себя так же, как объект, хорошо изученный и обеспеченный теорией, исследователь может попытаться распространить эту теорию (со всеми доказанными в ней теоремами) на первый объект, даже если субстанциально эти объекты совершенно непохожи друг на друга. В качестве классического примера обобщения такого рода можно привести теорию колебаний: колеблющиеся системы описываются одной и той же моделью (одними и теми же уравнениями) независимо от того, являются ли колебания акустическими, механическими или электромагнитными.
Влияние этих идей испытала в последнее время и лингвистика; в частности, Н. Хомский, основоположник современной структурной (математической) лингвистики, показал, что так называемые «порождающие грамматики», во всяком случае некоторые их типы, могут рассматриваться как конечные автоматы, и поэтому к ним применима хорошо разработанная в математике теория конечных автоматов.
Все другие свойства модели связаны с тем ее основным свойством, что она является функциональной аппроксимацией объекта.
2. Модель всегда является некоторой идеализацией объекта. Реальные явления очень сложны. Чтобы понять эти сложные явления, необходимо начать с изучения самых простых и общих случаев, даже если они никогда не встречаются в чистом виде, и от них продвигаться к более, сложным и специальным случаям. Этот прием не нов. Он знаком всем нам со школьных лет, когда мы решали задачи по физике и химии — не реальные задачи, которые ставит перед исследователем природа, а искусственные и упрощенные логические загадки, в которых описываются идеальные ситуации, практически не встречающиеся в чистом виде. Решая эти упрощенные задачи, в которых мы имели дело лишь со схемами вещей, мы тем не менее усваивали не научную фикцию, а важные теоретические истины.
На идеализации объекта основан существующий в криминалистике метод опознания преступника по его «словесному портретy» - описанию тех черт лица, которые связаны исключительно со строением черепа человека. В их число не входит цвет волос и кожи, цвет и выражение глаз и т. п.; оказывается, что ученый может ими пренебречь, хотя, например, для художника они представляют первостепенный интерес. Тот факт, что строение черепа и скелета определяет все существенные черты физического облика человека, был использован советским археологом и скульптором М. М. Герасимовым при разработке оригинального метода реконструкции внешности, с успехом применявшегося в археологии и криминалистике.
Чтобы понять механику движения, остававшуюся загадкой в течение тысячелетий, физики должны были предположить, что при отсутствии внешних влияний (трения, неровностей пути) становится возможным бесконечное движение тела по прямой линии, хотя практически такое движение никогда не может быть осуществлено, так как нельзя устранить все внешние влияния .
Мы привели эти примеры несомненно удачной идеализации объекта, заимствованные из самых различных областей интеллектуальной деятельности человека, в надежде на то, что на их фоне нижеследующие лингвистические примеры будут рассмотрены читателем без предупреждения.
Если попросить кого-либо привести пример атрибутивной связи в русском языке, то почти всегда будет дано словосочетание типа большой дом, красная роза, железная кровать. Мало вероятно, чтобы в качестве первого примера атрибутивной связи привели словосочетания типа прибавка четыре центнера, глубина 700 метров, стена длиной 600 метров, бег 500 метров и т. п. Было бы, конечно, хорошо создать теорию, объясняющую все типы атрибутивной связи, в том числе и те весьма редкие, хотя и развивающиеся типы, которые в настоящее время находятся на границах литературной нормы (ср. последние четыре примера, где более нормальными были бы словосочетания прибавка в четыре центнера, глубина в 700 метров, стена длиной в 600 метров, бег на 500 метров). Однако, если нет теории, объясняющей самые обычные и массовые типы атрибутивной связи, представляется вполне оправданной такая идеализация объекта, которая исключает подобные раритеты из картины русской грамматики.
Идеализация такого рода, неизбежно приводит к огрублению живого явлениями схематизации фактов (ср. метод «словесного портрета»), которую сторонники классического языкознания склонны считать недопустимым насилием над языком. Но без такой схематизации научное описание невозможно; научная концепция того или иного явления «скорее диаграмма, чем картина», и ученый, который стал бы настаивать на внесении в эту диаграмму всех фактов, касающихся данного явления, не смог бы справиться ни с одной научной задачей.
В рассмотренном нами случае некоторые реально существующие факты русской речи признаются «несуществующими». Гораздо чаще идеализация объекта сводится к тому, что признаются существующими некоторые реально не наблюдаемые факты. Мы рассмотрим ниже несколько примеров этого более классического типа идеализации.
Относительно давно известен в лингвистике принцип «подстановки», или «подразумевания», недостающих членов предложения, который представляет собой простейший случай идеализации лингвистических объектов. Принцип подстановки часто используется в синтаксисе при описании некоторых типов предложений, на первый взгляд совершенно изолированных и занимающих особое место синтаксической системе языкам. В качестве примера можно упомянуть два основных подхода к объяснению так называемых безличных предложений русского языка. В большинстве грамматик они рассматриваются как особый класс предложений, утративших связь с личными предложениями. С другой стороны, предпринимались попытки, начиная с М. В. Ломоносова и А. X. Востокова и кончая А. А. Шахматовым и В. А. Богородицким, истолковать их как результат эллипсиса, сфера действия которого в естественных языках, по-видимому, шире, чем принято было думать раньше. У В. А. Богородицкого, например, мы находим интересную мысль о том, что одночленные (безличные) предложения можно рассматривать как продукт сокращения нормальных двучленных предложений: Морозит – Мороз морозит . В современной лингвистике аналогичные соображения были с успехом использованы для принципиально нового описания соответствующего фрагмента русской грамматики (см. часть III).
Принцип подстановки является частным случаем более общего принципа конструирования фраз, не встречающихся в речи, но необходимых для объяснения всей совокупности языковых фактов. Так, для объяснения инфинитивных предложений с инфинитивом субъекта и объекта конструируются фразы типа Я хочу, чтобы я пил - Я хочу пить; Я велю, чтобы он пришел - велю ему прийти. Для объяснения сравнительных предложений типа Он выше меня рассматриваются предложения типа Он выше, чем я высок. Для объяснения придаточных определительных предложений типа Он встретил сына, которого не видел 20 лет конструируются предложения вроде Он встретил сына, которого сына он не видел 20 лет и т. п. Все это имеет глубокий лингвистический смысл; идеальные фразы, которые реально в речи не встречаются, в принципе могли бы существовать и часто отражают либо прошлые, либо будущие этапы развития языка. Некоторые из них, например Я хочу, чтобы я пил или Я велю, чтобы он пришел, являются вполне нормальными фразами, но только лишёнными естественности, идиоматичности, которая в глазах многих является основным признаком доброкачественности языкового материала. В связи с этим в правильном языковом материале стоит, по-видимому, различать то, что обычно говорят, и то, что может быть сказано, хотя обычно не говорится. По мнению С. Карцевского, трехчленная пассивная конструкция в русском языке является искусственным образованием, так как в естественной речи почти никогда не встречается; тем не менее грамматисты самых различных направлений признают пассивные предложения с творительным падежом действующего лица нормальным языковым, материалом. Известный английский грамматист Г. Суит рассматривал в своей «Новой английской грамматике, логической и исторической» глагольные формы I shall have been seeing, I shall have been being seen, практически не встречающиеся в естественных условиях, но выводимые по грамматическим правилам1. Любопытно, что, когда некий иностранец спросил у Г. Суита, можно ли сказать по-английски an elegant supper — «элегантный ужин», Г. Суит, будучи лингвистом, и притом последовательным, ответил, что английский язык — свободный, и сказать так можно, хотя он не припоминает случая, когда бы он сам назвал ужин элегантным.
Наиболее важным случаем идеализации лингвистического объекта является предположение, что число предложений в языке бесконечно и что длина предложения в принципе ничем не ограничена (т. е. возможны предложения, длина которых будет больше любой наперед заданной). Мы знаем, что фактически число написанных или произнесенных предложений на любом языке, конечно, хотя и очень велико; однако, чтобы объяснить способность говорящего строить совершенно новые, раньше никогда не произносившиеся и не писавшиеся предложения, мы должны рассмотреть не эту реально наблюдаемую ситуацию, а некоторую идеальную ситуацию, которая только и. может дать нам ключ к решению задачи. Точно так же, хотя все реально произнесенные и написанные фразы на любом языке были фразами конечной длины, в строе естественных языков нет правил, ограничивающих их длину. Ввиду важности этого последнего пункта мы подробно рассмотрим относящиеся к делу примеры.
В одном фельетоне, посвященном стилю литературно-критических статей, высмеивался некий вымышленный автор, громоздящий один родительный падеж на другой: Суть смысла темы раздела книги художника периода расцвета... Стилистически это словосочетание никуда не годится, но грамматика русского языка допускает построение и более длинных именных словосочетаний с последовательным подчинением существительных в родительном падеже, а словосочетания, содержащие 4—5 существительных, встречаются настолько часто, что даже не вызывают удивления, ср. Работники аппарата высшего органа законодательной власти республики... («Известия», 3/VI-64); Понимание необходимости сочетания уважения суверенитета ГДР... («Правда», 3/V-62).
Аналогичным „образом строятся словосочетания с последовательным подчинением инфинитивов, структурно родственные только что рассмотренным именным словосочетаниям, ср. Соединенные Штаты должны перестать пытаться различать диктаторов и демократические режимы... («Известия», 19/111-64). С. Карцевский приводит еще более любопытный пример, звучащий достаточно непринужденно даже с наращением еще одного (последнего) члена: Я не мог решиться поручить ему пойти просить вас пожаловать к нам отобедать.
Последним весьма продуктивным типом подчинительных словосочетаний, которые могут практически бесконечно расти в длину, являются атрибутивные словосочетания вида ее смеющийся старший брат, его старая железная двуспальная кровать2. "
До сих пор мы имели дело со словосочетаниями. Однако предложение может расти в длину и за счет своих собственных ресурсов. Оставляя в стороне тривиальный случай сложносочиненных предложений, укажем, что почти все типы сложноподчиненных предложений допускают грамматически ничем не ограниченный рост; ср. ложно-многозначительные штампы современной прозы вроде следующего: Причем вру и чувствую, что она понимает, что Я вру. И даже хуже: она понимает, что я понимаю, что она понимает, что я вру (С. Гансовский)
Итак, если устранить действие таких подобных трению в мире физической действительности факторов, как ограниченный объем человеческой памяти, ограниченная продолжительность человеческой жизни и т. п., то следует признать, что грамматические правила языка допускают построение предложений сколь угодно большой длины. Поэтому более «проницательной» и глубокой будет та грамматика, которая ориентируется на идеализированную ситуацию, а не та, которая исходит из реально наблюдаемого факта конечной длины предложений. Такая идеализация многократно упрощает описание: совершенно очевидно, что нельзя сформулировать простых правил, ограничивающих длину предложения, и очень сомнительна возможность сформулировать сложные правила такого рода, которые были бы конечными.
3. Обычно модель оперирует не понятиями о реальных объектах, а к о н с т р у к т а м и , т. е. Понятиями об идеальных объектах, не выводимыми непосредственно и однозначно из опытных данных, но построенными «свободно» на основании некоторых общих гипотез, подсказанных совокупностью наблюдений и исследовательской интуицией. Всякая модель является конструкцией, логически выведенной из гипотез с помощью определенного математического аппарата.
Прежде чем иллюстрировать это положение языковым материалом, мы сошлемся на бесспорный пример плодотворности рассматриваемого здесь принципа конструирования теоретических понятий, заимствованный из области физики. Известно, что непосредственно наблюдаемое нами пространство трехмерно. Однако в созданной А. Эйнштейном теории относительности рассматривается не трехмерное, а четырехмерное пространство, причем в современных интерпретациях этой теории за четвертую координату принимается не время, а мнимая величина (
, где с — скорость света, a t — время в секундах). В то время как измеренная в трехмерном пространстве длина отрезка получает различные значения в зависимости от скорости наблюдателя, длина отрезка, измеренная в четырехмерном пространстве, инвариантна (неизменна) относительно системы координат. «Многие законы приобретают в такой системе чрезвычайно простой вид, удобный для любых построений». Четвертое измерение теории относительности — это «удобный и наглядный прием изображения законов природы, позволяющий математически сформулировать связь, существующую между пространством и временем». Имея в виду подобные построения, А. Эйнштейн писал: «Я убежден, что чисто математические конструкции позволяют найти понятия и связывающие их законы, которые дают ключ к явлениям природы. Опыт, разумеется, может руководить нашим выбором нужных математических понятий, но он практически не может быть источником, из которого они вытекают. В известном смысле я считаю истиной, что чистая мысль способна ухватить реальное, как об этом мечтали древние»; «...именно в математике, — говорит он в другом месте, — содержится действительно творческий принцип».
Типичным конструктом в лингвистике является понятие нулевой флексии (или нулевого варианта флексии) для слов типа депо, шоссе; такие «нули» непосредственно не наблюдаются, но свободно конструируются исследователем для объяснения наблюдаемых фактов, в частности факта согласования этих слов с прилагательным в роде, числе и падеже. Укажем на еще один конструкт, издавна используемый в самых традиционных описаниях русского языка. Речь идет о грамматических категориях прилагательных и других согласуемых слов. Мы воспользуемся очень ясным изложением этого вопроса, принадлежащим А. А. Зализняку: «Необходимо учитывать, что признание у прилагательных и других согласуемых слов большего или меньшего числа категорий, по которым происходит согласование, не вытекает однозначно из фактов, а отражает определенные принципы описания. В самом деле, у русских прилагательных различаются не более 13 внешне различных словоформ (имеются в виду полные формы положительной степени), например: новый, -ая, -ое, -ого, -ой, -ому, -ую, -ым, -ою, -ом, -ые, -ых, -ыми. Известно, что в этих словоформах нельзя найти отдельного внешнего выражения для числа, или падежа, или рода, а все эти значения выражены синкретически. Поэтому вполне естественно следующее описание. Существует всего одна грамматическая категория прилагательных, по которой происходит согласование. Она принимает 13 различных значений, т. е. прилагательные имеют всего 13 грамматических форм. Правила выбора форм при атрибутивной связи задаются в виде таблицы, где каждому набору грамматических значений существительного соответствует номер формы прилагательного, например: в. ед. муж. одуш.—№ 4 (-ого). Такое описание дает максимально простую парадигму прилагательного, но сложные правила выбора формы подчиненного слова. Общепринятым является другое описание, а именно: прилагательному приписывают все те грамматические категории существительного, которые хотя бы в одном случае влияют на выбор формы прилагательного. 13 форм разносятся по 36 (а после признания категории одушевленности — по 72) клеткам. Получается более сложная парадигма, с многочисленными случаями омонимии, но зато достигается максимально простое правило выбора формы при атрибутивной связи: «грамматические значения прилагательного повторяют грамматические значения подчиняющего существительного» (откуда и само слово «согласование»). Как указал (устно) И. А. Мельчук, выбор второго решения в значительной мере определен также тем, что при субстантивации грамматические характеристики, приписываемые прилагательному в соответствии с этим решением, автоматически превращаются в одноименные характеристики существительного».
Следовательно, и в этой области современная структурная лингвистика развивает, весьма последовательно и решительно, принципы, не чуждые классическому языкознанию.
В идеале лингвистические конструкты суть понятия, построенные без непосредственного обращения к субстанции, фонетической или семантической, тех явлений, для изучения которых они созданы. Из этого, однако, не следует, что значение не может быть объектом лингвистической теории; поскольку основная функция языка состоит в том, чтобы передавать смысл, построение моделей семантики является «неотъемлемой частью полного описания языка». «Описать язык, не установив на каком-то этапе его значений,— говорил известный американский психолог и психолингвист Дж. Кэрролл,— это то же самое, что разработать код без ключа к нему» (см. также главу 2).
4. Всякая модель, в том числе лингвистическая, должна быть формальной. Модель считается формальной, если в ней в явном виде и однозначно заданы исходные объекты, связывающие их утверждения и правила обращения с ними (правила образования или выделения новых объектов и утверждений). В идеале всякая формальная модель является математической системой. Поэтому в некотором смысле понятие формальности равнозначно понятию математичности, точности, или однозначности3.
Формальность, точность, однозначность — это свойство языка, на котором излагается теория. Само по себе это свойство не обеспечивает совпадения предсказаний формальной теории с объективными экспериментальными данными. Точность теории делает возможной постановку недвусмысленных экспериментов, которые способны подтвердить или опровергнуть ее, но никакой необходимой логической связи между точностью и истинностью теории нет и не может быть.
Формальная модель связывается с опытными данными посредством той или иной интерпретации. Дать интерпретацию модели — значит указать правила, вероятностные или строгие, подстановки объектов некоторой предметной области, например языка, вместо объектов (символов) модели4.
Из того, что было сказано выше о свойствах модели как функциональной аппроксимации объекта, следует, что число возможных интерпретаций данной модели в принципе ничем не ограничено и, во всяком случае, больше одного. Пусть, например, в модели рассматриваются элементы а1, а2, а3, ..., аn и b1, b2, b3, ..., bm и цепочки вида aj ← bi, ai ← bi → aj, bi → aj и т.п. (стрелка показывает, что bi является главным, а ai и aj – зависимым элементом); модель может быть интерпретирована фонологически: вместо а1, а2, а3, ..., аn мы подставляем согласные, вместо b1, b2, b3, ..., bm — гласные и интерпретируем цепочки указанного вида как фонологические слоги с гласным в вершине слога. Модели может быть дана и грамматическая интерпретация. Тогда вместо а1, а2, а3, ..., аn мы подставляем группу существительного, вместо b1, b2, b3, ..., bm — группу глагола в личной форме и интерпретируем цепочки вида aj ← bi, ai ← bi → aj и т. п. как предложения со сказуемым в качестве его вершины (ядерного элемента).
В рассмотренном здесь примере модель интерпретировалась для различных предметных областей (фонологии и грамматики) внутри одного языка. Абстрактная модель может быть интерпретирована и на однотипном материале (например, грамматическом) разных языков. Представим, например, модель, в которой рассматриваются, в частности, элементарные символы N, V, A, D и производные символы N(N), N(V), N (A), N (D), V(N), V (V), V (A), V(D) и т. д. Интерпретируем N как основу непроизводного существительного, V — как основу непроизводного глагола, А — как основу непроизводного прилагательного, D — как основу непроизводного наречия. Тогда N(V) интерпретируется как основа инфинитива и отглагольного существительного на материале русского языка и как основа инфинитива, отглагольного существительного и герундия на материале английского.
Эти положения дают нам ответ на вопрос о том, каким образом свободные, или идеальные, математические конструкции могут объяснять поведение некоторых объектов вполне определенной природы. Модель, построенная для объяснения некоторого эмпирического материала, но не допускающая ни одной строгой интерпретации, является научной фикцией; она должна быть отброшена и заменена новой моделью. Модель тем эффективнее, чем шире ее предметная область, т.е. чем больше "число допускаемых ею "интерпретаций5.
5. Всякая интерпретированная модель, в том числе лингвистическая, должна обладать свойством экспланаторности, или объяснительной силы. Считается, что модель обладает этим свойством, если она 1) объясняет факты или данные специально поставленных экспериментов, которые необъяснимы с точки зрения старой теории, 2) предсказывает неизвестное раньше, но принципиально возможное поведение объекта, которое позднее подтверждается данными наблюдения или новых экспериментов. И в том и в другом случае объяснительная сила модели тем больше, чем полнее мера совпадения предсказаний с экспериментальными данными.
Классической иллюстрацией первого случая является специальная (частная) теория относительности А. Эйнштейна, объяснившая знаменитый опыт А. Майкельсона, результаты которого казались совершенно загадочными с точки зрения доэйнштейновой физики. Классическими иллюстрациями второго случая являются принадлежащая ему же общая теория относительности, основной вывод которой был подтвержден два года спустя после ее формулировки экспериментом А. Эддингтона; открытие Д. И. Менделеева, предсказавшего существование ряда в его время неизвестных элементов; теоретические расчеты У. Леверрье, из которых с неизбежностью вытекал вывод о существовании в солнечной системе еще одной планеты (Нептуна), позднее действительно открытой исследователями.
В лингвистике также есть прецеденты обоего рода. Ввиду исключительной важности рассматриваемого здесь вопроса мы остановимся на них несколько более подробно.
В 1946 году была опубликована широко известная статья Г. О. Винокура о русском словообразовании, в которой излагались, в частности, разработанные им принципы морфологического анализа производных слов. Для нас представляет интерес только анализ слов с уникальными основами типа малина, смородина, буженина, аптека и т. п. и слов с уникальными суффиксами типа пас-тух, жен-их, рис-унок, корол-ева, поп-адья, пе-сня, враж-да и т. п. Слова первого типа он считал непроизводными, несмотря на наличие семантически близких к ним слов с ясно выраженной делимостью на основу и аффикс, ср. буженина — баран-ина, свин-ина, телят-ина; аптека — фото-тека, карто-тека. Слова второго типа он считал
производными. «Неравноправие» уникальных основ и уникальных суффиксов Г. О. Винокур объяснял различием в значениях корневых и аффиксальных морфем. Значение аффикса является чисто дифференциальным; оно устанавливается в противопоставлениях типа пас--ти — пас, нес-ти — нес, пас-ти — пас-тух и т. п. В отличие от этого, для установления значения основы необходимо соотнести ее не с другой основой, а с чем-то вне языка; ее значение является не дифференциальным, а вещественным. Поскольку мы не знаем, какой предмет реального мира обозначается элементом бужен-, или мал-, или смород-, мы не можем выделить его в качестве первичной (непроизводной) основы слов буженина, малина, смородина. Чтобы такое разложение было возможно, необходимо существование хотя бы еще одного слова, где встречается данная первичная основа.
Два года спустя появилась полемическая статья А. И. Смирницкого, в которой излагались принципы морфологического анализа, реализующие другую содержательную гипотезу о структуре производных слов. А. И. Смирницкий исходил из того, что и у корней, и у аффиксов имеется дифференциальное значение (это не мешает ни тем, ни другим иметь и некоторое вещественное значение). Поэтому корень и аффикс в составе основы рассматривались им на равных основаниях. Общие условия разложимости основы были сформулированы А. И. Смирницким следующим образом: пусть дана основа L и внутри нее — звуковые отрезки А и В. Эти отрезки имеют значение (и, следовательно, основа L разложима), если 1) хотя бы один из них встречается не только в L, но и в какой-либо другой основе М с другим звуковым отрезком С или с нулем; 2) L и М относятся к таким предметам и явлениям, которые обладают отчетливо выделимыми общими признаками (общим значением): «... В результате осознания этих признаков образуется значение этого общего звукового отрезка, тогда как звуковые отрезки,— в том числе и нуль, — дифференцирующие основы L и М, неизбежно получают те значения, которыми осмысляются различительные признаки предметов, явлений и т. п., обозначаемых посредством L и М». Если в смород-ин-а и мал-ин-а -ин- значит «ягода», то мал- и смород- значат «то в малине и смородине, что отличает их друг от друга и от прочих ягод»6. Аналогичный, а иногда и буквально совпадающий анализ слов с уникальными основами мы находим в работах таких представителей структурной лингвистики, как Л. Блумфильд, Г. Глисон, Дж. Гринберг, 3. Харрис, Ч. Хоккет и др.7.
Итак, перед нами две разные миниатюрные теории, объясняющие некоторый кусочек языковой действительности, и на первый взгляд неясно, которую из них следует предпочесть. Мы должны были бы узаконить обе эти теории в качестве столь привычных для лингвиста «различных точек зрения по данному вопросу», если бы не существовало эмпирического материала, который одна из них объясняет, а другая нет. Теория Г. О. Винокура не объясняет широко известных по материалам самых различных языков фактов так называемого обратного словообразования. Существо процессов обратного словообразования можно пояснить с помощью уже приводившегося примера выделения слова зонт из слова зонтик. Это последнее было заимствовано из голландского языка (ср. zonnedek) и в русском языке было сначала простым по структуре. Позднее оно ассоциировалось с уменьшительными типа столик, мячик, шарик и т. п. и само стало восприниматься как уменьшительное. В результате оно разложилось на уникальную основу зонт- и уменьшительный суффикс -ик, причем тот факт, что основа со временем вошла в состав непроизводного слова зонт, свидетельствует об осознании самостоятельности ее значения («то в зонтике, что отличает его от столика, мячика, шарика и т. п.»). Аналогичным образом выделились в английском языке слова to beg («просить») из beggar («нищий») [или beguine (член нищенствующего ордена)] и to chauffe («водить машину», «быть шофером») из chauffeur («шофер»). И в том и в другом случае основы являются уникальными, так как существительные beggar, chauffeur были заимствованы из французского языка (ср. французские bag(h)ard, chauffeur) и не имели на английской почве никаких параллелей. Все эти факты непринужденно объясняются теорией А. И. Смирницкого и тех исследователей, которые придерживались аналогичных принципов морфологического анализа.
Перейдем к прецеденту второго рода — лингвистической теории, которая не только объясняет весь наличный материал, но и предсказывает до того не наблюдавшиеся факты. В качестве примера такой теории мы рассмотрим в несколько упрощенном виде соссюровскую концепцию ларингальных, уже упоминавшуюся нами на стр. 3—48. К этой концепции Ф. де Соссюр пришел в 1879 году, изучая индоевропейские чередования гласных. Эти чередования можно иллюстрировать следующими греческими примерами:
Настоящее
Перфект
Аорист
e
o
Ø
pétomai – "я лечу"
pepótēmai
eptómēn
ei
oi
i
píthō – "я убеждаю"
pépoitha
épithon
er
or
r
dérkomai – "я гляжу"
dédorka
’édrakon
Во всех случаях имеет место индоевропейское чередование е—о— Ø, причем гласный корня может быть осложнен звуками i, и, l, т, п, r. Чередование идет по двум признакам: 1) передние — задние гласные (е—о) (так называемое качественное чередование); 2) гласный полного образования — нуль звука (так называемое количественное чередование). Эта великолепная картина нарушается из-за следующих, правда, менее частотных чередований, где появляются долгие гласные и исчезает чередование «гласный — нуль звука»:
ā
ō
a
phāmí – "я говорю"
phōnế – "голос"
phatós – "сказанный"
hístāmi – "я кладу"
ststós – "положенный"
ср. лат. dāre – "давать"
dōnum – "дар"
datus – "данный"
stāre – "стоять"
ststus – "стояние"
Для объяснения этой нерегулярности выдвигались различные более или менее правдоподобные принципы, признание которых, однако, сильно усложняло картину. Ф. де Соссюр принял в качестве исходного наиболее обычный тип чередования е—о— Ø (где за гласным корня могут следовать указанные выше звуки). Он допустил, что в серии ā – ō – а долгие гласные звуки образовались в результате стяжения краткого гласного корня с каким-то неизвестным звуком, не давшим никаких рефлексов в исторически засвидетельствованных (к тому времени) языках. Этот звук, который мы условно обозначим буквой А, имел, по Ф. де Соссюру, качество ларингального сонанта (он называл его сонантическим коэффициентом), и его фонетический эффект состоял в том, что он обращал гласный корня в гласный заднего ряда типа [а] или [о]. Если в безударном положении гласный корня исчезал (нулевая ступень чередования), то ларингальный, являющийся, по предположению, сонантом, отражался либо в виде а, либо i. В сильно упрощенном виде этот процесс можно представить себе следующим образом:
pheAmi → phāmí
phAtos→ phatόs
histeAmi→ hístāmi
stAtos→ statόs
phoAne→ phōné
stAtus→ status
doAnum→ dōnum
dAtus→ datus9
«Преимущество такого анализа перед классическим,— пишет по этому поводу Л. Ельмслев,— состояло, во-первых, в том, что он давал более простое решение проблемы, устраняя так называемые долгие гласные из системы, а с другой стороны, в том, что получалась полная аналогия с чередованиями гласных, которые до тех пор рассматривались как нечто фундаментально отличное... Этот анализ был произведен исключительно по внутренним причинам, с целью проникнуть глубже в основную систему языка; он не был основан на каких-нибудь очевидных данных самих сравниваемых языков; он был внутренней операцией, произведенной в индоевропейской системе».
Ф. де Соссюру был 21 год, когда он написал свою работу10. Она опередила современную ему науку не менее чем на 50 лет. Лишь в 1927 году, после дешифровки хеттского языка, были обнаружены первые факты, предсказанные теорией Ф. де Соссюра. Е. Курилович указал, что хеттское ĥ является рефлексом индоевропейского ларингального сонанта, и привел следующие параллели, подтвердившие правильность теории: лат. pāscunt — «они защищают», зап.-тохарское pāskem — «они защищают», хет. pahsanzi — «они защищают»; в хеттском — краткий гласный с последующим ларингальным; лат. novāre — «делать новым», хет. newahh — «делать новым»; греч. laos — «армия», хет. lahha — «война».
Много примеров такого рода знает история лингвистической дешифровки. Ж. Ф. Шампольон дешифровал египетское иероглифическое письмо в 1824 году, но правильность предложенной им «модели» была бесповоротно подтверждена только в 1866 году, когда его последователь Р. Лепсиус нашел в Египте, в местечке Сан, камень с текстом на трех языках («Канопский декрет») и, переведя египетский текст на греческий язык по методу своего учителя, получил перевод, полностью совпавший с греческим текстом декрета. Подтверждение правильности дешифровки хеттского иероглифического письма, начатой Б. Грозным, было дано более 20 лет спустя X. Т. Боссертом, которому посчастливилось найти в 1947 году билингву с надписями, сделанными хеттским иероглифическим и финикийским письмом. Дешифровка линейного письма В, предложенная М. Вентрисом, была подтверждена несколько лет спустя У. Блегеном, который прочел, пользуясь методом М. Вентриса, табличку из Пилоса .
Во всех этих случаях имела место реконструкция исторических фактов, причем ее правильность подтверждалась материалом, который в силу тех или иных причин, чаще всего случайных, обнаруживался значительно позднее. Эта редкостно благоприятная экспериментальная ситуация, но без присущего ей элемента случайности легко проецируется и на синхронические исследования. С указанной точки зрения между диахроническими и синхроническими исследованиями есть лишь одно непринципиальное различие: в диахронических исследованиях реконструируются уже бывшие факты, а в синхронических исследованиях конструируются существующие и возможные будущие факты.
Это создает широкие возможности для экспериментов, на которые одним из первых обратил внимание Л. В. Щерба. Он считал, что задача лингвиста не исчерпывается составлением грамматики и словаря на основании ограниченного материала: «Построив из фактов этого материала некую отвлеченную систему, необходимо проверять ее на новых фактах, т. е. смотреть, отвечают ли выводимые из нее факты действительности. Таким образом, в языкознание вводится принцип эксперимента. Сделав какое-либо предположение о смысле того или иного слова, той или иной формы, о том или ином правиле словообразования или формообразования и т. п., следует пробовать, можно ли сказать ряд разнообразных фраз (который можно бесконечно множить), применяя это правило. Утвердительный результат подтверждает правильность постулата... Но особенно поучительны бывают отрицательные результаты: они указывают или на неверность постулированного правила, или на необходимость каких-то его ограничений, или на то, что правила уже больше нет, а есть только факты словаря, и т. п. ... В возможности применения эксперимента и кроется громадное преимущество с теоретической точки зрения изучения живых языков. Только с его помощью мы можем действительно надеяться подойти в будущем к созданию вполне адекватных действительности грамматики и словаря»11.
На той же идее основан предложенный Н. Хомским способ экспериментальной проверки объяснительной силы лингвистической модели: модель должна уметь строить не только те языковые объекты, которые уже встречались в речевой практике говорящих, но и объекты, принципиально допустимые, хотя и не встречавшиеся еще в речевой практике. Аналогичным образом модель, имитирующая речевую деятельность слушающего, должна обладать способностью анализировать не только те речевые произведения, которые послужили в качестве исходного материала при ее разработке, но и другие правильные речевые произведения. Только такие модели могут объяснить способность говорящего строить любые новые предложения (за исключением неправильных) и способность слушающего понимать любые новые предложения (опять-таки за исключением неправильных). Отметим, что такие модели способны объяснить и процесс усвоения языка ребенком.
Эти указания, конечно, не решают исключительно сложного и интересного вопроса об экспериментальных способах проверки предсказаний модели и определения ее объяснительной силы. В идеале мы имеем право утверждать, что предсказания модели подтверждаются опытными данными, только в том случае, если эти предсказания сформулированы вполне точно не только с качественной, но и с количественной стороны. История науки знает немало ложных теорий, несоответствие которых действительности выяснялось не потому, что они не предсказывали общую форму поведения объекта, а потому, что они неверно предсказывали его количество. К сожалению, в лингвистике только сейчас начинается разработка экспериментов, способных подтвердить не только качественные, но и количественные аспекты предсказаний12. <…>
Поскольку исследовательские модели в идеале предшествуют моделям конкретных языковых процессов, а метамодели следуют за ними, мы будем в этой главе и в последующих частях книги держаться указанного в данном абзаце порядка изложения материала: мы начнем с рассмотрения исследовательских моделей, затем перейдем к моделям конкретных языковых процессов (моделям речевой деятельности человека) и расскажем в заключение об основных положениях метатеории.
Мы уже говорили о том, что модели второго типа имитируют исследовательскую деятельность лингвиста. Эта деятельность состоит в том, что из суммы наблюдений над речевыми произведениями (текстами) извлекается некоторое представление о способе их организации, т.е. системе, порождающей их. Следовательно, имитировать деятельность лингвиста — значит обеспечить переход от совокупности текстов к лежащей в их основе системе. Система считается в достаточной мере изученной, если мы знаем: 1) ее элементарные единицы, 2) классы элементарных единиц, 3) законы сочетания элементов различных классов на всех уровнях анализа, включая семантический (ср. постановку этого вопроса у американских дескриптивистов).
Исследовательские модели можно подразделить на три класса в зависимости от того, какая информация используется в них в качестве исходной. В моделях первого класса в качестве исходной информации используется только текст, и все сведения о системе, т.е. языке, порождающем этот текст, извлекаются исключительно из текстовых данных. Это классические дешифровочные модели. В моделях второго класса считается заданным не только текст, но и множество правильных фраз данного языка. Практически это значит, что при разработке модели лингвист прибегает к помощи информанта, который по поводу каждой предъявляемой ему фразы должен говорить, правильна она или нет. Информантом может быть и сам лингвист, если он в совершенстве владеет изучаемым языком. Наконец, в моделях третьего класса считаются заданными не только текст и множество правильных фраз, но и множество семантических инвариантов. Практически это значит, что информант должен определять не только правильность каждой предъявляемой ему фразы, но и о любых двух фразах говорить, значат ли они одно и то же или нет. Модели этого класса близки традиционным описаниям, и в дальнейшем мы на них не останавливаемся.
Перейдем теперь к моделям конкретных языковых процессов и явлений, которые иначе можно назвать моделями речевой деятельности человека или моделями владения языком. Прежде чем обсуждать типы таких моделей, следует уточнить, какой смысл вкладывается в слова «владение языком»; в частности, следует определить свое отношение к самому важному из всех лингвистических вопросов — вопросу о том, предполагает ли владение языком знание смысла (иными словами, входит ли значение в структуру языка или нет). Несколько замечаний по этому поводу было сделано раньше, но вопрос настолько серьезен, что заслуживает несколько более детального обсуждения.
В первой части мы уже приводили мнение Л. Блумфильда о том, что конкретное значение слова не должно интересовать лингвиста, так как оно не входит в структуру языка. Лингвист не может и не должен анализировать различие между фламинго и колибри (это — дело зоолога), между метаном и этаном (это — дело химика), между нейтрино и нейтроном (это — дело физика). Если бы мы держались иного мнения на этот счет, нам пришлось бы внести в толковые словари культурных языков около 300 000 химических терминов, около 600 000 энтомологических терминов и т. п. Тогда лингвистика должна была бы слиться с энциклопедическим сводом всех накопленных человечеством знаний. Между тем известно, что человек может в совершенстве владеть языком, либо вовсе не зная большей части научных и технических терминов и терминообразных слов, либо зная их чисто номинально и имея лишь смутное представление о том, что они значат. Ж. Вандриес заметил по этому поводу, что каждый культурный человек знает номинально несколько специальных словарей, иногда даже на нескольких языках, не зная сколько-нибудь точно значений соответствующих слов. Из этого следует, что владение языком не предполагает знания всех семантических различий между всеми словами, и в какой-то мере Л. Блумфильд был прав, когда он утверждал, что значение не может быть проанализировано в рамках нашей науки.
Некоторые лингвисты, в особенности крайние представители американского дескриптивизма, сделали из этого вывод, что значение ни в каком смысле не входит в структуру языка и что владение языком, как таковым, проявляется у говорящего в способности строить грамматически правильные фразы, а у слушающего — в способности понимать такие фразы. При этом под грамматической правильностью понимается соблюдение чисто формальных запретов: фраза Она пришел неправильна, а фраза Квадрат выпил гипотенузу совершенно безупречна. Для обоснования этого взгляда можно как будто сослаться на следующие довольно любопытные факты:
1) Легко определить, какого рода текст — художественный или научный — закодирован фразой Под стурической стурой стурой стуры стурается стуренность стураций о стурах между стурами и между стурыми стурениями этой стуры (опыт Г. А. Лесскиса, проведенный по рекомендации В. А. Ицковича), хотя все корневые морфемы были заменены одной безразличной корневой морфемой, не имеющей значения в русском языке.
2) Каждому англичанину «понятны» стихи Льюиса Кэррола из его широко известной книги «Алиса в стране чудес»:
'Twas brillig, and the slithy toves
Did gyre and gimble in the wabe;
All mimsy were the borogoves,
And the mome raths outgrabe.
Хотя в этом четверостишии нет ни одного английского корня, сказочный персонаж Хампти-Дампти, слушавший его вместе с Алисой, объяснил, что outgrabe — прошедшее время глагола to outgribe, а Алиса сказала, что стихи наполняют ее голову мыслями, хотя она не знает в точности, какими именно.
3) Каждому человеку, владеющему русским языком, в каком-то смысле «понятна» придуманная Л. В. Щербой фраза, не содержащая ни одной лексической морфемы русского языка: глокая куздра штко будланула бокра и кудрячит бокрёнка; это понимание проявляется, в частности, в том, что он сумеет поставить вопросы ко всем членам предложения и ответить на них.
4) Каждый англичанин «поймет» придуманные Ч. Фризом предложения:
1. Woggles ugged diggles.
2. Uggs woggled diggs.
3. Woggs diggled uggles.
и сумеет вывести по правилам английской грамматики другие фразы того же типа, например:
4. A woggle ugged a diggle,
5. An ugg woggles diggs,
6. A diggled woggle ugged a woggled diggle.
Во всех этих случаях вполне разумно говорить о «понимании» текста (оно проявляется в умении определить жанр текста, дать исходные формы слов, поставить вопросы к членам предложения, построить новые правильные фразы). Однако это «понимание» недостаточно для того, чтобы мы могли реагировать на фразы собеседника или предсказать его реакции на такие же фразы, произносимые нами. Если в общем случае предложения языка не обязаны быть осмысленными, диалог (общение, связный текст) становится невозможным: нельзя эффективно общаться при помощи бессмысленных фраз.
Здесь следует сказать, что описанные выше эксперименты, вообще говоря, недостаточны для вывода о том, что значение не входит в структуру языка. Можно указать на эксперименты, в которых предложения препарировались прямо противоположным образом: в них оставлялись только корневые морфемы и выкидывались все грамматические, например: ребен- cna- комнат- шир- распах- окн-. Ч. Хоккет, проводивший эти эксперименты, отмечает, что им неизменно сопутствовал успех: испытуемые всегда могли предложить толкование предложения, очень часто однозначное. Будучи последовательными, мы должны были бы сделать из них вывод, что в структуру языка входит только значение, но не грамматические правила. Разумеется, этот вывод был бы ложным.
По всей видимости, тексты, не организованные смыслом, рано или поздно должны были бы утратить свою грамматику, а тексты, не организованные грамматическими правилами, должны были бы рано или поздно утратить свой смысл. Если язык действительно является средством общения, то значение, во всяком случае в определенных пределах, входит в структуру языка. Любопытно, что, когда у Р. Якобсона во время его публичной лекции в Московском институте иностранных языков в 1958 году спросили, как он относится к возможности описать язык, не описывая его значений, он ответил следующей параболой: можно, конечно, отрубить у курицы голову и сделать ценные наблюдения над ее поведением в этом состоянии, но было бы неосторожно утверждать, что для курицы оно является естественным и что, изучив его, мы узнаем о ней все самое существенное.
Попытаемся ответить на вопрос о том, какие типы значений входят в структуру языка и, следовательно, являются предметом лингвистики. В упомянутой работе И. А. Мельчука о типах языковых значений различаются, в частности, грамматические и неграмматические значения. Значение называется грамматическим, если в данном языке оно выражается обязательно, т. е. всякий раз, когда в высказывании появляется элемент, значение которого может сочетаться с данным грамматическим значением, причем такие элементы образуют в языке большие классы и поэтому появляются в текстах достаточно часто. Если же некоторое значение выражается необязательно и не появляется в текстах с достаточно большой частотой, оно считается неграмматическим. С этой точки зрения значение числа в русском языке является грамматическим, так как всякое существительное обязательно имеет показатель числа — единственного или множественного. Грамматические правила русского языка вынуждают нас выражать это значение, независимо от того, считаем ли мы его существенным для сообщения или нет. В противоположность этому в китайском языке значение числа является неграмматическим; если нет нужды специально указать число предметов, о которых идет речь, значение числа остается невыраженным. Аналогичным образом значение вида в славянских языках является грамматическим, а в большинстве романских и германских языков — неграмматическим; в романских и германских языках видовые различия выражаются только в случае необходимости, а в славянских языках — обязательно. Из приведенных примеров следует, между прочим, что значение, являющееся грамматическим в одном языке, может быть неграмматическим в другом.
Не всякое значение может быть грамматическим. Трудно представить себе язык, в котором различие между иволгой и сойкой выражалось бы грамматически. Обычно в качестве грамматических, т. е. подлежащих обязательному выражению, выступают более или менее абстрактные значения (времени, числа, деятеля, объекта, причины, цели, контакта, обладания, знания, ощущений, воли, желания, реальности, потенциальности, возможности, умения и т. п.). Как отмечает А. К. Жолковский, интересными для лингвиста являются те значения, которые хотя бы в некоторых языках являются грамматическими. Следовательно, круг значений, которые должны стать объектом лингвистики, может быть получен, если собрать вместе так называемые грамматические значения самых разных языков; именно эти значения входят в структуру языка (правила кодирования сообщений), независимо от того, являются ли они в данном языке грамматическими или нет.
Изложенный здесь подход к решению важнейшей лингвистической проблемы, кажущийся автору исключительно перспективным, не является, однако, общепринятым. Поэтому в дальнейшем изложении мы учтем и противоположную точку зрения, состоящую в том, что значения не входят в структуру языка.
В зависимости от того, какой смысл вкладывается в понятие «владения языком» (включается ли в него признак владения значением слов или нет), модели речевой деятельности приобретают тот или иной вид и могут быть разделены на: 1) несемантические, или чисто синтаксические, имитирующие владение грамматикой, т. е. способность носителей языка понимать и строить грамматически правильные, но не обязательно осмысленные фразы, и 2) семантические, которые имитируют способность носителей языка понимать и строить осмысленные предложения.
В зависимости от того, какая сторона речевой деятельности — слушание или говорение — является предметом моделирования, модели речевой деятельности делятся на модели анализа и модели синтеза. Моделью анализа называется конечное число правил, способных проанализировать бесконечное число предложений данного языка. Синтаксические аналитические модели получают на «входе» текст, а на «выходе» выдают для каждого предложения запись его синтаксической структуры. Семантические аналитические модели получают на «входе» тот же материал, а на «выходе» выдают смысловую запись (изображение смысла) каждого предложения на специальном семантическом языке. Моделью синтеза называется конечное число правил, способных построить бесконечно большое число правильных предложений. Синтаксические синтетические модели используют в качестве исходной информации запись синтаксической структуры предложений, а на выходе выдают правильные предложения данного языка. Семантические синтетические модели получают на входе смысловую запись некоторого предложения на специальном семантическом языке и выдают на выходе множество предложений естественного языка, синонимичных данному предложению.
Помимо моделей анализа и синтеза, существуют еще так называемые порождающие модели, в некотором смысле промежуточные между моделями анализа и синтеза. Порождающей моделью называется устройство, содержащее алфавит символов13 и конечное число правил образования (и преобразования) выражений из элементов этого алфавита, способное построить бесконечное множество правильных предложений данного языка и приписать каждому из них некоторую структурную», характеристику.
С понятием аналитических и синтетических моделей связано важное понятие обратимости модели. Модель М1 называется обратной по отношению к модели М2, если исходные объекты М1 являются конечными объектами М2, а конечные объекты М1 — исходными объектами М2. Некоторые исследователи рассматривают синтетические модели как обратные по отношению к аналитическим. При таком подходе к делу отпадает надобность в построении двух самостоятельных моделей данного явления: аналитическая модель может быть получена простым обращением синтетической, и наоборот 14.
Изобразим схематически отношения между разобранными выше типами моделей (см. схему 2).
В зависимости от того, в какой математической форме излагается модель, модели делятся на исчисления и алгоритмы. Содержательно различие между ними можно пояснить следующим образом: исчисление — это система разрешений (позволений), а алгоритм — это последовательность приказов (команд).
Схема 2
Признаки
Тип модели
Что известно лингвисту
Характер исходной информации
Характер конечной информации
Цель
Исследовательские
Текст (и множество правильных фраз)
Текст
Грамматика и словарь
Смоделировать деятельность лингвиста
Аналитические
Грамматика и словарь
Текст
Изображение структуры текста
Смоделировать понимание текста
Синтетические
Грамматика и словарь
Изображение структуры текста
Текст
Смоделировать производство текста
Порождающие
Грамматика и словарь
Алфавит символов и правила образования и преобразования фраз
Множество правильных фраз и изображение их структуры
Смоделировать умение отличать правильное от неправильного в языке
Обычно исчисление имеет вид математической системы, включающей: 1) исходные (первичные, или неопределяемыe) понятия, имена которых образуют уже знакомый нам "алфавит символов"; 2) первичные (недоказываемые) утверждения о связях между этими понятиями (аксиомы); 3)правила вывода новых утверждений (теорем) из уже имеющихся. Вместо аксиом и правил вывода иногда используются правила образования и преобразования выражений из элементов алфавита. В исчислениях часто пользуются так называемые рекурсивные определения и правила. Рекурсивными называются определения и правила, которые строятся в два шага, причем первый шаг содержит определение простейшего частного случая, а второй — определение общего случая через частный. Примером рекурсивного определения может служить следующее определение натурального числа (т. е. любого целого положительного числа, начиная с единицы): (1)1 (единица) есть натуральное число; (2) если i — натуральное число, то и i + 1 — также натуральное число. Легко убедиться, что под это определение подойдут все натуральные числа, и только они. Пример рекурсивного правила будет приведен ниже15.
Исчисление позволяет задать с помощью конечного аппарата все объекты некоторого множества, в том числе бесконечного (например, все предложения данного языка). Это свойство исчислений и должно быть использовано лингвистикой, имеющей дело с очень большими или бесконечными инвентарями единиц. В дальнейшем мы изложим несколько лингвистических исчислений; здесь мы проиллюстрируем это понятие одним абстрактным примером. Дан алфавит символов X, а, с. Обязательное правило образования выражений в этом алфавите следующее: Х → ас (X переходит в ас). Чтобы наше исчисление порождало бесконечное множество выражений, добавим в него одно факультативное рекурсивное правило: Х → аХс. Следовательно, X переходит либо в ас, либо в аХс, а X в последнем выражении может снова заменяться другими символами по любому из двух правил исчисления. Элемент X, с которым связано это рекурсивное правило, называется рекурсивным. Проиллюстрируем работу построенного здесь исчисления, применив каждое правило по одному разу:
Правило
Результат применения
(1) Х → аХс
аХс
(2) Х → ас
аасс
Предлагаем читателю самостоятельно построить хотя бы одно неправильное выражение, не принадлежащее к числу выражений на данном языке (не порождаемое данным исчислением), и указать одно общее свойство всех правильных выражений.
Перейдем теперь к понятию алгоритма. Алгоритмом называется, как мы помним, последовательность команд, выполнение которых ведет к выделению (или построению) желаемого объекта. В качестве иллюстрации рассмотрим алгоритмы решения следующей простой задачи: сложить миллион заданных произвольных чисел, например чисел 12, 1, 102, 29, ..., 5. Простейшим алгоритмом решения этой задачи будет следующий: 1) возьми первое число (12), 2) прибавь к нему второе (1), 3) прибавь к сумме третье (102), 4) прибавь к сумме четвертое (29), ..., 1 000000) прибавь к сумме миллионное число (5) и выдай результат. Этот алгоритм, содержащий миллион команд, очень непрактичен: бессмысленно повторять миллион раз по существу одно и то же. В хорошем алгоритме стандартная команда должна быть обобщена с помощью одного рекурсивного правила. Мы и попытаемся это сделать. Перенумеруем все числа от первого до миллионного:
12 1 102 29 ... 5
1 2 3 4 ... 1000 000
Условимся обозначать буквой i номер произвольного числа (но не само число !). Наконец, уясним себе тот факт, что сумма миллиона чисел формируется постепенно и в начале процесса (до того, как мы взяли первое число) равна нулю. Алгоритм: (1) прими сумму равной нулю; (2) прими i равным единице; (3) прибавь i -е число к сумме; (4) проверь, имеет ли место i = 1 000 000; (5) да — выдай результат; (6) нет — прибавь к i единицу и делай (3). Этот алгоритм можно представить в виде так называемой блок-схемы (см. рис. 2).
да
нет
Рис. 2.
Алгоритм должен допускать совершенно автоматическую реализацию, т. е. реализацию, доступную электронной вычислительной машине; в этом отношении алгоритм можно сравнить с инструкцией для лаборанта, который точно выполняет предписания, проворен, никогда не делает ошибок, но не способен размышлять. Инструкция для такого лаборанта может содержать команды типа приведенных выше, но в ней не должно быть предписаний типа «будь разумен», «поступай правильно», «сделай вывод» или «найди прилагательное» (если нет подробных механически выполняемых правил о том, как это делать).
Алгоритм, записанный на понятном для машины языке, называется программой.
Любая модель, включая исчисление, должна быть представлена в виде алгоритма (или снабжена алгоритмом), чтобы быть реализованной на машине, потому что машина понимает только язык команд, но не язык разрешений.
Прежде чем перейти к другим типам моделей, укажем на зависимость, существующую между исследовательскими, аналитическими, синтетическими и порождающими моделями, с одной стороны, и алгоритмами и исчислениями — с другой. Первые три типа моделей оформляются обычно в виде алгоритмов, а для изложения порождающих моделей, как правило, используется форма исчислений.
В зависимости от того, какого рода правила используются в модели, различаются вероятностные (статистические) и детерминистские (структурные) модели16. Существуют и смешанные структурно-статистические модели. Естественные языки в большин-: случаев устроены таким образом, что немногие правила охватывают основное множество фактов, но для объяснения остающихся немногих фактов, большей частью непродуктивных, требуется очень большое число правил. Поэтому в ряде случаев бывает выгодней объяснить данную совокупность фактов не детерминистской моделью, которая из-за обилия правил может оказаться излишне громоздкой для выполнения некоторой вполне определенной задачи, а вероятностной моделью, которая обходится меньшим числом чисто статистических правил и потому менее громоздка. Потеря в точности правил компенсируется в такой модели ее относительной простотой. В качестве иллюстрации можно сослаться на работу И.А. Мельчука об определении рода французского существительного по концу слова; довольно простые правила позволяют правильно решить этот вопрос в 85 случаях из 100. Для испанского языка аналогичные правила более эффективны: они дают правильный ответ в 95 случаях из 100.
Наиболее важными детерминистскими моделями являются модели бинарных дифференциальных структур в области фонологии и морфологии, модель непосредственно составляющих, трансформационная и аппликативная модели в области синтаксиса, модель «семантических множителей» в области семантики.
На этом мы заканчиваем краткий очерк типов исследовательских моделей и моделей речевой деятельности человека. Более подробно они рассматриваются нами в III и IV частях книги соответственно.
Мы ничего не говорим здесь о моделях третьего типа (метамоделях, или метатеории), так как не собираемся описывать их сколько-нибудь подробно. Некоторые элементарные сведения о моделях этого типа, совместимые с жанром данной книги, даются нами в V части.
1Ср. свыше полутора сотен форм английского глагола, выводимых в исчислении К- И. Бабицкого и Е. Л. Гинзбурга.
2Одним из первых, обратил внимание на словосочетания этого типа А. де Гроот.
3Формализация некоторой области содержательных представлений сопровождается обычно введением символических обозначений, но, конечно, как следует из сказанного выше, не сводится к нему. В этой связи следует подчеркнуть, что распространившееся в последнее время увлечение символами, за которыми не стоят точно (однозначно) определенные понятия, не имеет ничего общего с научным методом. Наукообразная символика не может заменить работу мысли и способна только дискредитировать большое и серьезное дело в глазах людей, искренне им интересующихся, но мало осведомленных.
4Логически интерпретация является совершенно особым этапом исследования, хотя практически она не всегда излагается отдельно от самой формальной модели. Об этом следует помнить при знакомстве с материалом частей III и IV.
5Впрочем, следует иметь в виду, что существует обратное отношение между широтой модели (числом допускаемых ею интерпретаций) и ее богатством: чем шире предметная область модели, тем беднее ее содержание (тем меньше ее моделирующая сила), и наоборот.
6Слова данного типа анализируются и другими способами, отличными от способа Г. О. Винокура и способа А. И. Смирницкого.
7Сопоставляя слово cran-berry («клюква»), содержащее уникальную основу сrап-, со словами berry («ягода»), blackberry («черная смородина») и другими подобными, Ч. Хоккет говорит: «...Значение сrап-, таким образом,— это все то, что отличает клюкву от других видов ягод. Его, может быть, трудно описать, но легко продемонстрировать на фруктовом рынке»
8В современной лингвистике основные выводы ларингальной теории уже не оспариваются, хотя некоторые специалисты не разделяют ряда ее положений или относятся к ним с осторожностью, особенно в связи с материалами хеттского языка, положение в котором оказалось сложнее, чем думали вначале.
9Более точно, Ф. де Соссюр считал, что всякий индоевропейский корень имел только один гласный а1 (соответствующий греческому е), который в некоторых условиях переходил в а2 (соответствующий греческому о). Ф. де Соссюр постулировал два семантических коэффициента, А и Ô, причем качество получавшегося в результате стяжения долгого гласного (ā или ō) зависело не от качества корневой гласной, а от качества ларингального.
10Чтобы читатель мог составить некоторое представление о величии этого открытия, мы рекомендуем ему попытаться решить последнюю задачу из уже упоминавшейся статьи А. А. Зализняка. Словоформы подобраны в ней таким образом, что «становится возможным строго сформулировать проблему, впервые поставленную и разрешенную де Соссюром... Таким образом, при решении этой задачи читатель должен самостоятельно повторить открытие де Соссюра». Наше изложение облегчит, но не обессмыслит ее.
11Большое значение «отрицательному языковому материалу» придавали В. А. Богородицкий, А. Фрей, Ш. Балли, видевшие в патологии преувеличение нормы или зародыш будущего развития.
12Во всех этих случаях имелись в виду решающие эксперименты, подтверждающие теорию или опровергающие ее. Их не следует путать с теми экспериментальными приемами обработки сырого материала, которые издавна известны в языкознании (ср., например, систему, разработанную американскими дескриптивистами).
13Под алфавитом символов понимается набор исходных элементов модели, ее словарь—например, набор фонем, или морфем, или словоформ, или символов простейших типов предложений.
14Другое мнение о соотношении анализа и синтеза см. у Р. Якобсона
15См рекурсивное определение слова у П. С. Кузнецова, морфемы — у И. И. Ревзина, комплекса и других лингвистических объектов - у С. К. Шаумяна. Ср. также работу И Бар-Хиллела; в ней ясно и убедительно показано значение рекурсивных определений для эмпирических наук, в том числе лингвистики, которая раньше ими не пользовалась, хотя природа ее материала прямо располагает к этому.
16Различные типы чисто статистических моделей (вероятностных и теоретико-информационных) ясно и доступно описаны Фрумкиной и Е. В. Падучевой в их работах. Поэтому мы не будем специально на них останавливаться в последующих частях книги, тем более что они не имеют непосредственного отношения к собственно структурным методам.