Эволюция семантики экономической терминологии

3.3 Выводы

Проведенный эксперимент по извлечению данных о семантических  изменениях 210 единиц экономической лексики из словарей С.И Ожегова и Д.Н. Ушакова позволяет установить возможность исследования эволюции семантики основного терминологического слоя экономики с помощью толковых словарей русского языка разных лет. Этот подход эффективен для изучения истории означающих тех слов, которые в настоящее время входят в сферу экономической лексики. Он позволяет установить достаточно тонкие качественные сдвиги в лексической семантике на большинстве ее уровней.

Анализ генетически близких и схожих по лексикографическим параметрам словарей, разделенных периодом около 50 лет показывает, что даже за такой относительно небольшой отрезок времени в той части литературного русского языка, которая пересекается с терминологическим полем экономики, происходят многочисленные сдвиги.

Так, из 210 слов, зафиксированных в словаре Ожегова, 13 являются новыми, у 24 слов появились новые экономические ЛСВ. С другой стороны, из зарегистрированных экономических ЛСВ в словаре Ушакова 42 отсутствуют в словаре Ожегова, что связано как изменениями на семантическом уровне русского языка, так и с различием объема двух словарей.

У 62 экономических ЛСВ зарегистрированы сдвиги на уровне сигнификата, из них 30 – в сторону расширения, у 52 экономических ЛСВ зарегистрированы сдвиги на уровне денотата, из них 28 – в сторону расширения. Тогда как не все расширения денотата/сигнификата могут считаться достоверными в силу соотношения объема словарей, количество относительно достоверных сдвигов остается весьма существенным. У экономических 17 ЛСВ зарегистрированы изменения коннотата, у 11 экономических ЛСВ – изменения в уровне актуальности их экономического значения, и наконец, у 29 экономических ЛСВ – изменения их актуальности в семантической структуре слова.

Выполненный эксперимент по вычислительной обработке переводов «Исследований…» А. Смита 1895 и 1931 гг. показывает принципиальную возможность использования методов статистического машинного перевода для поиска «диахронических синонимов» в массивах текстов. Предлагаемая методика комбинированной машинной и ручной обработки текстов разных исторических периодов позволяет выявить изменения означающих при неизменности означаемых, что представляет собой весьма трудоемкую задачу при полностью ручном поиске по набору текстов или даже по данным словарей.

Установлено, что для распознавания печатного русскоязычного текста в дореволюционной орфографии может использоваться программный продукт «ABBYY FineReader». Впрочем, из-за отсутствия модулей словаря, синтаксиса и характерных дореволюционных шрифтов распознавание происходит с высоким процентом ошибок.

Создан набор инструментов для статистической обработки параллельных текстов на одном языке, в том числе текстов с отличной от современной орфографией и дефектами распознавания отсканированного материала, основанный на современных алгоритмах обработки параллельных текстов и новых решениях, специфичных для данной задачи:

  • для выравнивания предложений двух переводов иноязычного текста в качестве меры схожести предложений используется обобщенный показатель количества лексических совпадений и близости длин;
  • для приведения словоформ с потенциальными отличиями орфографии и возможными опечатками к лемме используется коэффициент схожести на основе числа совпадающих и различающихся букв.
  • для поиска диахронических синонимов по переводам одного иноязычного текста, выполненным в разные годы, используется методика, основанная на модели статистического перевода IBM №1.

Изменение общепринятого наименования ряда экономических реалий за первую треть 20 века привело к замене автором перевода «Исследований» А.Смита 1931 года не менее 65 экономических лексем на варианты, отличные от первого перевода 1895 года. Их список может быть использован при составлении исторического словаря экономической лексики.

© Б.Н. Рахимбердиев, 2003.

Сайт управляется системой uCoz