Том 17, № 1 (2019)
Скачать выпуск
PDF
ПРИКЛАДНАЯ И КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА
5-20 209
Аннотация
В рамках методик математического стиховедения осуществлен комбинаторный анализ корпуса немецких сонетов на материале творческого наследия Райнера Мария Рильке, построена классификация вариантов рифмовки сонетов на основе их симметрийных отношений в катренной и терцетной частях. Классификация не учитывает так называемые нерегулярные сонеты. Согласно данной классификации вводятся понятия симметричных, частично симметричных и несимметричных сонетов и комбинаторным способом подсчитывается возможное количество сонетов каждого типа. С учетом этой классификации выявляется уникальный комбинаторный потенциал поэта, в частности исследуется эволюция структуры сонетов Рильке от «Новых стихотворений» к «Сонетам к Орфею». Вводятся понятия независимых и зависимых сонетов. На основе этих понятий показано, что «Новые стихотворения» содержат только независимые, т. е. с неповторяющимися способами рифмовки, сонеты, в то время как в «Сонетах к Орфею» этот принцип нарушается. Выделена ядерная часть сонетов Рильке, состоящая из тех независимых сонетов, которые порождают весь корпус сонетов Рильке, т. е. всю совокупность независимых и зависимых сонетов. В соответствующих подсчетах учтены также восемь сонетов из примыкающих к «Сонетам к Орфею». Отдельное внимание в статье уделено симметричным сонетам. Описана структура всех 18 симметричных сонетов Рильке, среди которых 11 являются независимыми («Новые стихотворения» - 4, «Сонеты к Орфею» - 7). В качестве примера проведен стилеметрический анализ ритмического поля одного из симметричных сонетов. Показано, что его внутренний ритм близок к структуре золотого сечения. Высказана гипотеза о влиянии вариантов рифмовки, присущих симметричным сонетам, на внешний и внутренний ритмы сонета.
21-48 256
Аннотация
Лингвистические корпусы и компьютерные технологии дают возможность осуществлять исследования и получать результаты на больших текстовых массивах, что прежде, до появления этих средств, было недостижимо. Настоящая статья описывает некоторые количественные данные использования прилагательных, обозначающих цвета, в русских поэтических текстах. Произведено сравнение частотности базовых прилагательных цвета (белый, черный, красный, зеленый, желтый, синий, голубой, коричневый, оранжевый, розовый, фиолетовый) в текстах четырех корпусов НКРЯ - основного, газетного, устного и поэтического. Сравнение осуществлялось двумя способами: в каждом корпусе определялась относительная частота (ipm) каждого из перечисленных выше прилагательных, а также ipm всех прилагательных, имеющих тег «цвет» семантической разметки НКРЯ. Оба способа определения показали, что в текстах поэтического корпуса частотность прилагательных цвета значительно выше, чем в текстах трех других корпусов (основном, газетном и устном). Установлено также, что убывание значений частоты прилагательных цвета в текстах всех четырех корпусов в значительной степени коррелирует с эволюционно-исторической схемой Берлина - Кея. Помимо этого, проведено исследование частоты встречаемости прилагательных цвета в поисковой системе Государственного Эрмитажа (массив аннотаций к произведениям искусства), где нам пришлось ограничиться абсолютным числом текстов, содержащих то или иное прилагательное цвета, поскольку данная поисковая система не содержит лингвистических характеристик. Корреляция полученных данных со схемой Берлина - Кея выражена в данном случае намного слабее, чем в корпусах НКРЯ. В статье детально описана методика извлечения прилагательных цвета из авторских подкорпусов поэтического корпуса НКРЯ и создания списков этих прилагательных средствами менеджера Sketch Engine из текстов авторов, отсутствующих в поэтическом корпусе НКРЯ. На основе анализа 180 лемм прилагательных цвета, извлеченных из текстов тридцати шести авторов, произведена категоризация прилагательных цвета. Для анализа и категоризации привлечены также и данные поисковой системы Эрмитажа. Приведены также количественные данные о представленности (репрезентации) выделенных категорий прилагательных в исследованных текстах. В ходе исследования выявлены некоторые недостатки семантической разметки в НКРЯ. Таким образом, мы выявили некоторые закономерности частотного поведения прилагательных цвета в русском языке и предложили один из возможных вариантов их классификации.
49-64 267
Аннотация
Статья посвящена оценке степени акустической вариативности альвеолярного сибилянта s в разных языках. В работе привлекается материал пяти неродственных языков народов России с различными фонетическими системами: адыгейского, нанайского, русского, удмуртского и чукотского. Рассматривается в первую очередь вариативность единиц в одном и том же контексте в условиях контроля максимального числа параметров. Анализировались полевые записи авторов. Произнесения были размечены вручную, затем информация о спектре автоматически извлекалась и трансформировалась методом линейного предиктивного кодирования. Полученные спектральные срезы анализировались по десяти параметрам: частота первого пика (в герцах и барках), угловой коэффициент, отражающий крутизну подъема огибающей до первого пика, спектральный центр масс (в герцах и барках), стандартное отклонение (в герцах и барках), асимметрия и эксцесс. Поскольку анализировать все эти меры одновременно не представляется возможным, для уменьшения числа переменных был использован метод главных компонент. Кумулятивная доля дисперсии, объясненная двумя первыми главными компонентами, составила 65 %. В статье показано, как с помощью метода главных компонент можно измерить и сравнить вариативность произнесений s в разных языках. В результате исследования: 1) был создан алгоритм анализа вариативности, который может использоваться и в других областях акустики; 2) можно заключить, что у отдельных дикторов различия в реализации s могут быть более резкими, чем между языками в целом; 3) выяснилось, что произнесения на нанайском и чукотском более вариативны, чем на других языках, что соотносится с объемом подсистем сибилянтов выбранных языков. Полученные данные могут быть аргументом в пользу того, что в больших подсистемах единицы менее вариативны, и чем меньше подсистема, тем больше вариативность входящих в нее единиц.
65-77 182
Аннотация
Статья посвящена описанию серии экспериментов по исследованию роли семантической информации в разрешении кореферентных связей для русского языка, ее использованию в системах автоматического анализа текстов и оценке результатов их работы. Целью первого этапа экспериментов было определить, какие метрики семантической близости между референциальными выражениями больше соответствуют кореферентным связям между ними. Подсчет метрик производился на материале русской Википедии и тезауруса RuThes. На втором этапе была разработана система автоматического распознавания кореферентности, использующая метрики семантической близости в качестве признаков для машинного обучения, и оценено качество ее работы. Результаты проведенных экспериментов позволяют установить метрики семантической близости, подходящие для использования в системах разрешения кореферентности, а также демонстрируют повышение качества работы подобных систем при использовании семантической информации.
78-89 245
Аннотация
Представлен сравнительный обзор подходов, которые практиковались в российской традиции составления лексических минимумов русского языка, а также в зарубежных традициях, среди которых особое внимание уделено англо- и немецкоязычной традиции. Цель обзора - проследить направление развития науки в области составления лексических списков на стыке лексикографии и лингводидактики и определить критерии, на которые должны ориентироваться составители списков, чтобы отвечать запросам пользователей в рамках различных задач. Приводится определение понятия «лексический минимум», и задаются параметры сравнения лексических минимумов в последующем обзоре. Рассматриваются отечественные подходы к составлению списков с фокусом на лингводидактической проблематике, лежащей в основе всего русскоязычного направления. Обсуждаются зарубежные подходы, основное внимание уделяется спискам общего пользования и проблеме выделения лексического ядра. Сравниваются отечественная и зарубежные традиции. Приведенный в статье обзор дает основания утверждать, что вне зависимости от предназначения лексического минимума создание его требует сочетания как статистического, так и коммуникативно-ориентированного метода. Кроме того, для составления актуального и достоверного корпуса необходимо равномерное соотношение составных частей анализируемых данных: кроме корпуса текстов художественной литературы следует обратиться к данным устного корпуса и к таким различным по стилю и жанру источникам, как газетный, художественный и академический корпусы, а также корпус интернет-речи.
90-101 200
Аннотация
Предлагается критический обзор существующих компьютерных ресурсов с точки зрения их использования в филологическом анализе. В гуманитарных науках, таких как социология, психология и менеджмент, существуют различные типы программного обеспечения для многомерного анализа текста (проверка авторства, определение совместимости слов, выявление эмоциональной окраски текста и т. д.), которые могут применяться и в филологических исследованиях для интерпретации текста. Однако для филологии они остаются terra incognita: традиционно изучение и анализ текста в литературоведении связаны с его индивидуальной интерпретацией исследователем, поэтому до сих пор превалирует консервативный подход, не подкрепленный данными контент-анализа или статистики. Различные программы были успешно протестированы на материале русской и иностранной художественной литературы, а в дальнейшем интегрированы в обучение студентов бакалавриата и магистратуры факультета гуманитарных наук (Национальный исследовательский университет «Высшая школа экономики», Нижний Новгород). Накопленный пятилетний опыт позволил получить неединичные достоверные данные и выполнить сравнительный анализ компьютерных программ, таких как AntConc concordancer, многофункциональный контент анализатор LEKTA, LF Alighner, TextAnalyst SDK. На фактическом материале доказывается необходимость перехода от традиционного сбора художественного материала и анализа различных дискурсов к широкому применению веб-инструментов. Практическое применение компьютерных программ заполняет разрыв между современными требованиями цифровых гуманитарных наук (Digital Humanities) и консервативным подходом многих исследователей. Авторами статьи приводятся краткие аннотации курсовых и дипломных работ, посвященных различным видам анализа текста с опорой на программные инструменты. Отдельные аспекты, посвященные перспективным, но малоиспользуемым компьютерным ресурсам, описываются подробно. При этом подчеркивается необходимость избирательного подхода к общедоступным лингвистическим корпусам, узкоспециализированным программам-конкордансерам и частотным анализаторам. Применение компьютерных инструментов в анализе текста обязательно требует дальнейшей традиционной интерпретации материала. Достижение необходимого баланса в использовании программных ресурсов может означать оптимизацию анализа художественного оригинального или переводного текста наряду с определением новых критериев оценки репрезентативности и валидности результатов подобных литературоведческих и лингвистических исследований.
ЛИНГВОКУЛЬТУРНАЯ КОГНИТИВИСТИКА И ПСИХОЛИНГВИСТИКА
102-114 203
Аннотация
Статья посвящена изучению любопытства в плане концептуальной его конфигурации в русском языковом сознании. Обращение к Национальному корпусу русского языка представляется в этой связи тем более оправданным и необходимым, что содержание анализируемого концепта, как и экспликация связанных с ним ситуаций и установок мнения, не представлено в «готовом виде» ни в одном из отдельно взятых случаев употребления, а реконструируется на совокупности всех возможных употреблений. По данным Национального корпуса русского языка, рус. любопытство входит в отношения дополнительности с интересом, удивлением, волнением, нетерпением, надеждой, желанием, скукой, праздностью, пороком, похотью, грехом, позволяющими реконструировать основные ситуации любопытства в отношении к сопутствующим переживаниям, поступкам и действиям, а также базисным установкам мнения, задающим оценку анализируемого чувства сообразно избираемой по случаю «концептуальной схеме» как любопытства- познавательного интереса, любопытства-скуки, любопытства-праздности или любопытства-греха. Судя по засвидетельствованным употреблениям, приложимые к любопытству предикаты варьируются в зависимости от позиции в синтаксической структуре высказывания. В функции семантического объекта к любопытству приложимы предикаты испытывать, внушать, удовлетворять, выказывать, сдерживать, скрывать; в функции субъекта - появляться, просыпаться, охватывать, снедать, распирать, терзать, побеждать, говорить, заставлять, одолевать, побуждать, губить и проч. В метафорическом отображении рус. любопытство определяется в терминах пропозициональной модели других предметных областей, о чем свидетельствуют избираемые по случаю дескрипции вида говорить, советовать, руководить (‘внутренний голос’), просыпаться, пробуждаться (‘живое существо’), мучить, грызть, глодать (‘злобный зверек’), влечь, побуждать, одолевать (‘неподвластная сила’), разгораться, разжигаться, жечь (‘огонь’) в функции семантического предиката. Причем аргументом в пользу такого употребления, а заодно и интерпретантом метафорической транспозиции, служит не подлежащее сомнению мнение, что для обозначения особо примечательных свойств любопытства нет более подходящих вспомогательных объектов, кроме разве только внутреннего голоса, силы, огня и живого существа.
115-124 195
Аннотация
Статья имеет целью установление некоторых черт остготского языка VI в., которые доступны для наблюдения в латинском тексте «Гетики». Исследовательская посылка основана на том факте, что текст написан готом на неродном языке и что влияние родного языка должно проявить себя в соответствии с законами интерференции. Это влияние выявляется на довербальном уровне с опорой на понятия текстового менталитета и текстовой ментальности в аспекте прогнозируемого расширения правил лингвистической реконструкции. Обоснование ментальных основ лингвистической реконструкции осуществляется в статье на базе текстовой образности, особенно чувствительной к влиянию национального менталитета. Анализ выявил достаточно ограниченный в своем диапазоне характер образности, соотносящейся с немногочисленными сферами внешней действительности: человек, растительный, животный мир, неодушевленные предметы, природа и очень редкие абстрактные понятия. Поскольку латинская вербализация практически всех перечисленных сфер обнаруживает готские лексические соответствия, зафиксированные в Готской Библии, рассмотрение текстовой образности «Гетики» завершается построением языковой картины мира в том ее реконструируемом виде, который мог быть свойствен текстовому уровню остготского языка VI в. Новизна статьи заключается в развитии практики лингвистической реконструкции в соответствии с современными подходами в языкознании, наиболее продуктивными и популярными в сфере когнитивной лингвистики, активно оперирующей понятиями менталитета и ментальности. Новым является и предложенный способ реконструкции текстовых явлений. Актуальность статьи определяется обращением к историческому текстовому материалу, позволяющему установить истоки современных явлений, характерных для процесса текстопостроения, активно изучаемого на базе разных языков и типов текста.
125-133 204
Аннотация
Статья посвящена возможностям использования лингвистического корпуса английского языка для формирования межкультурной компетенции. Успешность обучения межкультурной коммуникации зависит как от уровня владения иностранным языком, так и от освоения норм речевого этикета. Сведения об этих нормах преподаватели, не являющиеся носителями языка, могут почерпнуть из учебно-методических комплексов, словарей, справочников, научных исследований. Однако несовпадение рекомендаций поднимает вопрос о поиске более достоверных источников информации о стилистической и социальной маркированности языковых единиц. Лингвистический корпус текстов, будучи репрезентативным, унифицированным и структурированным массивом данных, лучше показывает социокультурную маркированность единиц, так как он отражает реальный узус, а не мнения носителей. В исследовании использован Британский национальный корпус (British National Corpus), представляющий британский вариант английского языка конца XX в. На примере формулы извинения с pardon исследуется возможность применять лингвистический корпус как источник сведений о социально-классовой маркированности дискурса. Поскольку перед исследователем стояла задача подтвердить или опровергнуть убеждение, что формула извинения с pardon присуща речи низшего и среднего слоя среднего класса, было проведено сравнение частотности ее употребления представителями разных слоев британского общества. По данным нашего корпусного исследования, формула извинения с pardon в большей степени присуща речи представителей высших слоев общества, которые пользуются этой формулой в два с лишним раза чаще, чем представители других социальных групп: 303,47 против 139,54 употреблений на миллион. Кроме того, очевидна тенденция к повышению частотности этой формулы извинения в каждом следующем социальном классе, начиная с низшего. Несмотря на ограничения, вызванные полисемией и неполной разметкой материалов, можно говорить о целесообразности применения корпуса как инструмента обучения межкультурной коммуникации.
134-148 447
Аннотация
Несмотря на отмену дискриминационного законодательства в США и последующие меры общественного и правового воздействия, расизм до сих пор остается одной из самых острых проблем американского общества. Современный расизм зачастую выражается в завуалированных и трудно различимых формах (covert, subtle racism), которые включают в себя проявление излишней вежливости или специфическое употребление эвфемизмов. Являясь средством выражения основных идеологических позиций, язык также служит мощным инструментом воздействия на общественное сознание. В статье раскрываются способы воспроизводить и укоренять расовую идеологию посредством языка. Оппозиция социальных конструктов «whiteness» и «blackness» непосредственно отражается и в лингвистических явлениях. Например, в таком явлении, как политкорректность, ставшем обязательной частью языковой практики западного общества. Автор также раскрывает содержание популярной в США идеологии расового «дальтонизма» (colorblind ideology). В противоположность политике мультикультурализма концепция расового «дальтонизма» не признает никаких различий между расовыми и этническими группами. Однако в американском дискурсе данная идеология стала ассоциироваться со скрытым расизмом, так как приводит к замалчиванию существующих расовых проблем и превращает любое упоминание о расах и расизме в запретную тему. Обосновывается идея о том, что американский английский идеологически связан с категориями расы в сознании его носителей. На примере афроамериканской культуры и афроамериканского английского языка проводится социолингвистический анализ таких феноменов, как «лингвистическая апроприация» и «лингвистическая дискриминация». Диаметрально противоположные проблемы характеризуют американскую действительность: с одной стороны, проблема сохранения языковой и культурной самобытности этнических меньшинств, с другой - их комплексная интеграция в американское общество. Отталкиваясь от концепции «двойственного сознания» Уильяма Дюбуа, автор утверждает, что данный дуализм как одно из важнейших последствий столетий рабства и сегрегации свойственен не только афроамериканскому сообществу, но и евроамериканцам.
149-160 212
Аннотация
Статья посвящена анализу изменений, связанных с образом войны в русском языковом сознании, на материале психолингвистических ассоциативных экспериментов. Результаты анализа могут применяться в комплексной гуманитарной экспертизе, направленной на мониторинг этнополитической ситуации в рамках своевременной диагностики зарождающихся конфликтов. Сравнительно-сопоставительный анализ русских ассоциативных баз, полученных в разные годы, позволил вскрыть динамику связей, образуемых словом война на макроуровне (в ядре языкового сознания) и на микроуровне (в ассоциативном поле, объединяющем реакции на слово-стимул война). Сравнение с материалами иноязычных ассоциативных баз (британской, американской, французской и испанской) позволило выявить специфику смысловой структуры общерусских образов языкового сознания, а также универсальные образы, характерные для русского языкового сознания и языкового сознания европейских народов. С помощью ассоциативного эксперимента, проведенного с российскими военнослужащими, выявлены профессиональные особенности связей, образуемых словом война. В языковом сознании военных слово война образует большое количество ассоциативных связей, тогда как в обыденном сознании это понятие не обладает высокой степенью актуальности. Во всех анализируемых ассоциативных базах к наиболее частотным ассоциатам, вызванным словом война, относятся слова мир и смерть. При этом если в европейских ассоциативных базах разных лет неизменным остается высокая частотность реакции мир, образующей вместе со стимулом война универсальную дихотомию, то в языковом сознании русских в течение последних сорока лет на первое место по частотности вышла ассоциация «война - смерть». Различия в степени устойчивости дихотомии «война - мир» в языковом сознании русских и европейцев могут быть связаны с изменчивостью смысловой наполненности обоих членов дихотомии, о чем свидетельствуют результаты их этимологического анализа, предпринятого в ходе данного исследования.
ISSN 1818-7935 (Print)