Preview

Вестник НГУ. Серия: Лингвистика и межкультурная коммуникация

Расширенный поиск

ИСПОЛЬЗОВАНИЕ УНИВЕРСАЛЬНЫХ ЗАВИСИМОСТЕЙ ПРИ ГРАММАТИЧЕСКОМ РАЗБОРЕ МНОГОЯЗЫЧНОГО ТЕКСТА (НА ПРИМЕРЕ БЕЗЛИЧНОГО ПРЕДИКАТИВА)

https://doi.org/10.25205/1818-7935-2018-16-2-19-33

Аннотация

Статья посвящена инициативе универсальных зависимостей (УЗ), направленной на создание кросс-лингвистически непротиворечивой схемы грамматического разбора предложения. Цель данной инициативы - упрощение кросс-лингвистических исследований, унификация межъязыковой лингвистической типологии, создание основы для автоматизированных многоязычных систем и универсального кросс-языкового парсера текстов. В первой части статьи рассматриваются основные проблемы, возникающие при грамматическом разборе многоязычного текста, описываются преимущества унификации языковых признаков, даются цели проекта УЗ, приводится история возникновения проекта, на примере трех языков - русского, английского и немецкого - описываются основные принципы построения УЗ в части морфологии и синтаксиса, рассматриваются наиболее характерные варианты синтаксических конструкций. Во второй части статьи на примере безличного предикатива описывается, как можно вести корпусные исследования с использованием УЗ. Рассматривается методика автоматического выявления безличных предикативов, их частотное распределение в корпусе русского языка УЗ, семантическая категоризация наиболее часто используемых предикативов.

Об авторе

Е. В. Люкина
Национальный исследовательский университет «Высшая школа экономики»
Россия


Список литературы

1. Дяченко П. В., Иомдин Л. Л., Лазурский А. В., Митюшин Л. Г., Подлесская О. Ю., Сизов В. Г., Фролова Т. И., Цинман Л. Л. Современное состояние глубоко аннотированного корпуса текстов русского языка (СинТагРус) // Национальный корпус русского языка: 10 лет проекту. Труды Института русского языка им. В. В. Виноградова. М., 2015. Вып. 6. С. 272-299.

2. Летучий А. Б. Предикатив. Материалы для проекта корпусного описания русской грамматики (http://rusgram.ru). На правах рукописи. М., 2017.

3. Русская грамматика / Под ред. Н. Ю. Шведовой. М.: Наука, 1980. Т. 1: Фонетика. Фонология. Ударение. Интонация. Словообразование. Морфология; Т. 2: Синтаксис.

4. Шелякин М. А. Функциональная грамматика русского языка. М.: Русский язык, 2001.

5. Щерба Л. В. Языковая система и речевая деятельность. М.: Едиториал УРСС, 2004.

6. Duden. Mannheim; Leipzig; Wien; Zurich, 1995. Bd. 4: Grammatik der deutschen Gegenwartssprache.

7. Marneffe M. et al. Universal Stanford Dependencies: A cross-linguistic typology, 2006.

8. McDonald R., Nivre J., Quirmbach-Brundage Y., Goldberg Y., Das D., Ganchev K., Hall K., Petrov S., Zhang H., Täckström O., Bedini C., Bertomeu Castelló N., Lee J. Universal dependency annotation for multilingual parsing // ACL, 2013.

9. Nivre J., Marneffe M., Ginter F., Goldberg Y., Hajic J., Manning C., McDonald R., Petrov S., Pyysalo S., Silveira N., Tsarfaty R., Zeman D. Universal Dependencies v1: A Multilingual Treebank Collection // Proceedings of the Tenth International Conference on Language Resources and Evaluation. European Language Resources Association (ELRA). Paris, France, 2016.

10. Nivre J. Towards a Universal Grammar for Natural Language Processing // CICLing 2015: Proceedings of Computational Linguistics and Intelligent Text Processing. Cairo, Egypt, 2015. Vol. 9041. Р. 3-16.

11. Petrov S., Das D., McDonald R. A universal part-of-speech tagset // LREC, 2012.

12. Straka M., Hajič J., Straková J. UDPipe: Trainable Pipeline for Processing CoNLL-U Files Performing Tokenization, Morphological Analysis, POS Tagging and Parsing // Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016). Portorož, Slovenia, 2016.

13. Zeman D., Mareček D., Popel M., Ramasamy L., Štěpánek J., Žabokrtský Z., Hajič J. HamleDT: To parse or not to parse? // LREC, 2012. Р. 2735-2741.

14. Zeman D. Reusable tagset conversion using tagset drivers // LREC, 2008. Р. 213-218.


Рецензия

Для цитирования:


Люкина Е.В. ИСПОЛЬЗОВАНИЕ УНИВЕРСАЛЬНЫХ ЗАВИСИМОСТЕЙ ПРИ ГРАММАТИЧЕСКОМ РАЗБОРЕ МНОГОЯЗЫЧНОГО ТЕКСТА (НА ПРИМЕРЕ БЕЗЛИЧНОГО ПРЕДИКАТИВА). Вестник НГУ. Серия: Лингвистика и межкультурная коммуникация. 2018;16(2):19-33. https://doi.org/10.25205/1818-7935-2018-16-2-19-33

For citation:


Lyukina E.V. USE OF UNIVERSAL DEPENDENCIES FOR GRAMMATICAL ANALYSIS OF THE MULTILINGUAL TEXT (ON THE EXAMPLE OF PREDICATIVE). NSU Vestnik. Series: Linguistics and Intercultural Communication. 2018;16(2):19-33. (In Russ.) https://doi.org/10.25205/1818-7935-2018-16-2-19-33

Просмотров: 173


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1818-7935 (Print)