Preview

Вестник НГУ. Серия: Лингвистика и межкультурная коммуникация

Расширенный поиск

Структурные модели терминологических словосочетаний для разметки корпуса научно-технических текстов

https://doi.org/10.25205/1818-7935-2021-19-3-45-56

Аннотация

В статье представлены структурные модели терминологических словосочетаний из предметной области «Сварка» как основа для создания автоматизированных средств разметки корпусов научно-технических текстов. Обозначено место корпусов научно-технических текстов в корпусной лингвистике и перспективы дальнейших научных исследований на их основе. Актуальность исследования обусловлена необходимостью создания корпусов научно-технических текстов в целом и средств автоматической разметки терминов в частности. Обосновано, что в настоящее время основной проблемой при создании корпусов научно-технических текстов является автоматическая разметка терминологических словосочетаний. Проведен анализ современного состояния терминосистемы предметной области «Сварка». Представлены результаты анализа двух-, трех-, четырех- и пятикомпонентных терминологических словосочетаний предметной области «Сварка», а также созданы и проиллюстрированы примерами их структурные модели. Обоснована необходимость исчисления всех возможных структурных моделей терминологических сочетаний. Усложнение структуры терминологического словосочетания чаще всего связано с усложнением структуры постпозитивного определения в зависимости от выражаемых им видовых особенностей. Новизна исследования видится в обеспечении теоретического базиса для формирования базы данных структурных моделей терминологических словосочетаний как основы надкорпусной базы данных о структуре многокомпонентных терминов для повышения качества автоматической разметки корпусов научно-технических текстов; также предложен подход к автоматической разметке многокомпонентных терминов на основе структурных моделей терминологических словосочетаний. Результат полезен также для обработки терминов-кандидатов при проведении корпусных исследований при последующем использовании корпусов научно-технических текстов.

Об авторах

Ю. И. Бутенко
Московский государственный технический университет им. Н. Э. Баумана; Российский университет дружбы народов
Россия


Н. С. Николаева
Московский государственный технический университет им. Н. Э. Баумана
Россия


Т. Д. Маргарян
Московский государственный технический университет им. Н. Э. Баумана
Россия


Список литературы

1. Захаров В. П. Корпуса русского языка // Труды института русского языка им. В. В. Виноградова. 2015. Т. 6. С. 20–65.

2. Захаров В. П., Богданова С. Ю. Корпусная лингвистика: учебник. 3-е изд., перераб. СПб.: Изд-во С.-Петерб. ун-та, 2020. 234 с.

3. Захаров В. П., Хохлова М. В. Автоматическое извлечение терминов из специальных текстов с использованием дистрибутивно-статистического метода как инструмент создания тезаурусов // Структурная и прикладная лингвистика. 2012. № 9. С. 222–233.

4. Захаров В. П., Хохлова М. В. Автоматическое выявление терминологических словосочетаний // Структурная и прикладная лингвистика. 2014. № 10. С. 182–200.

5. Гринев-Гриневич С. В., Сорокина Э. А. Опыт описания формальной структуры термина (на материале английской терминологии лексикологии // Вестник Московского государственного областного университета. Серия: Лингвистика, 2020. № 5. С. 74–85. DOI 10.18384/2310-712X-2020-5-74-85

6. Кружков М. Г. Информационные ресурсы контрастивных лингвистических исследований: электронные корпуса текстов // Системы и средства информатики. 2015. Т. 25, № 2. С. 140–159.

7. Лейчик В. М. Исходные понятия, основные положения, определения современного терминоведения и терминографии // Вестник Харьковского политехнического университета. 1994. № 1. C. 147–180.

8. Лесников В. С. Виды разметок текстовых корпусов русского языка // Научно-техническая информация. Серия 2. Информационные процессы и системы. 2019. № 9. С. 27–30.

9. Лотте Д. С. Основы построения научно-технической терминологии. М.: Изд-во АН СССР, 1961. 158 с.

10. Морев Н. А. К проблеме лингвистического анализа терминологии в области нанотехнологий (о необходимости разработки исследовательского корпуса терминологических единиц) // Вестник МГЛУ. 2012. № 13 (646). С. 115–124.

11. Нагель О. В. Корпусная лингвистика и ее использование в компьютеризированном языковом обучении // Язык и культура, 2008. № 4. С. 53–59.

12. Николаева Н. С. Особенности происхождения основных терминов терминосистемы «Сварка» (на материале английской и русской терминологий) // Вестник Московского государственного областного университета. Серия: Лингвистика. 2011. № 1. С. 132–138.

13. Циткина Ф. А. Терминология и перевод. Львов: Высшая школа, 1988. 157 с.

14. Терминология сварки металлов / Под ред. С. А. Чаплыгина, Д. С. Лотте. М.: Изд-во Акад. наук СССР, 1937. 31 с.

15. Butenko Iu. I., Garazha V. V. BMSTU Corpus of Scientific and Technical Texts: Conceptual Framework. Applied Linguistics Research Journal, 2021, vol. 5(3), p. 76–81. DOI 10.14744/alrj.2021.15579

16. Loukachevitch N., Dobrov B. Ontological Resources for Representing Security Domain in Infor-mation-Analytical System. Open Semantic Technologies for Intelligent Systems Design, 2018. № 8. P. 185–191.


Рецензия

Для цитирования:


Бутенко Ю.И., Николаева Н.С., Маргарян Т.Д. Структурные модели терминологических словосочетаний для разметки корпуса научно-технических текстов. Вестник НГУ. Серия: Лингвистика и межкультурная коммуникация. 2021;19(3):45-56. https://doi.org/10.25205/1818-7935-2021-19-3-45-56

For citation:


Butenko I.I., Nikolaeva N.S., Margaryan T.D. Structural Models of Terminological Word Combinations for Marking up a Corpus of Scientific and Technical Texts. NSU Vestnik. Series: Linguistics and Intercultural Communication. 2021;19(3):45-56. (In Russ.) https://doi.org/10.25205/1818-7935-2021-19-3-45-56

Просмотров: 330


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1818-7935 (Print)