Структурные модели терминологических словосочетаний для разметки корпуса научно-технических текстов
https://doi.org/10.25205/1818-7935-2021-19-3-45-56
Аннотация
В статье представлены структурные модели терминологических словосочетаний из предметной области «Сварка» как основа для создания автоматизированных средств разметки корпусов научно-технических текстов. Обозначено место корпусов научно-технических текстов в корпусной лингвистике и перспективы дальнейших научных исследований на их основе. Актуальность исследования обусловлена необходимостью создания корпусов научно-технических текстов в целом и средств автоматической разметки терминов в частности. Обосновано, что в настоящее время основной проблемой при создании корпусов научно-технических текстов является автоматическая разметка терминологических словосочетаний. Проведен анализ современного состояния терминосистемы предметной области «Сварка». Представлены результаты анализа двух-, трех-, четырех- и пятикомпонентных терминологических словосочетаний предметной области «Сварка», а также созданы и проиллюстрированы примерами их структурные модели. Обоснована необходимость исчисления всех возможных структурных моделей терминологических сочетаний. Усложнение структуры терминологического словосочетания чаще всего связано с усложнением структуры постпозитивного определения в зависимости от выражаемых им видовых особенностей. Новизна исследования видится в обеспечении теоретического базиса для формирования базы данных структурных моделей терминологических словосочетаний как основы надкорпусной базы данных о структуре многокомпонентных терминов для повышения качества автоматической разметки корпусов научно-технических текстов; также предложен подход к автоматической разметке многокомпонентных терминов на основе структурных моделей терминологических словосочетаний. Результат полезен также для обработки терминов-кандидатов при проведении корпусных исследований при последующем использовании корпусов научно-технических текстов.
Об авторах
Ю. И. БутенкоРоссия
Н. С. Николаева
Россия
Т. Д. Маргарян
Россия
Список литературы
1. Захаров В. П. Корпуса русского языка // Труды института русского языка им. В. В. Виноградова. 2015. Т. 6. С. 20–65.
2. Захаров В. П., Богданова С. Ю. Корпусная лингвистика: учебник. 3-е изд., перераб. СПб.: Изд-во С.-Петерб. ун-та, 2020. 234 с.
3. Захаров В. П., Хохлова М. В. Автоматическое извлечение терминов из специальных текстов с использованием дистрибутивно-статистического метода как инструмент создания тезаурусов // Структурная и прикладная лингвистика. 2012. № 9. С. 222–233.
4. Захаров В. П., Хохлова М. В. Автоматическое выявление терминологических словосочетаний // Структурная и прикладная лингвистика. 2014. № 10. С. 182–200.
5. Гринев-Гриневич С. В., Сорокина Э. А. Опыт описания формальной структуры термина (на материале английской терминологии лексикологии // Вестник Московского государственного областного университета. Серия: Лингвистика, 2020. № 5. С. 74–85. DOI 10.18384/2310-712X-2020-5-74-85
6. Кружков М. Г. Информационные ресурсы контрастивных лингвистических исследований: электронные корпуса текстов // Системы и средства информатики. 2015. Т. 25, № 2. С. 140–159.
7. Лейчик В. М. Исходные понятия, основные положения, определения современного терминоведения и терминографии // Вестник Харьковского политехнического университета. 1994. № 1. C. 147–180.
8. Лесников В. С. Виды разметок текстовых корпусов русского языка // Научно-техническая информация. Серия 2. Информационные процессы и системы. 2019. № 9. С. 27–30.
9. Лотте Д. С. Основы построения научно-технической терминологии. М.: Изд-во АН СССР, 1961. 158 с.
10. Морев Н. А. К проблеме лингвистического анализа терминологии в области нанотехнологий (о необходимости разработки исследовательского корпуса терминологических единиц) // Вестник МГЛУ. 2012. № 13 (646). С. 115–124.
11. Нагель О. В. Корпусная лингвистика и ее использование в компьютеризированном языковом обучении // Язык и культура, 2008. № 4. С. 53–59.
12. Николаева Н. С. Особенности происхождения основных терминов терминосистемы «Сварка» (на материале английской и русской терминологий) // Вестник Московского государственного областного университета. Серия: Лингвистика. 2011. № 1. С. 132–138.
13. Циткина Ф. А. Терминология и перевод. Львов: Высшая школа, 1988. 157 с.
14. Терминология сварки металлов / Под ред. С. А. Чаплыгина, Д. С. Лотте. М.: Изд-во Акад. наук СССР, 1937. 31 с.
15. Butenko Iu. I., Garazha V. V. BMSTU Corpus of Scientific and Technical Texts: Conceptual Framework. Applied Linguistics Research Journal, 2021, vol. 5(3), p. 76–81. DOI 10.14744/alrj.2021.15579
16. Loukachevitch N., Dobrov B. Ontological Resources for Representing Security Domain in Infor-mation-Analytical System. Open Semantic Technologies for Intelligent Systems Design, 2018. № 8. P. 185–191.
Рецензия
Для цитирования:
Бутенко Ю.И., Николаева Н.С., Маргарян Т.Д. Структурные модели терминологических словосочетаний для разметки корпуса научно-технических текстов. Вестник НГУ. Серия: Лингвистика и межкультурная коммуникация. 2021;19(3):45-56. https://doi.org/10.25205/1818-7935-2021-19-3-45-56
For citation:
Butenko I.I., Nikolaeva N.S., Margaryan T.D. Structural Models of Terminological Word Combinations for Marking up a Corpus of Scientific and Technical Texts. NSU Vestnik. Series: Linguistics and Intercultural Communication. 2021;19(3):45-56. (In Russ.) https://doi.org/10.25205/1818-7935-2021-19-3-45-56