Preview

Вестник НГУ. Серия: Лингвистика и межкультурная коммуникация

Расширенный поиск

Об одном подходе к автоматической суммаризации потребительских отзывов

https://doi.org/10.25205/1818-7935-2022-20-4-90-106

Аннотация

Потребительские отзывы являются важным аспектом электронной коммерции, они влияют на коммуникативное поведение потенциального адресата (покупателей). Пользователи часто читают их, чтобы получить общее либо конкретное представление о продукте или услуге. Компании анализируют отзывы клиентов для усовершенствования своих продуктов и/или для корректировки маркетинговой стратегии. Однако из-за слабой структурированности отзывов и быстро возрастающего количества, их изучение становится трудоемким процессом как для пользователей, так и для компаний. Вследствие этого повышается актуальность проблемы автоматической суммаризации потребительских отзывов. В данной статье предлагается новый подход к решению этой задачи, разработанный на основе проведенного и апробированного исследования отзывов о цифровой и бытовой технике. Он позволяет структурировать и расположить тексты отзывов в соответствии с тематической иерархией аспектов, предоставить сводную информацию об их тональности (количестве положительных и отрицательных упоминаний тех или иных аспектов), а также показать наиболее релевантные предложения. Исследование строится на материале текстов отзывов, собранных с интернет-ресурса «Яндекс.Маркет». Подробно описан процесс суммаризации отзывов, включающий несколько этапов: 1) экспертное формирование перечня тематических классов аспектных терминов; 2) классификация предложений по заданным классам аспектов; 3) распределение предложений на два класса – положительные и отрицательные – с подсчетом количества положительных и отрицательных предложений внутри каждого класса аспектов; 4) этап ранжирования предложений; 5) этап визуализации результатов, полученных на предыдущих шагах. Качество работы алгоритма по созданию резюме из большой коллекции отзывов было протестировано на пяти моделях товаров из следующих категорий: кофемашины, роботы-пылесосы, электронные книги, телевизоры, стиральные машины.

Об авторе

Н. С. Чечнева
Санкт-Петербургский государственный университет
Россия

Чечнева Надежда Сергеевна, аспирант

Санкт-Петербург



Список литературы

1. Борисова Е. Г. Маркетинговая лингвистика: направления и перспективы // Верхневолжский филологический вестник. 2016. № 4. С. 140–143.

2. РД 50-165-79 Товары народного потребления. Выбор номенклатуры потребительских свойств и показателей качества. Основные положения [Электронный ресурс]. URL: https://files.stroyinf.ru/Index2/1/4293762/4293762287.htm (дата обращения: 28.05.2022).

3. Рубашкин В. Ш. Онтологическая семантика. Знания. Онтологии. Онтологически ориентированные методы информационного анализа текстов. М.: Физматлит, 2012. 348 с.

4. Akhtar N. et al. Aspect based sentiment oriented summarization of hotel reviews // Procedia computer science. 2017. Т. 115. Pp. 563–571.

5. Bojanowski P. et al. Enriching word vectors with subword information // Transactions of the association for computational linguistics. 2017. Vol. 5. Pp. 135–146.

6. Brokos G. I., Malakasiotis P., Androutsopoulos I. Using centroids of word embeddings and word mover’s distance for biomedical document retrieval in question answering // Proceedings of the 15th Workshop on Biomedical Natural Language Processing, 2016. Pp. 114–118.

7. Condori R. E. L., Pardo T. A. S. Opinion summarization methods: Comparing and extending extractive and abstractive approaches // Expert Systems with Applications. 2017. Vol. 78. Pp. 124–134.

8. d’Sa A. G. et al. Label propagation-based semi-supervised learning for hate speech classification // Insights from Negative Results Workshop, EMNLP, 2020.

9. Ellson J. et al. Graphviz and dynagraph—static and dynamic graph drawing tools // Graph drawing software. Springer, Berlin, Heidelberg, 2004. Pp. 127–148.

10. Fishbein M. An investigation of the relationships between beliefs about an object and the attitude toward that object // Human relations. 1963. Vol. 16, № 3. Pp. 233–239.

11. Howard J. A. Consumer behavior: Application of theory. McGraw-Hill Companies. 1977.

12. Johnson E. J., Tversky A. Representations of Perceptions of Risk // Journal of Experimental Psychology: General, 1984. Pp. 55–70.

13. Hu M., Liu B. Mining and summarizing customer reviews // Proceedings of the tenth ACM SIGKDD international conference on Knowledge discovery and data mining, 2004. Pp. 168–177.

14. Kim S. et al. A hierarchical aspect-sentiment model for online reviews // Proceedings of the AAAI Conference on Artificial Intelligence. 2013. Vol. 27. Pp. 526–533.

15. Joulin A., Grave E., Bojanowski P., Mikolov T. Bag of Tricks for Efficient Text Classification // Proceedings of the 15th Conference of the European Chapter of the Association for Computational Linguistics, 2017. Pp. 427–431.

16. Kotler F. Marketing Management: Analysis, Planning, and Control. Prentice-Hall. 1967. 628 p.

17. Lancaster K. J. A new approach to consumer theory // Journal of political economy. 1966. Vol. 74, № 2. Pp. 132–157

18. Mihalcea R., Tarau P. Textrank: Bringing order into text // Proceedings of the 2004 conference on empirical methods in natural language processing. 2004. Pp. 404–411.

19. Mithun S., Kosseim L. Summarizing blog entries versus news texts // Proceedings of the Workshop on Events in Emerging Text Types. 2009. Pp. 1–8

20. Mukherjee A., Liu B. Aspect extraction through semi-supervised modeling // Proceedings of the 50th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). 2012. Pp. 339–348.

21. Rosenberg M. J. Cognitive structure and attitudinal affect // The Journal of abnormal and social psychology. 1956. Vol. 53, № 3. P. 367.

22. Thaler R. Toward a positive theory of consumer choice // Journal of economic behavior & organization. 1980. Vol. 1, № 1. Pp. 39–60.

23. Tversky A., Kahneman D. Judgment under uncertainty: Heuristics and biases // Science. 1974. Vol. 185, № 4157. Pp. 1124–1131.

24. Zhai Z. et al. Clustering product features for opinion mining // Proceedings of the fourth ACM international conference on Web search and data mining. 2011. Pp. 347–354

25. Yu J. et al. Domain-assisted product aspect hierarchy generation: towards hierarchical organization of unstructured consumer reviews // Proceedings of the 2011 conference on empirical methods in natural language processing. 2011. Pp. 140–150.


Рецензия

Для цитирования:


Чечнева Н.С. Об одном подходе к автоматической суммаризации потребительских отзывов. Вестник НГУ. Серия: Лингвистика и межкультурная коммуникация. 2022;20(4):90-106. https://doi.org/10.25205/1818-7935-2022-20-4-90-106

For citation:


Chechneva N.S. An Approach to Summarizing Product Reviews. NSU Vestnik. Series: Linguistics and Intercultural Communication. 2022;20(4):90-106. (In Russ.) https://doi.org/10.25205/1818-7935-2022-20-4-90-106

Просмотров: 288


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1818-7935 (Print)