МЕТОДОЛОГИЧЕСКИЙ ПОТЕНЦИАЛ СЕНТИМЕНТ-АНАЛИЗА: КОРПУСНЫЙ АСПЕКТ
УДК 81’33
Баркович Александр Аркадьевич – доктор филологических наук, доцент, заведующий кафедрой информатики и прикладной лингвистики. Минский государственный лингвистический университет (220034, г. Минск, ул. Захарова, 21, Республика Беларусь). E-mail: barkovichaa@gmail.com
Антонов Андрей Владимирович – студент. Минский государственный лингвистический университет (220034, г. Минск, ул. Захарова, 21, Республика Беларусь). E-mail: andrey56735472@gmail.com
DOI: https://doi.org/ 10.52065/2520-6729-2023-273-2-5.
Ключевые слова: сентимент-анализ, корпус текстов, тональность текста, тональный словарь, оценка, контекст.
Для цитирования: Баркович А. А. Методологический потенциал сентимент-анализа: корпусный аспект // Труды БГТУ. Сер. 4, Принт- и медиатехнологии. 2023. № 2 (273). С. 32–39. DOI: 10.52065/2520-6729-2023-273-2-5.
Аннотация
Данная статья посвящена аспектам проведения процедуры сентимент-анализа на материале корпуса текстов. Сентимент-анализ текста традиционно ориентирован на оценку небольших речевых артефактов, типичным примером обрабатываемого текстового материала является пост блога или мессенджера. Вместе с тем постоянное развитие корпусного формата обусловливает актуальность реализации в референтном контексте всего спектра возможностей автоматизированной обработки речи, в том числе лингвопрагматической по сути практики сентимент-анализа. Данные возможности востребованы, однако их полноценная реализация предполагает предварительную апробацию существующих инструментов сентимент-анализа и их адаптацию для проведения исследований, в частности, в полностью совместимом с компьютерно-опосредованной коммуникацией корпусном аспекте – на качественно инновационном уровне. В процессе проведения соответствующего анализа был систематизирован и охарактеризован имеющийся методологический потенциал и предложены как пути тактической актуализации, так и стратегия совершенствования практики сентимент-анализа. Научная репрезентация релевантной проблематики поспособствует более полному раскрытию интердисциплинарного потенциала сентимент-анализа и позволит повысить результативность и эффективность его проведения.
Список литературы
- Майорова Е. В. О сентимент-анализе и перспективах его применения // Социальные и гуманитарные науки. Отечественная и зарубежная литература. Сер. 6: Языкознание. 2020. № 4. С. 78–87.
- Семина Т. А. Анализ тональности текста: современные подходы и существующие проблемы // Социальные и гуманитарные науки. Отечественная и зарубежная литература. Сер. 6: Языкознание. 2020. № 4. C. 47–64.
- Beigi G., Hu X., Maciejewski R., Liu H. An overview of sentiment analysis in social media and its applications in disaster relief // Sentiment analysis and ontology engineering: an environment of computational intelligence / eds. W. Pedrycz, S.-M. Chen. Cham: Springer, 2016. Р. 313–340.
- Araque O. Zhu G., Iglesias C. A. A semantic similarity-based perspective of affect lexicons for sentiment analysis // Knowledge-Based Systems. 2019. No. 165. Р. 346–359.
- Liu B. Sentiment analysis and opinion mining // Synthesis lectures on human language technologies. 2012. Vol. 5, no. 1. Р. 1–16.
- Баркович А. А., Ван Ц. Лингвистические корпусы китайского языка: функциональный аспект // Вестник МГЛУ. Сер. 1. Филология. 2015, № 5 (78). С. 105–113.
- Antonov A. V., Barkovich A. A. Instrument-independent text corpus “Avatar: The Way of Water” (movie reviews). URL: https://drive.google.com/file/d/1Y7V15sEmH0NI6rAFSbyIjAXd0wYY5h/view (accessed: 20.05.2023).
- VADER Sentiment Analysis: A Complete Guide, Algo Trading and More. URL: https://blog.quantinsti.com/vader-sentiment (accessed: 20.05.2023).
- Баркович А. А. Сентимент-анализ: лингвистический потенциал регламентации предобработки // Виртуальная коммуникация и социальные сети. 2023. Т. 2, № 3. С. 116–123.
- Mohammad S. M. Sentiment analysis: Detecting valence, emotions, and other affectual states from text // Emotion measurement. Elsevier. 2016. Р. 201–237.
- Пазельская А. Г., Соловьев А. Н. Метод определения эмоций в текстах на русском языке // Компьютерная лингвистика и интеллектуальные технологии: ежегодная Междунар. конф. «Диалог», Бекасово, 25–29 мая 2011 г. М., 2011. Вып. 10. С. 510–522.
- Taboada M., Brooke J., Tofiloski M., Voll K., Stede M. Lexicon-based methods for sentiment analysis // Computational linguistics. 2011. No. 37(2). Р. 267–307.
- Кулагин Д. И. Открытый тональный словарь русского языка КартаСловСент // Компьютерная лингвистика и интеллектуальные технологии: ежегодная Междунар. конф. «Диалог», Москва, 16– 19 июня 2021 г., М., 2021. Вып. 20. С. 1106–1119.
- Hutto C. J., Gilbert E. VADER: A parsimonious rule-based model for sentiment analysis of social media text // Proceedings of the 8th international conference on weblogs and social media (ICWSM), 2014, May. Ann Arbor, Michigan USA: PKP Publishing Services Network. 2014. Р. 216–225.
- Баркович А. А. Компьютерно-опосредованная коммуникация: потенциал металексической значимости // Ученые записки Петрозаводского государственного университета. Общественные и гуманитарные науки. 2015, № 7 (152). С. 38–43.
Поступила 26.06.2023