СЕНТИМЕНТ-АНАЛИЗ: ПРАГМАТИЧЕСКАЯ СПЕЦИФИКА

УДК 81’33

 

Баркович Александр Аркадьевич – доктор филологических наук, доцент, заведующий кафедрой информатики и прикладной лингвистики. Минский государственный лингвистический университет (220034, г. Минск, ул. Захарова, 21, Республика Беларусь). E-mail: barkovichaa@gmail.com

Петрова Наталья Сергеевна – преподаватель. Минский государственный лингвистический университет (220034, г. Минск, ул. Захарова, 21, Республика Беларусь). E-mail: natali040100@gmail.com

 

DOI: https://doi.org/ 10.52065/2520-6729-2023-273-2-6.

 

Ключевые слова: : сентимент-анализ, прагматика, методика, оценка тональности, тональный словарь, машинное обучение.

 

Для цитирования: Баркович А. А., Петрова Н. С. Сентимент-анализ: прагматическая специфика // Труды БГТУ. Сер. 4, Принт- и медиатехнологии. 2023. № 2 (273). С. 40–46. DOI: 10.52065/2520-6729-2023-273-2-6.

 

Аннотация

В статье рассмотрены прагматические аспекты практической реализации основных методик сентимент-анализа. Во введении очерчена специфика сентимент-анализа как актуального направления развития компьютерной лингвистики. В фокусе исследования – прагматика реализации методологического потенциала оценки тональности текста. В разделе, посвященном методам оценки тональности текста, дана характеристика приоритетов сентимент-анализа: целесообразности и результативности. Описаны методики сентимент-анализа и модели, лежащие в их основе. В разделе, посвященном результатам исследования и их оценке, отражена специфика использования методик тональных словарей, машинного обучения и машинного обучения с использованием тональных словарей. Иллюстративный материал представлен фрагментом англоязычного медиадискурса, репрезентативным для детализированного изучения уровневой специфики сентимент-анализа. Исследование базировалось на общепринятом категориальном фундаменте, в том числе охватывающем полярность, интенсивность и магнитуду тональности текста. Кроме традиционной лексико-грамматической парадигмы исследования текста, должное внимание было уделено таким инновационным лингвистическим категориям, как сущности и ключевые слова. Были идентифицированы такие категории метаданных, как бренды, геополитические реалии, национальности и ряд др. В целом новизна проведенного исследования обеспечена лингвистическим анализом информационных процедур и методологической рефлексией интердисциплинарной проблематики. Не менее значимо рассмотрение прагмалингвистических аспектов деятельности по оценке тональности текста и актуализация в данной связи нового знания. Наиболее достоверные метаданные о тональности исследованного документа были получены с применением методики машинного обучения. Экспликация релевантных данных выполнялась программными средствами, специально предназначенными для проведения оценки тональности текста. Результаты данного исследования будут актуальны для оптимизации процедуры сентимент-анализа на всех ее этапах и имплементации соответствующих метаданных и знаний в лингвистическую и информационную практики.

Скачать

Список литературы

  1. Liu B., Hu M., Cheng J. Opinion Observer: Analyzing and Comparing Opinions on the Web // WWW– 2005: Proceedings of the 14th International World Wide Web conference, May 10–14, 2005, Chiba, Japan. New York, 2005. Р. 342–351.
  2. Pang B., Lee L. Opinion Mining and Sentiment Analysis // Foundations and Trends in Information Retrieval. 2008. Vol. 2, no. 1–2. Р. 1–135.
  3. Feldman R. Techniques and applications for sentiment analysis // Communications of the ACM. 2013. Vol. 56, no. 4. Р. 82–89.
  4. Handbook of Natural Language Processing / eds.: N. Indurkhya, F. J. Damerau. Boca Raton: Chapman & Hall / CRC, 2010. 702 p.
  5. Barkovich A. Informational Linguistics: The New Communicational Reality Newcastle upon Tyne: Cambridge Scholars Publ., 2020. 271 p.
  6. Баркович А. А. Интернет-дискурс: компьютерно-опосредованная коммуникация. М.: Флинта: Наука, 2015. 288 с.
  7. Reagan A. J., Danforth C. M., Tivnan B., Williams J. R., Dodds P. S. Sentiment analysis methods for understanding large-scale texts: a case for using continuum-scored words and word shift graphs // EPJ Data Science. 2017, 6.
  8. Poria S., Hazarika D., Majumder N., Mihalcea R. Beneath the tip of the iceberg: current challenges and new directions in sentiment analysis research // IEEE Transactions on Affective Computing. 2020. No. 14(1). Р. 108–132.
  9. Rana M. R. R., Nawaz A., Iqbal J. A survey on sentiment classification algorithms, challenges and applications // Acta Universitatis Sapientiae, Informatica. 2018. No. 10(1). Р. 58–72.
  10. Пазельская А. Г., Соловьев А. Н. Метод определения эмоций в текстах на русском языке // Компьютерная лингвистика и интеллектуальные технологии: ежегодная Междунар. конф. «Диалог», Бекасово, 25–29 мая 2011 г., М., 2011. Вып. 10. С. 510–522. 11. Taboada M., Brooke J., Tofiloski M., Voll K., Stede M. Lexicon-based methods for sentiment analysis // Computational linguistics. 2011. No. 37(2). Р. 267–307.
  11. Кулагин Д. И. Открытый тональный словарь русского языка КартаСловСент // Компьютерная лингвистика и интеллектуальные технологии: материалы ежегодной Междунар. конф. «Диалог», Москва, 16–19 июня 2021 г., М., 2021. Вып. 20. С. 1106–1119. 13. Баркович А. А. Тенденции развития компьютерно-опосредованного дискурса: металингвистический аспект // Вестник Тверского государственного университета. Филология. 2015, № 4. С. 108–114.
  12. Minsky M. The Emotion Machine: Commonsense Thinking, Artificial Intelligence, and the Future of the Human Mind. New York: Simon & Schuster, 2007. 400 p.
  13. Urban Dictionary. URL: https://www.urbandictionary.com/define.php?term=Lettuce (accessed: 13.05.2023).

 

Поступила 26.06.2023