КЛАССИФИКАЦИЯ ТИПОВ ДАННЫХ, ИСПОЛЬЗУЕМЫХ В АНАЛИТИКЕ БОЛЬШИХ ДАННЫХ
УДК 681.518
Королёв Артём Андреевич – старший преподаватель кафедры автоматизации производственных процессов и электротехники. Белорусский государственный технологический университет (ул. Свердлова, 13а, 220006, г. Минск, Республика Беларусь). E-mail: korolev@belstu.by
Карпович Дмитрий Семёнович – кандидат технических наук, доцент, заведующий кафедрой автоматизации производственных процессов и электротехники. Белорусский государственный технологический университет (ул. Свердлова, 13а, 220006, г. Минск, Республика Беларусь). E-mail: d.karpovich@belstu.by
Фокин Тимофей Павлович – преподаватель-стажер кафедры автоматизации производственых процессов и электротехники. Белорусский государственный технологический университет (ул. Свердлова, 13а, 220006, г. Минск, Республика Беларусь). E-mail: fokin@belstu.by
DOI: https://doi.org/ 10.52065/2520-6141-2025-290-6.
Ключевые слова: большие данные, структурированные данные, полуструктурированные данные, неструктурированные данные.
Для цитирования: Королёв А. А., Карпович Д. С., Фокин Т. П. Классификация типов данных, используемых в аналитике больших данных // Труды БГТУ. Сер. 3, Физико-математические науки и информатика. 2025. № 1 (290). С. 31–35. DOI: 10.52065/2520-6141-2025-290-6.
Аннотация
Статья посвящена основным категориям данных, применяемых в современных системах Big Data. В статье проводится классификация данных на структурированные, полуструктурированные и неструктурированные с описанием особенностей каждого типа, анализу их ключевых характеристик, а также сравнению их преимуществ и недостатков. Также в статье приведено описание больших данных, рассмотрены общие понятия и особенности больших данных, сферы их применения, источники их появления. Проведен анализ основных типов данных, используемых в системах Big Data, посредством сравнения их между собой по таким характеристикам, как гибкость, масштабируемость, сложность анализа, сложность интеграции, вид представления данных, эффективность хранения, сложность запросов для выборки данных. Рассматриваются технологии, которые обеспечивают эффективное использование различных типов данных в рамках Big Data, а также роль этих технологий в улучшении процессов обработки и принятия решений на предприятиях. Подчеркнута важность анализа каждого из существующих типов данных для оптимизации бизнес-операций.
Список литературы
- Chen M., Mao S., Liu Y. Big data: A survey // Mobile Networks and Applications. 2014. Vol. 19 (2). P. 171–209. DOI: 10.1007/s11036-013-0489-0.
- Katal A., Wazid M., Goudar R. H. Big Data: Issues, challenges, tools and good practices // 6th International Conference on Contemporary Computing (IC3). 2013. P. 404–409. DOI: 10.1109/IC3.2013.6612229.
- Chen C. P., Zhang C. Y. Data-intensive applications, challenges, techniques and technologies: A survey on Big Data // Information Sciences. 2014. Vol. 275. P. 314–347. DOI: 10.1016/j.ins.2014.01.015.
- Gandomi A., Haider M. Beyond the hype: Big data concepts, methods, and analytics // International Journal of Information Management. 2015. Vol. 35 (2). P. 137–144. DOI: 10.1016/j.ijinfomgt.2014.10.007.
- Papakonstantinou Y. Semistructured Models, Queries and Algebras in the Big Data Era // SIGMOD '16: Proceedings of the 2016 International Conference on Management of Data. 2016. P. 2229–2233. DOI: 10.1145/2882903.2912573.
Поступила после доработки 15.01.2025