Метод обробки неструктурованих даних для вдосконалення аналізу тексту

Вантажиться...
Ескіз

Дата

2025

Affiliation

Назва журналу

Номер ISSN

Назва тому

Видавець

Державний торговельно-економічний університет

Анотація

У статті досліджено підхід до обробки неструктурованих текстових даних з метою підвищення якості аналізу тексту. Розглянуто основні етапи NLP-пайплайну: очищення, токенізація, лематизація, видалення стоп-слів та векторизація. Проведено практичну реалізацію на базі відкритого датасету з Kaggle із використанням Python-бібліотек (spaCy, scikit-learn). Результати свідчать про підвищення точності класифікації тональності після попередньої обробки. Запропоновано подальші напрями вдосконалення, зокрема застосування трансформерів.

Опис

Ключові слова

Бібліографічний опис

Оліфіренко, К. А. (2025). Метод обробки неструктурованих даних для вдосконалення аналізу тексту. У А. В. Селіванова (Ред.), Прикладні комп’ютерні технології (с. 96–101). Державний торговельно-економічний університет.

Doi

UDC

Orcid