Метод обробки неструктурованих даних для вдосконалення аналізу тексту
Вантажиться...
Файли
Дата
2025
Автори
Affiliation
Назва журналу
Номер ISSN
Назва тому
Видавець
Державний торговельно-економічний університет
Анотація
У статті досліджено підхід до обробки неструктурованих текстових даних з метою підвищення якості аналізу тексту. Розглянуто основні етапи NLP-пайплайну: очищення, токенізація, лематизація, видалення стоп-слів та векторизація. Проведено практичну реалізацію на базі відкритого датасету з Kaggle із використанням Python-бібліотек (spaCy, scikit-learn). Результати свідчать про підвищення точності класифікації тональності після попередньої обробки. Запропоновано подальші напрями вдосконалення, зокрема застосування трансформерів.
Опис
Ключові слова
Бібліографічний опис
Оліфіренко, К. А. (2025). Метод обробки неструктурованих даних для вдосконалення аналізу тексту. У А. В. Селіванова (Ред.), Прикладні комп’ютерні технології (с. 96–101). Державний торговельно-економічний університет.