Оліфіренко, К. А.2026-03-172026-03-172025Оліфіренко, К. А. (2025). Метод обробки неструктурованих даних для вдосконалення аналізу тексту. У А. В. Селіванова (Ред.), Прикладні комп’ютерні технології (с. 96–101). Державний торговельно-економічний університет.https://ur.knute.edu.ua/handle/123456789/14275У статті досліджено підхід до обробки неструктурованих текстових даних з метою підвищення якості аналізу тексту. Розглянуто основні етапи NLP-пайплайну: очищення, токенізація, лематизація, видалення стоп-слів та векторизація. Проведено практичну реалізацію на базі відкритого датасету з Kaggle із використанням Python-бібліотек (spaCy, scikit-learn). Результати свідчать про підвищення точності класифікації тональності після попередньої обробки. Запропоновано подальші напрями вдосконалення, зокрема застосування трансформерів.ukAttribution 4.0 InternationalМетод обробки неструктурованих даних для вдосконалення аналізу текстуArticle96-101