Метод обробки неструктурованих даних для вдосконалення аналізу тексту

dc.contributor.authorОліфіренко, К. А.
dc.date.accessioned2026-03-17T09:06:53Z
dc.date.available2026-03-17T09:06:53Z
dc.date.issued2025
dc.description.abstractУ статті досліджено підхід до обробки неструктурованих текстових даних з метою підвищення якості аналізу тексту. Розглянуто основні етапи NLP-пайплайну: очищення, токенізація, лематизація, видалення стоп-слів та векторизація. Проведено практичну реалізацію на базі відкритого датасету з Kaggle із використанням Python-бібліотек (spaCy, scikit-learn). Результати свідчать про підвищення точності класифікації тональності після попередньої обробки. Запропоновано подальші напрями вдосконалення, зокрема застосування трансформерів.uk
dc.description.abstractotherThe article explores an approach to processing unstructured textual data for improving text analysis quality. The main stages of the NLP pipeline are considered: cleaning, tokenization, lemmatization, stop word removal, and vectorization. A practical implementation was carried out using a Kaggle dataset and Python libraries (spaCy, scikit-learn). The results demonstrate an improvement in sentiment classification accuracy after preprocessing. Further directions such as the use of transformer models are proposed.en_US
dc.format.pages96-101
dc.identifier.citationОліфіренко, К. А. (2025). Метод обробки неструктурованих даних для вдосконалення аналізу тексту. У А. В. Селіванова (Ред.), Прикладні комп’ютерні технології (с. 96–101). Державний торговельно-економічний університет.
dc.identifier.urihttps://ur.knute.edu.ua/handle/123456789/14275
dc.language.isouk
dc.publisherДержавний торговельно-економічний університет
dc.rightsAttribution 4.0 Internationalen
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/
dc.titleМетод обробки неструктурованих даних для вдосконалення аналізу текстуuk
dc.typeArticle

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
25.pdf
Розмір:
195.08 KB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
147 B
Формат:
Item-specific license agreed to upon submission
Опис: