Метод обробки неструктурованих даних для вдосконалення аналізу тексту
| dc.contributor.author | Оліфіренко, К. А. | |
| dc.date.accessioned | 2026-03-17T09:06:53Z | |
| dc.date.available | 2026-03-17T09:06:53Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | У статті досліджено підхід до обробки неструктурованих текстових даних з метою підвищення якості аналізу тексту. Розглянуто основні етапи NLP-пайплайну: очищення, токенізація, лематизація, видалення стоп-слів та векторизація. Проведено практичну реалізацію на базі відкритого датасету з Kaggle із використанням Python-бібліотек (spaCy, scikit-learn). Результати свідчать про підвищення точності класифікації тональності після попередньої обробки. Запропоновано подальші напрями вдосконалення, зокрема застосування трансформерів. | uk |
| dc.description.abstractother | The article explores an approach to processing unstructured textual data for improving text analysis quality. The main stages of the NLP pipeline are considered: cleaning, tokenization, lemmatization, stop word removal, and vectorization. A practical implementation was carried out using a Kaggle dataset and Python libraries (spaCy, scikit-learn). The results demonstrate an improvement in sentiment classification accuracy after preprocessing. Further directions such as the use of transformer models are proposed. | en_US |
| dc.format.pages | 96-101 | |
| dc.identifier.citation | Оліфіренко, К. А. (2025). Метод обробки неструктурованих даних для вдосконалення аналізу тексту. У А. В. Селіванова (Ред.), Прикладні комп’ютерні технології (с. 96–101). Державний торговельно-економічний університет. | |
| dc.identifier.uri | https://ur.knute.edu.ua/handle/123456789/14275 | |
| dc.language.iso | uk | |
| dc.publisher | Державний торговельно-економічний університет | |
| dc.rights | Attribution 4.0 International | en |
| dc.rights.uri | http://creativecommons.org/licenses/by/4.0/ | |
| dc.title | Метод обробки неструктурованих даних для вдосконалення аналізу тексту | uk |
| dc.type | Article |
Файли
Контейнер файлів
1 - 1 з 1
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 147 B
- Формат:
- Item-specific license agreed to upon submission
- Опис: