ІНФОРМАЦІЙНА ТЕХНОЛОГІЯ РОЗПІЗНАВАННЯ ГРАФІЧНОЇ ІНФОРМАЦІЇ НА ОСНОВІ НЕЙРОННОЇ МЕРЕЖІ Спеціальність 122 – Комп’ютерні науки

dc.contributor.authorХорольська, Карина Вікторівна
dc.date.accessioned2025-08-05T11:07:10Z
dc.date.available2025-08-05T11:07:10Z
dc.date.issued2023
dc.description.abstractХорольська К.В. Інформаційна технологія розпізнавання графічної інформації на основі нейронної мережі. – Кваліфікаційна робота на правах рукопису. Дисертація на здобуття наукового ступеня доктор філософії в галузізнань «Інформаційні технології» за спеціальністю 122 «Комп’ютерні науки». Державний торговельно-економічний університет, Київ, 2023.Дисертація є комплексним дослідженням з моделювання, розробки та застосування інформаційної технології розпізнавання графічної інформації на основі нейронної мережі. Актуальність теми дослідження обумовлюється факторами важливості розпізнавання графічної інформації, практичного застосування теоретичних основ розпізнавання графічної інформації на основівисокоефективних рішень. На даному етапі розвитку практичного застосування теоретичних основ розпізнавання графічної інформації залишаються невирішеними проблеми: якісного виділення контурів; автоматизованого виділення об’єктів; варіабельності просторового розташування об’єктів та їх розпізнавання; практичного застосування методологічних розробок в розпізнаванні графічної інформації; якісної класифікації об’єктів розпізнавання.Розпізнавання візуальних образів є суттєвим компонентом автоматизованих та/або інтелектуальних систем управління та обробки інформації. Задачі, повʼязані з ідентифікацією і класифікацією обʼєктів та сигналів на основі обмеженого набору властивостей, є актуальними в галузях, таких як робототехніка, інформаційний пошук, моніторинг і аналіз візуальних даних, а також у дослідженнях штучного інтелекту. Алгоритмічна обробка та класифікація зображень застосовуються в системах безпеки, контролю доступу, віртуальній реальності та інформаційних пошукових системах. У звʼязку з розширенням використання систем віртуальної реальності та розвитком гейм індустрії, а також у звʼязку з тим, що створення тривимірних моделей передбачає попереднє перетворення двовимірних зображень, виникає питання про необхідність ефективного процесу перетворення 2D зображень у 3D моделі. Чималу роль у вирішенні зазначених проблем набуває створення програмних комплексів і математичного апарату, заснованих на застосуванні нейронних мереж, експертних систем і кібернетики. Особлива увага приділена штучним нейронним мережам (або просто нейронним мережам) – обчислювальним системам, що вчаться на даних спостережень за допомогою процесу оптимізації, коли параметри моделі ітеративно коригуються, щоб мінімізувати різницю між прогнозованим результатом і фактичним результатом. Нейронні мережі, і, зокрема, згорткові нейронні мережі (CNN- convolutional neural network), широко визнані своєю ефективністю в аналізі візуальних зображень. CNN – це клас моделей глибокого навчання, спеціально обладнаних для моделей глибокого навчання, спеціально обладнані для обробки 2D-зображень. Вони складаються з кількох шарів невеликих нейронних колекцій, що обробляють частини вхідного зображення, які називаються рецептивними полями. Результати цих колекцій потім розміщуються так, щоб вони накладалися один на одного для кращого представлення вихідного зображення, що є ключовою особливістю CNN. Крім того, вони інваріантні до перекладу, тобто вони мають здатність ідентифікувати об’єкт як однаковий, коли він з’являється в різних поданнях. Ці функції надають CNNздатність фіксувати складні шаблони в просторовій і часовій областях - аспект, який є ключовим у завданні 3D-реконструкції з 2D-зображень.Штучні нейронні мережі також мають перевагу в обробці зашумлених, неповних або неоднозначних даних - сценарій, який зазвичай зустрічається в задачах обробки зображень. Вони здатні витягувати значущі характеристики навіть із недосконалих даних (зашумлення, пропуски, дублікати, протиріччя), забезпечуючи таким чином надійність роботи моделі. На додаток до цього, нейронні мережі, а точніше CNN, мають здатність розпізнавати ієрархічні шаблони в даних. Наприклад, у завданнях обробки зображень вони можуть ідентифікувати краї та градієнти кольорів на нижчому рівні, а форми чи частини об’єкта – на вищому рівні. Ця функціональність має першочергове значення в таких завданнях, як 3D- реконструкція, які вимагають, щоб модель виявляла високорівневі особливості та зв’язки у 2D-зображеннях. Основна увага в дисертаційному дослідженні приділена розпізнанню графічної інформації на основі нейронної мережі, тобто обробці графічних зображень у вигляді креслень та їх подальшої трансформації у 3D-модель з використанням логічних процедур навчання (ЛПН) згорткової нейронної мережі (CNN). Інформаційною базою дослідження стали нормативні матеріали, наукові праці сучасних вітчизняних та закордонних науковців і практиків та емпіричні результати власних досліджень. Теоретичною основою роботи є модель класифікатора графічних зображень на основі покриттів класів та елементарних класифікаторів примітивів для підвищення ефективності навчання CNN, а також принципи конструювання логічних процедур навчання з використанням апарату логічних функцій, що дозволить на практиці створювати ефективні програмні рішення CNN у задачах розпізнавання креслень та їх трансформації. Метою дисертаційної роботи є розвиток існуючих та побудова нових моделей розпізнавання графічної інформації на основі застосування нейронної мережі в задачах розпізнавання креслень та її подальшої трансформації з 2D зображень у 3D модель. Об’єкт дослідження – процеси інтелектуального розпізнавання креслень та їх трансформації . Предмет дослідження – методи та моделі розпізнавання креслень та їх трансформації Наукова новизна отриманих результатів. У дисертаційній роботі отримані такі наукові результати: вперше - визначено генезу інформаційної технології розпізнавання графічної інформації як комплекс методик на основі концепції нейромережевого підходу, що застосовуються для її перетворення із двовекторного простору у тривекторний з можливістю перенесення точних деталей креслення у 3D модель; - розроблено модель класифікатора графічних зображень на основі покриття класів та елементарних класифікаторів примітивів для підвищення ефективності навчання згорткової нейронної мережі. Удосконалено - архітектуру згорткової нейронної мережі, яка, на відміну від чинних рішень, враховує логічні процедури навчання на основі пошуку інформативних фрагментів описів для інтелектуального визначення наявності або відсутності конкретних графічних примітивів у системі розпізнавання креслень; - контекстну модель інформаційної технології розпізнавання графічної інформації, яка, на відміну від інших, аналізує взаємодію процесів всередині нейронної мережі та зовнішні впливи на неї, що дозволяє представити інформаційну технологію як в агрегованому системному контексті (макрорівень), так і в деталізованому контексті у вигляді простих проєкцій (мікрорівень) із визначенням впливу рівнів декомпозиції на процес прийняття рішень щодо розпізнавання графічної інформації. набуло подальшого розвитку - систематизація та узагальнення методів, моделей, алгоритмів та програмного забезпечення задачі розпізнавання графічної інформації, що, на відміну від існуючих підходів, базуються на методах штучного інтелекту і дозволяють використовувати згорткові нейронні мережі в задачі розпізнавання креслень; - етапи трансформації 2D зображень у 3D модель, які є узагальненням моделі автоматизованої підготовки виробництва для задачі розпізнавання креслень, і сприяють подальшій автоматизації проєктно-конструкторських та проєктно- технологічних робіт; - принципи конструювання логічних процедур навчання нейронної мережі з використанням апарату логічних функцій, які, на відміну від існуючих рішень, на етапі конструювання множини елементарних класифікаторів для креслярських примітивів зводяться до знаходження допустимих та максимальних кон’юнкцій для функції опису класу графічних об’єктів, що дозволить на практиці створювати ефективні програмні рішення CNN у задачах розпізнавання креслень та їх трансформації. Практична значимість наукових результатів. Спроєктована в роботі засобами CASE-технології ERwin інформаційна технологія розпізнавання графічної інформації на основі нейронної мережі, розпізнавання креслень та трансформації з визначеними зовнішніми впливами на неї та взаємодії процесів всередині системи дає можливість програмно реалізувати програмні застосунки для розв’язання завдань розпізнавання графічної інформації на основі нейронної мережі та перетворення інформаційних масивів із двовекторного простору у тривекторний. Розроблені алгоритми та архітектура програмного додатку, які базуються на створеній моделі класифікатора графічних зображень на основі покриттів класів та ЕК примітивів для підвищення ефективності навчання CNN, дозволяють в 1,5- 2 рази зменшити обчислювальні витрати на навчання CNN та до 2 разів зменшити сумарну похибку навчання CNN, що забезпечує зменшення ресурсоємності та похибки розпізнавання графічної інформації на основі нейронної мережі та перетворення інформаційних масивів із двовекторного простору у тривекторний. Результати інформаційної технології розпізнавання графічної інформації нас основі нейронної мережі апробовані і впроваджені в наступних продуктових компаніях: ТОВ «ФЬЮЧЕ КОНСАЛТИНГ», ТОВ«ІНТЕРНЕТ ІНВЕСТИЦІЙНА ГРУПА». Дисертаційна робота виконана відповідно до плану науково- дослідних робіт Державного торговельно-економічного університету. НДР № 0122U001549 «Моделювання інтелектуальних систем управління діяльністю підприємств», (довідка від 29.08.2023 №1453/24), виконавцем якої є здобувач, а її результати включають наукові дослідження зазначеної теми. Результати дисертаційного дослідження використано у навчальному процесі Державного торговельно-економічного університету.
dc.description.abstractotherKhorolska K.V. Information technology for graphic information recognition based on neural networks. - Qualification work in manuscript form. Thesis for the degree of Doctor of Philosophy in the field of "Information Technology" by specialty 122 "Computer Science". State University of Trade and Economics, Kyiv, 2023. The thesis is a comprehensive study on the modeling, development, and application of information technology for graphic information recognition basedon neural networks. The relevance of the research topic is determined by the importance of recognizing graphical information and the practical application of the theoretical solutions. At this stage of practical application development, several unresolved issues remain in the theoretical foundations of graphical information recognition: quality contour extraction; automated object extraction; variability in spatial placement and recognition of objects; practical application of methodological developments in recognizing graphical information; and high-quality classification of recognition objects. Visual image recognition is a crucial component of management and information processing systems, automated systems, and decision-making systems. Tasks associated with classifying and identifying objects, phenomena, and signals, characterized by a finite set of certain properties and features, arise in fields such as robotics, information retrieval, monitoring and analysis of visual data, and artificial intelligence research. Algorithmic processing and classification of images are applied in security systems, access control and management, virtual reality systems, and information search systems. Moreover, with the broad implementation of virtual reality systems and the development of the gaming industry, and considering that a 3D model is initially created as its 2D version, an acute need arises for the rapid conversion of two-dimensional images into three- dimensional models. A significant role in solving the mentioned problems is played by the creation of software complexes and mathematical tools based on the application of neural networks, expert systems, and cybernetics. Particular attention is given to artificial neural networks (or simply neural networks) - computing systems that learn from observational data through an optimization process, wherein model parameters are iteratively adjusted to minimize the difference between the predicted outcome and the actual result. Neural networks, especially convolutional neural networks (CNN), are widely recognized for their effectiveness in analyzing visual images. CNNs are a class of deep learning models specifically designed for processing 2D images. They consist of multiple layers of small neuron collections that process parts of the input image called receptive fields. The outputs from these collections are arranged so they overlap for a better representation of the output image, a key feature of CNNs. Moreover, they are translation-invariant, meaning they can identify an object as the same when it appears in different representations. These ь functions allow CNNs to capture intricate patterns in spatial and temporal domains – a critical aspect in the task of 3D reconstruction from 2D images. Artificial neural networks also excel in processing noisy, incomplete, or ambiguous data – a scenario commonly encountered in image processing tasks. They can extract significant features even from flawed data (noise, missing values, duplicates, contradictions), ensuring the model's reliability. Additionally, neural networks, specifically CNNs, can recognize hierarchical patterns in the data. For instance, in image processing tasks, they might identify edges and color gradients at a lower level and shapes or parts of an object at a higher level. This functionality is paramount in tasks like 3D reconstruction, which require the model to detect high-level features and relationships in 2D images. The primary focus of the thesis research is on the recognition of graphical information based on a neural network, specifically the processing of graphical images in the form of drawings and their subsequent transformation into a 3D model using the logical learning procedures (LLP) of a convolutional neural network (CNN). The informational base of the research consists of regulatory materials, scientific works of contemporary domestic and foreign scientists and practitioners, as well as empirical results of the author's own investigations. The theoretical foundation of the work is a model of a graphic image classifier based on class coverings and elementary primitive classifiers to enhance the training efficiency of CNN. Additionally, the principles of constructing logical learning procedures using logical functions are explored. This will practically enable the creation of efficient CNN software solutions in tasks of recognizing drawings and their transformation. The goal of the doctoral thesis work is to develop existing and construct new models for recognizing graphical information based on the application of a neural network in tasks related to recognizing drawings and their subsequent transformation from 2D images into a 3D models. The research object is the processes of intelligent recognition of drawings and their transformation. The subject of the study is methods and models for recognizing drawings and their transformation. The scientific novelty of the obtained results. Given thesis presents the following scientific results: For the first time: - Defined the genesis of information technology for recognizing graphical information as a complex of methodologies based on the concept of the neural network approach, used to transform it from a bi-vector space to a tri-vector one with the ability to transfer precise drawing details into a 3D model. - Developed a model classifier of graphical images based on the coverage of classes and elementary classifiers of primitives to increase the efficiency of training convolutional neural networks (CNN). Improved: - The architecture of the convolutional neural network which, unlike current solutions, considers logical training procedures based on searchinginformative description fragments for intelligent identification of the presence or absence of specific graphic primitives in the drawing recognition system.- The contextual model of information technology for recognizing graphical information which, unlike others, analyzes the interaction of processes within the neural network and external influences on it. This allows presenting the information technology both in an aggregated system context (macro level) and in a detailed context in the form of simple projections (micro level) determining the influence of decomposition levels on the decision-making process regarding the recognition of graphic information. Further development has been achieved in: - Systematization and generalization of methods, models, algorithms, and software of the graphical information recognition task, which, unlike existing approaches, are based on artificial intelligence methods and allow the use of CNN in drawing recognition tasks. - Stages of transforming 2D images into a 3D model, which generalizes the model of automated production preparation for the drawing recognition task, and further automate design and technological work. - Principles of constructing logical training procedures of the neuralnetwork using logical functions. Unlike existing solutions, at the stage of constructing a set of elementary classifiers for drawing primitives, they boil down to finding permissible and maximum conjunctions for the class description function of graphic objects. This will allow in practice to create effective softwaresolutions for CNN in tasks of recognizing drawings and their transformation. Practical significance of the scientific results. The information technology for recognizing graphical information based on neural networks, drawing recognition, and transformation, designed in the study using CASE technology ERwin, considering external influences on it and the interaction of processes within the system, provides the opportunity to implement software applications to solve tasks of graphical information recognition based on neural networks and converting data from bi-vector space to tri-vector space. The developed algorithms and software application architecture, grounded on the created model of graphical image classifiers based on class coverages andelementary classifiers (EC) of primitives to enhance CNN training efficiency, allow a 1.5-2 times reduction in computational costs for CNN training and up to a 2-fold decrease in the overall training error of CNN. This ensures a reduction in resource intensity and error in recognizing graphical information based on neural networks and transforming data from a bi-vector space to a tri-vector one. Results of the information technology for recognizing graphical information based on neural networks have been tested and implemented in the following product companies: LLC "FUTURE CONSULTING", LLC"INTERNET INVESTMENT GROUP". The doctoral thesis work was carried out according to the research workplan of the State Trade and Economic University. R&D No. 0122U001549 "Modeling of Intellectual Management Systems in Enterprise Activities", (reference from 29.08.2023 No.1453/24). The executor of this work is the candidate, and its results include scientific research on the specified topic. The results of the doctoral thesis research have been used in the educational process of the State Trade and Economic University.
dc.identifier.citationХорольська К.В. (2023 ) ІНФОРМАЦІЙНА ТЕХНОЛОГІЯ РОЗПІЗНАВАННЯ ГРАФІЧНОЇ ІНФОРМАЦІЇ НА ОСНОВІ НЕЙРОННОЇ МЕРЕЖІ , м. Київ [Дисертація за спеціальність 122 – Комп’ютерні науки , Державний торговельно-економічний університет]. Репозитарій Державного торговельно-економічного університету. https://ur.knute.edu.ua/handle/123456789/10615
dc.identifier.urihttps://ur.knute.edu.ua/handle/123456789/10615
dc.language.isouk
dc.publisherДержавний торговельно-економічний університет
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internationalen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectінформаційна технологія
dc.subjectграфічна інформація
dc.subjectзображення
dc.subjectнейронна мережа
dc.subjectрозпізнавання
dc.subjectмодель
dc.subjectобраз.
dc.subjectinformation technology
dc.subjectgraphical information
dc.subjectpicture
dc.subjectneuralnetwork
dc.subjectrecognition
dc.subjectmodel
dc.subjectimage.
dc.titleІНФОРМАЦІЙНА ТЕХНОЛОГІЯ РОЗПІЗНАВАННЯ ГРАФІЧНОЇ ІНФОРМАЦІЇ НА ОСНОВІ НЕЙРОННОЇ МЕРЕЖІ Спеціальність 122 – Комп’ютерні науки
dc.typeThesis Doctoral

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Khorolska_ Karina_Viktorovna-122_2023.pdf
Розмір:
2.9 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
147 B
Формат:
Item-specific license agreed to upon submission
Опис: