Дисертації та реферати І Dissertations & Dissertation abstracts
Постійне посилання на фонд
Переглянути
Перегляд Дисертації та реферати І Dissertations & Dissertation abstracts за Автор "Хорольська, Карина Вікторівна"
Зараз показуємо 1 - 1 з 1
Результатів на сторінці
Налаштування сортування
Документ ІНФОРМАЦІЙНА ТЕХНОЛОГІЯ РОЗПІЗНАВАННЯ ГРАФІЧНОЇ ІНФОРМАЦІЇ НА ОСНОВІ НЕЙРОННОЇ МЕРЕЖІ Спеціальність 122 – Комп’ютерні науки(Державний торговельно-економічний університет, 2023) Хорольська, Карина ВікторівнаХорольська К.В. Інформаційна технологія розпізнавання графічної інформації на основі нейронної мережі. – Кваліфікаційна робота на правах рукопису. Дисертація на здобуття наукового ступеня доктор філософії в галузізнань «Інформаційні технології» за спеціальністю 122 «Комп’ютерні науки». Державний торговельно-економічний університет, Київ, 2023.Дисертація є комплексним дослідженням з моделювання, розробки та застосування інформаційної технології розпізнавання графічної інформації на основі нейронної мережі. Актуальність теми дослідження обумовлюється факторами важливості розпізнавання графічної інформації, практичного застосування теоретичних основ розпізнавання графічної інформації на основівисокоефективних рішень. На даному етапі розвитку практичного застосування теоретичних основ розпізнавання графічної інформації залишаються невирішеними проблеми: якісного виділення контурів; автоматизованого виділення об’єктів; варіабельності просторового розташування об’єктів та їх розпізнавання; практичного застосування методологічних розробок в розпізнаванні графічної інформації; якісної класифікації об’єктів розпізнавання.Розпізнавання візуальних образів є суттєвим компонентом автоматизованих та/або інтелектуальних систем управління та обробки інформації. Задачі, повʼязані з ідентифікацією і класифікацією обʼєктів та сигналів на основі обмеженого набору властивостей, є актуальними в галузях, таких як робототехніка, інформаційний пошук, моніторинг і аналіз візуальних даних, а також у дослідженнях штучного інтелекту. Алгоритмічна обробка та класифікація зображень застосовуються в системах безпеки, контролю доступу, віртуальній реальності та інформаційних пошукових системах. У звʼязку з розширенням використання систем віртуальної реальності та розвитком гейм індустрії, а також у звʼязку з тим, що створення тривимірних моделей передбачає попереднє перетворення двовимірних зображень, виникає питання про необхідність ефективного процесу перетворення 2D зображень у 3D моделі. Чималу роль у вирішенні зазначених проблем набуває створення програмних комплексів і математичного апарату, заснованих на застосуванні нейронних мереж, експертних систем і кібернетики. Особлива увага приділена штучним нейронним мережам (або просто нейронним мережам) – обчислювальним системам, що вчаться на даних спостережень за допомогою процесу оптимізації, коли параметри моделі ітеративно коригуються, щоб мінімізувати різницю між прогнозованим результатом і фактичним результатом. Нейронні мережі, і, зокрема, згорткові нейронні мережі (CNN- convolutional neural network), широко визнані своєю ефективністю в аналізі візуальних зображень. CNN – це клас моделей глибокого навчання, спеціально обладнаних для моделей глибокого навчання, спеціально обладнані для обробки 2D-зображень. Вони складаються з кількох шарів невеликих нейронних колекцій, що обробляють частини вхідного зображення, які називаються рецептивними полями. Результати цих колекцій потім розміщуються так, щоб вони накладалися один на одного для кращого представлення вихідного зображення, що є ключовою особливістю CNN. Крім того, вони інваріантні до перекладу, тобто вони мають здатність ідентифікувати об’єкт як однаковий, коли він з’являється в різних поданнях. Ці функції надають CNNздатність фіксувати складні шаблони в просторовій і часовій областях - аспект, який є ключовим у завданні 3D-реконструкції з 2D-зображень.Штучні нейронні мережі також мають перевагу в обробці зашумлених, неповних або неоднозначних даних - сценарій, який зазвичай зустрічається в задачах обробки зображень. Вони здатні витягувати значущі характеристики навіть із недосконалих даних (зашумлення, пропуски, дублікати, протиріччя), забезпечуючи таким чином надійність роботи моделі. На додаток до цього, нейронні мережі, а точніше CNN, мають здатність розпізнавати ієрархічні шаблони в даних. Наприклад, у завданнях обробки зображень вони можуть ідентифікувати краї та градієнти кольорів на нижчому рівні, а форми чи частини об’єкта – на вищому рівні. Ця функціональність має першочергове значення в таких завданнях, як 3D- реконструкція, які вимагають, щоб модель виявляла високорівневі особливості та зв’язки у 2D-зображеннях. Основна увага в дисертаційному дослідженні приділена розпізнанню графічної інформації на основі нейронної мережі, тобто обробці графічних зображень у вигляді креслень та їх подальшої трансформації у 3D-модель з використанням логічних процедур навчання (ЛПН) згорткової нейронної мережі (CNN). Інформаційною базою дослідження стали нормативні матеріали, наукові праці сучасних вітчизняних та закордонних науковців і практиків та емпіричні результати власних досліджень. Теоретичною основою роботи є модель класифікатора графічних зображень на основі покриттів класів та елементарних класифікаторів примітивів для підвищення ефективності навчання CNN, а також принципи конструювання логічних процедур навчання з використанням апарату логічних функцій, що дозволить на практиці створювати ефективні програмні рішення CNN у задачах розпізнавання креслень та їх трансформації. Метою дисертаційної роботи є розвиток існуючих та побудова нових моделей розпізнавання графічної інформації на основі застосування нейронної мережі в задачах розпізнавання креслень та її подальшої трансформації з 2D зображень у 3D модель. Об’єкт дослідження – процеси інтелектуального розпізнавання креслень та їх трансформації . Предмет дослідження – методи та моделі розпізнавання креслень та їх трансформації Наукова новизна отриманих результатів. У дисертаційній роботі отримані такі наукові результати: вперше - визначено генезу інформаційної технології розпізнавання графічної інформації як комплекс методик на основі концепції нейромережевого підходу, що застосовуються для її перетворення із двовекторного простору у тривекторний з можливістю перенесення точних деталей креслення у 3D модель; - розроблено модель класифікатора графічних зображень на основі покриття класів та елементарних класифікаторів примітивів для підвищення ефективності навчання згорткової нейронної мережі. Удосконалено - архітектуру згорткової нейронної мережі, яка, на відміну від чинних рішень, враховує логічні процедури навчання на основі пошуку інформативних фрагментів описів для інтелектуального визначення наявності або відсутності конкретних графічних примітивів у системі розпізнавання креслень; - контекстну модель інформаційної технології розпізнавання графічної інформації, яка, на відміну від інших, аналізує взаємодію процесів всередині нейронної мережі та зовнішні впливи на неї, що дозволяє представити інформаційну технологію як в агрегованому системному контексті (макрорівень), так і в деталізованому контексті у вигляді простих проєкцій (мікрорівень) із визначенням впливу рівнів декомпозиції на процес прийняття рішень щодо розпізнавання графічної інформації. набуло подальшого розвитку - систематизація та узагальнення методів, моделей, алгоритмів та програмного забезпечення задачі розпізнавання графічної інформації, що, на відміну від існуючих підходів, базуються на методах штучного інтелекту і дозволяють використовувати згорткові нейронні мережі в задачі розпізнавання креслень; - етапи трансформації 2D зображень у 3D модель, які є узагальненням моделі автоматизованої підготовки виробництва для задачі розпізнавання креслень, і сприяють подальшій автоматизації проєктно-конструкторських та проєктно- технологічних робіт; - принципи конструювання логічних процедур навчання нейронної мережі з використанням апарату логічних функцій, які, на відміну від існуючих рішень, на етапі конструювання множини елементарних класифікаторів для креслярських примітивів зводяться до знаходження допустимих та максимальних кон’юнкцій для функції опису класу графічних об’єктів, що дозволить на практиці створювати ефективні програмні рішення CNN у задачах розпізнавання креслень та їх трансформації. Практична значимість наукових результатів. Спроєктована в роботі засобами CASE-технології ERwin інформаційна технологія розпізнавання графічної інформації на основі нейронної мережі, розпізнавання креслень та трансформації з визначеними зовнішніми впливами на неї та взаємодії процесів всередині системи дає можливість програмно реалізувати програмні застосунки для розв’язання завдань розпізнавання графічної інформації на основі нейронної мережі та перетворення інформаційних масивів із двовекторного простору у тривекторний. Розроблені алгоритми та архітектура програмного додатку, які базуються на створеній моделі класифікатора графічних зображень на основі покриттів класів та ЕК примітивів для підвищення ефективності навчання CNN, дозволяють в 1,5- 2 рази зменшити обчислювальні витрати на навчання CNN та до 2 разів зменшити сумарну похибку навчання CNN, що забезпечує зменшення ресурсоємності та похибки розпізнавання графічної інформації на основі нейронної мережі та перетворення інформаційних масивів із двовекторного простору у тривекторний. Результати інформаційної технології розпізнавання графічної інформації нас основі нейронної мережі апробовані і впроваджені в наступних продуктових компаніях: ТОВ «ФЬЮЧЕ КОНСАЛТИНГ», ТОВ«ІНТЕРНЕТ ІНВЕСТИЦІЙНА ГРУПА». Дисертаційна робота виконана відповідно до плану науково- дослідних робіт Державного торговельно-економічного університету. НДР № 0122U001549 «Моделювання інтелектуальних систем управління діяльністю підприємств», (довідка від 29.08.2023 №1453/24), виконавцем якої є здобувач, а її результати включають наукові дослідження зазначеної теми. Результати дисертаційного дослідження використано у навчальному процесі Державного торговельно-економічного університету.