Управляющие системы и машины, №6, 2018, статья 4
DOI: https://doi.org/10.15407/usim.2018.06.046
Тимчишин Р.М., Волков О.Є., Господарчук О.Ю., Богачук Ю.П. Сучасні підходи до розв’язання задач комп’ютерного зору. Управляющие системы и машины. 2018. № 6. C. 46-73.
УДК 581.513
Тимчишин Роман Миронович, аспирант,
Волков Александр Евгеньевич, заведующий отделом,
Господарчук Алексей Юрьевич, старший научный сотрудник,
Богачук Юрий Петрович, ведущий научный сотрудник
Международный научно-учебный центр информационных технологий и систем НАН Украины и МОН Украины, пр. Академика Глушкова, 40, Киев, 03187, Украина
Современные подходы к решению задач компьютерного зрения
Введение. Компьютерное зрение включает в себя широкий спектр задач: сегментацию, обработку и классификацию изображений, восстановление сцен, обнаружение, оценку положения и восстановление траекторий объектов, и многие другие.
Эта направление стремительно развивается в последние годы, частично и потому, что к исследованию присоединились такие гиганты ИT-индустрии, как Google и Microsoft. В настоящее время системы искусственного интеллекта пользуются большим спросом. Технологические достижения сделали возможным применение компьютерного зрения в десятках новых отраслей, таких как умные магазины, биометрическая аутентификация, автоматизация сельскохозяйственных процессов с использованием беспилотных летательных аппаратов (БпЛА), видеонаблюдение, улучшение качества фото- и видеоданных, автономная доставка посылок. Область применения будет расширяться, поскольку потребность в системах искусственного интеллекта только возрастает.
Цель. Количество наработок в области компьютерного зрения увеличивается экспоненциально и выбор подходящего инструмента – непростая задача. Цель данной статьи – представить структурированный обзор современных технологий компьютерного зрения с их преимуществами и недостатками, а также идентифицировать нерешенные проблемы.
Методы. Нечеткая логика, сверточные нейронные сети, детекторы и дескрипторы ключевых точек.
Результаты. Теория нечеткой логики вывела распознавание на качественно новый уровень, представив новый фреймворк для работы со сложными и неопределенными системами. Введение нечетких множеств второго типа значительно улучшило точность и устойчивость алгоритмов. Основными преимуществами систем на базе нечеткой логики являются использование знаний эксперта и интерпретируемость финальной модели. Сейчас этот метод часто используется для решения задач сегментации и фильтрации изображений.
Сверточные нейронные сети (CNN) делают явное предположение о том, что на вход системе подается изображение. Это предположение позволило внедрить определенные свойства в архитектуру и привело к поразительным результатам. Архитектура CNN даже в некоторых случаях превзошла человека в роешении задачи классификации (например, на базе данных ImageNet). В статье представлены архитектуры с лучшими результатами в задачах классификации изображений и обнаружения объектов.
Детекторы и дескрипторы ключевых точек – наиболее часто используемый инструмент обработки изображений в течение многих лет. Они остаются отличной альтернативой ресурсоемким нейронным сетям. Методы, что базируются на детекторах и дескрипторах, не требуют больших баз данных для обучения. Хорошим применением этих типов методов может быть автономная навигация беспилотных летательных аппаратов, где для идентификации координат требуется сопоставление изображений.
Выводы. Несмотря на то, что в последние годы удалось добиться значительного прогресса, остается множество нерешенных проблем. Повышение производительности обычно приводит к ухудшению точности. Нет достаточно точных алгоритмов, которые могли бы решать проблемы обнаружения объектов в режиме реального времени. Использование точных алгоритмов компьютерного зрения требует значительных объемов памяти и вычислительных ресурсов, которые недоступны во встраиваемых системах. Время обучения глубоких сверточных нейронных сетей по-прежнему велико и может достигать недель даже на самых производительных компьютерах.
Загрузить полный текст в PDF (на украинском).
Ключевые слова: компьютерное зрение, классификация изображений, выявление объектов, сегментация, фильтрация изображений, идентификация контуров, нечеткая логика, нейронные сети, детекторы, дескрипторы.
Поступила 22.11.18