Управляющие системы и машины, №6, 2018, статья 4

DOI: https://doi.org/10.15407/usim.2018.06.046
Тимчишин Р.М., Волков О.Є., Господарчук О.Ю., Богачук Ю.П. Сучасні підходи до розв’язання задач комп’ютерного зору. Управляющие системы и машины. 2018. № 6. C. 46-73.

Abstract on English.

УДК 581.513

Тимчишин Роман Миронович, аспирант,

Волков Александр Евгеньевич, заведующий отделом,

Господарчук Алексей Юрьевич, старший научный сотрудник,

Богачук Юрий Петрович, ведущий научный сотрудник

Международный научно-учебный центр информационных технологий и систем НАН Украины и МОН Украины, пр. Академика Глушкова, 40, Киев, 03187, Украина

Современные подходы к решению задач компьютерного зрения

Введение. Компьютерное зрение включает в себя широкий спектр задач: сегментацию, обработку и классификацию изображений, восстановление сцен, обнаружение, оценку положения и восстановление траекторий объектов, и многие другие.

Эта направление стремительно развивается в последние годы, частично и потому, что к исследованию присоединились такие гиганты ИT-индустрии, как Google и Microsoft. В настоящее время системы искусственного интеллекта пользуются большим спросом. Технологические достижения сделали возможным применение компьютерного зрения в десятках новых отраслей, таких как умные магазины, биометрическая аутентификация, автоматизация сельскохозяйственных процессов с использованием беспилотных летательных аппаратов (БпЛА), видеонаблюдение, улучшение качества фото- и видеоданных, автономная доставка посылок. Область применения будет расширяться, поскольку потребность в системах искусственного интеллекта только возрастает.

Цель. Количество наработок в области компьютерного зрения увеличивается экспоненциально и выбор подходящего инструмента – непростая задача. Цель данной статьи – представить структурированный обзор современных технологий компьютерного зрения с их преимуществами и недостатками, а также идентифицировать нерешенные проблемы.

Методы. Нечеткая логика, сверточные нейронные сети, детекторы и дескрипторы ключевых точек.

Результаты. Теория нечеткой логики вывела распознавание на качественно новый уровень, представив новый фреймворк для работы со сложными и неопределенными системами. Введение нечетких множеств второго типа значительно улучшило точность и устойчивость алгоритмов. Основными преимуществами систем на базе нечеткой логики являются использование знаний эксперта и интерпретируемость финальной модели. Сейчас этот метод часто используется для решения задач сегментации и фильтрации изображений.

Сверточные нейронные сети (CNN) делают явное предположение о том, что на вход системе подается изображение. Это предположение позволило внедрить определенные свойства в архитектуру и привело к поразительным результатам. Архитектура CNN даже в некоторых случаях превзошла человека в роешении задачи классификации (например, на базе данных ImageNet). В статье представлены архитектуры с лучшими результатами в задачах классификации изображений и обнаружения объектов.

Детекторы и дескрипторы ключевых точек – наиболее часто используемый инструмент обработки изображений в течение многих лет. Они остаются отличной альтернативой ресурсоемким нейронным сетям. Методы, что базируются на детекторах и дескрипторах, не требуют больших баз данных для обучения. Хорошим применением этих типов методов может быть автономная навигация беспилотных летательных аппаратов, где для идентификации координат требуется сопоставление изображений.

Выводы. Несмотря на то, что в последние годы удалось добиться значительного прогресса, остается множество нерешенных проблем. Повышение производительности обычно приводит к ухудшению точности. Нет достаточно точных алгоритмов, которые могли бы решать проблемы обнаружения объектов в режиме реального времени. Использование точных алгоритмов компьютерного зрения требует значительных объемов памяти и вычислительных ресурсов, которые недоступны во встраиваемых системах. Время обучения глубоких сверточных нейронных сетей по-прежнему велико и может достигать недель даже на самых производительных компьютерах.

Загрузить полный текст в PDF (на украинском).

Ключевые слова: компьютерное зрение, классификация изображений, выявление объектов, сегментация, фильтрация изображений, идентификация контуров, нечеткая логика, нейронные сети, детекторы, дескрипторы.

Поступила 22.11.18