Результаты выполнения проекта первого года по программе Старт-1
Компанией "Нейроспектр" был завершен первый год реализации проекта "Разработка специальных самообучающихся алгоритмов и программного продукта, автоматизирующего разметку больших массивов изображений для обучения систем искусственного интеллекта" при поддержке Фонда содействия инновациям. В ходе выполнения 3-го заключительного этапа был создан установщик системы автоматизации разметки массивов изображений для обучения системы искусственного интеллекта и была разработана документация на программный продукт: 1)программа и методики экспериментальных исследований прототипа программного продукта; 2) описание программы; 3) руководство пользователя. Для тестирования разработанного функционала программы разметки было подготовлено два набора данных. Результат работы функции автоматического поиска и разметки неразмеченных объектов на текущем кадреПервый набор данных представляет собой фотографии планограмм и выкладок пачек сигарет, сделанные в реальных условиях на торговых точках. Планограмма представляет собой фотографию стенда для хранения и продажи сигарет, установленного в точке продажи. При разметке фотографий из этой базы активно применялись интеллектуальные функции доразметки. В частности, функция автоматического поиска и разметки неразмеченных объектов на текущем кадре была сильно востребована для планограмм, для которых характерно наличие 60-80 объектов в кадре, подлежащих разметке, а также функция автоматического поиска других экземпляров объекта в окрестности выделенного, т.к. пачки сигарет на стеллажах всегда размещают группами. Пример изображения из базы данных транспортных средствВторой набор данных представляет собой составленную из различных источников базу изображений и видеозаписей дорожного движения, полученных с борта БПЛА. Он включает: 1) Несколько видеозаписей, полученных при помощи БПЛА в России (Город Ижевск, его южные и восточные окрестности, трасса Агрыз-Можга, трасса Ижевск-Агрыз, Подмосковье и др.); 2) Видеозапись (город Бандунг, Западная Ява, Индонезия); 3) База изображений с транспортными средствами (ТС) – KIT. Города Германии. Около 12000 изображений; 4) База изображений с транспортными средствами – VEDAI. США, штат Юта. Около 3500 изображений; 5) База изображений с транспортными средствами - DLR 3K. Открытый доступ. Мюнхен. Создатель- Institute of Transportation Systems. Около14000 изображений. В базе данных встречаются изображения, полученные в различных условиях (урбанизированные территории, сельская местность, леса и т.д.). Данные из разных источников имели различный формат и были приведены к единому формату. При разметке изображений также использовались интеллектуальные функции доразметки. Функция автоматического поиска других экземпляров объекта в окрестности выделенного применялась, в основном, при разметке ТС стоящих в пробке или припаркованных вдоль дорог. Пример ручной разметки ТС представлен на изображении слева: красным выделена область поиска для функции автоматического поиска других экземпляров объекта в окрестности выделенного объекта. На изображении справа - результаты работы функции автоматического поиска других экземпляров объекта в окрестности выделенного объекта. Дополнительно работа алгоритма автоматической разметки была проверена на фото с представленными изображениями различных предметов. Одним из наиболее важных аспектов в области практического использования алгоритмов автоматизации разметки изображений, наряду с точностью, является производительность: необходимо, чтобы скорость работы алгоритма значительно превышала скорость ручной разметки изображений. Разработанные специальные самообучающиеся алгоритмы и архитектуры нейронных сетей, задействованные в алгоритмах разметки предлагается использовать для дальнейшего развития систем организации информации, а разработанный прототип ПО послужит основой для создания коммерческого программного продукта, при этом скорость процедуры разметки (аннотирования) видеоряда изображений типовых или известных (классифицированных) объектов по сравнению с ручной процедурой может увеличиваться более чем на порядок. На втором году выполнения НИОКР при поддержке Фонда содействия инновациям и Инвестора планируется разработать интеллектуальную компоненту автоматизации разметки регионов для искусственных нейронных сетей семантической сегментации. Основная особенность ПО будет заключаться в том, что наряду с процессом ручной разметки имеется возможность использовать нейронную сеть семантической сегментации для выделения объектов или регионов на изображении полигональными контурами, причем сеть дообучается в процессе работы оператора. Система разметки со всеми интеллектуальными функциями позволит не только автоматически детектировать объекты на изображениях, но и автоматически проводить смысловую сегментацию изображений.