Компания Dahua победила в двух категориях конкурса ICDAR по распознаванию слов

Согласно информации, опубликованной на сайте ICDAR Robust Reading 2015 в октябре 2017 года, компания Dahua Technology заняла первое место в конкурсе [Word Recognition] в категориях распознания случайного текста  (Incidental Scene Text Challenge) и распознания текста с цифровых изображений (Born-Digital Image Challenge), добившись точности 82.76% и 97.43% соответственно.

 Компания Dahua победила в двух категориях конкурса ICDAR по распознаванию слов

Результат в категории распознания случайного текста (Incidental Scene Text Challenge) в рамках [Word Recognition]

 Компания Dahua победила в двух категориях конкурса ICDAR по распознаванию слов. Изображение 2

Результат в категории распознания текста с цифровых  изображений (Born-Digital Image Challenge) в рамках [Word Recognition]

Международная конференция по анализу и распознанию документов - International Conference on Document Analysis and Recognition (ICDAR) – это академическое мероприятие, проходящее один раз в два года в разных городах. Соревнования по надежному чтению ICDAR Robust Reading проводились пять раз, в 2003, 2005, 2011, 2013 и 2015 годах. Соревнование организуется по категориям, отражающим реальные ситуации применения технологии машинного чтения.

Распознание случайного текста – это новая категория, введенная в 2015 году, одна из самых сложных. В рамках этой категории рассматривается текст, случайно попавший в поле зрения. При этом пользователь не выполняет никаких специальных действий по позиционированию картинки. Такого рода изображения часто встречаются во множестве ситуаций, например, при съемке носимой камерой или в городском видеонаблюдении.

 Компания Dahua победила в двух категориях конкурса ICDAR по распознаванию слов. Изображение 3

Пример случайного текста на видео

Текст с цифровых изображений – это одна из двух категорий соревновательной программы, существующая с самого первого конкурса, ICDAR 2011.  В ней рассматриваются цифровые картинки из интернета или электронной почты. Автоматическое выделение текста с таких изображений – это очень интересное и перспективное направление. Такая технология может использоваться для автоматического индексирования и поиска web-контента, его фильтрации и расширенных настроек доступа. В том числе и для борьбы со спамом.

Надежное чтение и ICDAR 2015

«Надежное чтение» относится к области интерпретации письменных сообщений в свободных условиях. Технология имеет важное значение для систем видеонаблюдения, к примеру, для распознания номеров автомобилей номеров контейнеров, логистических отметок и любых попавших в кадр текстов.

OCR от Dahua

Команда Dahua AI OCR из Института Передовых Технологий Dahua принимала участие в конкурсе ICDAR Robust Reading 2015. Команда использовала технологию глубокого машинного обучения и сети со структурой SENet и ResNet, это позволило использовать уникальную стратегию многофункциональной и многоканальной интеграции. Развертывание системы вместе с многомодельной платформой интеграции позволило значительно повысить точность результата.

Участвовавшая в конкурсе технология применяется в системе умного транспорта Dahua. Эффективность работы этих  алгоритмов в случае детектирования наклонного номерного знака составляет 99,99%.

 Компания Dahua победила в двух категориях конкурса ICDAR по распознаванию слов. Изображение 4

Пример распознания госномера автомобиля и серийного номера транспортного контейнера.

В последние годы системы глубокого машинного обучения привели к мощному рывку в развитии видеоаналитики.  Точность работы таких систем во многих ситуациях уже превысила возможности человека. Это сделало возможным и экономически обоснованным автоматизацию целого ряда задач, ранее доступных только человеку. Системы искусственного интеллекта широко используются в системах общественной безопасности, перевозках, банковском деле и других сферах.