Согласно информации, опубликованной на сайте ICDAR Robust Reading 2015 в октябре 2017 года, компания Dahua Technology заняла первое место в конкурсе [Word Recognition] в категориях распознания случайного текста (Incidental Scene Text Challenge) и распознания текста с цифровых изображений (Born-Digital Image Challenge), добившись точности 82.76% и 97.43% соответственно.
Результат в категории распознания случайного текста (Incidental Scene Text Challenge) в рамках [Word Recognition]
Результат в категории распознания текста с цифровых изображений (Born-Digital Image Challenge) в рамках [Word Recognition]
Международная конференция по анализу и распознанию документов - International Conference on Document Analysis and Recognition (ICDAR) – это академическое мероприятие, проходящее один раз в два года в разных городах. Соревнования по надежному чтению ICDAR Robust Reading проводились пять раз, в 2003, 2005, 2011, 2013 и 2015 годах. Соревнование организуется по категориям, отражающим реальные ситуации применения технологии машинного чтения.
Распознание случайного текста – это новая категория, введенная в 2015 году, одна из самых сложных. В рамках этой категории рассматривается текст, случайно попавший в поле зрения. При этом пользователь не выполняет никаких специальных действий по позиционированию картинки. Такого рода изображения часто встречаются во множестве ситуаций, например, при съемке носимой камерой или в городском видеонаблюдении.
Пример случайного текста на видео
Текст с цифровых изображений – это одна из двух категорий соревновательной программы, существующая с самого первого конкурса, ICDAR 2011. В ней рассматриваются цифровые картинки из интернета или электронной почты. Автоматическое выделение текста с таких изображений – это очень интересное и перспективное направление. Такая технология может использоваться для автоматического индексирования и поиска web-контента, его фильтрации и расширенных настроек доступа. В том числе и для борьбы со спамом.
Надежное чтение и ICDAR 2015
«Надежное чтение» относится к области интерпретации письменных сообщений в свободных условиях. Технология имеет важное значение для систем видеонаблюдения, к примеру, для распознания номеров автомобилей номеров контейнеров, логистических отметок и любых попавших в кадр текстов.
OCR от Dahua
Команда Dahua AI OCR из Института Передовых Технологий Dahua принимала участие в конкурсе ICDAR Robust Reading 2015. Команда использовала технологию глубокого машинного обучения и сети со структурой SENet и ResNet, это позволило использовать уникальную стратегию многофункциональной и многоканальной интеграции. Развертывание системы вместе с многомодельной платформой интеграции позволило значительно повысить точность результата.
Участвовавшая в конкурсе технология применяется в системе умного транспорта Dahua. Эффективность работы этих алгоритмов в случае детектирования наклонного номерного знака составляет 99,99%.
Пример распознания госномера автомобиля и серийного номера транспортного контейнера.
В последние годы системы глубокого машинного обучения привели к мощному рывку в развитии видеоаналитики. Точность работы таких систем во многих ситуациях уже превысила возможности человека. Это сделало возможным и экономически обоснованным автоматизацию целого ряда задач, ранее доступных только человеку. Системы искусственного интеллекта широко используются в системах общественной безопасности, перевозках, банковском деле и других сферах.