На днях, команда из компании Dahua Technologies, занимающаяся распознаванием лиц, представила результаты своей работы на примере набора Labeled Faces in the Wild (LFW) - тестовой базы подписанных человеческих лиц в свободном виде. Набор LFW является общепризнанным в мире тестом для алгоритмов распознания. После ряда технических улучшений программа от Dahua не только превзошла алгоритмы от Google, Facebook, Baidu и Tencent, но и поставила новый рекорд для LFW и вывела компанию на позиции мирового лидера в отрасли.
База LFW была собрана в 2007 году в Массачусетском университете и чаще других используется для сравнения производительности и алгоритмов распознавания лиц в естественных условиях. На сегодняшний момент всего несколько десятков команд со всего мира получили результат более 80 баллов. Это были команды из Google, Facebook, Microsoft Research Asia, Baidu, Tencent, SenseTime, Face++, Китайского Университета Гонг-Конга и других известных компаний и учебных заведений. Многие из разработанных ими алгоритмов сыграли важную роль в развитии технологии.
В последнее время самые высокие достижения в этом направлении основаны на глубоком обучении. Такой подход к машинному обучению эмулирует процессы нейронных сетей человека. Функции сверточных нейросетей, как правило используемых для глубокого обучения, тесно связаны с их глубиной. Однако, несмотря на сложности в оптимизации глубоких сетей, в приложениях распознания лиц их глубина составляет от нескольких до нескольких дюжин слоев. Алгоритм, разработанный Dahua, включает в себя более сотни слоев, что значительно больше, чем в приложениях конкурентов. Это открывает новый тип машинного обучения, позволяющий лучше находить сходства между разными фотографиями одного человека и различия между фотографиями разных. Совместно с эффективной техникой семплирования на лету, новый алгоритм достигает высочайшего уровня точности - 99,78% для набора данных LFW.
Команда по разработке технологии распознавания лиц компании Dahua является частью института передовых технологий R&D-центра, имеющего широкие ресурсы для развития технологии глубокого обучения и показывающего отличные результаты. Команда поддерживает продукты Dahua, использующие распознавание лиц, такие как детектирование лиц, расположение опорных точек на лицах, распознавание лиц, анализ атрибутов лиц, детектирование улыбок и так далее.
Участник команды, профессор Вонг Хайянг (Wang Haiyang), заявил, что достижение высокой точности на свободном наборе данных мотивирует команду на проверку работы в реальных условиях. Компания Dahua на протяжении многих лет была лидером в области систем безопасности и видеонаблюдения и накопила большой массив видеоданных. Если использовать этот массив для обучения алгоритма, то можно добиться его высочайшей производительности. Более того, применение распознавания лиц в системах безопасности требует высокой скорости работы, поэтому в данном случае во избежание избыточных операций применяется сокращение сети и техника мульти-модельного разделения особенностей. Благодаря такому подходу объем вычислений в нейросети из сотни слоев аналогичен объему, характерному для нескольких десятков слоев.
Технология распознавания лиц Dahua уже нашла применение в системах общественной безопасности, финансовом секторе и в других областях. На последнем саммите G20 эта технология использовалась для обеспечения безопасности. IP-видеокамеры Dahua были развернуты во внутренних помещениях и во многих транспортных узлах. Изображения в реальном времени обрабатывались и данные сравнивались с черными списками. При появлении в поле зрения нежелательной персоны, в командный центр поступало тревожное сообщение. Новая система сыграла большую роль во время саммита и позволила полиции арестовать несколько беглецов еще на этапе ввода ее в эксплуатацию. Система распознавания лиц от Dahua отражает стремление компании обеспечить своим клиентам самые передовые технологии и сервисы по самым доступным ценам.