Практическое пособие. Часть 1
Продолжаем публикацию об экспериментах в организации систем видеонаблюдения с минимальным затратами. На это раз на портале Хабр ( https://m.habr.com/ru/post/432444/ ) появился материал, посвященный распознаванию номеров и адресованный тем, кто "не боится словосочетания «сверточные сети» и умеете писать «Hello World» на питоне"
Оказалось, на рынке Украины работать с номерами стран exUSSR умеет не так уж много БЕСПЛАТНЫХ сервисов и ПО. Основные: Automatic License Plate Recognition и Recognitor
Какие инструменты нужны для распознавания номеров?
1) Нахождение объектов на изображении или в видео-потоке это задача из области компьютерного зрения, которая решается разными подходами, но чаще всего с помощью, так-называемых, сверточных нейронных сетей Нужно найти не просто область на фото в которой встречается искомый объект, но и отделить все его точки от других объектов или фона. Эта разновидность задач называется «Instance Segmentation».
2) Библиотека по распознаванию текстов, которая бы могла работать с разными языками и которую можно легко настраивать под специфику текстов, которые мы будем распознавать. Тут выбор не так уж велик, самой продвинутой является tesseract от Google. Так же есть ряд менее «глобальных» инструментов, с помощью которых нужно будет нормализовать область с номерным знаком (привести его в такой вид, при котором распознавание текста будет возможным). Обычно для таких преобразований используют opencv.
Так же, можно будет попробовать определить страну и тип, к которой относится найденный номерной знак, чтоб в постобработке применить уточняющий шаблон, характерный для этой страны и этого типа номера. Например, украинский номерной знак, начиная с 2015 года оформлен в сине-желтом оформлении состоит из шаблона «две буквы черыре цифры две буквы».
3)Python3
4) opencv-python не ниже версии 3.4
5) свежие Mask RCNN, tesseract
6) через менеджер пакетов pip3 нужно будет установить несколько модулей на python3, они будут перечислены в отдельном файле requirements.txt
Выявленные проблемы вов время проедения эксперимента:
-В качестве модуля распознавания выбран универсальная OCR tesseract и она может прочитать многое, но ошибок делает много. В случае распознавания украинских номеров, там написана специализированная система коррекции, которая пока что компенсирует часть ошибок, но есть предчувствие что тут можно сделать значительно лучше.
-«Квадратные» номера (номерные знаки с пропорцией 1:2) встречаются достаточно редко и с ними только начали разбираться, так что с ними погрешность будет больше.
- Иногда вместо номерного знака модель находит дорожные знаки с названием населенного пункта, приборную доску внутри салона и др. артефакты.
- При плохом качестве номера или малом разрешении, не совсем точно определяется регион из 4 точек
Подробности https://m.habr.com/ru/post/432444
Присоединяйтесь — мы покажем вам много интересного
Присоединяйтесь к ОК, чтобы подписаться на группу и комментировать публикации.
Нет комментариев