Есть бумажные конверты определенного образца, в которых дизайн я могу поменять, в них три поля, одно состоит из печатных цифр, два заполняются от руки. везде цифры. Конверт будет фотографироваться на смартфон - далее отправляется на сервер. Посоветуйте как лучше разнести поля, и может есть какие хитрости, чтобы при OCR не было ошибок. И OCR уже стоит возица со скриптами на нейронных сетях или сойдет через стандартную попиксельную обработку?
По идее такое сложно будет распознать. Обычно нанимают людей которые смотрят на сними и печатают с них уже текстом. Например когда собирают анкеты для акций в магазинах, потом их вот так расшифровывают. --- Добавлено --- Проверь если abbyy finereader справляется, то просто воспользуйся его API --- Добавлено --- У них же можешь и совета спросить, что могут заполнять только от руки и можно ли как-то потом эти данные распознать
Tesseract не справляется. Abbyy рукописный не понимает Пример что распознать в аттаче. Можно сделать вариант как с индексами, чем только распознавать.
Думаю проще поставить принтер с терминалом, и печатать на нём, тогда и в базу можно будет заносить информацию и распознать при необходимости
под цифры он тоже заточен, ему и визитки нужно распознавать, но раз письменный текст не распознаёт, значит тут не всё так просто, попробуй как раньше трафареты для почтового индекса нужно было заполнять, может их выйдет распознавать, а вообще тебе нужно на форму по OCR чтобы разузнать какие алгоритмы можно использовать при твоей ситуации
Простое приложение для php Далее вам нужно подготовить изображение(убрать шумы, помехи, обозначить зоны) Проще использовать формы И наконец обучить