За последние 24 часа нас посетили 51720 программистов и 1767 роботов. Сейчас ищут 839 программистов ...

Распознавание цифр OCR

Тема в разделе "PHP для профи", создана пользователем cardrunners, 20 янв 2017.

  1. cardrunners

    cardrunners Новичок

    С нами с:
    19 янв 2017
    Сообщения:
    6
    Симпатии:
    0
    Есть бумажные конверты определенного образца, в которых дизайн я могу поменять, в них три поля, одно состоит из печатных цифр, два заполняются от руки. везде цифры. Конверт будет фотографироваться на смартфон - далее отправляется на сервер. Посоветуйте как лучше разнести поля, и может есть какие хитрости, чтобы при OCR не было ошибок. И OCR уже стоит возица со скриптами на нейронных сетях или сойдет через стандартную попиксельную обработку?
     
  2. denis01

    denis01 Суперстар
    Команда форума Модератор

    С нами с:
    9 дек 2014
    Сообщения:
    12.227
    Симпатии:
    1.714
    Адрес:
    Молдова, г.Кишинёв
    просто впихни barcode или QR code на конверт и его распознавай
     
  3. Poznakomlus

    Poznakomlus Активный пользователь

    С нами с:
    12 сен 2014
    Сообщения:
    96
    Симпатии:
    19
    Адрес:
    Киев
    Используйте к примеру Tesseract
    Сам компилировал свое расширение под php. Все ok, работает
     
  4. cardrunners

    cardrunners Новичок

    С нами с:
    19 янв 2017
    Сообщения:
    6
    Симпатии:
    0
    QR code - не подходит, у меня 2 поля заносятся от руки, обычной ручкой или карандашом.
     
  5. denis01

    denis01 Суперстар
    Команда форума Модератор

    С нами с:
    9 дек 2014
    Сообщения:
    12.227
    Симпатии:
    1.714
    Адрес:
    Молдова, г.Кишинёв
    Это нужно через OCR распознать?
     
  6. cardrunners

    cardrunners Новичок

    С нами с:
    19 янв 2017
    Сообщения:
    6
    Симпатии:
    0
  7. denis01

    denis01 Суперстар
    Команда форума Модератор

    С нами с:
    9 дек 2014
    Сообщения:
    12.227
    Симпатии:
    1.714
    Адрес:
    Молдова, г.Кишинёв
    По идее такое сложно будет распознать. Обычно нанимают людей которые смотрят на сними и печатают с них уже текстом.
    Например когда собирают анкеты для акций в магазинах, потом их вот так расшифровывают.
    --- Добавлено ---
    Проверь если abbyy finereader справляется, то просто воспользуйся его API
    --- Добавлено ---
    У них же можешь и совета спросить, что могут заполнять только от руки и можно ли как-то потом эти данные распознать
     
  8. cardrunners

    cardrunners Новичок

    С нами с:
    19 янв 2017
    Сообщения:
    6
    Симпатии:
    0
    Tesseract не справляется. Abbyy рукописный не понимает Пример что распознать в аттаче. Можно сделать вариант как с индексами, чем только распознавать.
     

    Вложения:

    • szsz.jpg
      szsz.jpg
      Размер файла:
      165,2 КБ
      Просмотров:
      9
  9. denis01

    denis01 Суперстар
    Команда форума Модератор

    С нами с:
    9 дек 2014
    Сообщения:
    12.227
    Симпатии:
    1.714
    Адрес:
    Молдова, г.Кишинёв
    Думаю проще поставить принтер с терминалом, и печатать на нём, тогда и в базу можно будет заносить информацию и распознать при необходимости
     
  10. cardrunners

    cardrunners Новичок

    С нами с:
    19 янв 2017
    Сообщения:
    6
    Симпатии:
    0
    принтер нет. заполняется от руки, как и что заполнять человека можно обучить.
     
  11. denis01

    denis01 Суперстар
    Команда форума Модератор

    С нами с:
    9 дек 2014
    Сообщения:
    12.227
    Симпатии:
    1.714
    Адрес:
    Молдова, г.Кишинёв
    обучите писать так чтобы finereader справлялся
     
  12. cardrunners

    cardrunners Новичок

    С нами с:
    19 янв 2017
    Сообщения:
    6
    Симпатии:
    0
    так то оно так, но файнридер заточен под разные языки буквы и тд. Мне надо только цифры.
     
  13. denis01

    denis01 Суперстар
    Команда форума Модератор

    С нами с:
    9 дек 2014
    Сообщения:
    12.227
    Симпатии:
    1.714
    Адрес:
    Молдова, г.Кишинёв
    под цифры он тоже заточен, ему и визитки нужно распознавать, но раз письменный текст не распознаёт, значит тут не всё так просто,
    попробуй как раньше трафареты для почтового индекса нужно было заполнять, может их выйдет распознавать, а вообще тебе нужно на форму по OCR чтобы разузнать какие алгоритмы можно использовать при твоей ситуации

    p38.jpg
     
  14. Poznakomlus

    Poznakomlus Активный пользователь

    С нами с:
    12 сен 2014
    Сообщения:
    96
    Симпатии:
    19
    Адрес:
    Киев
    Простое приложение для php
    Далее вам нужно подготовить изображение(убрать шумы, помехи, обозначить зоны)
    Проще использовать формы
    И наконец обучить