OCR tesseract

addewyd@

Member
Он вообще-то работает?
Помнится, когда-то давно удавалось с его помощью парсить даже вьетнамские водительские права.

Но без пикса. А вот теперь понадобилось.

Язык русский, красивый, чёткий скан. Результат — мусор.

Что-то такое:

1626264083124.png

из такого:

1626264246089.png

С этим можно что-то сделать или придётся снова заводить аккаунты в яндексе или МС ( а это ну очень муторно(?
 

Анатолий Халак

Administrator
Команда форума
Добрый день.

На данный момент активность Тессеракт не имеет гибких настроек. Но в будущем рассмотрим внесение кастомизации для улучшения распознавания документов.
Как вариант попробуйте увеличить разрешение изображений.
 

artarik

Active member
я пробовал запускать отдельно тессеракт, результат был немного лучше, но тоже не особо читаемо. поэтому пока забил на него
 

addewyd@

Member
попробовал для полноты картины abbyy cloud

результат пустой без каких-либо намёков на сообщение об ошибке. Как через PIX, так и при обращении к апи альтернативными способами

Ничего не понимаю.

УПД

Похоже, у них нет триала, и просто таким образом просят сразу денег
 
Верх