Вопрос по Урок 6 - OCR

Денис

New member
Полностью сделал по видеоинструкции распознавание 3х файлов и сортировку их по папкам.
Но результата нет.

1. Все 3 файла (скачал те, примеры, которые вы разместили под видео) не распознаются Тессератом.
2. Не создается папка ни для тех файлов, которые идут по ветке Истина, ни для тех, что Ложь. Просто создается 1 файл, без папки, который называется Другие, без расширения и вообще не опознать его.
3. Потом я сам добавил активности "создать папку".
4. В итоге просто все 3 файла ПИКС кладет в созданную папку "Другие" и не создает текстового файла. Не распознает.

Толи тот метод, который указан в примере не работаете, то ли Тессерат не хочет так работать. Дело в том, что если просто запустить Тессерат для работы с одним файлом и создать из этого текстовый файл, то все ок. А вот так как в видео - не получается. В чем может быть проблема?

Файл прикладываю.
 

Вложения

Последнее редактирование:
Полностью сделал по видеоинструкции распознавание 3х файлов и сортировку их по папкам.
Но результата нет.

1. Все 3 файла (скачал те, примеры, которые вы разместили под видео) не распознаются Тессератом.
2. Не создается папка ни для тех файлов, которые идут по ветке Истина, ни для тех, что Лож. Просто создается 1 файл, без папки, который называется Другие, без расширения и вообще не опознать его.
3. Потом я сам добавил активности "создать папку".
4. В итоге просто все 3 файла ПИКС кладет в созданную папку "Другие" и не создает текстового файла. Не распознает.

Толи тот метод, который указан в примере не работаете, то ли Тессерат не хочет так работать. Дело в том, что если просто запустить Тессерат для работы с одним файлом и создать из этого текстовый файл, то все ок. А вот так как в видео - не получается. В чем может быть проблема?

Файл прикладываю.
Добрый день, Денис!
Спасибо за обращение, разбираемся
 
Полностью сделал по видеоинструкции распознавание 3х файлов и сортировку их по папкам.
Но результата нет.
...
Здравствуйте, Денис. Проверили урок в академии и ваш скрипт.

Tesseract - бесплатная технология, поэтому в её работе возможны сбои.
Если в обе ветви условного оператора добавить активности по созданию файлов - видно, что файлы распознаются, но текст в них не всегда читабельный, поэтому все файлы и помещаются в каталог "Другие".

Немного подправили ваш скрипт, чтобы файлы распознавались более точно. Проверьте, будут ли воспроизводиться описанные ранее проблемы с данным вариантом скрипта?
В результате его выполнения должны произойти следующие изменения:
- в каталоге "Files" создадутся 2 каталога: "Другие" и "Договора";
- в каталог "Другие" скопируются файлы "Scan-1.png" и "Scan_2.jpg";
- в каталог "Договора" скопируются файлы "Scan_1.jpg" и "Scan-2.png";
- в каталоге "Договора" создадутся файлы "Scan_1.jpg.txt" и "Scan-2.png.txt" с распознанным текстом документов.

Для работы скрипта не нужно менять пути (т.к. в скрипте используются относительные, а не абсолютные пути), достаточно распаковать архив и запустить скрипт.
 

Вложения

Денис

New member
Здравствуйте, Денис. Проверили урок в академии и ваш скрипт.

Tesseract - бесплатная технология, поэтому в её работе возможны сбои.
Если в обе ветви условного оператора добавить активности по созданию файлов - видно, что файлы распознаются, но текст в них не всегда читабельный, поэтому все файлы и помещаются в каталог "Другие".

Немного подправили ваш скрипт, чтобы файлы распознавались более точно. Проверьте, будут ли воспроизводиться описанные ранее проблемы с данным вариантом скрипта?
В результате его выполнения должны произойти следующие изменения:
- в каталоге "Files" создадутся 2 каталога: "Другие" и "Договора";
- в каталог "Другие" скопируются файлы "Scan-1.png" и "Scan_2.jpg";
- в каталог "Договора" скопируются файлы "Scan_1.jpg" и "Scan-2.png";
- в каталоге "Договора" создадутся файлы "Scan_1.jpg.txt" и "Scan-2.png.txt" с распознанным текстом документов.

Для работы скрипта не нужно менять пути (т.к. в скрипте используются относительные, а не абсолютные пути), достаточно распаковать архив и запустить скрипт.
Большое спасибо. Так работает намного лучше.
 
Верх