Автор Тема: Чтение PDF файла  (Прочитано 173 раз)

Оффлайн gilr

  • Новичок
  • *
  • Сообщений: 8
    • Просмотр профиля
Чтение PDF файла
« : 07 Ноябрь 2019, 09:56:25 »
Использую Tesseract, указал путь к файлу и обозначил в какую переменную сохранить. Выводит ошибку "Недопустимый параметр". А если указать путь к jpg файлу, то все работает. Tesseract не поддерживает PDF файлы?
« Последнее редактирование: 07 Ноябрь 2019, 14:20:37 от gilr »

Оффлайн Serovkir

  • Новичок
  • *
  • Сообщений: 10
    • Просмотр профиля
Re: Чтение PDF файла
« Ответ #1 : 08 Ноябрь 2019, 09:45:45 »
Добрый день!

Да, Tesseract работает только с изображениями.
Вы можете использовать активности для получения изображений из PDF или конвертации PDF в изображения, перед тем как использовать Tesseract.

Оффлайн gilr

  • Новичок
  • *
  • Сообщений: 8
    • Просмотр профиля
Re: Чтение PDF файла
« Ответ #2 : 08 Ноябрь 2019, 12:44:40 »
Перевожу PDF в картинку, далее использую Tesseract и он криво определяет текст. У вас будет в скором времени добавление ABBYY для чтения PDF?

P.S.  Переводил PDF документ в JPG через онлайн сервис и текст более менее нормально определялся.