Распознавание бухгалтерских документов

zimichev

New member
Добрый день!

Давно смотрю в сторону роботов RPA, в прошлом году предлагал в нашей компании внедрить робота от ваших конкурентов, но IT отдел отговорил директора.
Не давно узнал про ваше решение, прошел курс на сайте (диплом №135), что рассказывается в курсе все получается, все очень просто.

Хочу сделать не большой проект что бы директору показать возможности системы, идеально это распознавание бухгалтерских документов и выгрузка в 1С (вместо выгрузки в 1С достаточно нужные значения запомнить в переменных).

По курсу распознавать документы получается, не понятно что делать с этим дальше, как понять что определенные цифры это ИНН, другие корреспондентский счет в банке или в УПД что-то номенклатура, а что-то количество и т.д.?

Может есть подобные примеры из практики?
 

artarik

Active member
например, по ключевым словам (тот же ИНН) , если это формализованный документ, тогда по положению в области документа
 

zimichev

New member
я вас правильно понимаю, распознаю весь текст, нахожу слово ИНН, и беру через "n" символов "m" символов?
 

artarik

Active member
я вас правильно понимаю, распознаю весь текст, нахожу слово ИНН, и беру через "n" символов "m" символов?
типа того.

Но это сложный пример, на мой взгляд. При распознавании документов могут быть ошибки типа: "о" распознался как "0"
Для демонстрации лучше показать что-то простое, но, чтобы можно было легко подсчитать время работы робота и сравнить с временем работы человека. А в заполнении данных в 1С скорость робота будет не особо выше, т.к. процесс проведения/сохранения документа не зависит от его скорости работы .
RPA все равно придется согласовывать с ИТ, хотя бы для того, чтобы выделить мощности для запуска агента, поэтому лучше с ними дружить )
 

zimichev

New member
дело не в скорости в сравнении с человеком, мне не нужно делать в 5 раз быстрее, мне достаточно делать так же как человек и даже медленнее, это уже будет выгоднее.
с айтишниками дружу, но в плане RPA у нас разногласия, по их мнению это тупиковая технология.
с распознаванием бухгалтерских документов самый яркий пример роботизации, ресурсов на "заколачивание" счетов в 1С очень много тратиться.
странно что нет реализованных кейсов на форуме, вообще какой смысл в распознавании, если не понятно что потом делать с этой информацией?
 
Последнее редактирование:

Анатолий Халак

Administrator
Команда форума
Добрый день!

Давно смотрю в сторону роботов RPA, в прошлом году предлагал в нашей компании внедрить робота от ваших конкурентов, но IT отдел отговорил директора.
Не давно узнал про ваше решение, прошел курс на сайте (диплом №135), что рассказывается в курсе все получается, все очень просто.

Хочу сделать не большой проект что бы директору показать возможности системы, идеально это распознавание бухгалтерских документов и выгрузка в 1С (вместо выгрузки в 1С достаточно нужные значения запомнить в переменных).

По курсу распознавать документы получается, не понятно что делать с этим дальше, как понять что определенные цифры это ИНН, другие корреспондентский счет в банке или в УПД что-то номенклатура, а что-то количество и т.д.?

Может есть подобные примеры из практики?
Добрый день!

Сделали небольшой пример, прикреплен к сообщению.

Также на сайте PIX можно заказать демо
 

Вложения

artarik

Active member
Добрый день!

Сделали небольшой пример, прикреплен к сообщению.

Также на сайте PIX можно заказать демо
Анатолий, касаемо видео, пара вопросов:
- BPM DEsigner это внутренняя разработка компании, недоступная для конечных пользователей?
- Отчетный EXCEL файл создан с горизонтальной и вертикальной группировкой. Какими активностями создаются группировки?
 
Последнее редактирование:

Анатолий Халак

Administrator
Команда форума
Анатолий, касаемо видео, пара вопросов:
- BPM DEsigner это внутренняя разработка компании, недоступная для конечных пользователей?
- Отчетный EXCEL файл создан с горизонтальной и вертикальной группировкой. Какими активностями создаются группировки?
1) - Это внутренняя разработка компании. Для конечных пользователей доступна в случае покупки лицензии на Мастер.
2) - Группировок, как таковых, в решаемой задаче нет. Заполняется шаблон.
 

Who

New member
Добрый день!

Давно смотрю в сторону роботов RPA, в прошлом году предлагал в нашей компании внедрить робота от ваших конкурентов, но IT отдел отговорил директора.
Не давно узнал про ваше решение, прошел курс на сайте (диплом №135), что рассказывается в курсе все получается, все очень просто.

Хочу сделать не большой проект что бы директору показать возможности системы, идеально это распознавание бухгалтерских документов и выгрузка в 1С (вместо выгрузки в 1С достаточно нужные значения запомнить в переменных).

По курсу распознавать документы получается, не понятно что делать с этим дальше, как понять что определенные цифры это ИНН, другие корреспондентский счет в банке или в УПД что-то номенклатура, а что-то количество и т.д.?

Может есть подобные примеры из практики?
Добрый день.
У меня есть опыт работы с Yandex Vision на платформе Pix, поделюсь.
Распознаются сканы документов (множество типов конечно, под каждый был некий анализ).
На формах заказчика некоторые параметры были ограничены рамкой (Дата/номер/исполнитель). Так что при распознавании можно ориентироваться на координаты таких параметров (Yandex Vision возвращает координаты распознанных блоков. Предварительно надо будет искать какую-то точку отсчета, относительно которой искать заранее известные размеры рамки). Если у вас нет таких блоков, можно регулярные выражения применять.

Если у вас в качестве входных данных pdf файлы, например, которые уже содержат текст (не являются изображением), тогда можно просто регулярками пройтись и выдернуть нужные переменные.
 

zimichev

New member
Верх