ContentCapture®
Почему ContentCapture
Технологии ИИ
NEW!
Распознавание рукописного текста
Извлекайте из документов данные, написанные от руки с помощью специализированных ICR-технологий. Они позволяют автоматизировать обработку разнообразных документов: паспортов, анкет, заявлений и др.
Предобработка входящих изображений
Автоматически улучшайте изображения для оптимизации обработки информации. Функциональность особенно важна для работы с документами со сложным фоном: паспортов, водительских удостоверений, транспортных форм
Многоуровневая классификация документов
Используйте классификаторы для повышения эффективности обработки и маршрутизации документов. Благодаря применению передовых методов машинного обучения возможно определить любые типы документов и избавиться от необходимости их ручной сортировки и маркировкиНадежность
Все типы документов
С помощью продвинутого анализа документов ПО ContentCapture способно точно определить тип бумажных или электронных документов (таких как электронные таблицы, изображения, логотипы и другие), а также выделить различные области внутри документа, даже если текст на первый взгляд неразборчив. Решение может обрабатывать в одном потоке файлы в форматах Word, Excel, PDF, электронные сообщения, отсканированные изображения и другие цифровые документы
Схема работы
ContentCapture обрабатывает в едином потоке электронные письма и вложения, бумажные документы, электронные документы в офисных форматах, фотографии с камер и мобильных устройств
В систему достаточно ввести 10 образцов нового класса документа, и технология автоматически научится определять тип документа по внешнему виду или взаимному расположению элементов
Распознавание текста:
Решение также распознает линейные и двухмерные штрихкоды, различные метки
ContentCapture автоматически извлекает данные из структурированных и неструктурированных документов.
Автоматическая проверка данных:
Система сравнивает данные распознавания с отсканированным оригиналом документа и автоматически подсвечивает неуверенно распознанные данные, а также отображает информацию о непройденных проверках данных.
Способы проверки данных:
ContentCapture автоматически сохраняет результаты распознавания в файлы различных форматов, экспортирует их в базы данных, учетные и иные информационные системы:
Данные можно одновременно экспортировать в различные директории и преобразовать сразу в несколько форматов
ContentCapture включает в себя консоль администрирования и мониторинга на базе HTML5 для настройки различных вариантов отчетов:
Сценарии применения
и др.
Эффект от внедрения
Сокращение времени принятия решений
Быстрая и точная обработка данных ускоряет принятие управленческих решений
Снижение издержек
на обработку документов
Автоматическая классификация, распознавание и экспорт данных из любых источников и типов документов в ИС
Контроль на всех этапах и уровнях
Расширенные возможности мониторинга помогают управлять потоком документов и оптимизировать работу сотрудников
Заказчики о ContentCapture
Спецификация
ContentCapture 12 Distributed
Процессор
Сервер Приложений: не менее 2 ГГц, рекомендуется использовать процессор с 2-мя и более ядрами
Остальные серверы: не менее 2 ГГц
Операционная система
Замечание. Для работы с локализованным интерфейсом операционная система должна обеспечивать необходимую языковую поддержку.
Оперативная память
Не менее 2 ГБ для каждого компонента
Замечание. Дополнительно 4 ГБ, если установлен Сервер Баз Данных.
Место на диске
Браузер
(для просмотра Консоли Администрирования и Мониторинга)
Замечание. Наилучшим браузером для работы с ContentCapture является Google Chrome либо другие браузеры на основе Chromium.
Внимание! Отказ от ответственности для пользователей Internet Explorer / Известная проблема
Из-за известных ограничений Internet Explorer 11 в ContentCapture могут возникать проблемы при одновременной обработке десятков страниц или при наличии большого числа задач верификации. Использование Internet Explorer в течение длительного периода времени может привести к тому, что браузер будет потреблять все больше памяти компьютера, замедлению работы пользователя и в конечном итоге к сбою в работе браузера.
Чтобы избежать нежелательных прерываний задач, Content AI рекомендует использовать для веб-верификации Microsoft Edge, Google Chrome или другие браузеры. Тем не менее, веб-станции ContentCapture полностью функционируют в Internet Explorer 11 и в некоторых случаях его можно использовать для обработки документов.
Особенности работы в браузере Internet Explorer
Другие требования
Процессор
не менее 2 ГГц
Операционная система
Замечание. Для работы с локализованным интерфейсом операционная система должна обеспечивать необходимую языковую поддержку.
Оперативная память
Станция Настройки Проекта, Станция Верификации, Станция Верификации Данных: 2 ГБ
Станция Обработки: не менее 2,5 ГБ на каждое ядро процессора
Станция Сканирования: 1 ГБ
Место на диске
Станция Сканирования: 1 ГБ (включая 200 МБ для установки и место для отсканированных изображений)
Остальные станции: 4 ГБ (включая 2 ГБ для установки)
Другие требования
Процессор
не менее 1,6 ГГц
Операционная система
Замечание. Для работы с локализованным интерфейсом операционная система должна обеспечивать необходимую языковую поддержку.
Оперативная память
1 ГБ
Место на диске
Браузер
Замечание. Наилучшим браузером для работы с ContentCapture является Google Chrome либо другие браузеры на основе Chromium.
Замечание. Для корректной работы Internet Explorer 11 требуется установить .NET Framework 4.5 на компьютере, на котором установлен Сервер Приложений, или добавить адрес Сервера Приложений в список сайтов, просматриваемых в режиме совместимости.
Замечание. Версия Internet Explorer для Metro-интерфейса Windows не поддерживается.
Внимание! Отказ от ответственности для пользователей Internet Explorer / Известная проблема
Из-за известных ограничений Internet Explorer 11 в ContentCapture могут возникать проблемы при одновременной обработке десятков страниц или при наличии большого числа задач верификации. Использование Internet Explorer в течение длительного периода времени может привести к тому, что браузер будет потреблять все больше памяти компьютера, замедлению работы пользователя и в конечном итоге к сбою в работе браузера.
Чтобы избежать нежелательных прерываний задач, Content AI рекомендует использовать для веб-верификации Microsoft Edge, Google Chrome или другие браузеры. Тем не менее, веб-станции ContentCapture полностью функционируют в Internet Explorer 11 и в некоторых случаях его можно использовать для обработки документов.
Особенности работы в браузере Internet Explorer
Другие требования
При установке ABBYY Scanning Plugin доступен выбор из двух вариантов:
Таблица выше иллюстрирует совместимость ABBYY Scanning Plugin с различными операционными системами при различных правах доступа.
Замечание. Чтобы разрешить установку Content AI Scanning Plugin для Windows Server 2012, необходимо запускать исполнимый файл Setup.exe от имени администратора либо изменить политику безопасности, установив значение ключа реестра HKEY_LOCAL_MACHINE\Software\Policies\Microsoft\Windows\Installer DisableMSI равным «0».
Процессор
не менее 2 ГГц
Операционная система
Замечание. Для работы с локализованным интерфейсом операционная система должна обеспечивать необходимую языковую поддержку.
Оперативная память
1 ГБ
Место на диске
400 МБ
Другие требования
Работу комплекса поддерживают следующие виртуальные машины:
Замечание. Версия Hyper-V соответствует версии операционной системы.
Замечание. Виртуальные машины Hyper-V не поддерживают работу с USB устройствами.
2. Платформы виртуализации, имитирующие рабочее место / приложение:
3. Сервисы облачных вычислений:
абхазский
аварский
агульский
адыгейский
азербайджанский (кириллица) ●○
азербайджанский (латиница)
аймара ○
албанский ○
алтайский
английский ●○
арабский (Саудовская Аравия) ●
армянский (восточный) ●
армянский (грабар) ●
армянский (западный) ●
африкаанс ○
ацтекский ○
баскский ○
башкирский ●
белорусский
бемба ○
бирманский
блэкфут ○
болгарский ●○
бретонскийx
буготу ○
бурятский ○
валлийский
венгерский ●
волоф ○
вьетнамский ●
гавайский ○
гагаузский
галисийский ○
ганда ○
греческий ●
грузинский
гуарани ○
гэлау ○
гаэльский (Шотландия) ○
дакота (сиу) ○
даргинский
датский ●
дун ○
дунганский
зулу
иврит ●
идиш
ингушский
индонезийский ●
ирландский ○
исландский
испанский ● ○
итальянский ● ○
кабардино-черкесский
казахский ○
калмыцкий
каракалпакский
карачаево-балкарский ○
каталанский ●
кашубский ○
кечуа (Боливия) ○
кикуйю
киргизский ○
китайский (традиционный)
китайский (упрощенный)
конго ○
корейский ●
корейский (хангыль)
корсиканский
корякский
коса ○
кпелле ○
кроу ○
крымскотатарский ○
кумыкский ○
курдский ○
лакский
латинский ● ○
латышский ● ○
латышский готический
лезгинский
литовский ● ○
луба ○
лужицкий
майя ○
македонский
малагасийский ○
малайский (малазийский)
малинке ○
мальтийский
мансийский
маори ○
марийский
минангкабау ○
могавк ○
монгольский ○
мордовский ○
мяо ○
немецкий ● ○
немецкий (Люксембург) ○
немецкий (новая орфография) ● ○
ненецкий
нивхский ○
нидерландский ● ○
нидерландский (Бельгия) ● ○
ногайский ○
норвежский (букмол) ● ○
норвежский (нюнорск) ● ○
ньянджа ○
оджибве ○
осетинский
папьяменто ○
персидский
пиньинь
польский ● ○
португальский ● ○
португальский (Бразилия) ● ○
провансальский
ретороманский ○
руанда ○
румынский ● ○
румынский (Молдова) ○
рунди ○
русский ● ○
русский (старая орфография) ●
русский с ударениями
саамский ○
самоа ○
сапотек ○
свази ○
себуанский ○
селькупский ○
сербский (кириллица) ○
сербский (латиница) ○
словацкий ● ○
словенский ● ○
сомали ○
сото (Южный) ○
староанглийский ● ○
староиспанский ● ○
староитальянский ● ○
старонемецкий ● ○
старославянский
старофранцузский ● ○
суахили ○
сунданский
табасаранский
тагальский ○
таджикский ○
таити ○
тайский ●
татарский ●
ток-писин ○
тонга ○
тсвана ○
тувинский ○
турецкий ● ○
туркменский (Кириллица)
туркменский (Латиница) ○
удмуртский
узбекский (кириллица)
узбекский (латиница) ○
уйгурский (кириллица)
уйгурский (латиница) ○
украинский ● ○
фарерский
фиджи ○
финский ● ○
французский ● ○
фризский ○
фриульский ○
хакасский
хани ○
хантыйский
хауса
хорватский ● ○
цзинпо
цыганский
чаморро ○
чеченский
чешский ●
○
чувашский
чукотский
шведский ● ○
шона
эвенкийский ○
эвенский ○
эскимосский (кириллица)
эскимосский (латиница)
эстонский ● ○
якутский
японский ●
японский (современный)
Искусственные языки
идо ○
интерлингва ○
окциденталь
эсперанто
Цифры
Арабские цифры ○
Арабско-индийские цифры ○
русский
английский
Программные продукты компании Content AI поддерживают сканирующие устройства, которые корректно работают с драйверами стандартов TWAIN, WIA. Например, с популярными моделями сканеров и многофункциональных устройств следующих производителей: Avision, Brother, Canon, Epson, Fujitsu, HP, Kodak, Lexmark, Microtek, Mustek, Oki, Panasonic, Plustek, Ricoh, Visioneer, VuPoint, Xeroxи многих других.
Тем не менее, в общем случае компания Content AI не может гарантировать и не гарантирует работоспособность своих программ с любыми сканерами. В соответствии с этим компания Content AI не несет ответственности за возможный коммерческий ущерб, связанный с использованием вышеприведенной информации.
Если Вам не удается наладить работу вашего сканера или многофункционального устройства с программным продуктом компании Content AI, обратитесь в службу технической поддержки.
Система распознает следующие типы текстов:
EAN 13
EAN 8
Code 39
Code 39 without asterisk
Check Code 39
Interleaved 25
Check Interleaved 25
Code 128
Codabar
UPC-A
UPC-E
Code 93
UCC-128
PDF-417
IATA 25
Matrix 25
Industrial 25
PostNet
Patch code
Check CodaBar
Aztec
Datamatrix
QR code
(!) Для распознавания штрих-кодов с кириллической кодировкой нужно использовать штрих-код в формате Datamatrix, PDF417 или QRCode.
Форматы импорта
Документы могут быть не только отсканированы, но и загружены в систему из файлов изображений:
* - Для изображений в формате JPEG-2000 используется сжатие без потери качества.
Форматы экспорта
Возможности экспорта данных:
Форматы экспорта данных
Форматы экспорта изображений