Только нужная информация
Кросс-платформенное решение
для интеллектуальной обработки информации

ContentCapture

Входит в реестр отечественного ПО

Возможности
/
Схема работы
/
Сценарии применения
/
Готовые гибкие описания
/
Спецификация
/
ContentCapture Банк

ContentCapture^®

ContentCapture – универсальное кросс-платформенное решение для автоматизации обработки информации из любых типов документов: отсканированных бумаг, фотографий, электронных документов, текстов писем и вложений. Решение распознает, классифицирует документы, извлекает данные, проверяет их корректность и передает в корпоративные информационные системы. C ContentCapture можно ускорить и упростить любые процессы, связанные с документооборотом.

ContentCapture включен в реестр российского ПО, работает на отечественных ОС и на Windows. Подходит для импортозамещения ABBYY Flexicapture, Kofax Capture, IBM Datacap.

Почему ContentCapture

Технологии ИИ
NEW!
Распознавание рукописного текста
Извлекайте из документов данные, написанные от руки с помощью специализированных ICR-технологий. Они позволяют автоматизировать обработку разнообразных документов: паспортов, анкет, заявлений и др.

Предобработка входящих изображений
Автоматически улучшайте изображения для оптимизации обработки информации. Функциональность особенно важна для работы с документами со сложным фоном: паспортов, водительских удостоверений, транспортных форм

Многоуровневая классификация документов
Используйте классификаторы для повышения эффективности обработки и маршрутизации документов. Благодаря применению передовых методов машинного обучения возможно определить любые типы документов и избавиться от необходимости их ручной сортировки и маркировки
Надежность
Внедрение
Решение развернуто в крупнейших российских организациях и протестировано под ежедневной нагрузкой до 3 миллионов документов в день. Гибкие возможности интеграции позволяют бесшовно встроить продукт в IT-систему организации и обеспечить бесперебойную автоматизацию на годы вперед

Многоуровневая защита данных
Конфиденциальные данные в документах могут быть скрыты разными способами при проверке результатов обработки операторами с разными правами доступа. HTTPs обеспечивает двунаправленное шифрование между пользователем и сервером для защиты от перехвата данных и предотвращения атак

Импортонезависимость
ContentCapture входит в реестр отечественного ПО и подходит для импортозамещения ABBYY Flexicapture, Kofax Capture, IBM Datacap
Работает на отечественных ОС (Astra Linux, РедОС, Alt Linux) и на Windows
Режим «единого окна»
Разнообразные
варианты ввода данных
Благодаря возможности многоканального ввода данных ContentCapture позволяет обрабатывать как бумажные, так и цифровые документы, поступающие из различных источников в едином потоке. Среди этих источников могут быть многофункциональные устройства (МФУ), сетевые сканеры, электронная почта, FTP, веб-почта, горячие папки и мобильные устройства

Все типы документов
С помощью продвинутого анализа документов ПО ContentCapture способно точно определить тип бумажных или электронных документов (таких как электронные таблицы, изображения, логотипы и другие), а также выделить различные области внутри документа, даже если текст на первый взгляд неразборчив. Решение может обрабатывать в одном потоке файлы в форматах Word, Excel, PDF, электронные сообщения, отсканированные изображения и другие цифровые документы

Узнать подробнее о возможностях продукта

История выпусков

Схема работы

1

Импорт

ContentCapture обрабатывает в едином потоке электронные письма и вложения, бумажные документы, электронные документы в офисных форматах, фотографии с камер и мобильных устройств

2

Классификация

В систему достаточно ввести 10 образцов нового класса документа, и технология автоматически научится определять тип документа по внешнему виду или взаимному расположению элементов

3

Распознавание

Распознавание текста:

печатного — на 190 языках
рукопечатного — на 110 языках
рукописного — на русском и английском

Решение также распознает линейные и двухмерные штрихкоды, различные метки

4

Извлечение данных

ContentCapture автоматически извлекает данные из структурированных и неструктурированных документов.

Автоматическая проверка данных:

сверка информации из документов с базами данных
проверка форматирования
нормализация данных. Решение приводит в единый вид данные, которые написаны по-разному, но одинаковые по значению, для корректного наполнения ИС
подключение пользовательских алгоритмов проверки

5

Верификация

Система сравнивает данные распознавания с отсканированным оригиналом документа и автоматически подсвечивает неуверенно распознанные данные, а также отображает информацию о непройденных проверках данных.

Способы проверки данных:

групповая верификация: посимвольная проверка данных
верификация в окне документа: проверка документа
контекстная верификация: проверка полей

6

Экспорт

ContentCapture автоматически сохраняет результаты распознавания в файлы различных форматов, экспортирует их в базы данных, учетные и иные информационные системы:

Microsoft™ SharePont
базы данных, соответствующие стандарту ODBC: Oracle, Microsoft SQL Server, Microsoft Access, PostgreSQL
ERP, ECM, CRM и др.

Данные можно одновременно экспортировать в различные директории и преобразовать сразу в несколько форматов

Мониторинг и Администрирование

ContentCapture включает в себя консоль администрирования и мониторинга на базе HTML5 для настройки различных вариантов отчетов:

о работе операторов
о производительности комплекса (оценить распределение ресурсов по тенантам, вычислить среднюю производительность, рассчитать эффективность работы комплекса за выбранный интервал времени)
по количеству ошибок.

Также возможно создание графиков и дашбордов для пользователей с разными ролями: администратор, пользователь и т. д.

Сценарии применения

Обработка бухгалтерских и финансовых документов

Быстро и качественно обработать первичные документы необходимо любому предприятию. Чем крупнее компания, тем больше финансовых операций она выполняет, и тем больше времени и ресурсов требуется для обработки счетов-фактур, актов, товарных накладных и других документов.

Российское решение ContentCapture значительно разгружает отдел бухгалтерии для более важных задач, сокращает время принятия решений, снижает издержки на обработку документов и при этом обеспечивает контроль на всех этапах работы системы.

Подробнее

Обработка входящей корреспонденции: сканирование, классификация, распределение

Какие бы услуги ни предоставлял бизнес, клиенты всегда ожидают точных ответов, оперативной обработки информации и высокой клиентоориентированности.

Автоматизируйте маршрутизацию входящих документов, и вся деловая корреспонденция будет обрабатываться в момент поступления. Запрос будет обработан в кратчайшие сроки, лояльность клиентов будет повышаться, а вы сократите расходы на сортировку, организацию и ручную маркировку документов.

Подробнее

Поточное сканирование для наполнения электронных архивов

Электронный архив документов необходим любой организации, которая регулярно решает задачи поиска и копирования документов по запросам внешних инстанций, например, в рамках камеральных проверок или налоговой отчетности.

Для того, чтобы отсканированные документы попали в электронный архив, необходимо привязать их к карточке документа, снабдив необходимыми атрибутами: дата, номер, поставщик и т. д. Если помещать в архив просто сканы, то найти документ в дальнейшем будет невозможно.

Подробнее

Автоматизация ввода и обработки кадровой документации

Для приема на новое место работы соискателю необходимо предоставить пакет документов. По данным аналитиков, кадровый специалист тратит до 1 часа на ручную обработку одного пакета документов для оформления нового работника в штат.

Универсальная платформа для интеллектуальной обработки информации ContentCapture поможет автоматизировать обработку кадровых документов при приеме на работу, снизить процент ошибок при переносе информации в базы данных компании и в несколько раз ускорить процесс оформления новых сотрудников.

Подробнее

Обработка проектно-сметной документации

При проектировании различных систем и оборудования в тяжелой промышленности и энергетике нередко встречаются расхождения в данных проектно-сметной документации и САПР.

Зачастую такие ошибки обнаруживаются на поздних стадиях проекта и требуют исправления несоответствий, что ведет к увеличению стоимости проекта. ContentCapture помогает снизить финансовые и технологические риски на ранних этапах проектирования.

Подробнее

Обработка обращений из государственных органов

Ежегодно банк обрабатывает более 100 тыс. запросов от госорганов о предоставлении информации по счетам и операциям клиентов. Каждое обращение составляется в бумажном виде и произвольной форме, а ответ должен быть дан в кратчайшие сроки. При этом по некоторым запросам подготовка релевантных документов может занять не одну неделю.

Универсальная платформа для интеллектуальной обработки информации ContentCapture поможет оптимизировать и ускорить процесс подготовки ответов на обращения от госорганов, а также упростить контроль за выполнением этой задачи.

Подробнее

Автоматизация обработки финансовой отчетности

Банки тщательно анализируют финансовые данные клиентов для того, чтобы снизить собственные риски и сохранять рыночные позиции. Так, например, в работе с корпоративными заказчиками для банков важна тщательная проработка бухгалтерского баланса и отчета о финансовых результатах предприятия, поскольку в них содержатся важные сведения, которые помогают заранее оценить платежеспособность клиента и присвоить ему внутренний кредитный рейтинг.

Сами формы бухгалтерской отчетности представляют из себя многостраничные текстовые документы с различными таблицами, в которых отражена информация об активах, собственном капитале, кредитных обязательствах, выручке, расходах и финансовых результатах предприятия. Качественно обработать такой объем данных способны технологии автоматизации, освободив рабочее время специалистов для более сложных аналитических задач.

Подробнее

Готовые гибкие описания документов

Указан неполный список. Если необходимый документа не оказалось в списке — напишите нам

Вебинар «Автоматизация ввода первичной бухгалтерской документации c помощью ContentCapture»

Рассказываем, как упростить и ускорить обработку первичных документов с помощью универсальной платформы ContentCapture.

>> Смотреть

Эффект от внедрения

Сокращение времени принятия решений

Быстрая и точная обработка данных ускоряет принятие управленческих решений

Снижение издержек

на обработку документов

Автоматическая классификация, распознавание и экспорт данных из любых источников и типов документов в ИС

Контроль на всех этапах и уровнях

Расширенные возможности мониторинга помогают управлять потоком документов и оптимизировать работу сотрудников

Заказчики

Истории успеха

Альфа-банк
крупнейший частный банк в России

Мазда
японская автомобилестроительная компания

Бургер Кинг
сеть ресторанов быстрого питания

РЕАЛИЗОВАННЫЕ ПРОЕКТЫ | КРОСС-ИНДУСТРИАЛЬНЫЕ

ТЭК-Торг сократил до 10 раз трудозатраты специалистов по госзакупкам с помощью решения Content AI

Скачать PDF

Читать кейс

Спецификация

ContentCapture 14 Cross-platform

ContentCapture 12 Distibuted

Процессор

Сервер Приложений: не менее 2 ГГц, рекомендуется использовать процессор с 2-мя и более ядрами

Остальные серверы: не менее 2 ГГц

Операционная система

Windows Server 2012
Windows Server 2012 R2
Windows Server 2016
Windows Server 2019
Windows Server 2022

Замечание. Для работы с локализованным интерфейсом операционная система должна обеспечивать необходимую языковую поддержку.

Оперативная память

Не менее 2 ГБ для каждого компонента

Замечание. Дополнительно 4 ГБ, если установлен Сервер Баз Данных.

Место на диске

500 МБ для установки Сервера Приложений
400 МБ для установки Сервера Обработки
100 МБ для установки Сервера Лицензирования
2 ГБ для базы данных SQL Server
Для файлового хранилища требуется дополнительное место на диске

Браузер

(для просмотра Консоли Администрирования и Мониторинга)

Google Chrome 55 и выше (32-бит)
Internet Explorer 11
Замечание. Для корректной работы Internet Explorer 11 требуется установить .NET Framework 4.7.2 на компьютере, на котором установлен Сервер Приложений, или добавить localhost в список сайтов, просматриваемых в режиме совместимости.
Mozilla FireFox 50 и выше (32-бит)
Microsoft Edge 41 и выше
Яндекс.Браузер 17.6.1 и выше
Спутник

Замечание. Наилучшим браузером для работы с ContentCapture является Google Chrome либо другие браузеры на основе Chromium.

Внимание! Отказ от ответственности для пользователей Internet Explorer / Известная проблема

Из-за известных ограничений Internet Explorer 11 в ContentCapture могут возникать проблемы при одновременной обработке десятков страниц или при наличии большого числа задач верификации. Использование Internet Explorer в течение длительного периода времени может привести к тому, что браузер будет потреблять все больше памяти компьютера, замедлению работы пользователя и в конечном итоге к сбою в работе браузера.

Чтобы избежать нежелательных прерываний задач, Content AI рекомендует использовать для веб-верификации Microsoft Edge, Google Chrome или другие браузеры. Тем не менее, веб-станции ContentCapture полностью функционируют в Internet Explorer 11 и в некоторых случаях его можно использовать для обработки документов.

Особенности работы в браузере Internet Explorer

Если при верификации произошел сбой, при повторном подключении оператор не сможет взять задачу, с которой работал в момент сбоя. Задача снова станет доступна только после очистки неактивных сессий. По умолчанию очистка происходит каждые 4 часа. Вы можете изменить этот период в файле web. config сервера обработки. Не рекомендуется выставлять данное значение слишком маленьким, минимальное рекомендуемое значение для периода очистки сессий 10 минут.
Начиная с версии ContentCapture R3 Update 1, каждая новая задача будет открываться в новой вкладке браузера. Это позволяет уменьшить потребление памяти. Однако при этом режиме не поддерживается автоматическое получение задач. Вы можете отключить режим открытия в новой вкладке, указав для ключа IEVerificationNewWindow значение false в файле web. config вебстанции.
В Internet Explorer 11 не поддерживается ввод текста на японском языке с помощью редактора метода ввода Microsoft IME

Другие требования

Компьютер, на который установлен сервер, должен входить в ваш домен
Видеокарта и дисплей с разрешением 1024×768
Internet Information Services 7 или выше
Microsoft .NET Framework 4.7.2 или выше
Microsoft SQL Server 2016 SP2, 2017, 2019; Microsoft Azure; Oracle Database 12c, 18с, 19c; PostgreSQL 11 или выше
Замечание. Для создания баз данных требуется также Microsoft SQL Server Native Client версии 2012 или выше
Visual C++ 2015 Redistributable

Процессор

не менее 1,6 ГГц

Операционная система

Windows 10
Windows 11
Windows Server 2012 + Desktop Experience
Windows Server 2012 R2 + Desktop Experience
Windows Server 2016 + Desktop Experience
Windows Server 2019 + Desktop Experience
Windows Server 2022+ Desktop Experience

Замечание. Для работы с локализованным интерфейсом операционная система должна обеспечивать необходимую языковую поддержку.

Оперативная память

1 ГБ

Место на диске

Место для установки браузера
Минимум 100 МБ для работы
Дополнительно 60 МБ для установки плагина сканирования (для Веб-станции Сканирования)

Браузер

Google Chrome 55 и выше (32-бит)
Настройки безопасности для Google Chrome:

JavaScript = Разрешить всем сайтам использовать JavaScript
Файлы cookie и данные сайтов = Разрешить всем сайтам

Mozilla FireFox 50 и выше (32-бит)
Настройки безопасности для Mozilla FireFox:

Java scripting = Включено
Firefox будет запоминать историю (Настройки → Приватность)

Microsoft Edge 41 и выше
Настройки безопасности для Microsoft Edge:

JavaScript = Разрешить всем сайтам использовать JavaScript
Файлы cookie и данные сайтов = Разрешить всем сайтам

Яндекс.Браузер 17.6.1 и выше
Настройки безопасности для Яндекс. Браузера:

JavaScript = Включено
Файлы cookie и данные сайтов = Разрешены

Спутник
Настройки безопасности для Спутника:

Java scripting = Разрешить всем сайтам использовать JavaScript
Файлы cookie и данные сайтов = Разрешены → Блокировать файлы cookie сторонних сайтов в режиме инкогнито

Замечание. Наилучшим браузером для работы с ContentCapture является Google Chrome либо другие браузеры на основе Chromium.

Microsoft Internet Explorer 11
Настройки безопасности для Internet Explorer: высокий (или ниже) уровень безопасности. Подробные настройки для Internet Explorer:

Запускать элементы ActiveX и подключаемые модули = Включено
Выполнять сценарии элементов ActiveX, помеченные как безопасные = Включено
Активные сценарии = Включено

Замечание. Для корректной работы Internet Explorer 11 требуется установить .NET Framework 4.5 на компьютере, на котором установлен Сервер Приложений, или добавить адрес Сервера Приложений в список сайтов, просматриваемых в режиме совместимости.

Замечание. Версия Internet Explorer для Metro-интерфейса Windows не поддерживается.

Внимание! Отказ от ответственности для пользователей Internet Explorer / Известная проблема

Из-за известных ограничений Internet Explorer 11 в ContentCapture могут возникать проблемы при одновременной обработке десятков страниц или при наличии большого числа задач верификации. Использование Internet Explorer в течение длительного периода времени может привести к тому, что браузер будет потреблять все больше памяти компьютера, замедлению работы пользователя и в конечном итоге к сбою в работе браузера.

Чтобы избежать нежелательных прерываний задач, Content AI рекомендует использовать для веб-верификации Microsoft Edge, Google Chrome или другие браузеры. Тем не менее, веб-станции ContentCapture полностью функционируют в Internet Explorer 11 и в некоторых случаях его можно использовать для обработки документов.

Особенности работы в браузере Internet Explorer

Если при верификации произошел сбой, при повторном подключении оператор не сможет взять задачу, с которой работал в момент сбоя. Задача снова станет доступна только после очистки неактивных сессий. По умолчанию очистка происходит каждые 4 часа. Вы можете изменить этот период в файле web. config сервера обработки. Не рекомендуется выставлять данное значение слишком маленьким, минимальное рекомендуемое значение для периода очистки сессий 10 минут.
Начиная с версии ContentCapture R3 Update 1, каждая новая задача будет открываться в новой вкладке браузера. Это позволяет уменьшить потребление памяти. Однако при этом режиме не поддерживается автоматическое получение задач. Вы можете отключить режим открытия в новой вкладке, указав для ключа IEVerificationNewWindow значение false в файле web. config веб-станции.
В Internet Explorer 11 не поддерживается ввод текста на японском языке с помощью редактора метода ввода Microsoft IME.

Другие требования

Видеокарта и дисплей с разрешением 1024×768
Для Веб-станции Сканирования:

Сканер с поддержкой TWAIN. Сканеры с поддержкой WIA видны на станции, но работа с ними не гарантируется
Надстройка Content AI Scanning Plugin (см. ниже).

Форматы и языки

ContentCapture распознает печатные тексты на более 200 языках, в том числе со словарной поддержкой (●), а формы заполненные от руки — на 110 языках (○).

абхазский

аварский

агульский

адыгейский

азербайджанский (кириллица) ●○

азербайджанский (латиница)

аймара ○

албанский ○

алтайский

английский ●○

арабский (Саудовская Аравия) ●

армянский (восточный) ●

армянский (грабар) ●

армянский (западный) ●

африкаанс ○

ацтекский ○

баскский ○

башкирский ●

белорусский

бемба ○

бирманский

блэкфут ○

болгарский ●○

бретонскийx

буготу ○

бурятский ○

валлийский

венгерский ●

волоф ○

вьетнамский ●

гавайский ○

гагаузский

галисийский ○

ганда ○

греческий ●

грузинский

гуарани ○

гэлау ○

гаэльский (Шотландия) ○

дакота (сиу) ○

даргинский

датский ●

дун ○

дунганский

зулу

иврит ●

идиш

ингушский

индонезийский ●

ирландский ○

исландский

испанский ● ○

итальянский ● ○

кабардино-черкесский

казахский ○

калмыцкий

каракалпакский

карачаево-балкарский ○

каталанский ●

кашубский ○

кечуа (Боливия) ○

кикуйю

киргизский ○

китайский (традиционный)

китайский (упрощенный)

конго ○

корейский ●

корейский (хангыль)

корсиканский

корякский

коса ○

кпелле ○

кроу ○

крымскотатарский ○

кумыкский ○

курдский ○

лакский

латинский ● ○

латышский ● ○

латышский готический

лезгинский

литовский ● ○

луба ○

лужицкий

майя ○

македонский

малагасийский ○

малайский (малазийский)

малинке ○

мальтийский

мансийский

маори ○

марийский

минангкабау ○

могавк ○

монгольский ○

мордовский ○

мяо ○

немецкий ● ○

немецкий (Люксембург) ○

немецкий (новая орфография) ● ○

ненецкий

нивхский ○

нидерландский ● ○

нидерландский (Бельгия) ● ○

ногайский ○

норвежский (букмол) ● ○

норвежский (нюнорск) ● ○

ньянджа ○

оджибве ○

осетинский

папьяменто ○

персидский

пиньинь

польский ● ○

португальский ● ○

португальский (Бразилия) ● ○

провансальский

ретороманский ○

руанда ○

румынский ● ○

румынский (Молдова) ○

рунди ○

русский ● ○

русский (старая орфография) ●

русский с ударениями

саамский ○

самоа ○

сапотек ○

свази ○

себуанский ○

селькупский ○

сербский (кириллица) ○

сербский (латиница) ○

словацкий ● ○

словенский ● ○

сомали ○

сото (Южный) ○

староанглийский ● ○

староиспанский ● ○

староитальянский ● ○

старонемецкий ● ○

старославянский

старофранцузский ● ○

суахили ○

сунданский

табасаранский

тагальский ○

таджикский ○

таити ○

тайский ●

татарский ●

ток-писин ○

тонга ○

тсвана ○

тувинский ○

турецкий ● ○

туркменский (Кириллица)

туркменский (Латиница) ○

удмуртский

узбекский (кириллица)

узбекский (латиница) ○

уйгурский (кириллица)

уйгурский (латиница) ○

украинский ● ○

фарерский

фиджи ○

финский ● ○

французский ● ○

фризский ○

фриульский ○

хакасский

хани ○

хантыйский

хауса

хорватский ● ○

цзинпо

цыганский

чаморро ○

чеченский

чешский ● ○

чувашский

чукотский

шведский ● ○

шона

эвенкийский ○

эвенский ○

эскимосский (кириллица)

эскимосский (латиница)

эстонский ● ○

якутский

японский ●

японский (современный)

Искусственные языки

идо ○

интерлингва ○

окциденталь

эсперанто

Цифры

Арабские цифры ○

Арабско-индийские цифры ○

Оставьте заявку на пробную версию

Заполните форму и получите консультацию, как наиболее эффективно использовать ContentCapture
для задач вашего бизнеса

Я даю согласие на обработку моих персональных данных.

Я хочу получать информацию о новых продуктах, ценовых изменениях, а также о специальных предложениях компании Content AI. Данное согласие может быть отозвано в любой момент. Для этого нажмите на ссылку «Отписаться» внутри любого письма, полученного от Content AI.

С апреля 2022 года техническую поддержу продуктов ABBYY на территории России оказывает компания Content AI (ООО «Контент ИИ»).

Только нужная информацияКросс-платформенное решение для интеллектуальной обработки информацииContentCapture

ContentCapture®

Почему ContentCapture

Схема работы

Сценарии применения

Готовые гибкие описания документов

Вебинар «Автоматизация ввода первичной бухгалтерской документации c помощью ContentCapture»

Эффект от внедрения

Заказчики

Истории успеха

Спецификация

Оставьте заявку на пробную версию

Только нужная информация
Кросс-платформенное решение
для интеллектуальной обработки информации

ContentCapture

ContentCapture^®