К основному контенту
ContentReader® PDF
вакансии
партнеры
image
image
image
Входит в реестр отечественного ПО.
Многофункциональный OCR SDK для разработчиков.
Используйте OCR-технологии с элементами искусственного интеллекта.

ContentReader® Engine

Главная / ContentReader® Engine

ContentReader Engine SDK

Многофункциональный инструментарий разработчика, который позволяет встраивать в приложения интеллектуальные технологии распознавания данных. 
С помощью OCR на основе технологий искусственного интеллекта вы можете создавать приложения с функциями качественного распознавания документов, изображений, фотографий, классификации документов, сохранение сканированных документов в файлы форматов Word, Excel и PDF с возможностью поиска.

More products

Применение в решениях



  • Организация электронного архива, СЭД, сервисы по обработке информации
    Конвертируйте документы в сжатые PDF или PDF/А с возможностью поиска, чтобы пользователи могли быстро и удобно находить нужную информацию.
  • ■■

    Предотвращение утечек данных
    Расширьте возможности DLP за счет распознавания сканов документов, фотографий и изображений, чтобы выявлять возможные случаи нарушений политики информационной безопасности.
  • ■■■

    Тестирование и контроль качества работы приборов
    Расширьте возможности системы машинного зрения. Распознавайте тексты на фотографиях экранов, дисплеев, сенсорных устройств и других приборов. Автоматизируйте тестирование и контроль качества работы приборов.
  • ■■■■

    Электронное обнаружение информации и анализ данных
    Конвертируйте документы в электронные файлы и находите нужную информацию с помощью инструментов анализа данных.

Возможности

ContentReader® Engine — это передовые возможности для разработки приложений для Windows и Linux.
  • image
    SDK позволяет использовать отмеченные многими наградами технологии полнотекстового и зонального распознавания печатного (OCR) и рукопечатного (ICR) текстов, а также распознавать штрихкоды (OBR).
  • image
    Конвертируйте документы в PDF и PDF/A с возможностью поиска. При импортировании PDF можно добавлять текстовый слой с сохранением настроек файла. Извлекайте XML-данные из импортированных файлов в формате PDF/A-3 и добавляйте их при сохранении файлов в формате PDF/A-3.
  • image
    Эффективные технологии с элементами искусственного интеллекта и машинного обучения в сочетании с ADRT-технологиями позволяют определять логическую структуру и форматирование документа, например, таблицы, колонтитулы и шрифты, чтобы с высокой точностью воссоздать исходный документ.
  • image
    Конвертируйте документы в PDF и PDF/A с возможностью поиска. При импортировании PDF можно добавлять текстовый слой с сохранением настроек файла. Извлекайте XML-данные из импортированных файлов в формате PDF/A-3 и добавляйте их при сохранении файлов в формате PDF/A-3.
  • image
    Точность распознавания можно повысить за счет предобработки и оптимизации изображений перед началом OCR-процесса. Выравнивание, изменение поворота, коррекция искажения, выпрямление строк, разделение на страницы, адаптивная бинаризация, шумопонижение и не только — все это позволяет распознавать изображения даже низкого качества.
  • image
    В предопределенных профилях обработки содержатся необходимые параметры, позволяющие быстро и точно распознавать текст в рамках определённых повторяющихся задач. Они также помогают ускорить процесс разработки и исключить необходимость настраивать систему вручную.
  • image
    BCR API и MRZ API позволяют распознавать визитные карточки и машинно-считываемых зоны (MRZ) в документах, удостоверяющих личность, загранпаспортах или визах. Они обеспечивают доступ к значениям отдельных полей с минимальными затратами на программирование.
  • image
    В передовых алгоритмах классификации ContentReader® Engine используются технологии машинного обучения, оптического распознавания символов и обработки естественного языка, что позволяет качественно определять типы документов.
  • image
    Обширный набор примеров кода содержит инструкции по применению OCR SDK, примеры работы технологии и может быть использован для разработки решений. В каждом разделе библиотеки содержатся фрагменты кода и руководство по выполнению определенных задач.
  • image
    Подробная документация помогает оптимизировать процесс интеграции. Есть вопросы? На протяжении всего срока действия пробной версии пользователи могут свободно обращаться в техническую поддержку.
  • image
    ContentReader® Engine позволяет сравнить две версии одного документа и найти в них различия. При этом документы могут быть в различных форматах, например, Microsoft Word, PDF, TIFF, JPEG и других.

* Некоторые возможности могут быть недоступны в зависимости от операционной системы.

Как работает OCR

Оптическое распознавание символов проходит в несколько этапов — от импортирования изображений до получения результатов распознавания.
  • Импортирование изображений 01
    Изображения можно загружать в OCR SDK из различных источников. Тексты в виде изображений в форматах TIFF, JPEG, и документы в формате PDF и т. д. можно импортировать, а сфотографированный текст или отсканированные документы могут быть обработаны прямо из памяти.
  • Предварительная обработка 02
    На этапе предварительной обработки происходит улучшение изображения. Для повышения качества распознавания OCR SDK применяет ряд функций, среди которых поворот, бинаризация, выравнивание и многие другие.
  • Анализ документа 03
    В OCR SDK используются алгоритмы на основе искусственного интеллекта и технологии адаптивного распознавания документов ADRT®, что позволяет анализировать оформление каждой страницы и структуру документа в целом. В ходе этого процесса определяются блоки для распознавания текста, а информация об оформлении и форматировании отправляется на итоговую стадию воссоздания документа.
  • Распознование 04
    ContentReader® Engine максимально точно распознает печатный (OCR) и рукопечатный текст (ICR), метки (OMR) и штрихкоды (OBR). Дополнительно повысить точность распознавания разных языков, нетипичных символов и шрифтов можно за счет создания словарей и шаблонов.
  • Воссоздание документа и экспорт результатов 05
    OCR SDK предлагает разные уровни воссоздания документа и различные способы экспорта результатов распознавания. Благодаря OCR SDK вы можете сохранять документы в следующих форматах: текстовый, XML, PDF и PDF/A, документы Microsoft® Office с возможностью редактирования и многих других.

Спецификация

Системные требования
Форматы и языки
image
image
image
image
image
image

Закажите эффективное решение

Заполните форму и получите консультацию, как наиболее эффективно использовать наши решения.
Имя
E-mail
Организация
+7(999)999-9999
Сайт компании
Описание задачи
пн-пт 09:00–18:00
Москва, Преображенская площадь, д. 8,
БЦ «ПРЕО 8», 4 этаж, блок А