Используйте OCR-технологии с элементами искусственного интеллекта

ContentReader® Engine. Многофункциональный OCR SDK для разработчиков

Передовые возможности предварительной обработки изображений

После получения изображений ContentReader® Engine выполняет их предварительную обработку, что позволяет улучшить качество документа и оптимизировать процесс распознавания данных. Таким образом, даже изображения самого низкого качества и документы, сфотографированные на смартфон, эффективно обрабатываются и распознаются в максимально высоком качестве.

Базовые функции обработки изображений

ContentReader® Engine позволяет выполнять следующие действия с изображениями, например:

  • Изменять масштаб
  • Обрезать изображение
  • Делать обтравку изображения
  • Создавать изображения для предпросмотра
  • Поворачивать изображение (на 90, 180 и 270 градусов)
  • Выпрямлять текстовые строки
  • Создавать зеркальное отражение и инвертирование
  • Удалять шумы
  • Повышать контрастность

Продвинутые функции обработки изображений

  • Технология Camera-OCR
  • Предварительная обработка документов с печатями и рукописными комментариями
  • Автоматическое разделение двойных страниц
  • Автоматическое определение ориентации страниц (90, 180 и 270 градусов)
  • Автоматическое выравнивание изображений (до +/- 20 градусов)
  • Удаление пятен (очистка изображения)
  • Очистка изображений в отдельных блоках
  • Фильтрация текстур и адаптивная бинаризация
  • Редактирование текста и цвета фона
  • Распознавание информации из полей с разными границами и рамками

Непревзойден­ное качество обработки (Camera-OCR)

Документы, сфотографированные на цифровые камеры, телефоны и планшеты зачастую обладают высоким качеством, однако, в зависимости от устройства, им свойственны некоторые искажения. Интеллектуальная технология позволяет определять фотографии сделанные на цифровую камеру, и активировать алгоритмы обработки таких изображений, чтобы устранять искажения, размытость, искривление текстовых строк, отсутствие информации о разрешении или ошибки, возникшие из-за недостаточного освещения.

Корректировка искажений перспективы

Искажения перспективы вызывают разные трудности при распознавании текста:

  • Потенциальные ошибки распознавания символов
  • Ошибки при разделении страниц
  • Изменения размера шрифта (сверху вниз)

Корректировка размытых изображений

При использовании камеры без штатива можно получить размытое изображение. Этот дефект, не заметный на экране камеры, может приводить к ошибкам распознавания. После обработки полученного изображения бинарное изображение выглядит «читаемым»

Уменьшение цифрового шума (ISO)

Цифровой шум выглядит на изображении как множество маленьких пикселей разных цветов. Этот дефект изображения приводит к ошибкам бинаризации и потере символов. Благодаря специальному фильтру ContentReader® Engine уменьшает цифровой шум и выравнивает фон, предотвращая потерю информации

Закажите эффективное решение
Заполните форму и получите консультацию, как наиболее эффективно использовать наши решения для задач вашего бизнеса.