Перейти к содержанию

Расшифровка надписей на обложках

Сервис автоматизированной расшифровки и интерпретации всех текстовых и графических элементов на обложках книг.

Интеллектуальный сервис, который анализирует изображение обложки книги, распознает все текстовые элементы (включая названия, имена авторов, издательства), специальные коды (ISBN, штрихкоды, знаки серий), а затем структурирует и интерпретирует их значение для точной идентификации издания.

Назначение

Автоматизация процесса первичной библиографической идентификации книг путем преобразования визуальной информации с обложки в структурированные машиночитаемые данные. Предназначен для интеграции в процессы обработки новых поступлений, ретроконверсии и проверки записей в электронном каталоге.

Позволяет мгновенно получать структурированные библиографические данные из визуального образа книги, обеспечивает корректную идентификацию и последующий поиск в каталоге.

Процесс обработки

flowchart LR
    A[Загрузка обложки] --> B[Обработка]
    B --> C[Вывод результата]
    C --> D[Поиск]
  1. Ввод данных (загрузка обложки)

    • Загрузка изображения обложки
      Прием графического файла (фотографии или скана) обложки. Для достижения наилучшего результата изображение должно быть четким и хорошо освещенным. Предварительно изображение может быть обработано и улучшено сервисом Обработки изображений.
  2. Обработка и анализ

    • Визуальный анализ и сегментация
      Использование моделей компьютерного зрения для определения областей обложки, содержащих текст, графику, штрихкоды и другие значимые элементы. Определение композиционного расположения блоков (заголовок, автор, серия, издательство).

    • Оптическое распознавание символов (OCR)
      Распознавание всего текста на изображении на русском языке.

    • Распознавание и валидация кодов
      Автоматическое обнаружение, считывание и проверка контрольных сумм штрихкодов EAN-13, а также распознавание числового кода ISBN в текстовом виде.

    • Структурирование и интерпретация данных
      Алгоритмы на основе NLP (обработки естественного языка) определяют, какой распознанный текст является заголовком, подзаголовком, именем автора, названием издательства, годом издания и т.д.

  3. Вывод результата

    • Представление структурированной записи
      Пользователю предоставляется заполненная форма библиографического описания с разбивкой по полям (автор, заглавие, выходные данные, ISBN, серия).

    • Возможность корректировки
      Пользователь может отредактировать любое поле, дополнить информацию или подтвердить автоматически предложенные данные.

Ключевой результат

Упрощение идентификации и поиска книг в фонде для сотрудников и читателей, в том числе при работе с изданиями, имеющими неочевидные или сложные заголовки.

Техническая архитектура

Сервис размещен на защищенных вычислительных мощностях облачной платформы "Библиотека технологий". Обработка изображений происходит на удаленных серверах, что гарантирует высокую производительность и отсутствие нагрузки на локальную инфраструктуру библиотеки. От пользователя требуется только стабильное интернет-соединение.

Процесс получения и настройки доступа

Сервис расшифровки обложек является частью платформы "Библиотека технологий" и не требует локальной установки в библиотеке. Функциональность доступна удалённо через два интерфейса.

1. Использование в интерфейсе АБИС

Для сотрудников

В состав платформы входит АБИС - Автоматизированная Библиотечная Информационная Система. Использование в АБИС - самый простой способ для повседневной работы сотрудников. Пользователь может осуществить поиск по фотографии обложки.

2. Использование через API

Для интеграции и автоматизации

Этот способ предназначен для разработчиков и администраторов, желающих встроить обработку в собственные скрипты или рабочие процессы.

Получение доступа к API Платформы "Библиотека технологий"

Пример результата

Изображение Описание
Спольски Автор: Джоэл Спольски
Название книги: Джоэл о программировании
Константин Ларри Константин
Название книги: Человеческий фактор в программировании
Пушкин Автор: Александр Пушкин
Название книги: Евгений Онегин