Перейти к содержанию

AI каталогизация

Сервис автоматизированной каталогизации - AI Каталогизация

Интеллектуальный сервис, который автоматически преобразует скан или фотографию библиографического описания в готовую машиночитаемую запись.

Назначение

Автоматизация начального, наиболее трудоемкого этапа создания библиографических записей путем преобразования графического изображения описания в структурированные машиночитаемые данные в формате RUSMARC. Может использоваться как при первичной каталогизации изданий, так и при ретрокаталогизации. Сервис разработан совместно с Центром искусственного интеллекта Новосибирского Государственного Университета (ЦИИНГУ).

Экономит время на подготовке записи, устраняет рутинный ввод данных.

Процесс обработки

flowchart LR
    A[Загрузка] --> B[Обработка]
    B --> C[Верификация]
    C --> D[Создание записи]
  1. Загрузка (ввод данных)

    • Прием на вход графического файла (скана или фотографии), содержащего библиографическое описание, оформленное в соответствии с ГОСТ Р 7.0.100–2018 «Библиографическая запись. Библиографическое описание. Общие требования и правила составления», ГОСТ Р 7.0.13-2011 «Карточки для каталогов и картотек, макет аннотированной карточки в издании. Общие требования и издательское оформление».
  2. Обработка

    • Оптическое распознавание текста (OCR)

      Выделение и распознавание текстовой информации с изображения.

    • Семантический анализ и парсинг

      Интеллектуальный анализ текста, определение элементов описания (автор, заглавие, выходные данные, ISBN и т.д.).

    • Трансформация в стандарт

      Автоматическое форматирование извлеченных данных в соответствии с RUSMARC и правилами каталогизации.

  3. Вывод и верификация

    • Представление результата: Пользователю предоставляется готовая библиографическая запись в текстовом представлении формата RUSMARC.
    • Интерактивная проверка и правка: Пользователь проверяет корректность автоматически заполненных полей и подполей RUSMARC, вносит необходимые исправления вручную.
  4. Создание записи

    • После подтверждения, исправленная запись сохраняется в каталоге АБИС. Может быть доступна для дальнейшего использования.

Ключевой результат

Значительное сокращение трудозатрат на этапе ввода данных, повышение скорости пополнения каталога, включение в каталог материалов отсутствующих в электронном виде.

Техническая архитектура

Сервис размещен на защищенных вычислительных мощностях облачной платформы "Библиотека технологий". Обработка изображений происходит на удаленных серверах, что гарантирует высокую производительность и отсутствие нагрузки на локальную инфраструктуру библиотеки. От пользователя требуется только стабильное интернет-соединение.

Процесс получения и настройки доступа

Сервис автоматизированной каталогизации является частью платформы "Библиотека технологий" и не требует локальной установки в библиотеке. Функциональность доступна удалённо через два интерфейса.

1. Использование в интерфейсе АБИС

Для сотрудников

В состав платформы входит АБИС - Автоматизированная Библиотечная Информационная Система. Использование в АБИС - самый простой способ для повседневной работы сотрудников. В процессе создания библиографической записи пользователь выбирает изображение в интерфейсе АБИС и нажимает кнопку обработки. Изображение может быть получено в виде файла или может быть получено с камеры подключенной к компьютеру пользователя. Далее система проводит обработку и возвращает результат в текстовом представлении RUSMARC. Пользователь проводит верификацию данных. При необходимости вносит изменения в запись. На этапе проверки происходит проверка наличия дублей записи в каталоге. После завершения верификации пользователь подтверждает создание записи, запись создается в каталоге.

2. Использование через API

Для интеграции и автоматизации

Этот способ предназначен для разработчиков и администраторов, желающих встроить обработку в собственные скрипты или рабочие процессы.

Получение доступа к API Платформы "Библиотека технологий"

Пример результата

Файл с описанием RUSMARC
Пушкин
Куприн