Перейти к содержанию

Озвучивание текстов

Сервис автоматизированного озвучивания текстов

Интеллектуальный сервис, который автоматически преобразует текстовый документ (PDF или TXT) в аудиофайл для прослушивания.

Назначение

Автоматическое создание аудиоверсий печатных материалов (книг, статей, документов) для обеспечения равного доступа к информации. Сервис позволяет расширить аудиторию библиотеки, предоставить альтернативный способ потребления контента и выполнить требования по обеспечению доступности среды. Может использоваться для создания аудиоколлекции, индивидуального запроса пользователя или фондового озвучивания. Сервис разработан совместно с Центром искусственного интеллекта Новосибирского Государственного Университета (ЦИИНГУ).

Повышает доступность библиотечного фонда для слабовидящих и незрячих пользователей, а также для всех, кто предпочитает аудиоформат. Способствует привлечению новых посетителей и современному имиджу библиотеки.

Процесс обработки

flowchart LR
    A[Загрузка текста] --> B[Обработка]
    B --> C[Получение аудиофайла]
    C --> D[Интеграция в каталог]
  1. Загрузка текста

    • Прием на вход текстового файла в формате PDF или TXT.
    • Проверка файла на корректность и возможность обработки.
  2. Обработка и анализ

    • Извлечение и подготовка текста

      • Для PDF: интеллектуальное распознавание и извлечение текстового слоя с сохранением структуры (главы, абзацы).
      • Очистка текста от некорректных символов, форматирование для оптимального озвучивания.
    • Синтез речи

      • Использование нейросетевой технологии синтеза речи для преобразования текста в речь.

      • Доступны настройки: выбор голоса (мужской/женский).

  3. Получение аудиофайла

    • Формирование аудиофайла

      Пользователю предоставляется готовый аудиофайл в стандартном формате (MP3).

    • Доступ к файлу

      Аудиофайл доступен для скачивания по ссылке.

  4. Интеграция в каталог

    • Включение в каталог в 856 поле записи RUSMARC в АБИС.

Ключевой результат

Создание альтернативных версий изданий, повышение инклюзивности и доступности библиотечных услуг, привлечение новой аудитории, увеличение востребованности фонда.

Техническая архитектура

Сервис размещен на защищенных вычислительных мощностях облачной платформы "Библиотека технологий". Обработка происходит на удаленных серверах, что гарантирует высокую производительность и отсутствие нагрузки на локальную инфраструктуру библиотеки. От пользователя требуется только стабильное интернет-соединение.

Процесс получения и настройки доступа

Сервис озвучивания текстов является частью платформы "Библиотека технологий" и не требует локальной установки в библиотеке. Функциональность доступна удалённо через два интерфейса.

1. Использование в интерфейсе АБИС

Для сотрудников

В состав платформы входит АБИС - Автоматизированная Библиотечная Информационная Система. Использование в АБИС - самый простой способ для повседневной работы сотрудников. Пользователь выбирает текстовый файл, включенный в каталог, и нажимает кнопку обработки. В результате будет сформирован и загружен аудиофайл, внесены изменения в 856 поле. Озвучивание занимает продолжительное время, около 20% от времени звучания. Сервис включается по требованию.

2. Использование через API

Для интеграции и автоматизации

Этот способ предназначен для разработчиков и администраторов, желающих встроить обработку в собственные скрипты или рабочие процессы.

Получение доступа к API Платформы "Библиотека технологий"

Пример результата

Научная статья

Тезисы конференции