Озвучивание текстов¶
Сервис автоматизированного озвучивания текстов
Интеллектуальный сервис, который автоматически преобразует текстовый документ (PDF или TXT) в аудиофайл для прослушивания.
Назначение¶
Автоматическое создание аудиоверсий печатных материалов (книг, статей, документов) для обеспечения равного доступа к информации. Сервис позволяет расширить аудиторию библиотеки, предоставить альтернативный способ потребления контента и выполнить требования по обеспечению доступности среды. Может использоваться для создания аудиоколлекции, индивидуального запроса пользователя или фондового озвучивания. Сервис разработан совместно с Центром искусственного интеллекта Новосибирского Государственного Университета (ЦИИНГУ).
Повышает доступность библиотечного фонда для слабовидящих и незрячих пользователей, а также для всех, кто предпочитает аудиоформат. Способствует привлечению новых посетителей и современному имиджу библиотеки.
Процесс обработки¶
flowchart LR
A[Загрузка текста] --> B[Обработка]
B --> C[Получение аудиофайла]
C --> D[Интеграция в каталог]
-
Загрузка текста
- Прием на вход текстового файла в формате PDF или TXT.
- Проверка файла на корректность и возможность обработки.
-
Обработка и анализ
-
Извлечение и подготовка текста
- Для PDF: интеллектуальное распознавание и извлечение текстового слоя с сохранением структуры (главы, абзацы).
- Очистка текста от некорректных символов, форматирование для оптимального озвучивания.
-
Синтез речи
-
Использование нейросетевой технологии синтеза речи для преобразования текста в речь.
-
Доступны настройки: выбор голоса (мужской/женский).
-
-
-
Получение аудиофайла
-
Формирование аудиофайла
Пользователю предоставляется готовый аудиофайл в стандартном формате (MP3).
-
Доступ к файлу
Аудиофайл доступен для скачивания по ссылке.
-
-
Интеграция в каталог
- Включение в каталог в 856 поле записи RUSMARC в АБИС.
Ключевой результат¶
Создание альтернативных версий изданий, повышение инклюзивности и доступности библиотечных услуг, привлечение новой аудитории, увеличение востребованности фонда.
Техническая архитектура¶
Сервис размещен на защищенных вычислительных мощностях облачной платформы "Библиотека технологий". Обработка происходит на удаленных серверах, что гарантирует высокую производительность и отсутствие нагрузки на локальную инфраструктуру библиотеки. От пользователя требуется только стабильное интернет-соединение.
Процесс получения и настройки доступа¶
Сервис озвучивания текстов является частью платформы "Библиотека технологий" и не требует локальной установки в библиотеке. Функциональность доступна удалённо через два интерфейса.
1. Использование в интерфейсе АБИС¶
Для сотрудников
В состав платформы входит АБИС - Автоматизированная Библиотечная Информационная Система. Использование в АБИС - самый простой способ для повседневной работы сотрудников. Пользователь выбирает текстовый файл, включенный в каталог, и нажимает кнопку обработки. В результате будет сформирован и загружен аудиофайл, внесены изменения в 856 поле. Озвучивание занимает продолжительное время, около 20% от времени звучания. Сервис включается по требованию.
2. Использование через API¶
Для интеграции и автоматизации
Этот способ предназначен для разработчиков и администраторов, желающих встроить обработку в собственные скрипты или рабочие процессы.
Получение доступа к API Платформы "Библиотека технологий"