Обработчик субтитров

Раздел Обработчик субтитров содержит параметры конфигурации модуля онлайн-транскрибации, включая настройки работы нейросетевых моделей, управления вычислительными ресурсами и обработки аудиопотоков в реальном времени для генерации субтитров во время проведения мероприятий.

Обработчик субтитров

Конфигурация включает:

  • настройки нейросетевых моделей для распознавания речи в реальном времени

  • параметры управления вычислительными ресурсами (CPU / GPU)

  • настройки обработки аудиопотоков и порогов обнаружения речи

  • настройки длительности таймаута клиентского соединения

Параметры для настройки обработчика субтитров

Параметр Значение по умолчанию Назначение

Уровень отладочных сообщений

INFO

минимальный уровень отладочных сообщений (возможные значения: CRITICAL, ERROR, WARNING, INFO, DEBUG)

Уникальное имя обработчика

FIRST

уникальное имя обработчика субтитров

Путь к файлу сообщений

/var/log/terra/
{WORKER_TYPE}.{LOG_WORKER_NAME}.
application.log

путь к файлу в контейнере, содержащему регулярные выражения для текста, исключаемого из стенограммы

Максимальный размер одного файла сообщений (байты)

10 000 000

максимальный размер одного лог-файла, в байтах

Максимальное количество файлов сообщений

10

максимальное количество хранимых лог-файлов одного контейнера

Использовать устройство CPU вместо GPU

off

переход в режим работы на CPU вместо GPU

Индекс используемого CUDA устройства внутри контейнера

0

номер CUDA-устройства, используемого при обработке данных нейросетями

Строка запроса при инициализации нейросети

<пусто>

текст запроса для инициализации нейросети

Количество используемых ядер CPU

8

количество ядер процессора, используемых для исполнения нейросети на CPU (при активном параметре Использовать устройство CPU вместо GPU)

Используемый тип структуры CUDA для развертывания модели

float16

тип данных, используемый при загрузке модели нейросети (возможные значения: int8, float16, float32, float64)

Размер пакета посылки в нейросеть

8

размер пакета сообщений в одной посылке к нейросети

Использовать быструю модель

on

использование более быстрой, но менее точной, версии нейросетевой модели

Показывать текст на оригинальном языке

off

отображение субтитров на оригинальном языке речи

Порог включения обнаружения голоса в звуке

0,4

значение минимального порога наличия речи в звуке, при которой звук будет использован в обработке

Порог выключения обнаружения голоса в звуке

0,25

значение максимального порога наличия речи в звуке. При меньшем значении звук не будет использован в обработке

Таймаут ожидания ответа от сервиса субтитров

5

таймаут ожидания от сервиса обработки запроса на формирование субтитров

Максимальная длительность обработки онлайн запроса

0,5

длительность ожидания ответа от онлайн-обработчика (секунды)

Длительность клиентского таймаута

4

время ожидания ответа для клиентских соединений (секунды)

Активация параметра Показывать текст на оригинальном языке рекомендуется для мероприятий, проводимых на нескольких языках.

При одновременном использовании параметра Показывать текст на оригинальном языке с опцией Использовать быструю модель возможны ошибки транскрибации иностранной речи.

Для повышения точности распознавания иностранной речи рекомендуется отключать опцию Использовать быструю модель