Обработчик стенограмм
Конфигурация включает:
-
настройки путей хранения данных, аудиофрагментов и стенограмм
-
параметры работы с нейросетевыми моделями и вычислительными ресурсами
-
настройки обработки аудио (пороги обнаружения речи, объединение фрагментов)
-
параметры интеграции с сервисами ADP (протоколирование и суммаризация)
Параметры для настройки обработчика стенограмм
| Параметр | Значение по умолчанию | Назначение |
|---|---|---|
Уровень отладочных сообщений |
INFO |
минимальный уровень отладочных сообщений (возможные значения: CRITICAL, ERROR, WARNING, INFO, DEBUG) |
Уникальное имя обработчика |
FIRST |
уникальное имя обработчика стенограмм |
Путь к файлу сообщений |
/var/log/terra/{WORKER_TYPE}. |
монтирование каталога для хранения лог-файлов |
Максимальный размер одного файла сообщений (байты) |
10 000 000 |
максимальный размер одного лог-файла, в байтах |
Максимальное количество файлов сообщений |
10 |
максимальное количество хранимых лог-файлов одного контейнера |
Корневой каталог размещения данных |
/var/www/alldata/ |
монтирование каталога для хранения всех данных |
Корневой каталог размещения данных |
/var/www/alldata/ |
монтирование каталога для хранения аудиофрагментов |
Каталог размещения стенограмм |
/var/www/alldata/ |
монтирование каталога для хранения стенограмм |
Количество дней хранения звука |
60 |
количество дней хранения файлов аудиоконтента |
Количество дней хранения звука |
365 |
количество дней хранения файлов стенограмм |
Каталог хранения файлов лицензий |
/var/www/alldata/ |
монтирование каталога для хранения файлов лицензий |
Каталог хранения публичных ключей ПАО ИВА |
/var/www/alldata/ |
монтирование каталога для хранения публичных ключей ПАО «ИВА» (IVA Technologies) |
Каталог хранения приватных ключей владельца |
/var/www/alldata/ |
монтирование каталога для хранения приватных ключей владельца |
Каталог хранения публичных ключей владельца |
/var/www/alldata/ |
монтирование каталога для хранения публичных ключей владельца |
Использовать устройство CPU вместо GPU |
off |
переход в режим работы на CPU вместо GPU |
Индекс используемого CUDA устройства внутри контейнера |
0 |
индекс CUDA-устройства |
Строка запроса при инициализации нейросети |
<пусто> |
текст запроса для инициализации нейросети |
Количество используемых ядер CPU |
8 |
количество ядер процессора, используемых для исполнения нейросети на CPU (при активном параметре Использовать устройство CPU вместо GPU) |
Используемый тип структуры CUDA для развертывания модели |
float16 |
тип данных, используемый при загрузке модели нейросети (возможные значения: int8, float16, float32, float64) |
Максимальная длина текста спикера в одной строке стенограммы (символы) |
1000 |
максимальное количество символов в одной строке стенограммы |
Размер пакета посылки в нейросеть |
8 |
размер пакета сообщений в одной посылке к нейросети |
Обнаруживать язык речи в звуке |
off |
режим обнаружения оригинального языка звука (игнорируется опция Код используемого языка) |
Использовать выравниватель длительности текста при обработке звука |
on |
использование выравнивателя текста по времени. Отключение выравнивателя приводит к двухкратному ускорению обработки, но вся речь каждого спикера объединяется в один временной сегмент. Значение off рекомендуется выставлять только для многочасовых лекций с участием одного спикера |
on |
использование более быстрой (но менее точной) версии нейросетевой модели |
|
off |
отображение распознанного текста в стенограмме на оригинальном языке речи |
|
Порог включения обнаружения голоса в звуке |
0,4 |
значение минимального порога наличия речи в звуке, при которой звук будет использован в обработке |
Порог выключения обнаружения голоса в звуке |
0,25 |
значение максимального порога наличия речи в звуке, при меньшем значении звук не будет использован в обработке |
Максимальная длительность обработки онлайн запроса |
0,5 |
длительность ожидания ответа от онлайн-обработчика (секунды) |
Путь к файлу шаблонов исключаемых фраз |
/var/www/alldata/ |
путь к файлу в контейнере, содержащему регулярные выражения для текста, исключаемого из стенограммы |
Добавлять тишину между аудиофрагментами |
on |
использование сэмпла тишины для разделения речи разных спикеров (не допускает слияния речи разных спикеров) |
Объединять аудиофрагменты по спикеру |
on |
режим объединения аудиофрагментов по спикеру. |
Доступность ADP сервисов |
off |
использование ADP-службы:
Значение по умолчанию зависит от режима развертывания IVA Terra:
|
URL размещения ADP клиента |
http://terra_adp_client:8080/ |
адрес endpoint, принимающего заказ на обогащение стенограммы результатами, возвращаемыми от модуля ADP |
Принудительно обрабатывать стенограмму ADP сервисами |
on |
принуждение для повторной обработки стенограммы сервисами ADP, даже если результаты обработки уже есть в стенограмме |
|
Активация параметра Показывать текст на оригинальном языке рекомендуется для мероприятий, проводимых на нескольких языках. При одновременном использовании параметра Показывать текст на оригинальном языке с опцией Использовать быструю модель возможны ошибки транскрибации иностранной речи. Для повышения точности распознавания иностранной речи рекомендуется отключать опцию Использовать быструю модель |
|
Для работы сервисов протоколирование и суммаризация модуля ADP необходимо:
|
