IVA ДОКУМЕНТАЦИЯ ОБНОВЛЕНИЯ

Общие настройки

Раздел Общие настройки содержит базовые параметры конфигурации инфраструктуры IVA Terra, включая настройки подключения к базе данных PostgreSQL, брокеру сообщений RabbitMQ, управления очередями обработки и логирования системы. Конфигурация обеспечивает интеграцию ключевых компонентов платформы и управление системными ресурсами.

Общие настройки

Конфигурация включает:

  • параметры подключения к СУБД PostgreSQL и брокеру сообщений RabbitMQ

  • настройки системного логирования и управления лог-файлами

  • конфигурацию очередей для обработки стенограмм, субтитров и переводов

  • базовые параметры обработки контента (язык, шаблоны исключаемых фраз)

  • настройки распознавания голосов и назначения имен спикеров

Параметры общих настроек

Параметр Значение по умолчанию Назначение

URL подключения к СУБД

postgresql://terra_control:
terra_control@database:5432/
terra_control

URL-адрес подключения к базе данных PostgreSQL

Время жизни соединения с СУБД

30

тайм-аут соединения с БД (в секундах)

Адрес хоста брокера сообщений

rabbitmq

принудительное назначение доменного имени для брокера сообщений

Номер TCP-порта брокера сообщений

5672

номер TCP-порта для подключения к брокеру сообщений

Логин для подключения к брокеру сообщений

guest

имя пользователя для подключения к брокеру сообщений

Пароль для подключения к брокеру сообщений

guest

пароль пользователя для подключения к брокеру сообщений

Очередь для запросов на обработку стенограмм

minutes_queue

очереди обработки для задач формирования стенограмм

Очередь для запросов на обработку субтитров

online_requests

очереди обработки для запросов онлайн-субтитров

Очередь для запросов на обработку субтитров

translate_requests

очереди обработки для задач перевода

Каталог хранения файлов сообщений

/var/log/terra/

основной каталог для хранения лог-файлов системы в контейнере. Общие системные лог-файлы клиента располагаются в /var/log/

Уровень отладочных сообщений

INFO

минимальный уровень отладочных сообщений (возможные значения: CRITICAL, ERROR, WARNING, INFO, DEBUG)

Уникальное имя обработчика

FIRST

уникальное имя обработчика. Используется по умолчанию, если не указано в обработчиках стенограмм / субтитров / переводов

Путь к файлу сообщений

/var/log/terra/{WORKER_TYPE}.{LOG_WORKER_NAME}.application.log

шаблон имени лог-файла с подстановками: тип обработчика и его имя

Максимальный размер одного файла сообщений (байты)

10 000 000

максимальный размер одного лог-файла, в байтах

Максимальное количество файлов сообщений

10

максимальное количество хранимых лог-файлов одного контейнера

Код используемого языка

ru

код языка, на котором требуется итоговый текст (подробнее о возможных значениях кодов языка — см. раздел Поддерживаемые языки)

Путь к файлу шаблонов исключаемых фраз

/var/www/alldata/cleaning_patterns.txt

путь к файлу в контейнере, содержащему регулярные выражения для текста, исключаемого из стенограммы

Корневой каталог размещения данных

/var/www/alldata/

монтирование каталога для хранения всех данных

Каталог размещения аудио

/var/www/alldata/
rawaudio/

монтирование каталога для хранения аудиофрагментов

Каталог размещения стенограмм

/var/www/alldata/
minutes/

монтирование каталога для хранения стенограмм

Каталог хранения файлов лицензий

/var/www/alldata/
licenses/

монтирование каталога для хранения файлов лицензий

Каталог хранения публичных ключей ПАО ИВА

/var/www/alldata/
terra_public_keys/

монтирование каталога для хранения публичных ключей ПАО «ИВА» (IVA Technologies)

Каталог хранения приватных ключей владельца

/var/www/alldata/
owner_private_keys/

монтирование каталога для хранения приватных ключей владельца

Каталог хранения публичных ключей владельца

/var/www/alldata/
owner_public_keys/

монтирование каталога для хранения публичных ключей владельца

Распознавание голосов

off

активация автоматического определения голосов участников из единого аудиопотока с множеством голосов и разметки речевых фрагментов в стенограмме по голосовой принадлежности. Результатом является стенограмма с техническими идентификаторами (voice_N), например: Иванов Иван (voice_0), Иванов Иван (voice_1), Иванов Иван (voice_N)

Назначение имён

off

активация автоматической подстановки имен распознанным голосам спикеров через сервис идентификации модуля ADP. Результатом является стенограмма, где технические идентификаторы (voice_N) заменяются на реальные имена спикеров, например: Иванов Иван(voice_0)Иванов Иван, Иванов Иван(voice_1)Петров Петр

Признак мультиголоса

multivoice

текстовая подстрока в имени спикера, при обнаружении которой активируется механизм распознавания голосов из аудиоканала спикера. При пустом значении обрабатываются все аудиофрагменты

Порог обнаружения языка

0,9

минимальная вероятность обнаружения языка в речи (дробное число). При меньшем значении для извлечения текста используется код языка по умолчанию (опция Код используемого языка, по умолчанию: ru)

Длительность речи (обнаружение языка)

1,0

минимальная длительность аудиофрагмента (в секундах) для обнаружения языка речи (дробное число). Для фрагментов меньшей длительности используется код языка, определяемый опцией Код используемого языка (по умолчанию: ru)

Размер аудиопосылки

4

максимальная длительность (в секундах) для объединения коротких аудиофрагментов перед обработкой нейросетью с применением механизма распознавания голосов. Минимальное значение — 2 секунды. Рекомендации по настройке параметра — см. ниже

Речевая пауза

3,0

минимальная длительность паузы (в секундах) между двумя последовательными аудиофрагментами (дробное число). Если пауза превышает указанное значение, фрагменты обрабатываются нейросетью как независимые (без объединения в единый аудиофрагмент)

Рекомендации по конфигурированию параметра Размер аудиопосылки:

Режим Рекомендуемое значение Результат

Максимальная производительность

30 секунд

наивысшая скорость обработки звука

Сбалансированный (по умолчанию)

4 секунды

оптимальное соотношение скорости и точности

Максимальная точность

2 секунды

наиболее точное распознавание голосов

В результате при увеличении значения параметра Размер аудиопосылки повышается скорость обработки звука, а при уменьшении — повышается точность распознавания голосов

При установке значения менее 2 секунд (минимальное значение) параметр Размер аудиопосылки в процессе обработки автоматически устанавливается равным 30 секундам (максимальное значение), что приведет к быстрой скорости обработки данных и менее точному распознаванию голосов