Общие настройки

Раздел Общие настройки содержит базовые параметры конфигурации инфраструктуры IVA Terra, включая настройки подключения к базе данных PostgreSQL, брокеру сообщений RabbitMQ, управления очередями обработки и логирования системы. Конфигурация обеспечивает интеграцию ключевых компонентов платформы и управление системными ресурсами.

Конфигурация включает:

параметры подключения к СУБД PostgreSQL и брокеру сообщений RabbitMQ
настройки системного логирования и управления лог-файлами
конфигурацию очередей для обработки стенограмм, субтитров и переводов
базовые параметры обработки контента (язык, шаблоны исключаемых фраз)
настройки распознавания голосов и назначения имен спикеров

Параметры общих настроек

Параметр	Значение по умолчанию	Назначение
URL подключения к СУБД	postgresql://terra_control: terra_control@database:5432/ terra_control	URL-адрес подключения к базе данных PostgreSQL
Время жизни соединения с СУБД	30	тайм-аут соединения с БД (в секундах)
Адрес хоста брокера сообщений	rabbitmq	принудительное назначение доменного имени для брокера сообщений
Номер TCP-порта брокера сообщений	5672	номер TCP-порта для подключения к брокеру сообщений
Логин для подключения к брокеру сообщений	guest	имя пользователя для подключения к брокеру сообщений
Пароль для подключения к брокеру сообщений	guest	пароль пользователя для подключения к брокеру сообщений
Очередь для запросов на обработку стенограмм	minutes_queue	очереди обработки для задач формирования стенограмм
Очередь для запросов на обработку субтитров	online_requests	очереди обработки для запросов онлайн-субтитров
Очередь для запросов на обработку субтитров	translate_requests	очереди обработки для задач перевода
Каталог хранения файлов сообщений	/var/log/terra/	основной каталог для хранения лог-файлов системы в контейнере. Общие системные лог-файлы клиента располагаются в /var/log/
Уровень отладочных сообщений	INFO	минимальный уровень отладочных сообщений (возможные значения: CRITICAL, ERROR, WARNING, INFO, DEBUG)
Уникальное имя обработчика	FIRST	уникальное имя обработчика. Используется по умолчанию, если не указано в обработчиках стенограмм / субтитров / переводов
Путь к файлу сообщений	/var/log/terra/{WORKER_TYPE}.{LOG_WORKER_NAME}.application.log	шаблон имени лог-файла с подстановками: тип обработчика и его имя
Максимальный размер одного файла сообщений (байты)	10 000 000	максимальный размер одного лог-файла, в байтах
Максимальное количество файлов сообщений	10	максимальное количество хранимых лог-файлов одного контейнера
Код используемого языка	ru	код языка, на котором требуется итоговый текст (подробнее о возможных значениях кодов языка — см. раздел Поддерживаемые языки)
Путь к файлу шаблонов исключаемых фраз	/var/www/alldata/cleaning_patterns.txt	путь к файлу в контейнере, содержащему регулярные выражения для текста, исключаемого из стенограммы
Корневой каталог размещения данных	/var/www/alldata/	монтирование каталога для хранения всех данных
Каталог размещения аудио	/var/www/alldata/ rawaudio/	монтирование каталога для хранения аудиофрагментов
Каталог размещения стенограмм	/var/www/alldata/ minutes/	монтирование каталога для хранения стенограмм
Каталог хранения файлов лицензий	/var/www/alldata/ licenses/	монтирование каталога для хранения файлов лицензий
Каталог хранения публичных ключей ПАО ИВА	/var/www/alldata/ terra_public_keys/	монтирование каталога для хранения публичных ключей ПАО «ИВА» (IVA Technologies)
Каталог хранения приватных ключей владельца	/var/www/alldata/ owner_private_keys/	монтирование каталога для хранения приватных ключей владельца
Каталог хранения публичных ключей владельца	/var/www/alldata/ owner_public_keys/	монтирование каталога для хранения публичных ключей владельца
Распознавание голосов	off	активация автоматического определения голосов участников из единого аудиопотока с множеством голосов и разметки речевых фрагментов в стенограмме по голосовой принадлежности. Результатом является стенограмма с техническими идентификаторами (voice_N), например: Иванов Иван (voice_0), Иванов Иван (voice_1), Иванов Иван (voice_N)
Назначение имён	off	активация автоматической подстановки имен распознанным голосам спикеров через сервис идентификации модуля ADP. Результатом является стенограмма, где технические идентификаторы (voice_N) заменяются на реальные имена спикеров, например: Иванов Иван(voice_0) → Иванов Иван, Иванов Иван(voice_1) → Петров Петр
Признак мультиголоса	multivoice	текстовая подстрока в имени спикера, при обнаружении которой активируется механизм распознавания голосов из аудиоканала спикера. При пустом значении обрабатываются все аудиофрагменты
Порог обнаружения языка	0,9	минимальная вероятность обнаружения языка в речи (дробное число). При меньшем значении для извлечения текста используется код языка по умолчанию (опция Код используемого языка, по умолчанию: ru)
Длительность речи (обнаружение языка)	1,0	минимальная длительность аудиофрагмента (в секундах) для обнаружения языка речи (дробное число). Для фрагментов меньшей длительности используется код языка, определяемый опцией Код используемого языка (по умолчанию: ru)
Размер аудиопосылки	4	максимальная длительность (в секундах) для объединения коротких аудиофрагментов перед обработкой нейросетью с применением механизма распознавания голосов. Минимальное значение — 2 секунды. Рекомендации по настройке параметра — см. ниже
Речевая пауза	3,0	минимальная длительность паузы (в секундах) между двумя последовательными аудиофрагментами (дробное число). Если пауза превышает указанное значение, фрагменты обрабатываются нейросетью как независимые (без объединения в единый аудиофрагмент)

Параметр

Значение по умолчанию

Назначение

URL подключения к СУБД

postgresql://terra_control:
terra_control@database:5432/
terra_control

URL-адрес подключения к базе данных PostgreSQL

Время жизни соединения с СУБД

тайм-аут соединения с БД (в секундах)

Адрес хоста брокера сообщений

rabbitmq

принудительное назначение доменного имени для брокера сообщений

Номер TCP-порта брокера сообщений

5672

номер TCP-порта для подключения к брокеру сообщений

Логин для подключения к брокеру сообщений

guest

имя пользователя для подключения к брокеру сообщений

Пароль для подключения к брокеру сообщений

guest

пароль пользователя для подключения к брокеру сообщений

Очередь для запросов на обработку стенограмм

minutes_queue

очереди обработки для задач формирования стенограмм

Очередь для запросов на обработку субтитров

online_requests

очереди обработки для запросов онлайн-субтитров

Очередь для запросов на обработку субтитров

translate_requests

очереди обработки для задач перевода

Каталог хранения файлов сообщений

/var/log/terra/

основной каталог для хранения лог-файлов системы в контейнере. Общие системные лог-файлы клиента располагаются в /var/log/

Уровень отладочных сообщений

INFO

минимальный уровень отладочных сообщений (возможные значения: CRITICAL, ERROR, WARNING, INFO, DEBUG)

Уникальное имя обработчика

FIRST

уникальное имя обработчика. Используется по умолчанию, если не указано в обработчиках стенограмм / субтитров / переводов

Путь к файлу сообщений

/var/log/terra/{WORKER_TYPE}.{LOG_WORKER_NAME}.application.log

шаблон имени лог-файла с подстановками: тип обработчика и его имя

Максимальный размер одного файла сообщений (байты)

10 000 000

максимальный размер одного лог-файла, в байтах

Максимальное количество файлов сообщений

максимальное количество хранимых лог-файлов одного контейнера

Код используемого языка

код языка, на котором требуется итоговый текст (подробнее о возможных значениях кодов языка — см. раздел Поддерживаемые языки)

Путь к файлу шаблонов исключаемых фраз

/var/www/alldata/cleaning_patterns.txt

путь к файлу в контейнере, содержащему регулярные выражения для текста, исключаемого из стенограммы

Корневой каталог размещения данных

/var/www/alldata/

монтирование каталога для хранения всех данных

Каталог размещения аудио

/var/www/alldata/
rawaudio/

монтирование каталога для хранения аудиофрагментов

Каталог размещения стенограмм

/var/www/alldata/
minutes/

монтирование каталога для хранения стенограмм

Каталог хранения файлов лицензий

/var/www/alldata/
licenses/

монтирование каталога для хранения файлов лицензий

Каталог хранения публичных ключей ПАО ИВА

/var/www/alldata/
terra_public_keys/

монтирование каталога для хранения публичных ключей ПАО «ИВА» (IVA Technologies)

Каталог хранения приватных ключей владельца

/var/www/alldata/
owner_private_keys/

монтирование каталога для хранения приватных ключей владельца

Каталог хранения публичных ключей владельца

/var/www/alldata/
owner_public_keys/

монтирование каталога для хранения публичных ключей владельца

Распознавание голосов

off

активация автоматического определения голосов участников из единого аудиопотока с множеством голосов и разметки речевых фрагментов в стенограмме по голосовой принадлежности. Результатом является стенограмма с техническими идентификаторами (voice_N), например: Иванов Иван (voice_0), Иванов Иван (voice_1), Иванов Иван (voice_N)

Назначение имён

off

активация автоматической подстановки имен распознанным голосам спикеров через сервис идентификации модуля ADP. Результатом является стенограмма, где технические идентификаторы (voice_N) заменяются на реальные имена спикеров, например: Иванов Иван(voice_0) → Иванов Иван, Иванов Иван(voice_1) → Петров Петр

Признак мультиголоса

multivoice

текстовая подстрока в имени спикера, при обнаружении которой активируется механизм распознавания голосов из аудиоканала спикера. При пустом значении обрабатываются все аудиофрагменты

Порог обнаружения языка

0,9

минимальная вероятность обнаружения языка в речи (дробное число). При меньшем значении для извлечения текста используется код языка по умолчанию (опция Код используемого языка, по умолчанию: ru)

Длительность речи (обнаружение языка)

1,0

минимальная длительность аудиофрагмента (в секундах) для обнаружения языка речи (дробное число). Для фрагментов меньшей длительности используется код языка, определяемый опцией Код используемого языка (по умолчанию: ru)

Размер аудиопосылки

максимальная длительность (в секундах) для объединения коротких аудиофрагментов перед обработкой нейросетью с применением механизма распознавания голосов. Минимальное значение — 2 секунды. Рекомендации по настройке параметра — см. ниже

Речевая пауза

3,0

минимальная длительность паузы (в секундах) между двумя последовательными аудиофрагментами (дробное число). Если пауза превышает указанное значение, фрагменты обрабатываются нейросетью как независимые (без объединения в единый аудиофрагмент)

Рекомендации по конфигурированию параметра Размер аудиопосылки:

Режим	Рекомендуемое значение	Результат
Максимальная производительность	30 секунд	наивысшая скорость обработки звука
Сбалансированный (по умолчанию)	4 секунды	оптимальное соотношение скорости и точности
Максимальная точность	2 секунды	наиболее точное распознавание голосов

Режим

Рекомендуемое значение

Результат

Максимальная производительность

30 секунд

наивысшая скорость обработки звука

Сбалансированный (по умолчанию)

4 секунды

оптимальное соотношение скорости и точности

Максимальная точность

2 секунды

наиболее точное распознавание голосов

В результате при увеличении значения параметра Размер аудиопосылки повышается скорость обработки звука, а при уменьшении — повышается точность распознавания голосов

При установке значения менее 2 секунд (минимальное значение) параметр Размер аудиопосылки в процессе обработки автоматически устанавливается равным 30 секундам (максимальное значение), что приведет к быстрой скорости обработки данных и менее точному распознаванию голосов