Общие настройки
Раздел Общие настройки содержит базовые параметры конфигурации инфраструктуры IVA Terra, включая настройки подключения к базе данных PostgreSQL, брокеру сообщений RabbitMQ, управления очередями обработки и логирования системы. Конфигурация обеспечивает интеграцию ключевых компонентов платформы и управление системными ресурсами.
Конфигурация включает:
-
параметры подключения к СУБД PostgreSQL и брокеру сообщений RabbitMQ
-
настройки системного логирования и управления лог-файлами
-
конфигурацию очередей для обработки стенограмм, субтитров и переводов
-
базовые параметры обработки контента (язык, шаблоны исключаемых фраз)
-
настройки распознавания голосов и назначения имен спикеров
Параметры общих настроек
| Параметр | Значение по умолчанию | Назначение |
|---|---|---|
URL подключения к СУБД |
postgresql://terra_control: |
URL-адрес подключения к базе данных PostgreSQL |
Время жизни соединения с СУБД |
30 |
тайм-аут соединения с БД (в секундах) |
Адрес хоста брокера сообщений |
rabbitmq |
принудительное назначение доменного имени для брокера сообщений |
Номер TCP-порта брокера сообщений |
5672 |
номер TCP-порта для подключения к брокеру сообщений |
Логин для подключения к брокеру сообщений |
guest |
имя пользователя для подключения к брокеру сообщений |
Пароль для подключения к брокеру сообщений |
guest |
пароль пользователя для подключения к брокеру сообщений |
minutes_queue |
очереди обработки для задач формирования стенограмм |
|
Очередь для запросов на обработку субтитров |
online_requests |
очереди обработки для запросов онлайн-субтитров |
Очередь для запросов на обработку субтитров |
translate_requests |
очереди обработки для задач перевода |
Каталог хранения файлов сообщений |
/var/log/terra/ |
основной каталог для хранения лог-файлов системы в контейнере. Общие системные лог-файлы клиента располагаются в /var/log/ |
Уровень отладочных сообщений |
INFO |
минимальный уровень отладочных сообщений (возможные значения: CRITICAL, ERROR, WARNING, INFO, DEBUG) |
Уникальное имя обработчика |
FIRST |
уникальное имя обработчика. Используется по умолчанию, если не указано в обработчиках стенограмм / субтитров / переводов |
Путь к файлу сообщений |
/var/log/terra/{WORKER_TYPE}.{LOG_WORKER_NAME}.application.log |
шаблон имени лог-файла с подстановками: тип обработчика и его имя |
Максимальный размер одного файла сообщений (байты) |
10 000 000 |
максимальный размер одного лог-файла, в байтах |
Максимальное количество файлов сообщений |
10 |
максимальное количество хранимых лог-файлов одного контейнера |
ru |
код языка, на котором требуется итоговый текст (подробнее о возможных значениях кодов языка — см. раздел Поддерживаемые языки) |
|
/var/www/alldata/cleaning_patterns.txt |
путь к файлу в контейнере, содержащему регулярные выражения для текста, исключаемого из стенограммы |
|
Корневой каталог размещения данных |
/var/www/alldata/ |
монтирование каталога для хранения всех данных |
Каталог размещения аудио |
/var/www/alldata/ |
монтирование каталога для хранения аудиофрагментов |
Каталог размещения стенограмм |
/var/www/alldata/ |
монтирование каталога для хранения стенограмм |
Каталог хранения файлов лицензий |
/var/www/alldata/ |
монтирование каталога для хранения файлов лицензий |
Каталог хранения публичных ключей ПАО ИВА |
/var/www/alldata/ |
монтирование каталога для хранения публичных ключей ПАО «ИВА» (IVA Technologies) |
Каталог хранения приватных ключей владельца |
/var/www/alldata/ |
монтирование каталога для хранения приватных ключей владельца |
Каталог хранения публичных ключей владельца |
/var/www/alldata/ |
монтирование каталога для хранения публичных ключей владельца |
off |
активация автоматического определения голосов участников из единого аудиопотока с множеством голосов и разметки речевых фрагментов в стенограмме по голосовой принадлежности. Результатом является стенограмма с техническими идентификаторами (voice_N), например: Иванов Иван (voice_0), Иванов Иван (voice_1), Иванов Иван (voice_N) |
|
off |
активация автоматической подстановки имен распознанным голосам спикеров через сервис идентификации модуля ADP. Результатом является стенограмма, где технические идентификаторы (voice_N) заменяются на реальные имена спикеров, например: Иванов Иван(voice_0) → Иванов Иван, Иванов Иван(voice_1) → Петров Петр |
|
multivoice |
текстовая подстрока в имени спикера, при обнаружении которой активируется механизм распознавания голосов из аудиоканала спикера. При пустом значении обрабатываются все аудиофрагменты |
|
Порог обнаружения языка |
0,9 |
минимальная вероятность обнаружения языка в речи (дробное число). При меньшем значении для извлечения текста используется код языка по умолчанию (опция Код используемого языка, по умолчанию: ru) |
Длительность речи (обнаружение языка) |
1,0 |
минимальная длительность аудиофрагмента (в секундах) для обнаружения языка речи (дробное число). Для фрагментов меньшей длительности используется код языка, определяемый опцией Код используемого языка (по умолчанию: ru) |
4 |
максимальная длительность (в секундах) для объединения коротких аудиофрагментов перед обработкой нейросетью с применением механизма распознавания голосов. Минимальное значение — 2 секунды. Рекомендации по настройке параметра — см. ниже |
|
Речевая пауза |
3,0 |
минимальная длительность паузы (в секундах) между двумя последовательными аудиофрагментами (дробное число). Если пауза превышает указанное значение, фрагменты обрабатываются нейросетью как независимые (без объединения в единый аудиофрагмент) |
Рекомендации по конфигурированию параметра Размер аудиопосылки:
| Режим | Рекомендуемое значение | Результат |
|---|---|---|
Максимальная производительность |
30 секунд |
наивысшая скорость обработки звука |
Сбалансированный (по умолчанию) |
4 секунды |
оптимальное соотношение скорости и точности |
Максимальная точность |
2 секунды |
наиболее точное распознавание голосов |
В результате при увеличении значения параметра Размер аудиопосылки повышается скорость обработки звука, а при уменьшении — повышается точность распознавания голосов
| При установке значения менее 2 секунд (минимальное значение) параметр Размер аудиопосылки в процессе обработки автоматически устанавливается равным 30 секундам (максимальное значение), что приведет к быстрой скорости обработки данных и менее точному распознаванию голосов |
