Обработчик переводов

Раздел Обработчик переводов содержит параметры конфигурации модуля машинного перевода, включая настройки путей к языковым моделям, управления токенизацией текста и параметрами обработки переводов для многоязычной поддержки мероприятий.

Обработчик переводов

Конфигурация включает:

  • пути хранения моделей перевода

  • параметры обработки текстовых данных и управления длиной запросов

  • настройки проверки входных языков и предотвращения некорректной работы нейросети

  • настройки длительности тайм-аута клиентского соединения

Параметры для настройки обработчика переводов

Параметр Значение по умолчанию Назначение

Уровень отладочных сообщений

INFO

минимальный уровень отладочных сообщений (возможные значения: CRITICAL, ERROR, WARNING, INFO, DEBUG)

Уникальное имя обработчика

FIRST

уникальное имя обработчика переводов

Путь к файлу сообщений

/var/log/terra/
{WORKER_TYPE}.{LOG_WORKER_NAME}.
application.log

путь к файлу в контейнере для хранения логов обработчика переводов

Максимальный размер одного файла сообщений (байты)

10 000 000

максимальный размер одного лог-файла, в байтах

Максимальное количество файлов сообщений

10

максимальное количество хранимых лог-файлов одного контейнера

Длительность клиентского таймаута

4,5

время ожидания ответа для клиентских соединений (секунды)

Коды языков поддерживаемых для перевода

['ru', 'en', 'de', 'es', 'fr', 'pt', 'ch', 'zh', 'ar', 'fa', 'id', 'in', 'af', 'xh', 'ur', 'th', 'te', 'gu', 'hi', 'ne', 'bn', 'ml', 'mr', 'ta', 'vi', 'km']

список кодов языков, поддерживаемых для перевода (соответствие кодов полным названиям языков см. в разделе Многоязычная поддержка транскрибации)

Место хранения моделей для перевода

/code/

путь к директории, в которой хранятся модели машинного перевода для всех поддерживаемых языков

Режимы перевода

['alone-brt', 'brt-hls', 'double-brt']

Выбранный режим перевода

alone-brt

текущий активный режим работы обработчика переводов

Режимы перевода

В обработчике переводов доступны следующие режимы работы:

  • alone-brt — режим использования одного экземпляра многоязычной модели перевода

    Характеристики режима alone-brt:

    • потребление VRAM: до 5 ГБ

    • скорость обработки: 420 текстовых предложений в секунду в направлении XX → YY (XX — один из доступных языков модели, YY — второй из доступных языков модели)

    • длина предложения: до 100 слов

      Режим alone-brt рекомендуется при работе в условиях ограниченных ресурсов VRAM
  • brt-hls — гибридный режим, сочетающий три нейросетевые модели перевода с разделением по языковым парам

    Характеристики режима brt-hls:

    • потребление VRAM: до 7 ГБ

    • скорость обработки:

      • 430 текстовых предложений в секунду в направлении XX → YY (XX — один из доступных языков модели, YY — второй из доступных языков модели, кроме пар RUEN)

      • 440 текстовых предложений в секунду в направлениях RUEN

    • особенность: режим brt-hls поддерживает три модели для перевода:

      • RUEN — модель для перевода фраз в направлении исключительно с русского языка на английский

      • ENRU — модель для перевода фраз в направлении исключительно с английского языка на русский

      • XXYY — модель для перевода фраз всех остальных языковых пар, кроме пар RUEN (XX — один из доступных языков модели, YY — второй из доступных языков модели)

    • длина предложения: до 80 слов

      Режим brt-hls рекомендуется для систем с умеренным объемом VRAM и ориентирован на обработку перевода между русским и английским языками
  • double-brt — режим использования двух экземпляров многоязычной модели перевода

    Характеристики режима double-brt:

    • потребление VRAM: до 10 ГБ

    • скорость обработки: 430 текстовых предложений в секунду в направлении XX → YY (XX — один из доступных языков модели, YY — второй из доступных языков модели)

    • особенность: один экземпляр используется только для направлений RUEN

    • длина предложения: до 100 слов

      Режим double-brt рекомендуется для систем с избыточными ресурсами VRAM и ориентирован на обработку многоязычного перевода

XX и YY обозначают языковые пары, поддерживаемые многоязычной моделью (например, ENDE, FRES, CHIN и т. д.).

Подробнее — см. раздел Многоязычная поддержка транскрибации