Сведения о производительности модуля ADP
-
Максимальное количество запросов на одновременную обработку: 5 сеансов транскрибации длительностью 1 час. Остальные запросы переходят в очередь ожидания и обрабатываются в порядке поступления в очередь
-
Время обработки первого результата растет линейно с увеличением одновременных запросов
-
Один docker-контейнер занимает весь GPU. При ограничении ресурсов GPU количество одновременно обрабатываемых запросов уменьшается