Сведения о производительности модуля ADP
Основные характеристики производительности
-
Максимальное количество запросов на одновременную обработку: 10 сеансов транскрибации длительностью 1 час для задач суммаризации и протоколирования. Остальные запросы переходят в очередь ожидания и обрабатываются в порядке поступления в очередь
-
Время обработки первого результата растет линейно с увеличением одновременных запросов
-
Один docker-контейнер занимает весь GPU. При ограничении ресурсов GPU количество одновременно обрабатываемых запросов уменьшается
Показатели производительности
В версии модуля ADP 5.0 достигнуты следующие улучшения:
| Показатель | До версии 4.0 | После версии 5.0 | Изменение |
|---|---|---|---|
Пропускная способность |
130 конференций/час |
440 конференций/час |
+241 % |
Среднее время обработки конференции |
109,7 секунд |
80,7 секунд |
-30,0 % |
95-й перцентиль (p95) времени обработки |
158,6 секунд |
120,6 секунд |
-20,2 % |
Результат: система обрабатывает почти в 3 раза больше часовых конференций за то же время, при этом среднее время обработки сокращено на 30 %, а длительные запросы (например, обработка многочасовых конференций с большим количеством спикеров) выполняются на 20 % быстрее, что повышает стабильность и предсказуемость времени отклика