Сведения о производительности модуля ADP

Основные характеристики производительности

Максимальное количество запросов на одновременную обработку: 10 сеансов транскрибации длительностью 1 час для задач суммаризации и протоколирования. Остальные запросы переходят в очередь ожидания и обрабатываются в порядке поступления в очередь
Время обработки первого результата растет линейно с увеличением одновременных запросов
Один docker-контейнер занимает весь GPU. При ограничении ресурсов GPU количество одновременно обрабатываемых запросов уменьшается

Показатели производительности

В версии модуля ADP 5.0 достигнуты следующие улучшения:

Показатель	До версии 4.0	После версии 5.0	Изменение
Пропускная способность	130 конференций/час	440 конференций/час	+241 %
Среднее время обработки конференции	109,7 секунд	80,7 секунд	-30,0 %
95-й перцентиль (p95) времени обработки	158,6 секунд	120,6 секунд	-20,2 %

Показатель

До версии 4.0

После версии 5.0

Изменение

Пропускная способность

130 конференций/час

440 конференций/час

+241 %

Среднее время обработки конференции

109,7 секунд

80,7 секунд

-30,0 %

95-й перцентиль (p95) времени обработки

158,6 секунд

120,6 секунд

-20,2 %

Результат: система обрабатывает почти в 3 раза больше часовых конференций за то же время, при этом среднее время обработки сокращено на 30 %, а длительные запросы (например, обработка многочасовых конференций с большим количеством спикеров) выполняются на 20 % быстрее, что повышает стабильность и предсказуемость времени отклика