Иван Бескровный | NISQA-s: оценка качества для потокового аудио

Спикер: Иван Бескровный, ВКонтакте, Единое Видео, команда звуковых технологий Описание: в докладе хочу рассказать о нейросетевой метрике оценки качества потокового аудио NISQA-s: в чем отличие от оригинальной метрики NISQA, области в которых можно использовать, профиты которые может принести такая оценка, а также потенциальные методы применения. Примерный план: 1. Для чего? Обработка онлайн аудио потока: a. Задача потокового аудио: звонки, трансляции, немного голосовые b. Слабые места обработки потокового аудио: плохое аудио от пользователя, пайплайны обработки, передача по сети 2. Что это? a. краткий обзор оригинальной метрики b. обзор наших модификаций и для чего они c. перфоманс на устройствах 3. Зачем? Как появилась идея оценки: пайплайна процессинга аудио, проблема плохого источника a. Обзор “плохих“ кейсов b. Использование метрики: оценка каждого отдельного этапа обработки (шумоподавление, регулировка усиления, кодеки и т.д.) c. Сценарии использования: уведомления пользователю, трейсинг событий в поддержке. Data Fest 2024: Презентацию к докладу Вы можете скачать в треке секции Speech: ______ Наши соц.сети: Telegram: Вконтакте: Канал с вакансиями в telegram: Канал с апдейтами по курсам: Как попасть в чат сообщества ODS Mattermost: