Иван Бескровный | NISQA-s: оценка качества для потокового аудио
Спикер: Иван Бескровный, ВКонтакте, Единое Видео, команда звуковых технологий
Описание: в докладе хочу рассказать о нейросетевой метрике оценки качества потокового аудио NISQA-s: в чем отличие от оригинальной метрики NISQA, области в которых можно использовать, профиты которые может принести такая оценка, а также потенциальные методы применения.
Примерный план:
1. Для чего? Обработка онлайн аудио потока:
a. Задача потокового аудио: звонки, трансляции, немного голосовые
b. Слабые места обработки потокового аудио: плохое аудио от пользователя, пайплайны обработки, передача по сети
2. Что это?
a. краткий обзор оригинальной метрики
b. обзор наших модификаций и для чего они
c. перфоманс на устройствах
3. Зачем? Как появилась идея оценки: пайплайна процессинга аудио, проблема плохого источника
a. Обзор “плохих“ кейсов
b. Использование метрики: оценка каждого отдельного этапа обработки (шумоподавление, регулировка усиления, кодеки и т.д.)
c. Сценарии использования: уведомления пользователю, трейсинг событий в поддержке.
Data Fest 2024:
Презентацию к докладу Вы можете скачать в треке секции Speech:
______
Наши соц.сети:
Telegram:
Вконтакте:
Канал с вакансиями в telegram:
Канал с апдейтами по курсам:
Как попасть в чат сообщества ODS Mattermost: