Анастасия Овчинникова - Сервис генерации саммари к вакансиям на основе LM,дообученной с помощью RLHF

- Зачем нужны саммари вакансий, как мы создавали их раньше и как хотим создавать в идеале. - Немного про генеративные модели. Что мы получили с помощью T5. - Предпосылки RLHF и как это может нам помочь. Основные компоненты RLHF: model, reward model, trainer. - Обучение reward model, генерация датасета с помощью t5 и человеческой разметки. - Обучение RLHF - Результаты A/B тестов и выкатка в prod Data Fest 2023: Трек “Instruct Models“: Наши соц.сети: Telegram: Вконтакте: