Прошла встреча ML-разработчиков и Data Science-специалистов с командами разработки продакшн GigaChat и речевых технологий. На митапе SberDevices ведущие разработчики GigaChat поделились деталями сбора данных для предобучения новой версии модели и метриками, которых достигают 7B и 29B модели, лежащие в основе GigaChat.
А ещё рассказали о подходах в разработке речевых технологий (ASR/TTS):
-Создании моделей распознавания речи;
-Дообучении для задач распознавания речи и эмоций;
-Модификации технологий в обучении, архитектуре и инференсе моделей TTS.
Хотите получать еженедельную подборку лучших материалов и ничего не пропустить? Подпишитесь!