29.05.2021 НовостиСбер объявил об открытии доступа к датасету Golos – самому большому размеченному вручную набору речевых данных на русском языке, включающему 1240 часов аудиоданных и обученную на них модель распознавания речи, которая показывает точность, сравнимую с человеческой. Датасет можно скачать на сайте GitHub. Данные могут быть использованы для распознавания и синтеза речи. Сбер предоставляет их по лицензии, допускающей использование в исследовательских и коммерческих целях, это более 1 млн коротких записей русской речи и соответствующие транскрипции. Над датасетом работала команда SberDevices: создание такой базы стало возможным благодаря разработке семейства виртуальных ассистентов Салют. Было сгенерировано более 1240 часов речи, похожей на запросы пользователей. Аудиофайлы записаны при помощи краудсорсинговой ...
читать далее.