«Яндекс» прокачал нейросетевой перевод в своем браузере — теперь озвучка может вестись 12 разными голосами. Компания также улучшила алгоритмы распознавания реплик, так что сервису будет проще различать участников.
Раньше задействовалось всего два голоса: один мужской и один женский. Чтобы получался многоголосый автоперевод, разработчики добавили к ним еще пять мужских и пять женских. Технология распознает речь, пропускает через «Яндекс.Переводчик», определяет пол говорящего и озвучивает с учетом пауз и скорости речи.
По оценкам «Яндекса», в большинстве разговорных YouTube-роликов участвуют три спикера и больше. Новые голоса упростят восприятие контента, когда реплики произносят несколько людей одного и того же пола.