Благодаря улучшенным алгоритмам воспринимать видео с большим количеством спикеров стало намного легче. Об этом CNews сообщили представители «Яндекса».
☝️ Как нейросеть распознает разных спикеров на видео? Сначала она переводит речь в текст, восстанавливает пунктуацию и определяет границы предложений. Затем уже другая нейросеть анализирует спектрограмму голоса и отмечает на аудиодорожке фрагменты, сказанные разными людьми. Так и становится ясно, кто из спикеров что произнес.
👉 «Мы постоянно работаем над качеством перевода и озвучки, чтобы дать нашим пользователям доступ к любому контенту со всего мира. По нашим оценкам, около половины YouTube-роликов на иностранных языках — это ролики с тремя и более спикерами. Смотреть их с двухголосой озвучкой не совсем удобно — поэтому мы и сделали десять новых голосов», — сказал руководитель приложения «Яндекс» и «Яндекс браузера» Дмитрий Тимко.
#yandex #digitalmarketing #internetmarketing #интернетвузбекистане #intarget #intargetuz
Мы в социальных сетях: T.me/intarget_uz Facebook.com/intarget.uz Instagram.com/intarget.uz linkedin.com/company/intarget.uz
Присоединяйтесь — мы покажем вам много интересного
Присоединяйтесь к ОК, чтобы подписаться на группу и комментировать публикации.
Нет комментариев