Коллега прислал 2 голосовых в WhatsApp, там шум-гам, несвязная речь и черт разберет, о чем он говорит.
Прослушал раз пять, даже что-то разобрал, но саму суть не уловил.
💡 И тут приходит мысль, а давай-ка я транскрибацию сделаю и отправлю ему обратно, чтобы он попробовал встать на мое место.
В общем, в поисках решения:
📍 1. Решил в ТГ в избранное закинуть скаченные .ogg файлы из WA, надеясь на транскрибацию TG Premium - не сработало.
📍 2. Решил найти сервис в поиске, нашел 5, 3 из них не работают, 1 не принимает формат .ogg, зато 1 отлично справился.
Быстрое и невероятно качественное распознавание речи.
Попробовать без регистрации Speech2Text.
👍 Супер! Мне большего и не надо.
📍 3. Попробовал также ИИ: DeepWhisperX и OpenAi через GPTunnel, делают, стоит 1.5 рубля, а ошибки есть.
Speech2Text справился лучше.
Видел также странные старые: Speechlogger, SpeechPad, SpeechNotes.
❌ Не работают они)
Еще Qudata есть, вполне себе рабочая.
👇 Все ссылки из эксперимента в комментариях:
Присоединяйтесь — мы покажем вам много интересного
Присоединяйтесь к ОК, чтобы подписаться на группу и комментировать публикации.
Комментарии 1
1.
https://speech2text.ru/ - имхо, лучший вариант
2.
https://audio-v-text.silero.ai/ - бесплатный, но e-mail требует
3.
https://qudata.com/ru/speech-to-text/ - хорошЕще поковырять:
4.
https://speechnotes.co/ru/5.
https://speechpad.ru/6.
https://speechlogger.appspot.com/ru/7.
https://converter.app/ru/audio-text/8.
https://www.audio2edit.com/ru/speech-to-textКстати говоря, у меня есть книга "Новая эра МЛМ", в которой я разобрал 89 сервисов для работы и жизни.
Книга "Новая эра МЛМ" + 7 бонусов
(
https://t.me/tribute/app?startapp=smiT)