Для того, чтобы распознать речь и перевести её из аудио или видео в текст, существуют программы и расширения (плагины) для браузеров. Однако зачем всё это, если есть онлайн сервисы? Программы надо устанавливать на компьютер, более того, большинство программ распознавания речи далеко не бесплатны.
Большое число установленных в браузере плагинов сильно тормозит его работу и скорость серфинга в интернет. А сервисы, о которых сегодня пойдет речь, полностью бесплатны и не требуют установки – зашел, попользовался и ушел!
В этой статье мы рассмотрим два сервиса перевода речи в текст онлайн. Оба они работают по схожему принципу: Вы запускаете запись (разрешаете браузеру доступ к микрофону на время пользования сервисом), говорите в микрофон (диктуете), а на выходе получаете текст, который можно скопировать в любой документ на компьютере.
Speechpad.ru
Русскоязычный онлайн сервис распознавания речи. Имеет подробную инструкцию по работе на русском языке.
Среди основных функций «Голосового блокнота» (так сам автор называет свой сервис) следует выделить:
- поддержку 7 языков (русский, украинский, английский, немецкий, французский, испанский, итальянский)
- загрузку для транскрибации аудио или видео файла (поддерживаются ролики с YouTube)
- синхронный перевод на другой язык
- поддержку голосового ввода знаков препинания и перевода строки
- панель кнопок (смена регистра, перевод на новую строку, кавычки, скобки и т.п.)
- наличие персонального кабинета с историей записей (опция доступна после регистрации)
- наличие плагина к Google Chrome для ввода текста голосом в текстовом поле сайтов (называется «Голосовой ввод текста — Speechpad.ru»)
Dictation.io
Второй онлайн сервис перевода речи в текст. Иностранный сервис, который между тем, прекрасно работает с русским языком, что крайне удивительно. По качеству распознавания речи не уступает Speechpad, но об этом чуть позже.
Основной функционал сервиса:
- поддержка 30 языков, среди которых присутствуют даже венгерский, турецкий, арабский, китайский, малайский и пр.
- автораспознавание произношения знаков препинания, перевода строки и пр.
- возможность интеграции со страницами любого сайта
- наличие плагина для Google Chrome (называется «VoiceRecognition»)
В деле распознавания речи самое важное значение имеет именно качество перевода речи в текст. Приятные «плюшки» и вохможности – не более чем хороший плюс. Так чем же могут похвастаться в этом плане оба сервиса?
Сравнительный тест сервисов
Для теста выберем два непростых для распознавания фрагмента, которые содержат нечасто употребляемые в нынешней речи слова и речевые обороты. Для начала читаем фрагмент поэмы «Крестьянские дети» Н. Некрасова.
Ниже представлен результат перевода речи в текст каждым сервисом (ошибки обозначены красным цветом):
Как видим, оба сервиса практически с одинаковыми ошибками справились с распознаванием речи. Результат весьма неплохой!
Теперь для теста возьмем отрывок из письма красноармейца Сухова (к/ф «Белое солнце пустыни»):
Отличный результат!
Как видим, оба сервиса весьма достойно справляются с распознаванием речи – выбирайте любой! Похоже что они даже используют один и тот же движок — уж слижком схожие у них оказались допущенные ошибки по результатам тестов ). Но если Вам необходимы дополнительные функции типа подгрузки аудио / видео файла и перевода его в текст (транскрибация) или синхронного перевода озвученного текста на другой язык, то Speechpad будет лучшим выбором!
Кстати вот как он выполнил синхронный перевод фрагмента поэмы Некрасова на английский язык:
Ну а это краткая видео инструкция по работе со Speechpad, записанная самим автором проекта:
Друзья, понравился ли Вам данный сервис? Знаете ли Вы более качественные аналоги? Делитесь своими впечатлениями в комментариях. Также хочу порекомендовать вам бесплатный сервис, который умеет не только распознавать текст, сказанный в микрофон, но и мгновенно переводить его на любой язык мира!
Похожие публикации:
Что то переводчик на другие языки, желательно синхронный не работает
Сергей, очень признателен за ссылки на приложения распознавания речи.
Для меня тема по прежнему актуальна. Попробовал Speechpad.ru.
Первое впечатление — замечательный продукт, полностью соответствующей моей потребности.
При моей тугоухости — просто панацея. Передаю микрофон собеседнику и в своем смартфоне вижу текст, практически без искажений. Давно отслеживаю прогресс Google translate для получения титров на youtube. Однако здесь эта технология реализована в очень удачной форме для использования людьми имеющими большие проблемы со слухом.
Очень рад, что информация из статьи Вам пригодилась!
Уважаемый автор статьи, хочу спросить Вашего совета или рекомендации по интересующей меня жизненно важной теме. Я слабослышащий (проблемы распознавания речи), современные цифровые с\а проблему не решают, начал искать подходящее приложение для гаджета (или бм специализированный гаджет) позволяющее видеть на экране гаджета в on line речь собеседника (как непосредственного, так и контактирующего по каналам связи (телефон, WiFi и пр.).
Что мне можете посоветовать ?
Марк Михайлович
Надеюсь на конструктивный ответ.
С подобными устройствами и программными средствами не знаком.
Посмотрите приложение Яндекс.Разговор для смартфона на Android. Его ещё в 2015г. запустили.
ЕWA , Speechpad.ru работает с Latviešu, Lietuviešu (Латышский, Литовский) и другими языками. Но надо диктовать чётко и медленно, так как в школе диктанты учителя диктуют детям. И микрофон надо хороший, тогда всё тип топ.
Однако,если темп речи средний,то программа ничего не распознает. Обидно(
Вообще то я скачал всё это для того чтобы иметь возможность РАСПОЗНАВАНИЯ звучащего видео тогда когда язык его мне неизвестен. Через гугл мне долго предлагали всякую дрянь, которая якобы может это сделать. Вот кажется и эта не работает.
Что вы скачивали, если речь в статье идет про онлайн сервисы?
Сергей, скажите, пожалуйста, можно ли получить код, чтобы вставить ваш продукт на свой сайт для некоммерческого использования? Заодно мы сможем провести многоуровневое тестирование (если надо, конечно)
Татьяна Борисовна, сервисы распознавания речи это не мой продукт. Я всего лишь пишу обзоры. Обратитесь к владельцу этих ресурсов.
А если сервисом пользоваться для написания книг, то авторские права идут лесом, наверное?
Какая тут взаимосвязь вообще?
Для написания книг используйте VOCO, работает без доступа к сети. Если успеете написать книгу за 30 дней, тоже получится бесплатно.
Уважаемый Сергей. А нет ли какого-нибудь бесплатного онлайн сервиса преобразования аудио в текст без браузера Гугл Хром? Я боюсь скачивать этот браузер, у меня уже один комп накрылся, потому что там какой-то скрипт проблемный. Помогите, пожалуйста.
Никакой проблемы с Гугл Хромом нет — скачивайте спокойно.
Смените хром на его аналог без шпионских модулей — Comodo Dragon.
Спасибо, не хочется :)
у меня аудио не распознаёт абсолютно, в поле Уровень распознавания пишет error: no-speech
no-speech означает, что Вы молчите ) Проверьте подключен ли микрофон.
Скажите, пожалуйста, каким микрофоном Вы пользуетесь?
У меня микрофон встроен в вебкамеру, а вебкамера Logitech, модель точно не помню.
А на айпад мини тоже можно?
Спасибо! Можете ли Вы помочь мне такую программу, где можно говорить на латышский (Латвия) и даёт текст? Мне деформации рук и трудно печатать на клавиши.
Благодарю!
Информацией о программах я не владею. В обозреваемых сервисах поддержки латышского нет.
«Сервисы, о которых сегодня пойдет речь, полностью бесплатны и не требуют установки»
———————————————————————
Оба эти сервиса имеют один минус — они требуют установленный Google Chrome. Работают только с ним (и даже родственные браузеры не подойдут).
Также часто случается, что онлайн сервис по каким-то причинам не работает. Взять, к примеру, рекомендованный вами сервис «Doggelganger — Найди собаку, похожую на тебя» — где он сейчас?! Канул в Лету.. Более того, многие сервисы, поднабрав приличную аудиторию, постепенно становятся платными (и «крякнуть» их никак нельзя).. а в лучшем случае — напичканными рекламой. Так что, с реальными программами в этом плане все же проще и надежней.
Большое спасибо! Это очень ценная находка! Получается что даже письма для email можно надиктовывать, а не набирать на клавиатуре?
Совершенно верно! )