Мой компьютер

Диктовка слов онлайн. Голосовой ввод. Голосовой ввод текста с помощью Web Speech API

Для того, чтобы распознать речь и перевести её из аудио или видео в текст , существуют программы и расширения (плагины) для браузеров. Однако зачем всё это, если есть онлайн сервисы? Программы надо устанавливать на компьютер, более того, большинство программ распознавания речи далеко не бесплатны.


Большое число установленных в браузере плагинов сильно тормозит его работу и скорость серфинга в интернет. А сервисы, о которых сегодня пойдет речь, полностью бесплатны и не требуют установки – зашел, попользовался и ушел!

В этой статье мы рассмотрим два сервиса перевода речи в текст онлайн . Оба они работают по схожему принципу: Вы запускаете запись (разрешаете браузеру доступ к микрофону на время пользования сервисом), говорите в микрофон (диктуете), а на выходе получаете текст, который можно скопировать в любой документ на компьютере.

Speechpad.ru

Русскоязычный онлайн сервис распознавания речи. Имеет подробную инструкцию по работе на русском языке.

  • поддержку 7 языков (русский, украинский, английский, немецкий, французский, испанский, итальянский)
  • загрузку для транскрибации аудио или видео файла (поддерживаются ролики с YouTube)
  • синхронный перевод на другой язык
  • поддержку голосового ввода знаков препинания и перевода строки
  • панель кнопок (смена регистра, перевод на новую строку, кавычки, скобки и т.п.)
  • наличие персонального кабинета с историей записей (опция доступна после регистрации)
  • наличие плагина к Google Chrome для ввода текста голосом в текстовом поле сайтов (называется «Голосовой ввод текста — Speechpad.ru»)

Dictation.io

Второй онлайн сервис перевода речи в текст. Иностранный сервис, который между тем, прекрасно работает с русским языком, что крайне удивительно. По качеству распознавания речи не уступает Speechpad, но об этом чуть позже.

Основной функционал сервиса:

  • поддержка 30 языков, среди которых присутствуют даже венгерский, турецкий, арабский, китайский, малайский и пр.
  • автораспознавание произношения знаков препинания, перевода строки и пр.
  • возможность интеграции со страницами любого сайта
  • наличие плагина для Google Chrome (называется «VoiceRecognition»)

В деле распознавания речи самое важное значение имеет именно качество перевода речи в текст. Приятные «плюшки» и вохможности – не более чем хороший плюс. Так чем же могут похвастаться в этом плане оба сервиса?

Сравнительный тест сервисов

Для теста выберем два непростых для распознавания фрагмента, которые содержат нечасто употребляемые в нынешней речи слова и речевые обороты. Для начала читаем фрагмент поэмы «Крестьянские дети» Н. Некрасова.

Ниже представлен результат перевода речи в текст каждым сервисом (ошибки обозначены красным цветом):

Как видим, оба сервиса практически с одинаковыми ошибками справились с распознаванием речи. Результат весьма неплохой!

Теперь для теста возьмем отрывок из письма красноармейца Сухова (к/ф «Белое солнце пустыни»):

Отличный результат!

Как видим, оба сервиса весьма достойно справляются с распознаванием речи – выбирайте любой! Похоже что они даже используют один и тот же движок — уж слижком схожие у них оказались допущенные ошибки по результатам тестов). Но если Вам необходимы дополнительные функции типа подгрузки аудио / видео файла и перевода его в текст (транскрибация) или синхронного перевода озвученного текста на другой язык, то Speechpad будет лучшим выбором!


Кстати вот как он выполнил синхронный перевод фрагмента поэмы Некрасова на английский язык:

Ну а это краткая видео инструкция по работе со Speechpad, записанная самим автором проекта:

Друзья, понравился ли Вам данный сервис? Знаете ли Вы более качественные аналоги? Делитесь своими впечатлениями в комментариях.

Сейчас без компьютера просто нереально обойтись в современном мире. От вас не требуется быть мастером фотошопа или профессионально монтировать видео (если это не связано с работой, конечно). Но суметь набрать какой-нибудь текст – это необходимый минимум.

№2. Web Speech API

Онлайн-программа Web Speech API по функционалу абсолютно идентична предыдущим.

Этот сервис, как и перечисленные выше, также был создан компанией Google.

Главная страница выглядит так:


В простом интерфейсе сразу очевидно, что для начала записи необходимо выбрать язык, а после нажать на микрофон.

После того как вы нажмете на значок справа, система обязательно сделает запрос на доступ.


После того как вы «дадите добро», можно сразу приступать к работе. Набирайте текст голосом, а его печатная версия будет появляться в окошке.

После окончания работы текст можно скопировать туда, куда вам необходимо (опять же таки – ctrl+C, ctrl+V).

№3. Talktyper


Не менее простая программа – это Talktyper.

Для начала работы перейдите на сайт: https://talktyper.com/ru/index.html.


Для начала работы достаточно нажать на значок микрофона справа.

В отличие от описанных выше, данный наборщик текста можно открывать с помощью любого браузера. Хотя сайт создан в США, приложение легко распознает самые популярные языки мира, в том числе и русский.

Talktyper многофункциональный: он не только набирает текст, но и ставит знаки препинания, исправляет самостоятельно ошибки. Если какое-то начитанное вами слово система не может распознать, как правильное, то оно обязательно высветится.

Кроме того, Talktyper имеет функцию перевода, а также его озвучивания.

Обратите внимание! После того как вы закончите голосовой набор текста, обязательно нажмите на стрелочку, чтобы набранный документ был перенесен в другое поле. После этого его можно будет отправить по электронной почте или скопировать в нужный файл.

Возможные проблемы при работе с программами голосового набора

Когда вы начнете использовать эти программы, то обязательно задумаетесь, как же компьютер распознает наш голос, а после еще переводит в живой текст.

Схема распознавания речи устройством выглядит так:

Весь процесс можно разделить на 3 главных этапа:

    Акустический распознаватель.

    Важно говорить четко, громко, микрофон должен передавать голос без перебоев.

    Лингвистическая обработка.

    Чем больше в словаре программы есть слов, тем качественнее будет набранный текст. То есть, все вами сказанное будет опознаваться и передаваться в текстовом виде без искажения.

    Распознанный орфографический текст.

    Программа в автоматическом режиме выводит на экран орфографическую версию надиктованной речи, опираясь на паузы, четкость слов, найденные лексемы в словаре и т.д.

При работе с компьютерными наборщиками текста чаще всего возникает 2 проблемы:

  1. Акустический распознаватель «улавливает» вашу речь с перебоями.
  2. В словаре системы недостаточно слов, чтобы распознать всё, сказанное вами.

Чтобы решить первую проблему, необходимо четко и громко говорить. А вот для второй проблемы решения практически не существует, по крайней мере, бесплатного.

Версии программ распознавания речи, которые распространяются свободно, имеют очень скупой словарный запас.

Чтобы обеспечить программе обширный запас слов разработчикам требуется вложить немало денег, поэтому многие распознаватели демонстрируют низкий уровень перевода речи в текст.

Дальше всех в этом деле продвинулась компания Google, т.к. имеет достаточно средств для инвестиций. Эта компания, кроме прочего, создала самый большой онлайн-словарь, который помогает распознавать голос и переводить его в графическую версию.

Смотрите подробное руководство в этом ролике:

  1. Когда вы произносите речь, в комнате должно быть тихо. Звуки природы, музыка, плач ребенка воспринимаются системой, как шум. Из-за этого текст будет набран с большими ошибками.
  2. Не говорите, если что-то едите. Это не только скажется на качестве набора, но и опасно для жизни к тому же.
  3. Перед началом работы нужно подобрать правильную громкость вашего голоса, а также понять какая чувствительность у вашего микрофона.

    Для этого попробуйте записать несколько предложений привычным тоном. Если в записи будут перебои, обратитесь к настройкам микрофона.

  4. Делайте небольшие паузы между словами.
  5. Избегайте длинных фраз.

Кто-то скажет, что программа для голосового набора – это прекрасный помощник, который освободил им руки и облегчил жизнь в целом. Другие решат, что «овчинка выделки не стоит». Потому выбрать, стоить ли их использовать, вам предстоит самостоятельно.

А уж из каких сервисов выбирать, вы уже знаете…

При работе в интернете часто требуется печатать тексты. Этим занимаются не только блоггеры и копирайтеры, необходимость написания текстов появляется у маркетологов, вебмастеров, оптимизаторов и профессионалов из других областей.


Даже составление ТЗ для копирайтера вынуждает нажимать клавиши на клавиатуре.

Программы для голосового набора текста облегчают эту задачу. Кто-то скажет, что созданы они для ленивых и неопытных и отчасти это будет верно. Дело в том, что софт недостаточно хорошо распознает отдельные слова и приходится четко проговаривать всё, а это снижает скорость набора текста.

Набор текста на компьютере голосом

Не зря же был запущен . Пользователям не нужно нажимать кнопки, они могут просто произнести нужный запрос.

Четко проговорить несколько слов не сложно, поэтому для данной цели это подходит. Что касается написания статей, то придется потренироваться. Также, стоит попробовать несколько программ, чтобы выбрать подходящий вариант.

Заходите на , выбираете язык и жмете на значок с микрофоном:

После этого, запрашивается разрешение на использование микрофона. Он может быть отдельным или встроенным в вебкамеру:

Разрешаете браузеру использовать микрофон и начинаете произносить слова. Они сразу же появляются в основной части страницы, откуда их можно легко скопировать и перенести, например, в Word.

2. Голосовой набор онлайн на . Этот сервис отличается наличием дополнительных кнопок. С их помощью можно быстро очистить поле ввода текста, а также перенести готовый текст на Google Диск, скачать в формате txt или отправить по электронной почте:

В целом, система ничем не отличается. Заходишь на сайт, выбираешь START DICTATION (после выбора языка) и появляется уведомление, где требуется дать разрешение на использование микрофона:

Интерфейс простой, а дизайн приятный. Именно с этим сервисом удается добиться хорошего распознавания, но отзывы двоякие.

3. Набор текста голосом с . Русский язык в этом иностранном сервисе распознается без проблем. Функционала в нем намного больше. Полученный текст проверяется на знаки препинания и ошибки. Очень удобно, что слова, которые программа не смогла распознать точно, подсвечиваются.

При нажатии на них, можно выбрать другие предложенные варианты:

Также здесь есть инструмент для быстрого перевода текса на любой язык или его воспроизведение. Отправлять документ можно разными способами. Единственное неудобство, это после ввода текста голосом, требуется нажимать на стрелку, чтобы перенести его во второе поле.

4. Программа голосового набора . Несмотря на скромный дизайн, этот сервис идеально справляется со своей задачей и предлагает самый продвинутый функционал. На сайте есть видео уроки по использованию системы, а также предлагается скачать плагин для браузера.

На сегодняшний день любой персональный компьютер является универсальным инструментом, позволяющим различным пользователям работать и общаться. При этом людям с ограниченными возможностями может быть неудобно использовать базовые средства ввода, отчего возникает необходимость организации ввода текста с помощью микрофона.

Первая и наиболее значимая оговорка, которую необходимо сделать, заключается в том, что ранее мы уже рассматривали тему управления компьютером при помощи специальных голосовых команд. В той же статье нами были затронуты некоторые программы, способные помочь вам в решении поставленной в данной статье задачи.

Для ввода текста путем произношения используется более узконаправленное программное обеспечение.

Прежде чем перейти к рекомендациям в рамках этой статьи вам следует обзавестись достаточно качественным микрофоном. Кроме того, может потребоваться дополнительная настройка или калибровка звукозаписывающего устройства путем выставления специальных параметров через системные инструменты.

Только после того, как вы будете уверены в полностью исправной работе вашего микрофона, следует переходить к методам решения задачи голосового ввода текстовых символов.

Способ 1: Онлайн-сервис Speechpad

Первый и наиболее примечательный метод организации голосового ввода текста заключается в использовании специального онлайн-сервиса. Для работы с ним от вас потребуется скачать и установить интернет-обозреватель Google Chrome .

Сайт довольно часто бывает перегружен вследствие чего могут быть проблемы с доступом.

Разобравшись со вступлением, можно переходить к описанию возможностей сервиса.

  1. Откройте главную страницу официального сайта голосового блокнота, используя представленную нами ссылку.
  2. При желании вы можете изучить все основные нюансы работы данного онлайн-сервиса.
  3. Пролистайте страницу до основного блока управления функционалом голосового ввода текста.
  4. Вы можете настроить работу сервиса удобным для вас образом, используя блок с настройками.
  5. Рядом со следующим полем нажмите кнопку «Включить запись» для инициализации процесса голосового ввода.
  6. По факту успешного ввода воспользуйтесь кнопкой с подписью «Отключить запись» .
  7. Каждая набранная фраза будет автоматически перемещена в общее текстовое поле, позволяющее выполнять некоторого рода операции над содержимым.

Затронутые возможности, как можно заметить, значительно ограничены, но при этом вполне позволят вам набирать большие блоки текста.

Способ 2: Расширение Speechpad

Данная разновидность голосового ввода текста является прямым дополнением к ранее расписанному методу, расширяя функционал онлайн-сервиса буквально на любые другие сайты. В частности, такой подход к реализации голосового написания текста может быть интересен людям, которые по каким-либо причинам не могут использовать клавиатуру при общении в социальных сетях.

Расширение Speechpad стабильно работает исключительно с браузером Google Chrome, равно как и онлайн-сервис.

Переходя непосредственно к сути способа, от вас потребуется выполнить ряд действий, заключающихся в скачивании и последующей настройке нужного расширения.

Теперь можно заняться рассмотрением основных возможностей данного расширения, начиная с параметров работы.

  1. Кликните по иконке расширения левой кнопкой мыши, чтобы открыть основное меню.
  2. В блоке «Язык ввода» можно выбрать базу данных определенного языка.
  3. Поле «Код языка» выполняет точно такую же роль.

  4. Установите галочку «Продолжительное распознавание» , если нужно самостоятельно контролировать процесс завершения ввода текста.
  5. О прочих особенностях данного дополнения вы можете узнать на официальном сайте Speeachpad в разделе «Помощь» .
  6. Завершив выставление настроек, воспользуйтесь клавишей «Save» и перезапустите веб-обозреватель.
  7. Чтобы воспользоваться возможностями голосового ввода, кликните правой кнопкой мыши по любому текстовому блоку на веб-странице и через контекстное меню выберите пункт «SpeechPad» .
  8. По необходимости подтвердите разрешение использования микрофона браузером.
  9. В случае успешной активации возможности голосового ввода текстовая графа будет окрашена в специальный цвет.
  10. Не снимая фокуса с текстового поля, произнесите текст, который необходимо ввести.
  11. При активированной возможности продолжительного распознавания вам потребуется повторно кликнуть по пункту «SpeechPad» в контекстном меню ПКМ.
  12. Работать данное расширение будет практически на любом сайте, включая поля ввода сообщений в различных социальных сетях.

Рассмотренное дополнение, по сути, является единственным универсальным способом голосового ввода текста буквально на любом веб-ресурсе.

Описанные возможности – это весь функционал расширения Speechpad для браузера Google Chrome, доступный на сегодняшний день.

Способ 3: Онлайн-сервис Web Speech API

Данный ресурс не сильно отличается от ранее рассмотренного сервиса и выделяется крайне упрощенным интерфейсом. При этом заметьте, что функционал Web Speech API является основой такого явления, как голосовой поиск от Google с учетом всех побочных нюансов.


На этом все возможности данного веб-ресурса заканчиваются.

Способ 4: Программа MSpeech

Затрагивая тему голосового ввода текста на компьютере, попросту нельзя игнорировать программы специального назначения, одной из которых является MSpeech. Основная особенность данного софта заключается в том, что распространяется этот голосовой блокнот по бесплатной лицензии, но не ставит особо значимых ограничений перед пользователем.


Данный софт не должен вызвать у вас проблем в процессе эксплуатации, так как все возможности детально описаны на указанном в начале метода сайте.

Расписанные в статье способы являются наиболее популярными и удобными решениями задачи голосового ввода текста.

Голосовой ввод текста в редакторе Word – очень удобный и продвинутый инструмент. Но о нём знают не многие. Это не удивительно, поскольку технология была запущена относительно недавно: 27 июня 2017 года на официальном сайте Microsoft появилась новость, в которой они сообщили о новой возможности.

По умолчанию эта функция в программе «Ворд» отсутствует и никакие обновления не помогут. Для этой цели нужно использовать сторонний сервис .

Данное дополнение позволяет вводить текст при помощи голоса более чем на 20 языках. Более того, оно может переводить слова в режиме онлайн на 60 различных языков. И самое главное – этот сервис полностью бесплатный.

Для того чтобы в вашем офисе появилась возможность надиктовки, нужно выполнить следующие шаги.

  1. Откройте официальную страницу разработчиков. Нажмите на ссылку «Download for Office 32-bit» или на «For Office 64-bit click here».

Для того чтобы определить разрядность своей системы и скачать правильную версию программы, нажмите на горячие клавиши Win +Pause/Break .

  1. Нажмите на кнопку «Сохранить».

  1. Запустите скачанный файл.

  1. Нажмите на кнопку «Next».

  1. Соглашаемся с лицензионным соглашением и кликаем на «Next».

  1. Затем на кнопку «Install».

  1. После небольшого ожидания завершаем установку нажатием на «Finish».

  1. Запускаем редактор Word и переходим на вкладку «Dictation».

  1. Если вы не собираетесь переводить текст, то в обоих полях выберите русский язык.

  1. Убедитесь, что у вас подключен микрофон и он работает. Сделайте правый клик по иконке со звуком.

  1. Выберите пункт «Записывающие устройства».

  1. Скажите что-нибудь в микрофон. При этом шкала должна загореться. Если ничего не происходит – это плохо. Значит, устройство выключено или не работает.
  2. Убедитесь, что именно этот микрофон указан по умолчанию. В противном случае набор текста будет невозможен.

Задать устройство по умолчанию можно при помощи контекстного меню (нужно сделать правый клик по выбранному пункту).

  1. Если всё хорошо, то нажмите на кнопку «OK».

  1. Возвращаемся в редактор «Ворд». Для того чтобы начать набирать текст при помощи голосовых команд, нужно всего лишь кликнуть на иконку «Start».

  1. Попробуем сказать что-нибудь.

  1. Всё работает отлично. Согласитесь, так печатать текст намного удобнее и проще. А самое главное – это очень быстро. Для остановки записи нужно нажать на кнопку «Stop».

Запись автоматически отключается, если вы длительное время не обращались к вордовскому документу (находились в другом приложении) или молчали.

Системные требования

Для того чтобы использовать это дополнение, и забыть, что такое «писать от руки», необходимо чтобы на компьютере был установлен «Net Framework 4.5» или новее. Если данное ПО у вас отсутствует или вы не можете это определить (факт установки на ПК), нужно будет выполнить следующие действия.

  1. Перейдите на официальный сайт Microsoft. Как только вы откроете эту страницу, нужно будет нажать на ссылку скачать.

  1. После этого вам предложат установить дополнительные обновления.
  2. Нажмите на кнопку «Отказаться».

  1. Запустите скаченный файл.
  2. Далее возможны два варианта: сообщение о том, что Net Framework уже установлен или стартовая страница установки.
  3. В данном случае мы видим, что кнопка «Продолжить» не активна. И при этом нам говорят, что на этом компьютере всё в порядке.

В противном случае нужно будет просто нажать на кнопку «Продолжить» и дождаться окончания процесса установки.

Заключение

В данной статье мы рассказали, как активировать речевой ввод текста в программе Microsoft Word. Если у вас что-то не получилось, возможно, ваша операционная система не соответствует требованиям или же вы неправильно подключили микрофон.

Обратите внимание на то, что качество записи текста зависит от того, насколько четко и внятно вы будете произносить слова.

Видеоинструкция

Если у вас всё равно не получается набрать текст при помощи голосового ввода, попробуйте посмотреть этот видеоролик. Возможно, дополнительные советы вам помогут устранить свои проблемы.