Голосовой набор онлайн. Я говорю — компьютер печатает текст! Фантастика!!! Расширение для браузера Войснот II

Если Вы слишком медленно печатаете на клавиатуре, а учиться десятипальцевому методу набора лень, можете попробовать воспользоваться современными программами и сервисами голосового ввода текста.

Клавиатура, бесспорно, достаточно удобный инструмент управления компьютером. Однако, когда дело доходит до наборки длинного текста, мы понимаем всё её (а, если быть честными, то наше:)) несовершенство... На ней ещё нужно уметь быстро печатать!

Пару лет назад я, желая упростить себе работу по написанию статей, решил найти такую программу, которая бы позволяла преобразовать голос в текст. Я думал, как было бы хорошо, если бы я просто говорил всё что нужно в микрофон, а компьютер печатал вместо меня:)

Каково же было моё разочарование, когда я понял, что на тот момент никаких реально работающих (а тем более бесплатных) решений для этого дела не существовало. Были, правда, отечественные разработки, вроде "Горыныча" и "Диктографа". Они понимали русский язык, но, увы, качество распознавания речи имели довольно низкое, требовали долгой настройки с созданием словаря под свой голос, да ещё и стоили довольно недёшево...

Потом на свет появился Android и ситуация немного сдвинулась с мёртвой точки. В этой системе голосовой ввод появился в качестве встроенной (и довольно удобной) альтернативы ввода с виртуальной экранной клавиатуры. И вот недавно в одном из комментариев меня спросили, есть ли возможность голосового ввода для Windows? Я ответил, что пока нет, но решил поискать и оказалось, что, может и не совсем полноценная, но такая возможность существует! О результатах моих изысканий и будет сегодняшняя статья.

Проблема распознавания речи

Перед тем как начать разбор существующих на сегодняшний день решений для голосового ввода в Windows, хотелось бы немного осветить суть проблемы распознавания речи компьютером. Для более точного понимания процесса предлагаю взглянуть на следующую схему:

Как видим, преобразование речи в текст происходит в несколько этапов:

  1. Оцифровка голоса . На этом этапе качество зависит от чёткости дикции, качества микрофона и звуковой карты.
  2. Сравнение записи с записями в словаре . Здесь работает принцип "чем больше - тем лучше": чем больше записанных слов содержит словарь, тем выше шансы того, что Ваши слова будут распознаны правильно.
  3. Вывод текста . Система автоматически, ориентируясь по паузам, пытается выделить из потока речи отдельные лексемы, соответствующие шаблонным лексемам из словаря, а затем выводит найденные соответствия в виде текста.

Главная проблема, как нетрудно догадаться, кроется в двух основных нюансах: качестве оцифрованного отрезка речи и объёме словаря с шаблонами. Первую проблему реально минимизировать даже при наличии дешёвого микрофона и стандартной звуковой карты. Достаточно просто говорить не спеша и внятно.

Со второй проблемой, увы, не всё так просто... Компьютер, в отличие от человека, не может корректно распознать одну и ту же фразу, сказанную, например, женщиной и мужчиной. Для этого в его базе должны существовать оба варианта озвучки разными голосами!

В этом и кроется основной подвох. Создать словарь для одного человека, в принципе, не так сложно, однако, учитывая, что каждое слово должно быть записано в нескольких вариантах, это получается очень долго и трудозатратно. Поэтому, большинство из существующих на сегодняшний день программ для распознавания речи либо стоят слишком дорого, либо не имеют собственных словарей, предоставляя пользователю возможность создать их самостоятельно.

Я не зря упомянул про Андроид чуть выше. Дело в том, что Гугл, который его разрабатывает, создал и единственный на сегодня общедоступный глобальный онлайн-словарь для распознавания речи (причём многоязычный!) под названием Google Voice API . Подобный словарь для русского языка также создаёт Яндекс, но пока он, увы, ещё непригоден для использования в реальных условиях. Поэтому практически все бесплатные решения, которые мы рассмотрим ниже, работают именно со словарями Google. Соответственно, все они имеют одинаковое качество распознавания и нюансы заключаются лишь в дополнительных возможностях...

Программы голосового ввода

Полноценных программ для голосового ввода под Windows не так уж много. Да и те, которые есть и понимают русский язык, в основном являются платными... Например, стоимость популярной пользовательской системы преобразования голоса в текст RealSpeaker стартует с отметки 2 587 руб, а профессионального комплекса Цезарь-Р аж с 35 900 руб!

Но среди всего этого дорогого софта имеется одна программка, которая не стоит и копейки, но при этом предоставляет функционал, более чем достаточний для большинства пользователей. Называется она MSpeech :

Основное окно программы имеет максимально простой интерфейс - индикатор уровня звука и всего три кнопки: включить запись, остановить запись и открыть окно настроек. Работает MSpeech также весьма просто. Вам нужно нажать кнопку записи, установить курсор в окно, в которое должен выводиться текст и начать диктовать. Для большего удобства запись и её остановку лучше производить горячими клавишами, которые можно задать в Настройках:

Кроме горячих клавиш Вам может потребоваться изменить тип передачи текста в окна нужных программ. По умолчанию установлен вывод в активное окно, однако, можно задать передачу в неактивные поля или в поля конкретной программы. Из дополнительных возможностей стоит отметить группу настроек "Команды", которая позволяет реализовать голосовое управление компьютером при помощи заданных Вами фраз.

Вообще же MSpeech - довольно удобная программа, которая позволяет набирать текст голосом в любом окне Windows. Единственный нюанс в её использовании - компьютер должен быть подключён к Интернету для доступа к словарям Гугла.

Голосовой ввод онлайн

Если Вам не хочется устанавливать на свой компьютер никаких программ, но есть желание попробовать вводить текст голосом, можете воспользоваться одним из многочисленных онлайн-сервисов, которые работают на базе всё тех же словарей Гугла.

Ну и, естественно, первым делом стоит упомянуть о "родном" сервисе Google под названием Web Speech API :

Этот сервис позволяет переводить в текст неограниченные отрезки речи на более чем 50 языках! Вам достаточно просто выбрать язык, на котором Вы говорите, нажать на иконку микрофона в правом верхнем углу формы, при необходимости подтвердить разрешение на доступ сайта к микрофону и начать говорить.

Если Вы не используете какую-либо узкоспециализированную терминологию и говорите внятно, то сможете получить весьма неплохой результат. Кроме слов сервис "понимает" ещё и знаки препинания: если Вы скажете "точка" или "запятая", необходимый знак появится в форме вывода.

По окончании записи распознанный текст будет автоматически выделен и Вы сможете скопировать его в буфер обмена или отправить по почте.

Из недостатков стоит отметить лишь возможность работы сервиса только в браузере Google Chrome старше 25-й версии, а также отсутствие возможности мультиязычного распознавания.

Кстати, на нашем сайте вверху Вы найдёте полностью русифицированную версию этой же формы распознавания речи. Пользуйтесь на здоровье;)

На базе сервиса Гугла существует достаточно аналогичных онлайн-ресурсов распознавания речи. Одним из представляющих для нас интерес можно назвать сайт Dictation.io :

В отличие от Web Speech API, Dictation.io имеет более стильное оформление в виде блокнота. Основным его преимуществом перед сервисом Гугла является то, что он позволяет остановить запись, а затем снова запустить и при этом введённый ранее текст сохранится пока Вы сами не нажмёте кнопку "Clear".

Как и сервис Google Dictation.io "умеет" ставить точки, запятые, а также восклицательный знак и знак вопроса, но не всегда начинает новое предложение с большой буквы.

Если же Вы ищете сервис с максимальным функционалом, то, наверное, одним из лучших в этом плане будет :

Главные преимущества сервиса:

  • наличие русскоязычного интерфейса;
  • возможность просмотра и выбора вариантов распознавания;
  • наличие голосовых подсказок;
  • автоотключение записи после длительной паузы;
  • встроенный текстовый редактор с функциями копирования текста в буфер обмена, распечатки его на принтере, отправки по почте или в Твиттер и перевода на другие языки.

Единственным недостатком сервиса (кроме уже описанных общих недостатков Web Speech API) является не совсем привычный для подобных сервисов алгоритм работы. После нажатия кнопки записи и надиктовки текста, его нужно проверить, выбрать вариант, наиболее соответствующий тому, что Вы хотели сказать, а затем перенести в текстовый редактор внизу. После чего процедуру можно повторить.

Плагины для Хрома

Кроме полноценных программ и онлайн-сервисов, существует ещё один способ распознать речь в текст. Этот способ реализовывается за счёт плагинов для браузера Google Chrome.

Главным преимуществом использования плагинов является то, что с их помощью Вы можете вводить текст голосом не только в специальной форме на сайте сервиса, но и в любом поле ввода на любом веб-ресурсе! Фактически плагины занимают промежуточную нишу между сервисами и полноценными программами для голосового ввода.

Одним из лучших расширений для перевода речи в текст является SpeechPad :

Не совру, если скажу, что SpeechPad - один из лучших русскоязычных сервисов перевода речи в текст. На официальном сайте Вы найдёте довольно мощный (хоть и немного староватый дизайном) онлайн-блокнот со множеством продвинутых функций, среди которых есть:

  • поддержка голосовых команд управления компьютером;
  • улучшенная поддержка расстановки знаков препинания;
  • функция отключения звуков на ПК;
  • интеграция с Windows (правда, на платной основе);
  • возможность распознавания текста с видео или аудиозаписи (функция "Транскрибация");
  • перевод распознанного текста на любой язык;
  • сохранение текста в текстовый файл, доступный для скачивания.

Что же касается плагина, то он предоставляет нам максимально упрощённый функционал сервиса. Установите курсор в нужное Вам поле ввода, вызовите контекстное меню и нажмите на пункт "SpeechPad". Теперь подтвердите доступ к микрофону и, когда поле ввода станет розовым, надиктуйте нужный текст.

После того, как Вы прекратите говорить (пауза более чем в 2 секунды), плагин сам остановит запись и выведет в поле всё, что Вы сказали. При желании Вы можете зайти в настройки плагина (правый клик на иконке плагина вверху) и изменить параметры по умолчанию:

Как ни странно, но во всём Интернет-магазине расширений Гугла мне больше не попалось ни одного стоящего плагина, который бы позволял реализовать голосовой ввод в любом текстовом поле. Единственным похожим расширением было англоязычное . Оно добавляет иконку микрофона ко всем полям ввода на веб-странице, но не всегда правильно располагает её, поэтому она может оказаться вне экрана...

Здравствуйте, уважаемые читатели. Сегодня я подробно расскажу про технические настройки и нюансы речевого набора текста голосом на компьютере. Как вы знаете способ, который я предложил в своём бесплатном видеокурсе « » — является мобильным и не требует наличие компьютера и платных программ. По многочисленным письмам можно судить, что курс очень понравился. Но также есть много вопросов, — А как набирать тексты голосом на компьютере? Причём из писем я понимаю, что интересен не, только способ набора текста голосом на компьютере, но и перевод аудио в текст.

Конечно, в комментариях и письмах я отвечал и рекомендовал единственный, на мой взгляд, подходящий для этого онлайн сервис «Блокнот для речевого ввода ». И теперь я уже получаю письма с просьбой рассказать о технических настройках компьютера (микрофона и звуковой карты) и как аудио перевести в текст.

В общем, секрет работы с данным сервисом очень прост, — у вас должен быть хороший, чувствительный микрофон. Иначе, качество распознания очень сильно хромает. Но и на этот случай есть выход.

1. Набор текста через микрофон.

2. Набор текста через виртуальный аудио кабель.

Прежде чем приступить к набору текста голосом при помощи голосового блокнота, нужно сделать кое какие настройки браузера Google Chrome. На данный момент, только в этом браузере доступна возможность набирать текст голосом. Нам понадобится установить два дополнительных расширения.

Как набрать текст голосом в голосовом блокноте

Для первого способа, дополнительных настроек делать не надо. Всё готово к набору текста голосом через голосовой блокнот.

Переходим на главную страницу блокнота, выставляем нужные параметры, и можно диктовать текст голосом. Иконка микрофона используется для ввода отдельных фраз или предложений. Для непрерывного ввода текста используйте кнопку «Включить запись».

Примечание: при первой попытке набрать текст голосом в верхней части браузера появится предупреждение с запросом на доступ к микрофону. Вам нужно нажать на кнопку «Разрешить».

Как заполнять любые поля и формы голосом в браузере Google Chrome

С помощью установленного ранее расширения «Голосовой ввод текста» Вам доступна функция заполнения любых полей в браузере. Например, в регистрационной форме или оставляя комментарий.

Для того чтобы заполнить отдельное поле в форме, — нажмите правую кнопку мышки в данном поле и в контекстно-зависимом меню выберите пункт «SpeechPad».

Разрешите доступ к микрофону и диктуйте текст.

А если вам нужно надиктовать несколько предложение, к примеру, комментарий или сообщение на форуме, нужно выполнить следующие действия.

Нажать правую кнопку мышки рядом с полем для ввода и выбрать в контекстно-зависимом меню все тот же пункт «SpeechPad». Но на этот раз откроется новое окно и включится запись. Диктуйте текст, а затем используя буфер обмена перенесите текст в нужную форму.

Комбинация клавиш для работы с буфером обмена:

Ctrl+A – выделить текст

Ctrl+C – скопировать в буфер обмена

Ctrl+V – вставить из буфера обмена

Вот так вот без особых хитрых настроек, при наличии доступа в Интернет можно вводить текст голосом на компьютере. Качество распознания будет зависеть от микрофона и Вашей дикции.

А теперь разберём возможность перевода аудио в текст. Этот метод называется – транскрибация. Данный сервис позволяет переводить аудио в текст из звуковых и видео файлов. И опять же упор делается на хороший микрофон.

Но в технических характеристиках микрофонов я не разбирался, и говорить какой хороший а какой нет, не стану. Скажу лишь, что у меня был обычный настольный микрофон Genius и он меня устраивал. Ещё вчера я начал подготовку к данной статье с использование этого микрофона, ошибок при распознании голоса было не много. За ночь, наш домашний питомец (кот) совершил диверсию и перегрыз провод микрофона. Не подумайте, что только микрофона, — нет, не только.

И для продолжения подготовки к статье я воспользовался наушниками с микрофоном. И должен сказать, это просто земля и небо. Микрофон на наушниках, — это просто труба. Толи от старости, толи он такой убогий и был, ну это просто убийца нервных клеток. Так, что делайте выводы.

Ну, да ладно, давайте переходить в к выполнению поставленной задачи.

Как преобразовать аудио в текст

Способ №1

Данный способ, не требует ни каких настроек. Принцип заключается в следующем. Вы воспроизводите звуковой файл или видео, звук идёт через колонки, а микрофон захватывает звук из колонок. Вы также можете включить запись на диктофоне или смартфоне, и микрофон будет захватывать звук с этих устройств.

Сервис предоставляет возможность захвата аудио из видео YouTube, видео файлов и аудио файлов. Видео и аудио файлы при этом могут быть расположены как в интернете, так и на Вашем компьютере.

Для начала, рассмотрим пример открытия видео с YouTube. Для этого потребуется ID данного видео. Этот ID нужно вставить в поле «URL медиа файла для проигрывания» и нажать кнопку «Обновить».

Такой уникальный ID есть у каждого видео на YouTube. Увидеть его можно в адресной строке браузера.

Теперь рассмотрим пример с открытием файла на вашем компьютере.

Сначала указываете тип файла, аудио или видео. Затем нажимаете на кнопку «Выберите файл» и выберите файл на компьютере. Выбрав файл, нажимаете кнопку «Открыть».

Следующим этапом располагаете, микрофон рядом с колонками вашего компьютера или скажем диктофоном или смартфоном, и включаете запись.

Способ №2

Данный способ позволяет исключить микрофон из цепочки преобразования аудио в текст. Звук будет напрямую передаваться из проигрывателя в голосовой блокнот. И уже не важно, какой у вас микрофон.

Но для этого потребуется отдельная программа — Virtual Audio Cable . Данная программа создаёт виртуальный аудио кабель и передаёт аудиопоток между приложениями. Программа эта платная, стоит от 25$ до 50$. Но можно воспользоваться бесплатной версией. В бесплатной версии есть ограничение на количество виртуальных кабелей. Можно создать только 3 кабеля. А ещё женский голос постоянно напоминает, что это бесплатная версия если использовать аудиорепитер. Но скажу вам честно, можно обойтись и без него. Зато пробная версия не ограничена по времени. В видеоуроке я покажу, в чем хитрость.

Итак, для начала скачиваем программу «Виртуальный аудио кабель», ссылка выше.

После того, как вы скачаете архивный файл на компьютер, его нужно распаковаться. Для этого можно воспользоваться архиватором или простым копирование файлов из архива в новую папку.

Установка программы VAC

Установка стандартная и не потребует от вас дополнительных знаний и умений. Просто следуйте указаниям мастера установки.

Теперь Вы ни звука не услышите из ваших колонок, зато весь звук через виртуальный аудио кабель будет передаваться в голосовой блокнот. То, что нам и нужно.

Примечание: если вы всё же захотите слышать звук, тогда следует перейти в папку, куда вы распаковали архив программы и запустить аудиорепитер. Указав в качестве устройства ввода виртуальный кабель, а в качестве устройства вывода колонки.

На этом все технические моменты набора текста голосом на компьютере, с помощью голосового блокнота, раскрыты. Если, что то рассказал не понятно, пишите в комментариях, постараюсь дополнить и помочь советом. А ещё, если писать статьи на сайт, самостоятельно вы не можете по какой-то причине, то можно на бирже. Сегодня так поступают многие владельцы сайтов, доверяя дело профессионалам.

Всем желаю удачи.

У многих пользователей, чья деятельность занята с наборами больших объёмов текста, часто возникает желание как-то ускорить данный процесс. Кто-то оттачивает метод слепой печати, кто-то подключает людей со стороны (диктовка, параллельный набор разных отрезков текста), а кто-то использует современные новации, уже ставшие обыденностью нашей жизни. Среди последних особое место занимает голосовой набор текста, позволяющий значительно ускорить процесс тайпинга. В этой статье я расскажу, как осуществить голосовой набор текста онлайн на компьютере, какие ресурсы нам в этом помогут, и как воспользоваться их функционалом.

Желая осуществить набор текста голосом важно учитывать, что практически все существующие сегодня онлайн-сервисы используют в своей работе движок от Google, который поддерживается только браузером Google Chrome . Первая часть подборки сервисов в прошлой . Попытка запустить данные сервисы на браузерах с принципиально иной структурой (например, Mozilla) обычно заканчиваются ничем, вам просто порекомендуют установить Хром и работать с его функционалом. И это в полной мере касается как отечественных, так и зарубежных онлайн-сервисов.

Соответственно, качество восприятия текста различных ресурсов находится на сопоставимом уровне. При этом рекомендуется использовать качественный внешний микрофон, установить оптимальные настройки микрофона на ПК, проговаривать текст громко и отчётливо.

Что относится самого набирания текста, то методика реализации крайне проста, и не вызовет никаких проблем. Обычно вы переходите на соответствующий сетевой ресурс, выбираете язык набора текста и задействуете микрофон. Произносите речь, выключаете микрофон и проверяете полученный текст на наличие ошибок. Затем текст может быть сохранён, скопирован в текстовый редактор и так далее.


Перейдём к непосредственному описанию сервисов, позволяющих осуществить голосовой набор текста онлайн.

Сервис Speechpad записывает текст в блокнот через микрофон

  1. Популярный сервис для набора текста голосом онлайн, работающий с браузером Хром. Для работы с ним необходимо перейти на сайт https://speechpad.ru/ .
  2. Выбрать язык голосового ввода (по умолчанию – русский), определиться с рядом смежных настроек.
  3. Для начала работы необходимо нажать на кнопку «Включить запись» и начать произносить текст, максимально чётко, называя словами знаки препинания (например, «запятая», «восклицательный знак» и так далее).
  4. После окончания вербального набора текста проверьте текст на наличие ошибок, а затем перенесите (скопируйте) его туда, куда вам необходимо (помогут, к примеру, стандартные команды «Копировать» – «Вставить»).

Сервис August4u озвучки голосом текста

  1. Аналогичный описанному выше сервис august4u.net , выполняющий набор текста онлайн голосом.
  2. Система настроек здесь крайне проста – выбираете язык набора (кликнув по соответствующему флагу), активируете преобразование фраз в знаки препинания (соответствующая кнопка), нажимаете на значок микрофона справа и диктуете текст.
  3. После окончания набора текста вновь жмёте на иконку микрофона, тем самым прекращая набор.
  4. Затем проверяете текст на ошибки, и если всё нормально, то сохраняете текст к себе на ПК или пересылаете по е-мейлу (помогут соответствующие кнопки).

Голосовой набор текста с помощью Vorabota

Ещё один отечественный сервис Vorabota , также работающий под Google Chrome. Регламент работы с ним похож на предыдущие сервисы – выбираете язык ввода, нажимаете на иконку микрофона справа и наговариваете текст. Для окончания набора вновь жмёте микрофон, проверяете текст на ошибки и копируете куда вам необходимо.


Перевод аудио в текст с Dictation.io

Англоязычный ресурс Dictation.io, с функционалом похожим на упомянутые выше.

  1. Для работы с ним необходимо выполнить вход на него https://dictation.io/ , в самом низу экрана выбрать язык диктовки, затем нажать на клавишу «Start Dictation» и начать наговаривать текст.
  2. Для прекращения набора необходимо вновь нажать на упомянутую клавишу.
  3. Для очистки текста нужно нажать на клавишу «Clear», клавиша «Save» позволит сохранить ваш текст, а клавиша «Сopy» — скопирует текст в буфер обмена.

Расширения и дополнения для браузера Хром

В магазине Хром также можно скачать расширения (дополнения), которые устанавливаются в браузер Хром, и дополняют его функционал голосовым набором текста. Установив такое расширение (его значок появится в панели управления браузера справа), вам будет необходимо сначала определиться с языком ввода и другими настройками (кликаем на соответствующий значок расширения в панели управления).

Чтобы воспользоваться функционалом приложения нужно установить курсор в место набора теста, кликнуть правой клавишей мыши, выбрать в появившемся меню опцию установленного расширения (например, Speechpad) и начать диктовку текста голосом онлайн.

Расширение Speechpad переводит речь в текст

Расширение от уже упомянутого мной сетевого сервиса – Speechpad для Гугл Хром. После установки данного расширения в браузер вы сможете осуществлять голосовой набор, установив курсор в нужное место, кликнув правой клавишей мыши и выбрав в появившемся меню опцию «Speechpad».

Дополнение Войснот II с голосовым блокнотом

Войснот II – сервис для браузера Chrome, предназначенный для набора голосом онлайн. После установки данного сервиса он появится в списке сервисов данного браузера, туда можно перейти, набрав в адресной строке: chrome://apps/ и нажав ввод.

После клика на соответствующий значок сервиса открывается новое окно, в котором вы можете осуществить голосовой набор текста, для чего необходимо кликнуть на кнопочку с изображением микрофона.

Вконтакте

Сейчас без компьютера просто нереально обойтись в современном мире. От вас не требуется быть мастером фотошопа или профессионально монтировать видео (если это не связано с работой, конечно). Но суметь набрать какой-нибудь текст – это необходимый минимум.

№2. Web Speech API

Онлайн-программа Web Speech API по функционалу абсолютно идентична предыдущим.

Этот сервис, как и перечисленные выше, также был создан компанией Google.

Главная страница выглядит так:


В простом интерфейсе сразу очевидно, что для начала записи необходимо выбрать язык, а после нажать на микрофон.

После того как вы нажмете на значок справа, система обязательно сделает запрос на доступ.


После того как вы «дадите добро», можно сразу приступать к работе. Набирайте текст голосом, а его печатная версия будет появляться в окошке.

После окончания работы текст можно скопировать туда, куда вам необходимо (опять же таки – ctrl+C, ctrl+V).

№3. Talktyper


Не менее простая программа – это Talktyper.

Для начала работы перейдите на сайт: https://talktyper.com/ru/index.html.


Для начала работы достаточно нажать на значок микрофона справа.

В отличие от описанных выше, данный наборщик текста можно открывать с помощью любого браузера. Хотя сайт создан в США, приложение легко распознает самые популярные языки мира, в том числе и русский.

Talktyper многофункциональный: он не только набирает текст, но и ставит знаки препинания, исправляет самостоятельно ошибки. Если какое-то начитанное вами слово система не может распознать, как правильное, то оно обязательно высветится.

Кроме того, Talktyper имеет функцию перевода, а также его озвучивания.

Обратите внимание! После того как вы закончите голосовой набор текста, обязательно нажмите на стрелочку, чтобы набранный документ был перенесен в другое поле. После этого его можно будет отправить по электронной почте или скопировать в нужный файл.

Возможные проблемы при работе с программами голосового набора

Когда вы начнете использовать эти программы, то обязательно задумаетесь, как же компьютер распознает наш голос, а после еще переводит в живой текст.

Схема распознавания речи устройством выглядит так:

Весь процесс можно разделить на 3 главных этапа:

    Акустический распознаватель.

    Важно говорить четко, громко, микрофон должен передавать голос без перебоев.

    Лингвистическая обработка.

    Чем больше в словаре программы есть слов, тем качественнее будет набранный текст. То есть, все вами сказанное будет опознаваться и передаваться в текстовом виде без искажения.

    Распознанный орфографический текст.

    Программа в автоматическом режиме выводит на экран орфографическую версию надиктованной речи, опираясь на паузы, четкость слов, найденные лексемы в словаре и т.д.

При работе с компьютерными наборщиками текста чаще всего возникает 2 проблемы:

  1. Акустический распознаватель «улавливает» вашу речь с перебоями.
  2. В словаре системы недостаточно слов, чтобы распознать всё, сказанное вами.

Чтобы решить первую проблему, необходимо четко и громко говорить. А вот для второй проблемы решения практически не существует, по крайней мере, бесплатного.

Версии программ распознавания речи, которые распространяются свободно, имеют очень скупой словарный запас.

Чтобы обеспечить программе обширный запас слов разработчикам требуется вложить немало денег, поэтому многие распознаватели демонстрируют низкий уровень перевода речи в текст.

Дальше всех в этом деле продвинулась компания Google, т.к. имеет достаточно средств для инвестиций. Эта компания, кроме прочего, создала самый большой онлайн-словарь, который помогает распознавать голос и переводить его в графическую версию.

Смотрите подробное руководство в этом ролике:

  1. Когда вы произносите речь, в комнате должно быть тихо. Звуки природы, музыка, плач ребенка воспринимаются системой, как шум. Из-за этого текст будет набран с большими ошибками.
  2. Не говорите, если что-то едите. Это не только скажется на качестве набора, но и опасно для жизни к тому же.
  3. Перед началом работы нужно подобрать правильную громкость вашего голоса, а также понять какая чувствительность у вашего микрофона.

    Для этого попробуйте записать несколько предложений привычным тоном. Если в записи будут перебои, обратитесь к настройкам микрофона.

  4. Делайте небольшие паузы между словами.
  5. Избегайте длинных фраз.

Кто-то скажет, что программа для голосового набора – это прекрасный помощник, который освободил им руки и облегчил жизнь в целом. Другие решат, что «овчинка выделки не стоит». Потому выбрать, стоить ли их использовать, вам предстоит самостоятельно.

А уж из каких сервисов выбирать, вы уже знаете…

Каждый день в мире создается большое количество информации, в интернете же её миллиарды. Те пользователи, которые работают над написанием документов могли бы многократно ускорить этот процесс и дать отдохнут своим глазам, пристально смотрящим в монитор. Как вы уже догадались, речь пойдет о возможности, которую называют голосовой ввод текста . Сейчас мы разберемся, что это за зверь такой и где его можно применить, а главное – как?

Сразу скажу, что набирание слов голосом применяется везде, где нужно набрать документ, как бы банально это не звучало. Для этого есть специальные программы, сервисы в интернет и даже приложения для . По сути на смартфонах уже есть встроенная функция, позволяющая набрать любую фразу и слово голосом, об этом я тоже расскажу.

Голосовой набор текста с помощью онлайн сервисов

Разберем парочку сервисов, которые осуществят наши желания, погнали.

vorabota.ru

Просто заходите на указанный ресурс и видите обычное поле для набора, только писать туда придется голосом, ручками не выйдет. Необходимо настроить микрофон и нажать на соответствующий значок справа вверху поля. Он будет мигать красным светом, а вы в этом время должны говорить.

Хочу сказать сразу – знаки препинания данный сервис не ставит, поэтому их нужно проговорить самому, некоторые атрибуты ставить он тоже не способен, например, тире, проценты, скобочки и прочее. Можно говорить на любом из указанных языков. После того, как вы проговорили текст его можно скопировать и вставить.

speechpad.ru

Этот сервис точно также позволяет ввести голосом текст. Для этого нужно нажать кнопку «Включить запись» . Дальше вы проговариваете слова. Тут уже настроек побольше, например, все необходимые знаки препинания можно проставить с помощью указанных кнопок.

Полученный документ можно скачать в формате txt, для этого там имеется специальная кнопка.


august4u.net

Зайдя на сайт, можно увидеть много цветовых решений, но мне это особо не помешало. Нашему взору открывается окошко с фразами, которые нужно проговаривать, чтобы поставить тот или иной знак. Речь обычно понимает на ура, поэтому проблем не будет. Если ввелась не та фраза или слово, вы бузе проблем можете удалить её.

Чтобы заново открыть справку, на панели управления нажмите значок вопросительного знака. Чтобы запустить запись, нажмите на знак микрофона. Доступен набор на нескольких языках.


dictation.io

Очень минималистичный ресурс, которые очень хорошо выполняет свои задачи. Для записи голоса достаточно выбрать язык, на котором будете говорить и нажать кнопку «Start Dictation» .

Чтобы скопировать слова нужно нажать кнопочку «Copy», а, чтобы сохранить – «Save». Очистка поля выполняется клавишей «Clear».


talktyper.com

Из всех вышеуказанных вариантов данный является самым худшим. Почему? Когда мы нажимаем на кнопку микрофона, чтобы начать говорить, он набирает парочку слов, а после того, как мы замолчали, микрофон как бы отключается и нужно еще раз нажать на значок. Перед этим, введенные слова окажутся в верхнем поле, и чтобы они сохранились нужно их перенести в нижнее – большое поле. Для этого служит кнопка в виде большой строчки «Принять надиктованный текст» .

Как и в других сервисах слова можно удалять и редактировать. По необходимости содержимое можно скопировать, распечатать, отправить по E-mail.


Google Документы

Этот онлайн-сервис работает, как через браузер, так и на смартфонах под управление Android, достаточно установить туда приложение «Документы» от Google.

Итак, чтобы начать набор документа через браузер в Google Документы надо перейти на вкладку «Инструменты» и выбрать опцию «Голосовой ввод» . Либо нажать сочетание клавиш Ctrl+Shift+S.



Голосовой ввод с помощью программ на ПК

С сервисами закончили, перейдем непосредственно к программному обеспечению для компьютеров с Windows.

VOCO

Данную программку можно скачать и установить на компьютер. Нам обещают быстрое распознавание, автозамена при неправильно введённом слове, автоматическая простановка знаков пунктуации и распознаванием слов аудиофайлов.

Также в базе данных VOCO насчитывается больше 85 тысяч слов. А еще она работает без Интернета, что немало важно.

Программа конечно, хорошая, много полезнейших функций, которых нет в онлайн решения, и такая программа поставляется платно. Примерно за 1690 рубликов. Если брать в качестве бизнес-решения, то приобретение стоит 13900 рублей.

Перед приобретением стандартной версии, скачайте пробную и почитайте отзывы в Интернете.

MSpeech

Этот инструмент использует Google Voice API, позволяющий распознать голос человека. Распространяется бесплатно и имеет много возможностей. Интерфейс можно изменить на русскоязычный.

Расширения для браузера Chrome

Вообще, при наборе запроса в поисковике вы и так можете выбрать функцию голосового набора, но если вы хотите расширить функционал или попробовать другое, то представляю парочку расширений для браузера.

Speechpad

В магазине приложений в поиске можно найти это расширение. Теперь там, где есть поля для набора текста можно заполнять и с помощью голоса. Достаточно нажать по значку расширения.

VoiceNote II

Это уже дополнение, что-то типа плагина, который будет находиться не в разделе расширения, а по пути — chrome://apps.

Эта возможность призвана просто набрать документ в специальном поле, а потом делать любые действия с ним.


Достоинства и недостатки голосового набора

Плюсы:

  • Любой аудио и видео файл можно преобразовать в текст. Иногда это используют для заработка;
  • Не нужно напрягаться, постоянно бегая по клавишам. Проговаривая слова, вы осуществите это намного быстрее, а еще дадите отдохнуть глазам;
  • Мгновенная запись важных мероприятий и идей через голосовой ввод;

Минусы:

  • При наличии других звуков слова может плохо распознаваться;
  • Приложения для Android или расширения в основном работают по сети;
  • Некоторые сервисы не проставляют знаки препинания и приходится делать это самому;
  • С плохим микрофоном вы многого не наберете из-за плохой слышимости и качества;
  • Если не четко и ясно проговаривать слова, вы увидите много ошибок в своем тексте.

Недостатков вышло хоть и больше, но некоторые их них не значительны, тем более, в интернете можно найти инструменты, которые напрочь убивают все минусы, но это платные решения.

Можно смело сказать, что голосовой ввод это одна из современных возможностей, которая сильно облегчает жизнь человеку и ей есть куда развиваться. На работе и в офисе при наборе документов можно добиться значительной продуктивности, поэтому на технологию стоит обратить внимание.

Поделитесь с друзьями или сохраните для себя:

Загрузка...