Что такое расшифровка аудиозаписей
10 лучших сервисов для расшифровки аудио в текст
Транскрибация (расшифровка) – это метод перевода информации из аудио или видео в текстовый формат. Такой подход актуален для слабослышащих, при расшифровке интервью и создании субтитров (для тех, кому нужно посмотреть видеоролик или прослушать аудио без звука). Цель транскрибации – перевести речь в текстовый формат, который будет понятен любому человеку.
Для расшифровки аудио в текст сегодня используется профессиональный софт. О лучших программах для расшифровки аудио мы и поговорим в данной статье.
Google Docs
Google Docs – онлайн-сервис для работы с текстом и данными. Внутри платформы можно включить микрофон, который поможет перевести речь в письменный формат. Для его активации следует воспользоваться комбинацией клавиш Ctrl+Shift+S, затем выбрать язык и нажать на значок микрофона.
Увы, но сервис очень плохо справляется с тихой и шумной диктофонной записью, но отлично с диктовкой в микрофон. Главный недостаток – работает только в активном окне Google Docs, то есть наговорить что-то с другой вкладки или включить запись на компьютере не получится.
Плюсы:
Минусы:
Операционная система: Web
Ссылка на сервис: Google Docs
Google Keep
Google Keep – это мобильное приложение для заметок, с помощью которого можно также переводить голосовые записи в текст. Для этого нужно нажать на значок микрофона на панели инструментов. Разговор в аудиоформате будет сохранен вместе с расшифрованным текстом.
Для длительных записей Google Keep, к сожалению, не подойдет, потому что останавливает запись после коротких пауз в диалоге. Но его можно использовать, чтобы расшифровывать уже готовые записи по кускам.
По какой‑то причине распознавание голоса в Keep работает лучше, чем в Гугл-документах: приложение даже угадывает начало новой фразы и помечает его заглавной буквой.
Плюсы:
Минусы:
Операционная система: Android, iOS, Web
Ссылка на скачивание: Google Keep
Speechpad
Speechpad – бесплатный онлайн-инструмент, с помощью которого можно расшифровать голосовую запись. Работает исключительно со звуком из микрофона, поэтому следует позаботиться о качестве оборудования.
Поддерживается Google Chrome, но есть приложения для iOS и Android. Также возможна интеграция в Windows, Mac и Linux, чтобы обеспечить голосовой ввод в любом текстовом поле. Четкий звук понимает достаточно хорошо, плохой – крайне посредственно.
Плюсы:
Минусы:
Операционная система: Web
Ссылка на сервис: Speechpad
RealSpeaker
RealSpeaker – платный сервис для перевода аудиофайлов в текстовый контент. Работает исключительно с готовыми файлами, поэтому использовать микрофон, как в предыдущих случаях, не получится.
Перевод аудио в текст бесплатен только в том случае, если запись длится не более 1.5 минут. Далее – 8 руб. за минуту, максимальная продолжительность аудио – 180 мин. Поддерживается более 40 языков, включая русский.
Для работы с сервисом достаточно выбрать язык озвучки, загрузить файл, рассчитать время расшифровки и оплатить услугу.
Плюсы:
Минусы:
Операционная система: Web
Ссылка на сервис: RealSpeaker
Dictation
Dictation – бесплатный онлайн-сервис, позволяющий распознавать запись с микрофона. Понимает не только русские слова, но и десятки команд: тире, новую строку и так далее.
Из особенностей – это встроенный редактор, позволяющий форматировать текст, оформлять списки и делать много всего другого. Готовый текст можно отправить на почту, в социальные сети или просто сохранить на компьютере.
Из недостатков – распознает только качественную речь. Если запись была сделана на слабенький микрофон, то получить хороший результат не получится.
Плюсы:
Минусы:
Операционная система: Web
Ссылка на сервис: Dictation
oTranscribe
Бесплатный веб-сервис для ручной транскрибации текста. Работает как с аудио, так и видео, в том числе с YouTube-роликами. Открывает множество форматов: WAV, MP3, MPEG, WEBM и другие. Можно назначить горячие клавиши для управления воспроизведением. Есть автосохранение, простой текстовый редактор, интерактивные метки, упрощающие навигацию.
Плюсы:
Минусы:
Операционная система: Web
Ссылка на сервис: oTranscribe
Transcribe
Transcribe – это универсальный сервис, в котором можно расшифровать файл или самостоятельно надиктовать текст. Подписка стоит 20 долларов в год. Есть тестовый период на 7 дней, в течение которого можно безлимитно использовать ручную расшифровку и 30 минут пользоваться автоматической транскрибацией.
В редакторе готового текста можно расставить временные метки, а также прослушать интервью на замедленной скорости и исправить неправильно распознанные сервисом места.
Из особенностей можно отметить поддержку множества форматов – 3GP, AAC, AIF, AIFF, AMR, CAF, DSS, FLAC, M4A, MOV, MP3, MP4, OGG, WAV, WEBM, WMA, WMV. Максимальный размер файла – 6 Гб или 420 минут.
Плюсы:
Минусы:
Операционная система: Web
Ссылка на сервис: Transcribe
Dragon Dictation
Плюсы:
Минусы:
Операционная система: iOS
Ссылка на скачивание: Dragon Dictation
Speechnotes
Плюсы:
Минусы:
Операционная система: Web, Android
Ссылка на сервис: Speechnotes, на Android: Speechnotes
Otter
Последний в нашем списке инструмент для расшифровки аудио в текст – это Otter. Работает только с английским языком, но у сервиса есть отличительная особенность: он может запоминать голос диктора – такая возможность позволяет разделять реплики в записях с несколькими собеседниками.
Также можно загрузить аудио или видео с английской речью, в результате чего сервис выведет текст. Некоторые спорные моменты из-за произношения могут расшифровываться неправильно.
Программа будет полезна, если вы работаете с англоязычными источниками.
Плюсы:
Минусы:
Операционная система: Web, iOS
Ссылка на сервис: Otter
Заключение
Сегодня мы поговорили о лучших сервисах для расшифровки аудио. Каждый из них позволяет буквально в несколько кликов получить желаемый результат, но только в том случае, если исходный файл был в хорошем качестве. Если же запись была записана нечетко, то не все инструменты могут с этим хорошо справиться, особенно те, что доступны бесплатно.
Подборка сервисов для расшифровки аудио в текст
Использовать голосовой набор не всегда удобно, если это не запросы в поисковики. В шумной обстановке не получается прослушать запись голосового сообщения, некоторые люди в принципе лишены такой возможности. Если надиктованная информация нужна в печатном виде, войсы приходится переслушивать и перепечатывать, это тратит время и силы. Расшифровать интервью и аудиодорожку к видео тоже хорошо бы не собственными руками.
Зачем может понадобиться конвертировать аудио в текст
Для помощи в расшифровке аудио в текст есть сервисы. Мы составили список из программ и ботов в социальных сетях, их существует больше, но мы выбрали самые удачные. Некоторые работают с русскими, некоторые с иностранными текстами. Всеми сервисами из подборки можно пользоваться бесплатно, но в некоторых нужно будет зарегистрироваться.
Сервисы для перевода речи в текст
Блокнот для речевого ввода
Возможности: перевод диктуемых слов в текст, транскрибирование речи из аудио и видео с Ютуба.
Сервис автоматически расшифровывает произносимые слова по ходу надиктовки, причем умеет распознавать знаки препинания, если отметить пункт «Заменять слова пунктуации». Мы надиктовали ему «Привет восклицательный знак мы тестируем запятая как справляется сервис с расшифровкой текста точка» и так далее, самые часто употребляемые знаки он распознал, но не справился с многоточием, тире, скобками и кавычками.
Тест сервиса на знаки препинания
Транскрибирование текстов из загруженных аудиозаписей и из видео с Ютуба происходит в реальном времени при воспроизведении. Загружаем файл в сервис или указываем ID видео (символы после https://www.youtube.com/watch?v=), нажимаем «Включить запись».
Сервис транскрибирует речь ведущего
Бесплатно сервис работает с транскрибированием онлайн без ограничений, а также с распознаванием голоса на аудио и видео не дольше 15 минут.
Сервис не идеальный, но работает бесплатно, прост в управлении и не требует регистрации. Результат расшифровки может быть довольно чистым — всё зависит от дикции и скорости речи. Лишний повод потренироваться, если диктуете для себя, но нужно привыкнуть называть знаки препинания, если не хочется расставлять их потом.
Инструмент полезен, когда нужно надиктовать себе материал для текста или в заметку, расшифровать подкаст или интервью. Его можно включить фоном в процессе интервью, чтобы сервис расшифровывал речь в реальном времени.
Расширение «Голосовой ввод текста» для Google Chrome
Возможности: диктовка текста в соцсетях, строке поиска и на сайтах. Диктовка в приложениях Windows,Linux и Mac.
От сервиса «Голосовой блокнот» есть браузерное расширение для переписки в соцсетях и речевого ввода текста на сайтах, а еще дополнительный модуль для использования в приложениях Windows.
Расширение для соцсетей и форумов
Расширение умеет переводить голос в текст: можно диктовать поисковые запросы, сообщения в социальных сетях и на форумах.
Попробуем надиктовать сообщение в ВКонтакте. Открываем диалог, кликаем правой кнопкой мыши и выбираем расширение.
Выбор расширения по клику правой кнопкой
Готовый текст сообщения
Сложно привыкнуть диктовать знаки препинания, на их озвучивание уходит много времени, но зато не нужно расставлять запятые вручную.
Результат расшифровки зависит от дикции говорящего, но в целом расширение для ввода хорошо справляется.
Расшифровка в любых приложениях Windows, Linux и Mac
Дополнительный бесплатный модуль для интеграции открывает тестовый период режима, который позволяет вводить текст напрямую в любые браузеры и приложения Windows: Word, Excel, Google Docs и другие — в любые места, где используется клавиатура. Для этого нужно зарегистрироваться в Голосовом блокноте и установить модуль.
Как установить модуль интеграции Голосового блокнота:
Что такое расшифровка аудиозаписей
Очень многое зависит от качества записи, которую надо расшифровать. Идеально, если вы записывали на профессиональный диктофон, находясь в помещении без внешних источников шума, а собеседник обладает хорошей дикцией и достаточно громким голосом. Но если вы вели запись на телефон, находясь на улице, где под свист ветра пытались зафиксировать бессвязное выступление «жующего слова» чиновника — тут никакая программа, скорее всего, не поможет.
Для нашего эксперимента создали «лабораторные» условия — внятно и не спеша зачитали в комнате без посторонних звуков уже опубликованное интервью « Главврач старооскольской окружной больницы ответила на популярные вопросы про вакцинацию » на диктофон. Чтобы осложнить задачу программам, использовали текст о коронавирусе, в котором были аббревиатуры, иностранные, а также заимствованные и сложные русские слова. Длительность записи составила 17 минут 25 секунд.
По итогам тестирования каждого сервиса/программы собрали получившиеся тексты для сравнения с исходным. Выяснилось, что большинство из них объединяет одна проблема — отсутствие знаков препинания и абзацных отступов. Получились огромные текстовые блоки, состоящие из отдельных слов.
Чтобы сравнение было независимым, использовали сервис Back Links Manager для определения степени схожести текстов. Руководствовались следующим соображением: чем лучше распознана речь — тем меньше процент авторства и тем выше число совпадений. Процент заимствования указан у каждой проверенной программы/сервиса. Однако вы можете провести свою проверку и сверить результаты самостоятельно.
Сервисы голосового ввода уже давно встроены в текстовые онлайн-редакторы (например, Google Docs или Translate) и некоторые мессенджеры. Также по умолчанию они есть в большинстве современных смартфонов с ОС Android (обычно на базе того же Google). Но есть проблема — они (пока) не поддерживают загрузку готового файла, а рассчитаны на диктовку.
Обычно пользователи обходят это ограничение тем, что просто включают воспроизведение записи на другом устройстве и пока звучит запись — идёт транскрибация. Но такой метод ощутимо ухудшает качество результата, поскольку добавляются внешние шумы, а также помехи воспроизводящего и принимающего устройств.
И вот тут на помощь приходят инструменты, позволяющие подменить поток с микрофона на выход звука воспроизводимого файла. В большинстве современных операционных систем можно в настройках звука во вкладке запись включить стерео микшер и сделать его устройством записи по умолчанию. Для этого в Windows 10 кликните правой кнопкой мыши по значку звука в строке с часами, выберите пункт меню «Звуки», перейдите на вкладку «Запись», нажмите пункт «Стерео микшер» и включите.
Можно также транскрибировать записи на иностранном языке с автоматическим переводом в Google Translate (правда, полученный результат в лучшем случае только даст понимание о сути текста).
Хотите расшифровать аудиозапись? Сделайте из неё видео.
Функция автоматического распознавания речи есть ещё в одном продукте компании Google — сервисе YouTube. Здесь она используется для автоматического создания субтитров к видео. А эти субтитры можно копировать и использовать в качестве расшифровки записи (схожесть текст с оригиналом — 16%).
С помощью видеоредактора мы сделали из исходной аудиозаписи видеоролик — просто наложив фоновую картинку. После — загрузили на YouTube-канал, выставив в настройках доступ по ссылке (можно сделать и закрытый доступ).
Сервис автоматически распознает звучащую речь и создает субтитры. Чтобы скопировать их, в нижнем правом углу под видео нажмите три точки, затем строчку «Посмотреть расшифровку видео». Справа появятся субтитры, которые можно выделить и скопировать. Если нажать три точки там, то можно отобразить их без временных меток.
Можно скопировать субтитры и через Творческую студию YouTube — нажмите «Редактировать» у нужного видео, перейдите на пункт «Субтитры» и нажмите «Копировать и изменить». Этот пункт лучше тем, что субтитры копируются сплошным текстом, а не выстроенным в колонку.
В следующей части будет обзор еще 12 программ и сервисов, которые «занимаются» расшифровкой аудио в текст.
Инструкция актуальна на июль 2021 года.
Расшифровка аудиозаписей: основные заблуждения и реальные сложности
Любая полезная информация, сохраненная на аудио или видеозаписях рано или поздно переводится в печатный вид. Прежде всего в текст сохраняется устная речь человека. Перевод записанной речи в текстовой формат называется транскрибацией или расшифровкой аудиозаписей.
Вот, только самые распространенные из них:
1. Аудиофайлы для транскрибации предоставляются в хорошем качестве, а речь на них всегда понятна
В реальности аудиоматериалы, записанные в студийных условиях, заказываются крайне редко. Чаще всего приходится работать с записями, на которых:
И, это далеко не весь перечень, с чем сталкивается расшифровщик.
2. Расшифровка аудиозаписей не требует внимания. Ты просто печатаешь и все
На самом деле, транскрибация обязывает к повышенной концентрации в течение всей работы. Отсебятина и вольный пересказ услышанного категорически неприемлемы. Неточности расшифровки искажают исходный смысл и вносят в текст серьезные ошибки. Особенно это критично для текстов, публикуемых в СМИ или для проводимых исследований.
3. Для расшифровки одного часа аудиозаписи понадобится один час печати
Самое распространенное заблуждение о транскрибации. Причем лично его никто не проверяет, а сразу регистрируются на фриланс-биржах в попытках заработать.
«У вас 30-минутный аудиофайл? Ок. Скидывайте его мне и через полчаса расшифровка будет готова. Ведь я набираю текст 10-пальцевым методом.»
Так, почему же расшифровка ВСЕГДА занимает больше времени, чем длится аудиозапись?
Во-первых, сложные отрезки приходится отматывать назад и переслушивать. И, чем хуже/сложнее запись, тем возвратов к трудному фрагменту будет больше.
Во-вторых, распознанный и набранный текст необходимо полностью проверить и отформатировать согласно требованиям клиента.
4. Для расшифровки каждого фрагмента аудиозаписи достаточно услышать его один раз
Это заблуждение напрямую связано с предыдущим. Т.е. представляется это так: прослушали предложение – набрали текст, прослушали следующее, опять набрали. И так последовательно, пока аудиофайл не закончится.
5. Распознавать речь одновременно говорящих людей также просто, как и каждого по отдельности
При проведении группового интервью, круглого стола, фокус-группы участники зачастую высказываются одновременно.
При параллельной речи даже короткие фразы и отдельные слова выделять трудно. Когда перебивают друг друга сразу 3-4 человека, распознать речь и идентифицировать каждого становится на грани возможностей.
Кто сказал первый, кто второй, кто третий и главное, что сказал – вот из такой мешанины информации нужно выстроить последовательный текст. Здесь без опыта и навыков активного слушания просто не обойтись. Начинающему транскрибатору за такой уровень сложности браться не следует, т.к. качество сданного материала будет крайне низким.
6. Расшифрованный текст не нуждается в форматировании
Конечно, самый простой вариант, когда набранный текст бьется только на абзацы.
Но, такая халява дается не всегда. В пожелания клиента часто входят:
Пример ниже, как раз из таких.
Дословная расшифровка диалектологической экспедиции с обязательным выделением оттенков особенностей речи и всех случаев ненормированного произношения (65 листов в формате А4).
Поэтому, каждая стенограмма будет по-своему уникальной и создается в новом текстовом макете.
Выводы
Как видно, услуги транскрибации гораздо сложнее, чем изначально представляются.
Быстрый набор текста и чуткий слух, терпение и аккуратность, широкий кругозор и интеллект – вот только часть навыков и качеств, которыми должен обладать расшифровщик аудиозаписей.
В данной сфере, решившие легко заработать надолго не задерживаются, т.к. требования к исполнителю очень высоки. И, для серьезных заказов этому уровню придется соответствовать.
Расшифровка аудио
Транскрибация (или расшифровка аудио) — это услуга по переводу речи из аудио- или видеозаписей в текст. Фактически, это набор текста, воспринимаемого на слух.
Бюро СВАН выполняет транскрибацию аудио и видеозаписей на русском и иностранных языках. Над вашими записями работает целая команда опытных профессионалов: транскрибаторы, корректоры, эксперты в нужной тематике (при необходимости). Расшифруем материалы с пресс-конференций, семинаров, лекций, совещаний, круглых столов и других мероприятий. Возьмемся за расшифровку аудиозаписей для суда. Оказываем косплексные услуги в соответствии со спецификой Вашего бизнеса.
Принимаем заказы на выходные дни.
Без ограничений по минимальному заказу!
Мы готовы и к крупным заказам. Объём в сутки?
Сколько стоит расшифровка аудиозаписей за минуту
РАСШИФРОВКА АУДИОЗАПИСИ | Цена за 1 минуту записи (руб.) при заказе от 3 минут |
---|---|
на русском языке в течение 2-х дней | от 21,00 |
на русском языке, в течение 1,5 дней | от 23,00 |
на русском языке, срочно в течение 24 часов | от 29,00 |
текстов, содержащих узкоспециальную терминологию (например, медицина, химия) | от 36,00 |
на английском и других европейских языках | от 64,00 |
на корейском и других восточных языках | от 300,00 |
Если запись на русском языке короткая: до 3 минут | 1 минута = 50 руб. 1 минута 15 секунд = 100 руб. (округление до 2-х минут). 2 минуты = 100 руб. |
Дополнительные услуги: | |
Литературная обработка (убираются слова-паразиты, просторечные выражения, заканчивается мысль, корректируются оборванные фразы и пр.) | 95,00 руб. за 1 страницу 1800 знаков |
Простановка тайм-кодов | по договоренности |
Набор с печатных носителей, набор формул и таблиц, графиков, предпечатная подготовка и распечатка | по договоренности |
Скидки для постоянных клиентов.
Для разовых заказчиков при больших объемах (10 и более часов) скидки от 5 %.
Чтобы заказать или получить точный расчет стоимости работ — отправьте заявку, воспользовавшись почтой info@swan-swan.ru, любой формой на сайте или по кнопке ниже.
Примеры наших работ и образцы оформления
Текст расшифровки телефонного разговора (образец) | |
Текст расшифровки интервью (образец) | |
Текст расшифровки записи звонка (образец) |
Образец прошивки расшифровки аудиозаписи с заверением печатью компании. | ||||||||||||||||||||||
Расшифровка требуется для перевода в текст записи коуч-сессий, докладов, интервью, мастер-классов, фокус-групп и прочей информации в виде записей. Готовы не только расшифровать, но и выполнить перевод записи на другой язык. Вам попала в руки кассета с мастер-классом Билла Гейтса? Вы взяли интервью у американского президента или просто хотите понять, о чем поется в новом альбоме любимого певца? Тогда добро пожаловать в бюро переводов «СВАН»!
Скидки для постоянных клиентов.
|