Что такое потоковая речь
Речевой поток
Выделяемые в потоке речи фоны ничем не отграничены друг от друга в пределах отрезка речи между паузами; их признаки накладываются друг на друга [2] ; выделение фрагментов потока основывается на их связи со значением. Поэтому для эффективного членения речевого потока как на слух, так и на спектрограмме (и тем более объединение полученных при членении фонов в фонемы) зачастую требуется знание соответствующего языка. Л. В. Щерба полагал, что связь звуковых единиц со значением состоит в том, что звуки служат для различения смыслов слов, а в некоторых случаях отдельный звук несёт значение, являясь единственной составляющей звукового облика значимой единицы [3] (так, в русском языке предлоги к, у, о, союз и, многие окончания представлены отдельными звуковыми единицами).
Примечания
Фонетика и фонология
Фонетика | Речевой звук • Речевой поток • Сегментация • Артикуляционный аппарат • Фонация • Артикуляция • Место образования согласных • Форманта • Гласные • Согласные • Ударение • Тон • Интонация • Слог • Мора • МФА • РЛА • Фонетическая транскрипция • Универсальные фонетические классификации |
Фонология | Фонема • Оппозиция • Позиция • Нейтрализация • Дифференциальный признак • Минимальная пара • Фонологизация • Аллофон • Вариант фонемы • Вариация фонемы • Архифонема • Гиперфонема • Чередование • Фонематическая транскрипция |
Полезное
Смотреть что такое «Речевой поток» в других словарях:
речевой поток — Фрагмент речевого сигнала, в котором отсутствуют длительные паузы между словами, а интенсивность выше порога срабатывания детектора речи. [Л.М. Невдяев. Телекоммуникационные технологии. Англо русский толковый словарь справочник. Под редакцией Ю.М … Справочник технического переводчика
речевой поток — Непрерывная цепь звучаний, расчленяемая слушающим и воспринимаемая им как организованная последовательность слов и словосочетаний … Словарь лингвистических терминов
речевой поток — Звучащая речь в ее линейной последовательности, представленная звуками речи, употребляемыми в составе слога, слова и фразы … Словарь лингвистических терминов Т.В. Жеребило
Речевой звук — Речевой звук звук, образуемый произносительным аппаратом человека с целью языкового общения (к произносительному аппарату относятся: глотка, ротовая полость с языком, лёгкие, носовая полость, губы, зубы). Наука о звуках речи называется… … Википедия
Артикуляционные жесты — двигательные акты, с помощью которых реализуется в речи целевая артикуляция. Они являются комплексными и включают в себя координированное движение всех речевых органов, которые участвуют в артикуляции. В артикуляционном жесте выделяется три… … Википедия
СИМВОЛИЧЕСКОЕ ВООБРАЖЕНИЕ — способность субъекта, связанная с процессом культурного творчества. Основы ее понимания заложены еще в учении Канта о схематизации продуктивного воображения. Продолжая эту линию теор. анализа, Кассирер рассматривал С.в. как продукт… … Энциклопедия культурологии
Трубецкой, Николай Сергеевич — Николай Сергеевич Трубецкой Дата рождения: 4 (16) апреля 1890 … Википедия
Глухие согласные — Основная статья: Согласные Глухие согласные тип согласных, произносимых без вибрации гортани. Глухота тип фонации, наряду с звонкостью и состоянием гортани. В Международном фонетическом алфавите имеются различные буквы для звонких и глухих… … Википедия
Фонетика — Лингвистика … Википедия
Фонология — Лингвистика … Википедия
Что такое потоковая речь
Кто ещё способен помнить — а значит, получал образование — хранит название учебника — «Родная речь». Подавляющее большинство исследователей предполагает, что наличие развитой речи — один из признаков, выделяющих человека из земного животного мира.
Речь вряд ли можно отнести к передаче, к потоку информации. С этой точки зрения обладателями речи станут и (гипотетически) инопланетяне, и космические спутники.
Вообще потоковая передача данных — вовсе не признак и не атрибут речи.
Тогда — зачем человеку речь? Зададимся этим вопросом. И увидим, как он приведет нас в весьма нежданным объектам — к сайтам и блоггерам.
Представим себе ситуацию — стадо эволюциониррующих обезьян (или — как угодно — падшего «до ниже зверя» человеков) находится на стоянке.
Что и о чем они говорят?
Выкрики и звуки о … о эмоциях. О состояниях. О чувствах и вдруг-мыслях. Поучения и передача опыта детенышам. Повествования о том как, сделать отверстие в камне, где найти подходящие кремни, как изготовить и использовать иглу из кости.
И только изредка — выкрики о том, что в зарослях — тигр. Или медведь. О том, что надвигается дождь. О том, что подкрадывается вражеское племя.
Короче говоря — основное содержание — это чувства, соображения. И только малая часть — сообщения о новом.
Речь, язык развивались как средство передачи соображений, мыслей, опыта, чувств — в первую очередь. О событиях-новостях — только во вторую. Соответственно, сам язык-речь — семантика, синтаксис, грамматика — передавили в первую очередь технологии знаковой передачи знаний, опыта, чувств, опыта, и только во вторую — о новых событиях.
Какие функции речи отмечают ныне источники?
Как можно видеть, обмен информацией — притом не обязательно событийной — всего лишь одна из четырех функций. Очень грубо — ¼ от всего содержания речи.
То есть речь — это для общения с социальной средой, инструмент для влияния (инструмент манипуляции) на менталитет, мысли и действия, средство передачи культурных событий. Упоминани о сообщениях (о событиях) тут вовсе нет.
Но может быть, просто неверно выбрано слово — речь? Может быть, надо говорить о языке?
Опять же — передача знаний, мыслей, чувств, сопереживания — о «ленте» событийности остается только догадываться.
Отдельно — о проповеди. Как пример — Нагорной проповеди.
Не буду сейчас и тут затрагивать её глубинные смыслы. Это вопросы для другой дискуссии.
Нагорная проповедь Христа НЕ сообщает нам ничего о событиях. Ничего не говорит о новостях. Проповедь передает принципы. Мысли. Постулаты.
По одной этой причине Нагорная проповедь имеет ныне нулевой шанс попасть в новостные ленты. В топ сайтов и блогов.
Но развернем вопрос зеркально.
О чем сайты и блоги? Без мыслей, без принципов и постулатов? Мы имеем дело с потоком событийных сообщений.
Это вовсе не речь и не язык. Не надо однобоко обижаться. Ибо это Не оценочное суждение. Это констатация. Фиксация разницы. Собственно разграничение Речи от не-Речи. Отделение Языка от не-Языка. Слова от Информации.
И ещё — это не Слово-Переживание или Слово-Мысль. Это манипуляции. То есть управляющая информация.
Ныне мы присутствуем в самый момент, в самом пекле перехода от мира слова к миру информации. При этом слово как размышление и переживание подменяется шумом, мусором, спамом и фейками.
Раб отныне отчужден не от собственности на средства производства. Раб ныне должен быть абсолютно стерилизован от Слова-Смысла и лишен прав собственности на информацию. Таково течение «прогресса».
В связи со всем ранее сказанным остается предположить, что некоторые сайты, блоги и блоггеры, ориентирующиеся на новостные потоки, суть ориентированы на информацию и деструктивны по отношению к языку и речи. Не со зла. «Так получилось». Для того они подкармливаются. Соучаствуют и подельничают в накоплении могущества.
Ну и немного почетного места для ангажированной манипуляции.
«Ради красного словца» (о развитии красивой, грамотной речи)
Публикации из раздела «Ораторское искусство»
Бесплатные уроки.
Как подготовить и провести
успешную презентацию
«Ради красного словца» (о развитии красивой, грамотной речи)
Эра эсэмэсок и компьютерного сленга окончательно угробила грамотную устную речь. И если вспомнить перлы Черномырдина, то и в публичной сфере косноязычие уже не является признаком профнепригодности. А уж на бытовом уровне фразы–обрубки, слова–паразиты и нецензурная лексика стали почти нормой. Ораторскому мастерству у нас нигде не учат. Курс риторики у филологов не в счет, потому что не конвертирует теорию в практику.
А вот древние греки знали цену красному словцу. Выдающиеся мастера устного слова в Афинах — софисты — обучали красноречию всех желающих в специальных школах за плату. И представьте себе, от учеников отбоя не было. Граждане Афин знали цену риторики, обучение которой было высшей степенью античного образования.
В более поздние века среди политических трибунов, адвокатов, университетских профессоров тоже находились такие Цицероны, что послушать их набивались полные залы. А сегодня? Где преподаватели, на чьи лекции студенты ломятся как на хороший спектакль? Интеллект и глубокие познания — драгоценность, но без огранки ораторским мастерством они не заблестят!
И вот такая «ювелирная мастерская» недавно в Риге появилась. На сайте www.orator.lv я нашла приглашение на тренинги по методикам Московского Университета Риторики и Ораторского Мастерства Сергея Шипунова. Ирина Назарова, которая их ведет в учебном центре BSG, рассказала, кого и чему на этих курсах учат.
— Красивая, свободная, раскованная речь — это огромное преимущество того, кто ею владеет, чем бы он ни занимался. Вот у нас сейчас прошла первый этап девушка, у которой на носу защита диплома. После нескольких занятий она перестала трястись от ужаса, потому что знает, как преподнесет комиссии свою работу. Не только студентам, но и педагогам, преподавателям высшей школы такие навыки нужны. Когда я училась в университете, мы на некотрых лекциях буквально засыпали. Почему–то считается, что сухая академическая подача материалов — это хорошо. Да нет же! Лектор должен увлекать, воодушевлять аудиторию. Как и директор крупной фирмы, который каждый день проводит совещания, как и консультант или менеджер, которым надо уговорить клиента. В контактах один на один это умение тоже необходимо. В любой сфере, от личной жизни до коридоров власти, красноречие — это ваш инструмент влияния.
— Но оно зависит от образовательного уровня личности (словарный запас, начитанность) и харизмы. Разве можно за несколько часов тренировок что–то с этим сделать?
— На первом этапе мы учим, КАК говорить. Как стоять, двигаться, жестикулировать, смотреть в зал, как подготовить свой голосовой аппарат, как «разогреть» аудиторию. Именно манера говорить в первую очередь определяет тот эффект, который вы производите на людей. Правильно выстроенное выступление может вытянуть даже слабое содержание.
— За счет личного обаяния или набора технических приемов?
— То и другое неразделимо. Когда выступающий зажат, скован, то само его тело дает ясный сигнал слушателям: я боюсь! Напряженный, неуверенный в себе человек не может никого обаять. Мы же даем технологии, как снимать этот испуг перед аудиторией — неважно, состоит она из двух человек или из пятисот.
Между прочим, страх публичных выступлений, по исследованиям ученых–психологов, в иерархии человеческих страхов занимает второе место после страха смерти. Это страх потерять лицо, опозориться и оказаться в изоляции. Человек — социальное существо, и для него невыносимо, если он отторгается группой.
— Меня пару раз приглашали выступить на телевидение. Смотрела потом со стороны на свой дебют и ужасалась: здесь скособочилась, там фразу коряво построила… Стыдоба!
— Оценка себя со стороны — это очень важный этап обучения. Мы записываем краткие выступления участников на видео и потом разбираем ошибки. Просматриваем видеофрагменты из выступлений известных персон и анализируем их промахи. Это очень интересно, и наши ученики сразу отмечают, почему вот этот лидер такой харизматичный, а этого невозможно слушать.
— Есть такая шутка: умная мысля приходит опосля. И правда, в споре часто нужные доводы почему–то не находятся, а всплывают задним числом.
— Будучи барышней, я нередко «тупила» при общении с незнакомыми людьми, потому что больше думала о том, как бы не сморозить глупость. Вижу, что и сейчас у многих девушек тот же комплекс.
— Это называется «фокус на себя». Нужно этот фокус взять и перенести на аудиторию. Контакт глазами уже переключит внимание. Хотя тут есть свои тонкости — не всегда и не всем можно смотреть прямо в глаза. Существует и много других техник, которым мы учим.
— Бывает, попадаешь в чужую компанию и чувствуешь дискомфорт, «встрять» в общий разговор никак не решаешься. Это преодолимо?
— Есть такой прием, как презентация на высоком уровне энергетики. Это привлечет к вам внимание людей, которые в вас не заинтересованы. Не важно, что вы говорите, важно, как вы себя преподносите.
90 процентов нашего тренинга — это практика и обратная связь с участниками. Навыки отрабатываются постоянным повтором: в полемике, дебатах, словесной импровизации на любую тему. Если в первые часы человек испытывает робость перед большой группой незнакомых людей, то под конец второго дня он уже не напрягается и говорит свободно. А к концу тренинга сам начинает объективно оценивать свою риторику и по ходу исправляет ошибки. То есть включается механизм самообучения, который действует и по окончании тренинга — человек постоянно шлифует свои речевые способности.
На втором этапе мы показываем, как правильно строить содержание речи. Это уже искусство презентации. Мы же постоянно презентуем себя, свои идеи, желания и взгляды, общаясь с коллегами, партнерами, клиентами, покупателями.
— Но у нас часто приходится презентовать себя на неродном языке…
— Законы ораторского искусства применимы, на каком бы языке ты ни говорил. Просто нагрузка больше и готовиться к выступлению нужно. Хотя мы как раз обучаем выступать, не готовясь.
Так говорили мудрецы
«Слово есть великий властелин, который, обладая весьма малым и совершенно незаметным телом, совершает чудеснейшие дела. Ибо оно может и страх нагнать, и печаль уничтожить, и радость вселить, и сострадание пробудить.
Древнегреческий ритор Горгий.
А ты используешь VAD? Что это такое и зачем он нужен
Очень часто при работе мы обращаем внимание на то, что все люди знают, что такое распознавание речи, но не знают, что такое Voice Activity Detector (VAD) или детектор речи. А ведь именно VAD на самом деле самый важный алгоритм при работе с речью людей в естественной среде обитания.
Как ни странно, если поискать поддерживаемые и высококачественные решения данной задачи в публичном доступе — найдутся буквально пара проектов достаточного уровня. Но вот незадача — академические решения тяжелы (и иногда работают запретительно долго) и зачастую принимают только целые аудио на вход (нельзя использовать потоково). Решение от Google (WebRTC) очень быстрое но плохо отличает речь от шума (но его можно использовать потоково). А некоторые коммерческие решения «привязаны» к личному кабинету и шлют какую-то телеметрию.
Мы решили исправить это недоразумение и сделать уникальный VAD мирового уровня (судите сами по метрикам), который работает на 1 ядре процессора с задержкой в 1 миллисекунду на кусочках аудио от 30 миллисекунд. В этой статье мы расскажем вам, что такое VAD, покажем на примерах как использовать его и наглядно потестировать на своем голосе.
Что такое VAD
Voice activity detection (VAD) — алгоритм, позволяющий обнаружить голосовую активность в непрерывном аудиопотоке. VAD выполняет роль «первого шага» в большинстве современных задач по обработке речи, ведь именно его сигнал служит триггером к началу их работы.
Примеры задач решаемых с использованием VAD:
Задача VAD сводится к выделению речи из шума или тишины. На входе — кусочек аудио, размер которого зависит от желаемого времени реакции системы. На выходе — вероятность того, что этот кусочек содержит в себе речь. Все просто! По сути, задача бинарной классификации. Однако, в современных реалиях алгоритм детекции речи должен удовлетворять ряду условий:
На практике хорошо натренированный VAD ведет себя примерно так:
Аудиопоток преобразованный VADом в вероятности
Наше решение
На днях мы опубликовали масштабное обновление нашего Silero VAD, опробовать его на своем голосе можно тут (но это работает не так быстро как работает сам VAD ввиду ограничений google colab), либо здесь. Под капотом — нейросеть на stft спектрограммах. Вкратце, наш VAD теперь:
Простой python пример на готовом аудио (нужен torch 1.9 и выше):
Тестовые данные и методика
Сбор данных для тестирования моделей — это вызов. В идеальном сценарии следовало бы поделить каждое аудио на кусочки минимального размера (в нашем случае 30 миллисекунд), а затем пометить, есть ли речь в каждом из кусочков.
Однако, от такого подхода пришлось отказаться, потому что определение на слух начала и конца речи с точностью до 30 миллисекунд — это трудоемкий и весьма неточный подход, который влечет за собой ряд ошибок при разметке.
Выбранный нами подход тестирования гораздо более прост и лаконичен — помечать все аудио целиком. Правила таковы:
Характеристики размеченного нами тестового датасета:
На этом моменте возникает вопрос — как быть? Ведь тестовые аудио длиной 7 секунд, а модели классифицируют фрагменты вплоть до 30 миллисекунд, то есть каждый цельный звуковой отрывок содержит сотни таких маленьких кусочков. Как показала практика, в реальной жизни длительность речи ограничена снизу
250 миллисекундами. Конечно, есть исключения, например, короткий возглас «А!» и ему подобные, но такими редкими случаями можно пренебречь. Хорошо, получается, если алгоритм предсказал 250 мс речи подряд, то мы помечаем все аудио меткой речь есть. Если речевая последовательность заканчивается, мы ждем еще 250 мс прежде чем обрезать ее.
Порог (threshold). VAD предсказывает вероятность в диапазоне [0, 1] для каждого куска аудио. При превышении этой вероятностью некоего порога, который подбирается заранее, данный кусок помечается речью. В 90% случаев дефолтный порог 0.5 работает замечательно, для остальных 10% случаев его нужно подбирать под конкретный домен (как правило, делать меньше)
Весь метод тестирования можно описать так:
Результаты
Для сравнения с новой моделью было решено взять:
Все тесты были проведены при следующих параметрах: 16000 Гц частота дискретизации, 30 мс длина кусочков аудио (кроме старой модели, у нее 250).
На графике видно, что наша новая модель стала значительно лучше относительно прошлой модели как по качеству, так и по минимальному размеру чанка. Picovoice хорошо показал себя при этом методе тестирования, но его удалось обойти.
Четкость речи — четкость мысли: как улучшить свою речь
Анна Веселко
Если окружающие и так понимают, что вы говорите, нужно ли лишний раз задумываться о том, как вы говорите? Особенно, если вы никак не связаны с профессиональным общением или публичными выступлениями? Ксения Чернова, тренер по технике речи, уверена, что да: по ее мнению, красивое звучание и четкая речь такая же базовая необходимость, как, например, опрятный внешний вид. Поговорили с Ксенией и узнали, зачем и каким образом можно самостоятельно развивать свои речевые навыки.
Ксения Чернова
Тренер по технике речи, актриса, телеведущая, автор книги «Говори как бог»
Обычно у людей редко возникают вопросы «Зачем красиво одеваться?» или «Зачем ходить с помытой головой и ровными зубами?» (мы, конечно, говорим об определенной категории людей, которым не все равно как они выглядят и какое впечатление производят). Та же самая история и с голосом.
Голос — это очень гибкая и поддающаяся структура, которая может меняться точно так же, как может меняться наше тело
Но если в случае с телом это долгий процесс, минимум 3–6 месяцев, то натренировать голос можно достаточно быстро. Более того, увидеть какие-то первые, но значительные изменения, можно, скажем, за 16 часов занятий (это два дня полноценного обучения и тренировки), а остальное — уже вопрос регулярности.
Получив такой голос, который нравится ему самому, человек начинает чувствовать себя совсем иначе — чувствовать себя настоящего, более уверенного, имеющего контроль над ситуацией. Голос — это тренировка. Тренировка дыхания, звучания, артикуляционного аппарата. А еще — регулярный осознанный контроль в процессе разговора: важно хотя бы думать о том, как я дышу, куда я звучу, не потерял ли я свой резонатор, на котором мне удобно разговаривать, открывается ли у меня рот, хорошо ли у меня работает язык…
Что такое техника речи? По большому счету — это сумма правильного дыхания, звучания в правильные места, правильного открывания рта и работы артикуляционного аппарата и, самое главное, наполнение всей этой формы содержанием — своим естеством, искренностью, эмоциями и энергетикой. Именно это — то, на что реагируют люди, ведь главное, это когда мы, помимо того, что обладаем красивым звуком голоса, еще и умеем передавать им все, что у нас есть.
Что вы можете сделать самостоятельно, чтобы улучшить свою речь
Качественная тренировка речи — это процесс, который нужно проходить под контролем со стороны специалиста. Тем не менее, есть базовые, начальные шаги, которые каждый может проделать самостоятельно, чтобы увидеть какие-то первые изменения и, может быть, задуматься о том, чтобы впоследствии обратиться к профессиональному тренингу.
Дыхание и разминка
Прямо с утра, лежа в постели, посмотрев, как дышит ваш живот, когда вы расслаблены, сделайте вдох и выдох на «фууу» со слегка сомкнутыми губами. Обратите внимание, чтобы в этот момент ваша грудь не двигалась. После нескольких «фууу» делаем вдох и выдох на «с», как бы выдавливая из себя воздух мышцами живота, все остальные мышцы должны быть расслаблены. Представьте, что внизу живота у вас как бы находится резервуар с воздухом (воздух, который мы выдыхаем — это и есть наш потенциальный звук), и вот весь этот воздух из резервуара вы и выдыхаете под давлением в передние зубы. Не в макушку, не там в затылок, а именно в передние зубы и на звук «с». И так 6–8 раз, после чего нужно встать и попытаться сделать это же упражнение, но уже стоя.
Артикуляция
Вот несколько самых простых упражнений для разминки губ (вы легко можете посмотреть их наглядное выполнение в интернете):
— Вытягиваем губы «хоботком» и крутим ими из стороны в сторону. Важно крутить именно губами и не работать челюстью — она сомкнута и не помогает губам, работают только мышцы лица! Сделали так 8 раз из стороны в сторону и сбросили напряжение, как делают лошади, эдаким «пфррр» из живота в губы, чтобы затрепетали губы.
— Дальше делаем то же самое, но теперь двигаем губами вверх-вниз, тоже 8 раз и также сбрасываем напряжение.
— Теперь включаем язык и круговыми движениями с внутренней стороны нашего рта разминаем мышцы щек и губ, разминается и сам язык. Это тяжелое упражнение, мышцы от него устают, но это прекрасная усталость. Так надо сделать 5 раз в одну сторону и 5 раз в другую, давя языком на щеки и губы. Сбрасываем напряжение.
— После того, как мы размяли язык и губы, разминаем челюсть. Сперва просто пальцами разминаем челюстные суставы около ушей, потом открываем рот, чтобы пальцы падали в эти околоушные впадины, потом можно подвигать челюстью из стороны в сторону.
— Есть и еще одно секретное упражнение — берем маркер, помаду, тушь, карандаш, в общем, что-то продолговатое, и вставляем его в рот поперек, зажав зубами, проверив, не напряжены ли мышцы лица — они должны быть расслаблены. В этом состоянии начинаем говорить, например, следующую чистоговорку: «В четверг четвертого числа в четыре с четвертью часа четыре черненьких чумазеньких чертенка чертили черными чернилами чертеж». Ваша задача — сделать так, чтобы слова звучали максимально четко даже в этом неудобном положении. Так у вас прекрасно разомнется челюсть, губы и язык, и когда вы вытащите маркер изо рта, вы сразу почувствуете, как говорить и звучать стало намного легче.
Дикция
Пример чистоговорки: «Стоит поп на копне, колпак на попе, копна под попом, а поп под колпаком». Довольно часто, когда люди произносят ее в первый раз, они «проглатывают» половину звуков. Произнесите эту чистоговорку, четко и внятно проговаривая окончания (можете записывать себя на диктофон, чтобы слушать со стороны). Далее обратите внимание, как вы произносите ударные гласные. Они должны быть чуть длиннее по звучанию и более наполнены звуком, чем остальные звуки. Ударные гласные — это ядро слова, они отвечают за его объем и красоту.
И еще один момент, который необходимо отметить — плавность речи: постарайтесь каждую фразу говорить как одно слово, как единую конструкцию. Слова должны перетекать одно в другое, говорить нужно в перспективу, а не ставить точки после каждого слова.