Что такое опознавание речевого материала

Распознавание речи. Часть 1. Классификация систем распознавания речи

Эпиграф

В России, направление систем распознавания речи действительно развито довольно слабо. Google давно анонсировала систему записи и распознавания телефонных разговоров… Про системы похожего масштаба и качества распознавания на русском языке, к сожалению, я пока не слышал.

Но не нужно думать, что за рубежом все уже все давно открыли и нам их никогда не догнать. Когда я искал материал для этой серии, пришлось перерыть тучу зарубежной литературы и диссертаций. Причем статьи и диссертации эти были замечательных американских ученых Huang Xuedong; Hisayoshi Kojima; DongSuk Yuk и др. Понятно, на ком эта отрасль американской науки держится? ;0)

В России я знаю только одну толковую компанию, которой удалось вывести отечественные системы распознавания речи на коммерческий уровень: Центр речевых технологий. Но, возможно, после этой серии статей кому-нибудь придет в голову, что заняться разработкой таких систем можно и нужно. Тем более, что в плане алгоритмов и мат. аппарата мы практически не отстали.

Что такое опознавание речевого материала. Смотреть фото Что такое опознавание речевого материала. Смотреть картинку Что такое опознавание речевого материала. Картинка про Что такое опознавание речевого материала. Фото Что такое опознавание речевого материала

Классификация систем распознавания речи

На сегодняшний день, под понятием “распознавание речи” скрывается целая сфера научной и инженерной деятельности. В общем, каждая задача распознавания речи сводится к тому, чтобы выделить, классифицировать и соответствующим образом отреагировать на человеческую речь из входного звукового потока. Это может быть и выполнение определенного действия на команду человека, и выделение определенного слова-маркера из большого массива телефонных переговоров, и системы для голосового ввода текста.

Признаки классификации систем распознавания речи

Что такое опознавание речевого материала. Смотреть фото Что такое опознавание речевого материала. Смотреть картинку Что такое опознавание речевого материала. Картинка про Что такое опознавание речевого материала. Фото Что такое опознавание речевого материала

Различия методов распознавания речи

UPD: Перенес в «Искуственный интеллект». Если будет интерес, дальше публиковать буду в нем.

Источник

Распознавание речи: очень краткий вводный курс

Что такое опознавание речевого материала. Смотреть фото Что такое опознавание речевого материала. Смотреть картинку Что такое опознавание речевого материала. Картинка про Что такое опознавание речевого материала. Фото Что такое опознавание речевого материала

Рассказать неспециалисту максимально просто о работе компьютерного распознавания речи и преобразовании её в текст — задача почти непосильная. Ни один рассказ об этом не обходится без сложных формул и математических терминов. Мы попробуем максимально понятно и немного упрощённо объяснить, как ваш смартфон понимает речь, когда машины научились распознавать человеческий голос и в каких неожиданных областях используется эта технология.

Необходимое предуведомление: если вы разработчик или, тем более, математик, вы едва ли узнаете из поста что-то новое и даже посетуете на недостаточную научность материала. Наша цель — самым простым образом познакомить непосвящённых читателей с речевыми технологиями и рассказать, как и зачем Toshiba взялась за создание своего голосового ИИ.

Важные вехи в истории распознавания речи

История распознавания электронными машинами человеческой речи началась чуть раньше, чем принято думать: в большинстве случаев принято вести отсчёт с 1952 года, но на самом деле одним из первых устройств, реагировавшим на голосовые команды, был робот Televox, о котором мы уже писали. Созданный в 1927 году в США робот Герберт Телевокс представлял собой несложное устройство, в котором различные реле реагировали на звуки разной частоты. В роботе было три камертона, каждый из которых отвечал за свою тональность. В зависимости от того, какой камертон срабатывал, включалось то или иное реле.

Что такое опознавание речевого материала. Смотреть фото Что такое опознавание речевого материала. Смотреть картинку Что такое опознавание речевого материала. Картинка про Что такое опознавание речевого материала. Фото Что такое опознавание речевого материала
Фактически вся «начинка» Телевокса, включая систему распознавания команд, располагалась на стойке в районе туловища «робота». Закрыть её крышкой было нельзя, иначе камертоны не смогли бы корректно «слышать» звуки. Источник: Acme Telepictures / Wikimedia

С Телевоксом можно было общаться как отдельными сигналами с помощью свистка, так и короткими словесными репликами — их камертоны тоже раскладывали на последовательность звуков. Создатель робота Рой Уэнсли даже устраивал фантастическую по тем временам демонстрацию, говоря команду «Сезам, откройся», по которой Телевокс включал реле, отвечающее за открытие двери. Никаких цифровых технологий, нейросетей, ИИ и машинного обучения — только аналоговая техника!

Следующим ключевым изобретением, открывшим путь к настоящему распознаванию человеческой речи, стала машина Audrey, разработанная в 1952 году в кузнице инноваций Bell Labs. Огромная Audrey потребляла кучу электроэнергии и была размером с хороший шкаф, но вся её функциональность сводилась к распознаванию произнесённых цифр от нуля до девяти. Всего десять слов, да, но не будем забывать, что и Audrey была аналоговой машиной.
Что такое опознавание речевого материала. Смотреть фото Что такое опознавание речевого материала. Смотреть картинку Что такое опознавание речевого материала. Картинка про Что такое опознавание речевого материала. Фото Что такое опознавание речевого материала
К сожалению, история не сохранила публичных фотографий Audrey, есть только принципиальная схема. Простая на бумаге, сложная в воплощении — по воспоминаниям современников, компоненты Audrey занимали целый шкаф. Источник: Bell Labs

Работало это так: диктор проговаривал в микрофон цифры, делая между словами интервалы не менее 350 мс, Audrey переводила услышанные звуки в электрические сигналы и сравнивала их с записанными в аналоговой памяти образцами. По результатам сравнения машина подсвечивала цифру на приборной панели.

Это был прорыв, но реальной пользы от Audrey не было и быть не могло — машина распознавала голос своего создателя с точностью до 97%, другие специально тренированные дикторы получали точность 70-80%. Посторонние люди, впервые контактирующие с Audrey, как бы ни старались, видели на табло свою цифру только в 50% случаев.

Несмотря на революционные для своего времени результаты, Audrey не нашла, да и не могла найти практического применения. Предполагалось, что систему можно приспособить вместо телефонных операторов, но всё же услуги человека оказались удобней, быстрее и гораздо надёжней, чем Audrey.

Презентация похожей на Audrey, только гораздо меньших размеров, машины — IBM Shoebox. Хорошо видна скорость работы Shoebox. Машина также могла выполнять простейшие математические операции сложения и вычитания

В начале 1960-х работы по созданию машин для распознавания речи велись в Японии, Великобритании, США и даже СССР, где изобрели очень важный алгоритм динамической трансформации временной шкалы (DTW), с помощью которого удалось построить систему, знающую около 200 слов. Но все наработки были похожи друг на друга, а общим недостатком стал принцип распознавания: слова воспринимались как целостные звуковые отпечатки, и затем их сверяли с базой образцов (словарём). Любые изменения скорости, тембра и чёткости проговаривания слов значительно влияли на качество распознавания. Перед учёными встала новая задача: научить машину слышать отдельные звуки, фонемы или слоги и затем составлять из них слова. Такой подход позволил бы нивелировать эффект смены диктора, когда в зависимости от говорящего уровень распознавания резко различался.

Фонемы — это звук или множество звуков, которыми обозначается буква слова в разговорной речи в зависимости от контекста. Например, в словосочетании «пока что» буква «ч» в разговоре чаще всего звучит как «ш». А предлог «с» в словосочетаниях «с сестрой» и «с братом» в первом случае звучит как «с», а во втором — как «з». То есть, буква одна, но фонемы разные.

Описание принципа работы Harpy. Видео работы программы не сохранилось.

Опыт Harpy показал, что наращивать словари целостных звуковых отпечатков бесполезно — это лишь увеличивает время распознавания и радикально снижает точность, поэтому исследователи всего мира пошли по другому пути — распознавания фонем. В середине 1980-х машина IBM Tangora могла научиться понимать речь любого диктора с любым акцентом, диалектом и особенностями произношения, для этого лишь требовалась 20-минутная тренировка, в ходе которой накапливалась база образцов фонем и аллофонов. Применение скрытой марковской модели повысило словарный запас IBM Tangora до впечатляющих 20 000 слов — в 20 раз больше, чем было у Harpy, и уже сравнимо со словарным запасом подростка.

Все системы распознавания речи с 1950-х до середины 1990-х годов не умели считывать естественную разговорную речь человека — слова приходилось произносить отдельно, делая паузы между ними. По-настоящему революционным событием стало внедрение разработанной в 1980-х скрытой марковской модели — статистической модели, строившей точные предположения о неизвестных элементах на основе вытекающих из них известных. Упрощённо говоря, с помощью всего нескольких распознанных фонем в одном слове скрытая марковская модель очень точно подбирает недостающие фонемы, тем самым значительно повышая точность распознавания речи.

В 1996 году появилась первая коммерческая программа, способная различать не отдельные слова, а беспрерывный поток естественной речи — IBM MedSpeak/Radiology. Продукт IBM был специализированным, он использовался в медицине для стенографирования описания результатов рентгенограммой, произносимых врачом в ходе исследования. Тут мощность компьютеров наконец стала достаточной для того, чтобы распознавать отдельные слова «на лету». Плюс алгоритмы стали более совершенными, появилось корректное распознавание микропауз между произносимыми словами.

Первым универсальным движком распознавания естественной речи стала программа Dragon NaturallySpeaking 1997-го года. При работе с нею диктору (т. е. пользователю) не требовалось проходить тренировку или оперировать определённым лексиконом, как в случае с MedSpeak, — с NaturallySpeaking мог работать любой человек, даже ребёнок, программа не ставила никаких правил произношения.

Что такое опознавание речевого материала. Смотреть фото Что такое опознавание речевого материала. Смотреть картинку Что такое опознавание речевого материала. Картинка про Что такое опознавание речевого материала. Фото Что такое опознавание речевого материала
Несмотря на уникальность Dragon NaturallySpeaking, ИТ-обозреватели не выказывали особого восторга от распознавания естественной речи. Среди недостатков отмечались ошибки распознавания и некорректная обработка команд, обращённых к самой программе. Источник: itWeek

Примечательно, что движок распознавания был готов ещё в 1980-х, но из-за недостаточной мощности компьютеров разработка Dragon Systems (сейчас компанией владеет Nuance Communications) не успевала «на лету» определять промежутки между словами, что необходимо для распознавания естественной речи. Без этого слова «пока лечится», например, могли быть услышаны компьютером как «покалечится».

Впереди был рост популярности систем распознавания речи, нейросети, появление голосового поиска Google на мобильных устройствах и, наконец, голосовой ассистент Siri, не просто конвертирующий речь в текст, но и адекватно отвечающий на построенные любым естественным образом запросы.

Как услышать сказанное и додумать нерасслышанное?

В наше время лучшим средством для создания движка распознавания речи стала рекуррентная нейросеть (RNN), на которой построены все современные сервисы распознавания голоса, музыки, изображений, лиц, объектов, текста. RNN позволяет с высочайшей точностью понимать слова, а также предсказывать наиболее вероятное слово в рамках контекста, если оно не было распознано.

Нейросетевая темпоральная классификация модели (CTC) выделяет в записанном аудиопотоке (слове, фразе) отдельные фонемы и расставляет их в том порядке, в котором они были произнесены. После многократного анализа, CTC очень чётко выделяет определённые фонемы, а их текстовая запись сравнивается с базой слов нейросети и затем превращается в распознанное слово.

Нейросети потому так и называются, что принцип их работы похож на работу человеческого мозга. Обучение нейросети очень похоже на обучение человека. Например, чтобы совсем маленький ребёнок научился узнавать автомобили и отличать их от мотоциклов, нужно как минимум несколько раз обратить его внимание на различные машины и каждый раз произносить соответствующее слово: это большое и красное — машина, и эта низкая чёрная — машина, а вот это и это мотоциклы. В какой-то момент ребёнок обнаружит закономерности и общие признаки для разных автомобилей, и научится безошибочно узнавать, где легковушка, где джип, где мотоцикл, а где квадроцикл, даже если мимолётом увидит их на рекламном плакате на улице. Так же и нейросеть нужно обучить базой примеров — заставить «изучить» сотни и тысячи вариантов произношения каждого слова, буквы, фонемы.

Рекуррентная нейросеть для распознавания речи хороша тем, что после длительной тренировки базой различных произношений она научится с высокой точностью различать фонемы и составлять из них слова вне зависимости от качества и характера произношения. И даже «додумывать» с высокой точностью в рамках контекста слова, которые не удалось распознать однозначно из-за фоновых шумов или нечёткого произношения.

Но с предсказаниями RNN есть нюанс — рекуррентная нейросеть может «додумать» пропущенное слово только опираясь на самый ближайший контекст примерно в пять слов. За пределами этого пространства анализ вестись не будет. А он порой ох как нужен! Например, для распознавания мы произнесли фразу «Великий русский поэт Александр Сергеевич Пушкин», в которой слово «Пушкин» (специально выделено курсивом) сказали настолько неразборчиво, что ИИ не смог точно распознать его. Но рекуррентная нейросеть, опираясь на имеющийся опыт, полученный в ходе обучения, может предположить, что рядом со словами «русский», «поэт», «Александр» и «Сергеевич» чаще всего встречается слово «Пушкин». Это достаточно простая задача для обученной на русских текстах RNN, потому что очень конкретный контекст позволяет делать предположения с высочайшей точностью.

А если контекст расплывчатый? Возьмём другой текст, в котором одно слово не сможет быть распознано: «Наше всё, Александр Сергеевич Пушкин, трагически погиб в расцвете лет после дуэли с Дантесом. Именем поэта назван Пушкинский театральный фестиваль». Если убрать слово «Пушкинский», RNN попросту не сможет угадать его, опираясь на контекст предложения, ведь в нём упомянуты лишь театральный фестиваль и отсылка к имени неизвестного поэта — возможных вариантов масса!

Вот тут вступает в дело архитектура долгой краткосрочной памяти (Long short-term memory, LSTM) для рекуррентных нейросетей, созданная в 1997 году (подробная статья о LSTM). Она специально разрабатывалась для того, чтобы добавить RNN умение учитывать контекст, удалённый от обрабатываемого события, — результаты решения предыдущих задач (то есть, распознаваний слов) проносятся сквозь весь процесс распознавания, сколь бы длинным не был монолог, и учитываются в каждом случае сомнений. Причём расстояние удаления почти не влияет на эффективность работы архитектуры. С помощью LSTM нейросеть при необходимости угадать слово будет учитывать весь имеющийся в рамках задачи опыт: в нашем примере RNN заглянет в предыдущее предложение, обнаружит, что ранее упоминались Пушкин и Дантес, поэтому «Именем поэта» скорее всего указывает на кого-то из них. Так как нет никаких данных о существовании театрального фестиваля Дантеса, то речь идёт о Пушкинском (тем более что звуковой отпечаток нераспознанного слова очень похож) — такой фестиваль был в базе для обучения нейросети.

«Исповедь голосового помощника». Когда в дело вступает хорошо обученная нейросеть, голосовой ассистент может точно додумать, что же нужно сделать с «зелёными тапочками»

Как распознавание речи делает мир лучше?

В каждом случае применения по-разному — кому-то оно помогает общаться с гаджетами, причём по данным PricewaterhouseCoopers более половины пользователей смартфонов отдают устройствам голосовые команды — среди взрослых людей (25-49 лет) доля тех, кто постоянно пользуется голосовыми интерфейсами, даже выше, чем среди молодёжи (18-25) — 65% против 59%. А в России хотя бы раз с Siri, Google Assitant или «Алисой» общались не менее 71% населения. 45 млн россиян постоянно общаются с «Алисой» от «Яндекса», причём на долю «Яндекс.Карт»/«Яндекс.Навигатора» приходится только 30% запросов.

Кому-то распознавание речи реально помогает в работе — например, как мы говорили выше, врачам: в медицине с 1996 года (когда вышел IBM MedSpeak) распознавание применяется для записи анамнеза и при исследовании снимков — медик может продолжать работу, не отвлекаясь на записи в компьютер или бумажную карту. Кстати, работа над диктовкой в медицине ведётся не только на Западе — в России существует программа Voice2Med от «Центра речевых технологий».

Есть и иные примеры — в том числе наш собственный. Организация бизнеса Toshiba подразумевает полную инклюзию, то есть равные права и возможности для людей с различными ограничениями здоровья, в том числе для сотрудников с нарушениями слуха. У нас есть корпоративная программа Universal Design Advisor System, в рамках которой люди с различными видами инвалидности участвуют в разработке продуктов Toshiba, внося предложения для повышения их удобства людям с ограничениями здоровья — то есть мы не предполагаем, как можно сделать лучше, а оперируем реальным опытом и отзывами сотрудников.

Несколько лет назад в главном офисе Toshiba в Японии мы столкнулись с очень интересной задачей, потребовавшей разработать новую систему распознавания речи. Во время работы Universal Design Advisor System мы получили важный инсайт: сотрудники с нарушениями слуха хотят участвовать в обсуждениях на встречах и лекциях в реальном времени, а не ограничиваться чтением обработанной стенограммы часы или дни спустя. Запуск распознавания речи через смартфон в таких случаях даёт очень слабый результат, поэтому специалистам Toshiba пришлось взяться за разработку специализированной системы распознавания. И, конечно, мы сразу столкнулись с проблемами.

Разговорная речь колоссально отличается от речи письменной — мы не говорим так, как пишем письма, а реальный разговор, переведённый в текст, выглядит очень неаккуратным и даже нечитабельным. То есть, если мы будем даже с высокой точностью конвертировать диалоги на утренней планёрке в текст, то получим бессвязную мешанину, изобилующую словами-паразитами, междометиями и задумчивыми «ааа», «эээ» и «ммм». Чтобы избавиться в тексте от транскрибирования ненужных звуков, слов и выражения эмоций, мы решили разработать ИИ, способный максимально безошибочно распознавать не всегда нужные элементы разговорной речи, в том числе эмоциональный окрас некоторый слов (например, «да ну» может звучать как скепсис или как искренне удивление, а это буквально противоположные значения).

Что такое опознавание речевого материала. Смотреть фото Что такое опознавание речевого материала. Смотреть картинку Что такое опознавание речевого материала. Картинка про Что такое опознавание речевого материала. Фото Что такое опознавание речевого материала
Так выглядит ноутбук с комплектом периферии для распознавания голоса с помощью ИИ Toshiba (слева) и приложение с результатами для конечных устройств (справа). Источник: Toshiba

Тут пригодилась LSTM, без которой точность распознавания была недостаточной для того, чтобы полученный текст можно было читать и понимать без усилий. Причём LSTM пригодилась не только для более точного предугадывания слов в контексте, но и для корректной обработки пауз в середине предложения и междометий-паразитов — для этого мы обучили нейросеть вот этим паразитам и паузам, естественным для разговорной речи.

Значит ли это, что теперь нейросеть может убирать из стенограмм междометия? Да, может, но делать этого не нужно. Дело в том, что (ещё один полученный инсайт) люди с нарушениями слуха ориентируются в том числе на движения губ говорящего. Если губы движутся, но на экране не появляется соответствующий этим движениям текст, возникает ощущение, будто система распознавания упустила часть беседы. То есть для того, кто не может слышать, важно получать максимум информации о разговоре, включая злосчастные паузы и меджометия. Поэтому движок Toshiba оставляет эти элементы в стенограмме, но в реальном времени приглушает яркость букв, давая понять, что это необязательные для понимания текста детали.

Вот так на клиентском устройстве выглядит результат распознавания на лету. В серый цвет окрашиваются не несущие смысловой нагрузки части монолога

Сейчас ИИ Toshiba работает с английской, японской и китайской речью, причём возможен даже перевод между языками на лету. Его не обязательно использовать для стенографирования на лету — ИИ может быть адаптирован для работы с голосовыми ассистентами, которые наконец научатся адекватно воспринимать междометия, паузы и запинки при произношении человеком команды. В марте 2019 года система успешно использовалась для добавления субтитров к видеотрансляции IPSJ National Convention, проводимой в Японии. В ближайших планах — превращение ИИ Toshiba в общедоступный сервис и опыты с внедрением распознавания голоса на производствах.

Источник

НЕРЕЧЕВЫХ И РЕЧЕВЫХ СИГНАЛОВ

Что такое опознавание речевого материала. Смотреть фото Что такое опознавание речевого материала. Смотреть картинку Что такое опознавание речевого материала. Картинка про Что такое опознавание речевого материала. Фото Что такое опознавание речевого материала Что такое опознавание речевого материала. Смотреть фото Что такое опознавание речевого материала. Смотреть картинку Что такое опознавание речевого материала. Картинка про Что такое опознавание речевого материала. Фото Что такое опознавание речевого материала Что такое опознавание речевого материала. Смотреть фото Что такое опознавание речевого материала. Смотреть картинку Что такое опознавание речевого материала. Картинка про Что такое опознавание речевого материала. Фото Что такое опознавание речевого материала Что такое опознавание речевого материала. Смотреть фото Что такое опознавание речевого материала. Смотреть картинку Что такое опознавание речевого материала. Картинка про Что такое опознавание речевого материала. Фото Что такое опознавание речевого материала

Что такое опознавание речевого материала. Смотреть фото Что такое опознавание речевого материала. Смотреть картинку Что такое опознавание речевого материала. Картинка про Что такое опознавание речевого материала. Фото Что такое опознавание речевого материала

Что такое опознавание речевого материала. Смотреть фото Что такое опознавание речевого материала. Смотреть картинку Что такое опознавание речевого материала. Картинка про Что такое опознавание речевого материала. Фото Что такое опознавание речевого материала

Эта работа включает в себя различение звучащих игрушек, музыкальных инструментов и бытовых шумов, определение количества звучаний и их характера (долгота, громкость, слитность, темп, ритм, высота), направления к источнику звука, а также различение музыкальных ритмов (марш, вальс, полька и т. д.), оркестрового, хорового и сольного исполнения, голосов людей и животных и т. п. Работа проводится на фронтальных занятиях по развитию слухового восприятия и обучению произношению. Используются те звучания, которые доступны слуху всех детей группы.

Методика обучения различению звучаний такова. Сначала дети дифференцируют звучания, воспринимая их на слухо- зрительной основе, далее слушают образец каждого звучания и, наконец, приступают к их различению только на слух. Каждый раз в случае ошибки педагог предъявляет то или иное звучание слухо- зрительно, а затем на слух. Дети в ответ на воспринятое звучание, как правило, отвечают движениями и произнесением слогосочетаний, соответствующих характеру звучания. Например, при различении темпа звучаний они в ответ на воспринятое хлопают в ладоши в медленном темпе, произнося та __та__ та__, в среднем —та __та __та__ или быстром — татата.

Важно подчеркнуть, что обучение различению на слух неречевых и речевых сигналов проводится не только с целью развития слухового восприятия детей и обогащения их представлений о звуках окружающего мира, но и для оказания положительного влияния на формирование устной речи. В первую очередь это относится к работе по различению на слух ритма, темпа, высоты и слитности звучаний.

Основное внимание в плане развития слухового восприятия уделяется формированию и развитию речевого слуха детей. С этой целью их учат различать, опознавать и распознавать на слух слова, словосочетания, фразы (повествовательные, вопросы, поручения), тексты. Дети поступают в детский сад, как правило, не владея речью и не умея пользоваться своим слухом. Поэтому заниматься с ними начинают на материале звукоподражаний, лепетных, а позже и полных слов. По мере формирования у детей фразовой речи исходной единицей в работе по развитию слуха становится фраза.

Вначале детей учат различать на слух речевой материал.Различение на слух — это ответное действие на предъявление речевого материала, знакомого по звучанию. Знакомым по звучанию считается тот материал, который уже использовался в слуховой тренировке. Различение на слух осуществляется в ситуации ограниченного и наглядного выбора. Перед ребенком находятся предметы, картинки, таблички, соответствующие словам и фразам, предлагаемым на слух (например: дом, мама, молоко).

Ребенок различает звучания сначала при выборе из двух-трех, постепенно выбор увеличивается до восьми-десяти единиц.

Речевой материал для различения на слух каждому ребенку подбирается на неделю. В начале занятия он различает его на слухо- зрительной основе, затем педагог предъявляет образец звучания каждой речевой единицы, для этого он произносит на ухо или за экраном название того или иного предмета (картинки), одновременно показывая его (т. е. дошкольник знает, что он слушает). Наконец, на том же занятии сурдопедагог предъявляет этот же материал только на слух. По мере совершенствования навыка восприятия первые два этапа занимают все меньше и меньше места (особенно у слабослышащих).

После того как дошкольники научились различать на слух первые звукоподражания и слова, они учатся и опознавать их на слух.

Опознавание на слух — это ответные действия детей на предъявление знакомого по звучанию речевого материала. Опознавание осуществляется вне ситуации наглядного выбора. При обучении опознаванию педагог, не предъявляя ребенку ни табличек, ни картинок, ни предметов и не предупреждая, какой материал он будет слушать, предлагает для слухового восприятия слово, словосочетание или фразу. Ребенок слушает, а затем повторяет услышанное слово, фразу-сообщение, отвечает на вопрос, выполняет поручение. Если дошкольник ответил правильно, то взрослый в подтверждение правильности показывает соответствующую картинку (предмет, табличку).

Новые слова, словосочетания и фразы, особенно на первых годах обучения, дети сначала различают на слух, а затем и опознают. Для опознавания на слух на каждое занятие подбирается новый речевой материал. Те слова, словосочетания и фразы, которые ребенок не смог опознать, предлагаются ему для различения, а на последующем занятии — вновь для опознавания на слух. И для различения, и для опознавания предлагается речевой материал, разнородный грамматически и относящийся к разным тематическим группам, чтобы дети учились воспринимать материал вне ситуации.

Что такое опознавание речевого материала. Смотреть фото Что такое опознавание речевого материала. Смотреть картинку Что такое опознавание речевого материала. Картинка про Что такое опознавание речевого материала. Фото Что такое опознавание речевого материала

Помимо соблюдения указанных требований, педагог постепенно увеличивает расстояние, на котором ребенок слушает с индивидуальным слуховым аппаратом или без него. Это расстояние при различении на слух, как правило, бывает большим, чем то, на котором они опознают материал на слух.

Необходимо следить за тем, чтобы ребенок вслушивался в сказанное, а не гадал, что это может быть. Поэтому и при различении, и при опознавании на слух одна и та же фраза (слово) может повторяться неоднократно (иногда по два-три раза подряд). При этом чаще повторяется тот материал, который ребенок слышит хуже.

Когда ребенок начнет справляться с опознаванием на слух речевого материала, его учат распознавать на слух незнакомые

по звучанию слова, словосочетания, фразы.При этом незнакомым по звучанию считается тот материал, который впервые предлагается ребенку сразу на слух. Распознавание на слух — это ответные действия детей на предъявление речевого материала, незнакомого по звучанию. Распознавание осуществляется вне ситуации наглядного выбора. С целью обучения распознаванию на слух каждое новое слово (т. е. не отработанное ранее на занятиях по развитию слухового восприятия), словосочетание или фраза предъявляются ребенку сразу на слух, а не слухо- зрительно. Дошкольник повторяет то, что он услышал, воспроизводя либо отдельные элементы, либо контур слова, либо его точный звуковой состав. Если слово, словосочетание, фраза не восприняты на слух, то педагог предъявляет данную речевую единицу для слухо- зрительного восприятия, а затем и только на слух. Ребенок каждый раз повторяет воспринятое. Речевой материал, впервые предлагаемый для распознавания на слух, на том же и последующих занятиях предлагается для различения, а в дальнейшем и для опознавания на слух в более сложных акустических условиях: с индивидуальным слуховым аппаратом или без него при постепенно увеличивающемся расстоянии.

При обучении различению материала на слух и при его опознавании и распознавании каждая речевая единица, не воспринятая с первого предъявления, повторяется три — пять раз, Если она все же остается неузнанной, то слово, словосочетание, фраза предлагаются на слухо- зрительной основе, а затем снова на слух.

В детском саду большое внимание уделяется работес текстом.Так, глухие и слабослышащие дети учатся опознавать на слух знакомые детские стихи и песенки. С этой целью педагог сразу на слух произносит четверостишие или поет один куплет песни и спрашивает ребенка, что он услышал. Затем песенка или стихотворение предъявляется для слухо- зрительного восприятия и вновь на слух. Упражнения проводятся и на последующих занятиях до тех пор, пока дошкольник не научится узнавать данное стихотворение (песню) на слух. В дальнейшем педагог то же самое делает со вторым и последующими стихами и песнями. В процессе этой работы дети учатся отличать одно стихотворение (песенку) от другого.

Глухие и слабослышащие дети учатся также воспринимать на слух и прозаические тексты. Глухих дошкольников на последнем году обучения готовят к восприятию на слух текстов. Дети учатся воспринимать на слухо- зрительной основе и различать на слух речевой материал типа: «Девочка взяла бумагу и карандаш. Девочка рисует мяч». Данный речевой материал предлагается слухо- зрительно не более двух раз. После его прослушивания ребенок должен сказать, что он понял. Если он не может повторить сказанного (чего не должно быть на четвертом-пятом году обучения), материал предлагается ему для прочтения. Затем

педагог дает образец звучания данных фраз: показывая ребенку написанное на табличке первое предложение, он произносит его за экраном, затем то же делает и со вторым предложением. В дальнейшем дошкольник учится различать на слух фразы, слова и словосочетания, предъявляемые вразбивку. Фразы, написанные на табличке, а также соответствующая картинка или предметы находятся перед ребенком.

После того как дошкольник научится различать на слух фразы и слова, ему предлагается выполнить ряд заданий, ответить на вопросы. Задания и вопросы предъявляются сразу на слух. Если после двухкратного повторения вопроса (задания) дошкольник не смог понять его, то педагог предъявляет его для восприятия на слухо- зрительной основе, а затем — на слуховой. Речевой материал считается усвоенным, если ребенок воспринимает на слух обе фразы и все слова и словосочетания из них, данные вразбивку, а также отвечает на вопросы и выполняет задания, воспринятые на слух. Работа с данным речевым материалом проводится обычно на трех-пяти занятиях.

Слабослышащих дошкольников, начиная со средней группы, учат воспринимать на слух сначала хорошо знакомые тексты, а затем и новые. При этом на начальном этапе работы обязательно используются сюжетные картинки, постепенно все больше текстов предлагается ребенку без опоры на картинку. Каждый новый текст предъявляется на слух не более двух раз. Ребенок пересказывает его. Затем текст предъявляется пофразно, каждая фраза предлагается на слух не более трех-пяти раз. Если дошкольник не может воспроизвести ее точно, она повторяется для слухо- зрительного восприятия и для чтения. После предъявления последней фразы педагог вновь прочитывает весь текст, который ребенок воспринимает уже слухо- зрительно, а затем читает. В дальнейшем дошкольники различают и опознают речевой материал, входящий в текст, а также отвечают на вопросы и выполняют задания по нему, которые предъявляются на слух не более двух раз. Работа с одним текстом, как правило, ведется в течение двух-трех занятий.

Как при использовании индивидуального слухового аппарата, так и без него большое внимание уделяется постепенному увеличению расстояния, на котором ребенок может воспринимать материал на слух. Речевой материал произносится голосом разговорной громкости. Если слабослышащий дошкольник воспринимает его без аппарата на 1 м и более, его необходимо тренировать в различении, опознавании и распознавании слов, словосочетаний и фраз, произносимых шепотом.

Работая над развитием слухового восприятия, следует осуществлять контроль за реализацией произносительных возможностей каждого ребенка.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *