Что такое оцифровка есть ли потеря информации при оцифровке почему

Что такое оцифровка?

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Сканирование, ретроконверсия и сопутствующие услуги. Обзор технологий перевода документов в электронный вид.

Существует несколько вариантов организации процессов оцифровки. Они могут производиться самостоятельно или с аутсорсингом услуг, с вывозом документов или выполнением работ на своей территории. При оцифровке могут применяться офисные, профессиональные документные или планетарные сканеры. Данные могут извлекаться в ручном, полуавтоматическом или автоматическом режимах, с проведением предварительной архивной обработки бумажных документов или классификацией информации уже в электронном виде и т.д.

Какой путь выбрать?

Решение зависит от конкретной задачи, потому что каждое из вышеупомянутых «или» определяет качество получаемого результата и стоимость работ. Например, извечен вопрос сшитых документов: выгодней медленно отсканировать в сшитом состоянии или потратиться на расшивку, зато быстро оцифровать на документных сканерах?

Самый простой способ выбрать наиболее подходящий для вас путь – обратиться за экспертизой к специализирующейся на оцифровке организации. Заинтересованные в работах, крупные компании проведут обследование бесплатно, и за вас определят оптимальный подход. Не пренебрегайте этой возможностью и не ждите склонения к заказу услуг: большинство этих компаний также заинтересованы в поставке оборудования и ПО для самостоятельной оцифровки.

Сколько документов нужно сканировать?

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Определяющий параметр – объем документов.

Определяющий параметр – объем документов. Для ежедневного сканирования небольших пачек расшитых документов (например, первичной бухгалтерии) подойдет обычный офисный сканер, выдерживающий нагрузку в несколько тысяч страниц в день. Нужно лишь дополнить его удобной программой для индексирования.

Для регулярного сканирования больших объемов необходимо профессиональное оборудование. Это – промышленные сканеры, которые стоят немалых денег (подобное оборудование используют ФНС, ФТС, крупные банки). Поэтому менее дорогой альтернативой может стать рамочное соглашение на оказание периодических услуг оцифровки.

Перевод в электронный вид больших ретроспективных массивов своими силами экономически не обоснован: помимо закупки оборудования и обучения сотрудников, потребуются значительные трудовые и временные затраты. Однозначно эффективнее заказывать услугу, так как крупная компания может выделить большой штат и решить задачу оперативно.

Где сканировать документы?

Определяющий параметр – востребованность сканируемых документов. Влияет ли на деятельность организации изъятие документов на время сканирования? Особенно это критично при оцифровке документов, к которым регулярно обращаются сотрудники, либо которые могут быть внезапно запрошены контролирующим органом, а также для устранения связанных с документами ЧП. Примеры: финансовые и кадровые документы, техническая и эксплуатационная документация, книги ЗАГС и другие отраслевые фонды.

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Участок сканирования, организованный в помещениях компании-заказчика услуг.

Если необходимо оцифровать их достаточно быстро, то традиционным подходом является заказ услуг с выездом бригады сканирования на вашу территорию. Зачастую это оказывается дешевле, чем доставлять документы на производство исполнителя и обратно, но все определяет территориальная удаленность. Регламент выездных работ подразумевает сканирование выданного дела в течение одного-двух рабочих дней, без длительного изъятия из рабочего процесса.

Расшивать ли документы?

Определяющие параметры: состояние документов и возможность расшивки. Если есть такая возможность, и бумага пригодна для протяжки документным сканером, то следует расшивать. Дело в том, что сканирование сшитых документов на планетарном (книжном) сканере в несколько десятков раз медленнее потоковой оцифровки. Пропорционально увеличиваются время работ и стоимость труда. Сканирование на документных сканерах, даже с учетом расшивки, оперативнее и дешевле.

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Расшивать можно самостоятельно, а можно доверить это исполнителю.

Расшивать можно самостоятельно, а можно доверить это исполнителю: если выбрана авторитетная компания, опасаться утраты документов не стоит. Наоборот, жесткая регламентация всех процессов и качественные материалы позволяют компаниям застраховаться от дополнительных финансовых потерь и ущерба имиджу. Этому подходу доверяют даже российские суды: при организации сканирования обычно внутренним приказом разрешается расшивка и последующая сшивка судебных дел.

К слову, крупные компании параллельно могут провести профессиональную архивную обработку: во-первых, часть работ итак выполняется при подготовке к сканированию, во-вторых, архивная обработка помогает выявить невостребованные документы и сократить объемы сканируемых массивов, что может снизить стоимость работ.

Какое качество выбрать?

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Сегодня высококачественно можно отсканировать любой объект: от маленькой библиотечной карточки до карт формата 8А0 и театральных декораций.

Определяющие параметры: вид документа и объем получаемого ресурса в электронной форме. Сегодня сканирующее оборудование позволяет получать образы с разрешением от 200 до 1200 точек на дюйм (dpi). Для художественных произведений обычно применяется разрешение 400–600 dpi, позволяющее создавать высококачественные репродукции. Более высокое качество используется только при необходимости увеличения изображения и детализации мелких предметов, например, монет.

Детализированные и неконтрастные чертежи, часто выполненные на кальке и синьке, нуждаются в сканировании с разрешением 300-400 точек на дюйм и дополнительной обработке изображений в графических редакторах. Остальные документы обычно сканируются с разрешением 300 dpi, достаточным для распечатки копий без потери качества. Необходимая обрезка изображений, геометрическое исправление, цветокоррекция, конвертация в форматы pdf, tiff, jpegи др. может проводиться в полностью автоматическом режиме программами, встроенными в сканирующее оборудование или поставляемыми вместе с ним.

В большинстве случаев используется цветной режим съемки. Это нужно для всех документов, в которые вносились исправления или ставились печати поверх текста, для удостоверения того, что электронная копия снималась с оригинала документа с печатью и подписью, а также для читаемости угасающих текстов и передачи уникальных особенностей оригинала. Необходимость цветного сканирования художественных произведений не обсуждается. Режим «градации серого» применяется лишь в некоторых случаях: когда документы не содержат цветных атрибутов, либо когда необходимо сократить объем получаемого электронного ресурса.

Сканирование может осуществляться самостоятельно. Главной задачей становится обучение сотрудников правильной работе со сложной техникой, так как качество получаемых изображений важно для последующего индексирования: плохо отсканированный документ, тени, засветка и другие дефекты на электронном образе могут сделать нечитаемой важную информацию. Это не позволит применить технологии автоматического извлечения данных и может привести к ошибкам в индексировании. Загрузка ошибочных данных в некоторые системы (государственные реестры, бухгалтерские учетные системы) не позволительна.

Индексирование

Простое сканирование применяется редко, поскольку при последующей работе искать информацию в наборе графических файлов будет лишь немногим проще перелистывания бумаги. Для возможности поиска необходимо выделить в документе несколько атрибутов (индексных полей).

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Сотрудники, задействованные в массовом индексировании документов методом ручного ввода.

Выделенные атрибуты можно внести в имя файла. Такая практика сложилась в российских судах: для того чтобы оператор сканирования не имел доступа к внутренним системам суда, при оцифровке все необходимые реквизиты вносятся в имя файла. В последующем эти реквизиты распознаются системой судопроизводства при загрузке каждого документа по отдельности.

Но обычно оцифрованные документы загружаются в информационную систему группой, что требует создания базы данных. Так, если необходимо прикрепить документ к уже существующей карточке в учетной системе, бывает достаточно извлечь пару однозначно определяющих его реквизитов – обычно номер и дату.

Если же нужно сформировать поисковую базу на основании самих документов, то объем извлекаемых данных определяется задачей: от пары реквизитов для поиска файла в электронном архиве до переноса всей значимой информации в аналитическую БД (ФИО, адресов, ИНН, КПП, дат, номеров документов-приложений и т.д.).

Свои правила индексирования применяются в музеях, библиотеках и архивах при оцифровке единиц хранения и учетных документов. Отдельным направлением услуг также является векторизация, которая применяется, в частности, при оцифровке каротажных лент (автоматическая) и чертежей (ручная отрисовка в CAD-системах).

Сколько данных извлекать?Ответ на этот вопрос также лучше получить, воспользовавшись экспертизой, так как количество извлекаемых реквизитов зависит от функциональной задачи и в значительной мере определяет стоимость оцифровки. В некоторых случаях можно ограничиться подборками документов, когда электронные образы объединяются под эгидой основного документа (например, договора или реестра счетов). В других необходимо извлечение всех содержащихся в документе данных для заполнения карточки информационной системы.

Примеры извлекаемых данных

Анализ размещенных на портале zakupki.gov.ru заказов компаний с государственным участием и госучреждений (44-ФЗ, 223-ФЗ), показывает, что:

– Для привязки электронных копий ОРД к системе электронного документооборота достаточно номера, даты и типа документа.

– Сканирование финансовой документации часто сопровождается извлечением номера, даты, наименований и реквизитов плательщиков, сумм.

– Оцифровка архивных документов муниципалитетов (постановления администраций, горисполкомов, сельсоветов и т.д.) в целях оказания услуг и инвентаризации объектов земельно-имущественных отношений требует извлечения номера и даты документа, всех встречаемых ФИО и адресов. Причем адреса необходимо сопоставлять с текущими справочниками КЛАДР/ФИАС.

– Оцифровка документов Архивного фонда РФ сопровождается строгим заполнением НСА и описанием фондов в соответствии с архивным законодательством.

– Индексирование описей и реестров подразумевает распознаванием всех порядковых записей.

– Для работы с чертежами в электронном виде необходимо извлечь практически все поля штампа.

– Сканирование составных дел требует не только извлечения реквизита каждого документа, но и установления взаимосвязей. Наиболее сложен случай конструкторской документации, где формируемая база данных обладает многоуровневой иерархией и связями документов.

Источник: zakupki.gov.ru, 2015

Какие методы извлечения данных выбрать?

Определяющий параметр – качество текста. Применяемые технологии, скорость и стоимость формирования баз данных зависят от того, как написан и в каком состоянии находится текст документа.

Напечатанный на современном принтере текст может быть автоматически распознан, необходимые данные могут быть извлечены с использованием различных автоматизированных методов: применением шаблонов и автоэкстракцией индексов (алгоритмы определения ключевых слов, семантического анализа и т.д.). Эти методы быстрые, и в большинстве случаев их стоимость ниже цены ручного распознавания.

Напечатанные необычным шрифтом, в низком качестве или поврежденные тексты книг, газет, архивных документов распознаются не всегда или с недостаточной точностью. Поэтому в большинстве случаев требуется ручной ввод или, по крайней мере, ручная проверка сведений. Предварительно для каждого ресурса формируются или подключаются внешние справочники, которые помогают операторам индексирования и значительно ускоряют процесс.

Документы с рукописным текстом индексируются только вручную. Это гораздо более медленный и дорогой процесс. Поэтому крупные компании применяют уникальные технологии, служащие ускорению обработки и, соответственно, снижению цены без потери качества. Показателен пример официальной переписки: в этих документах традиционно реквизиты печатаются, а номер и дата проставляется вручную по факту, что делает невозможным полноценное программное индексирование.

Можно ли провести индексирование самостоятельно?

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Альтернативой является технология извлечения данных с помощью анализа текста, применимая для любых документов, в том числе неструктурированных. Этот метод зачастую более доступен по цене, но предлагается только парой крупных компаний, так как требует накопления серьезной семантическо-морфологической базы для каждой отрасли деятельности.

Можно также вносить данные напрямую в информационную систему. Однако этот способ связан с высокой вероятностью ошибок, отследить которые в системе крайне сложно. При самостоятельном индексировании рекомендуется сначала создавать определенную базу данных, которую перед загрузкой можно проверить.

Именно так работают специализирующиеся на оцифровке компании: жесткая регламентация процесса, с протоколированием всех действий, и обязательная проверка сформированного массива ОКК позволяет минимизировать количество возможных ошибок. Например, корпорацией ЭЛАР в официальных договорах и контрактах используется стандартный критерий качества ≥99,8%. Теме выборы критериев качества будет посвящена одна из следующих статей.

Источник

Почему стоит делать оцифровку?

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почемуЗдравствуйте, дорогие друзья!
Продолжаем с вами тему оцифровки данных. В прошлой статье на блоге мы говорили о том, что такое оцифровка. В сегодняшней статье мы поговорим с вами о том, почему стоит делать оцифровку. У аналогового формата имеется один, но очень существенный недостаток. Проблема заключается в том, что информация, представленная в аналоговом виде, имеет свойство искажаться, портиться, а то и вовсе может быть утеряна в результате старения носителя.

Например, магнитные ленты в видеокассетах со временем размагничиваются, осыпаются, что, несомненно, отражается на качестве картинки, и спустя какое-то время видео может просто не поддаться восстановлению. То же самое относится и к аудиокассетам.

Что касается фотографий, то они также стареют, выцветают и со временем качество изображения на фото ухудшается и становится практически невидимым.

Выходит, что главный враг для аналогового формата – это время!

Поэтому оцифровка – это единственное, что позволит сохранить ваш старый архив и все воспоминания на очень долгое время.

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Почему стоит делать оцифровку?

Оцифровка позволяет перенести всю информацию в электронный цифровой файл, имеющий ряд преимуществ, и с которым можно делать все, что угодно:

Но самое главное преимущество, как я уже говорил, заключается в том, что цифровой файл никогда не испортится и может существовать вечно, особенно если сделать сразу несколько резервных копий.

Однако срок хранения – это не единственное преимущество цифрового формата перед аналоговым. Не менее важным фактором является то, что при копировании с цифры на цифру мы абсолютно не теряем качества. В то время как при перезаписи аналоговых данных с каждой новой копией теряется 15% и это число возрастает по экспоненте от копии к копии.

Цифровая революция свершилась! Аналоговые носители перешли в разряд ретро и используются в основном энтузиастами и художниками.

Для лучшего качества, удобного хранения и быстрого доступа к данным используйте цифровые форматы данных. Если у вас есть старый архив, нуждающийся в оцифровке, то оцифруйте его!

Вот, почему стоит делать оцифровку. Чтобы ваши воспоминания никогда не исчезли и всегда были под рукой.

Рекомендую дополнительно почитать полезные статьи и материалы:

Если вам интересно знать, что такое оцифровка и для чего она нужна, то рекомендуется прочитать статью «Что такое оцифровка?»

Для тех, кто хочет самостоятельно оцифровать, обработать и реставрировать любые аналоговые данные в домашних условиях, не обращаясь в профессиональные студии оцифровки, рекомендуется прочитать книгу «Оцифровка аудио, видео, фото, книг и документов в домашних условиях».

Данная книга – это пошаговое руководство по грамотному выбору оборудования, программного обеспечения и самостоятельной оцифровке любых аналоговых данных – аудио, видео, фото, книг и документов в домашних условиях.

Книга «Оцифровка аудио, видео, фото, книг и документов в домашних условиях» – это мощный инструмент, который поможет качественно оцифровать, обработать и реставрировать домашний архив!

На этом пока все! Надеюсь, что вы нашли в этой заметке что-то полезное и интересное для себя. Если у вас имеются какие-то мысли или соображения по этому поводу, то, пожалуйста, высказывайте их в своих комментариях. До встречи в следующих заметках! Удачи! 😎

Источник

Кодирование звуковой информации

Презентация к уроку «Кодирование звуковой информации». Раскрываются такие понятия как: оцифровка звука; интервал и частота дисретизации; разрядность кодирования.

Просмотр содержимого документа
«Кодирование звуковой информации»

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Кодирование звуковой информации

Аналоговый сигнал – это произвольное изменение некоторой величины в заданном диапазоне.

В любой момент времени сигнал на выходе микрофона (ток или напряжение) может принимать любое значение в некотором интервале.

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Оцифровка – это преобразование аналогового сигнала в цифровой код.

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Для кодирования звука в компьютерах чаще всего используются следующие частоты дискретизации:

Выбранная частота влияет на качество цифрового звука.

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Представим себе, что на один отсчет выделяется 3 бита. При этом код каждого отсчета – это целое число от 0 до 7. Весь диапазон возможных значений сигнала, от 0 до максимально допустимого, делится на 8 полос, каждой из которых присваивается номер (код). Все отсчеты, попавшие в одну полосу, имеют одинаковый код

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Преобразование измеренного значения сигнала в число называется дискретизацией по уровню. Эту операцию выполняет аналого-ифровой преобразователь (АЦП) звуковой карты.

С помощью оцифровки можно закодировать любой звук, который принимает микрофон. В частности, это единственный способ кодирования человеческого голоса и различных природных звуков (шум прибоя и т.п.).

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Среди форматов звуковых файлов наиболее известны:

Метод инструментального кодирования

Источник

Кодирование звуковой информации

Презентация к уроку «Кодирование звуковой информации». Раскрываются такие понятия как: оцифровка звука; интервал и частота дисретизации; разрядность кодирования.

Просмотр содержимого документа
«Кодирование звуковой информации»

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Кодирование звуковой информации

Аналоговый сигнал – это произвольное изменение некоторой величины в заданном диапазоне.

В любой момент времени сигнал на выходе микрофона (ток или напряжение) может принимать любое значение в некотором интервале.

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Оцифровка – это преобразование аналогового сигнала в цифровой код.

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Для кодирования звука в компьютерах чаще всего используются следующие частоты дискретизации:

Выбранная частота влияет на качество цифрового звука.

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Представим себе, что на один отсчет выделяется 3 бита. При этом код каждого отсчета – это целое число от 0 до 7. Весь диапазон возможных значений сигнала, от 0 до максимально допустимого, делится на 8 полос, каждой из которых присваивается номер (код). Все отсчеты, попавшие в одну полосу, имеют одинаковый код

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Преобразование измеренного значения сигнала в число называется дискретизацией по уровню. Эту операцию выполняет аналого-ифровой преобразователь (АЦП) звуковой карты.

С помощью оцифровки можно закодировать любой звук, который принимает микрофон. В частности, это единственный способ кодирования человеческого голоса и различных природных звуков (шум прибоя и т.п.).

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Среди форматов звуковых файлов наиболее известны:

Метод инструментального кодирования

Источник

Цифровое представление аналогового аудиосигнала. Краткий ликбез

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Дорогие читатели, меня зовут Феликс Арутюнян. Я студент, профессиональный скрипач. В этой статье хочу поделиться с Вами отрывком из моей презентации, которую я представил в университете музыки и театра Граца по предмету прикладная акустика.

Рассмотрим теоретические аспекты преобразования аналогового (аудио) сигнала в цифровой.
Статья не будет всеохватывающей, но в тексте будут гиперссылки для дальнейшего изучения темы.

Чем отличается цифровой аудиосигнал от аналогового?

Аналоговый (или континуальный) сигнал описывается непрерывной функцией времени, т.е. имеет непрерывную линию с непрерывным множеством возможных значений (рис. 1).

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Цифровой сигнал — это сигнал, который можно представить как последовательность определенных цифровых значений. В любой момент времени он может принимать только одно определенное конечное значение (рис. 2).

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Аналоговый сигнал в динамическом диапазоне может принимать любые значения. Аналоговый сигнал преобразуется в цифровой с помощью двух процессов — дискретизация и квантование. Очередь процессов не важна.

Дискретизацией называется процесс регистрации (измерения) значения сигнала через определенные промежутки (обычно равные) времени (рис. 3).

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Квантование — это процесс разбиения диапазона амплитуды сигнала на определенное количество уровней и округление значений, измеренных во время дискретизации, до ближайшего уровня (рис. 4).

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Дискретизация разбивает сигнал по временной составляющей (по вертикали, рис. 5, слева).
Квантование приводит сигнал к заданным значениям, то есть округляет сигнал до ближайших к нему уровней (по горизонтали, рис. 5, справа).

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Эти два процесса создают как бы координатную систему, которая позволяет описывать аудиосигнал определенным значением в любой момент времени.
Цифровым называется сигнал, к которому применены дискретизация и квантование. Оцифровка происходит в аналого-цифровом преобразователе (АЦП). Чем больше число уровней квантования и чем выше частота дискретизации, тем точнее цифровой сигнал соответствует аналоговому (рис. 6).

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Уровни квантования нумеруются и каждому уровню присваивается двоичный код. (рис. 7)

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Количество битов, которые присваиваются каждому уровню квантования называют разрядностью или глубиной квантования (eng. bit depth). Чем выше разрядность, тем больше уровней можно представить двоичным кодом (рис. 8).

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Данная формула позволяет вычислить количество уровней квантования:

Если N — количество уровней квантования,
n — разрядность, то

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Обычно используют разрядности в 8, 12, 16 и 24 бит. Несложно вычислить, что при n=24 количество уровней N = 16,777,216.

При n = 1 аудиосигнал превратится в азбуку Морзе: либо есть «стук», либо нету. Существует также разрядность 32 бит с плавающей запятой. Обычный компактный Аудио-CD имеет разрядность 16 бит. Чем ниже разрядность, тем больше округляются значения и тем больше ошибка квантования.

Ошибкой квантований называют отклонение квантованного сигнала от аналогового, т.е. разница между входным значением Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почемуи квантованным значением Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему(Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему)

Большие ошибки квантования приводят к сильным искажениям аудиосигнала (шум квантования).

Чем выше разрядность, тем незначительнее ошибки квантования и тем лучше отношение сигнал/шум (Signal-to-noise ratio, SNR), и наоборот: при низкой разрядности вырастает шум (рис. 9).

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Разрядность также определяет динамический диапазон сигнала, то есть соотношение максимального и минимального значений. С каждым битом динамический диапазон вырастает примерно на 6dB (Децибел) (6dB это в 2 раза; то есть координатная сетка становиться плотнее, возрастает градация).

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Ошибки квантования (округления) из-за недостаточного количество уровней не могут быть исправлены.

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

50dB SNR
примечание: если аудиофайлы не воспроизводятся онлайн, пожалуйста, скачивайте их.

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Теперь о дискретизации.

Как уже говорили ранее, это разбиение сигнала по вертикали и измерение величины значения через определенный промежуток времени. Этот промежуток называется периодом дискретизации или интервалом выборок. Частотой выборок, или частотой дискретизации (всеми известный sample rate) называется величина, обратная периоду дискретизации и измеряется в герцах. Если
T — период дискретизации,
F — частота дискретизации, то
Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Чтобы аналоговый сигнал можно было преобразовать обратно из цифрового сигнала (точно реконструировать непрерывную и плавную функцию из дискретных, «точечных» значении), нужно следовать теореме Котельникова (теорема Найквиста — Шеннона).

Теорема Котельникова гласит:

Если аналоговый сигнал имеет финитный (ограниченной по ширине) спектр, то он может быть восстановлен однозначно и без потерь по своим дискретным отсчетам, взятым с частотой, строго большей удвоенной верхней частоты.

Вам знакомо число 44.1kHz? Это один из стандартов частоты дискретизации, и это число выбрали именно потому, что человеческое ухо слышит только сигналы до 20kHz. Число 44.1 более чем в два раза больше чем 20, поэтому все частоты в цифровом сигнале, доступные человеческому уху, могут быть преобразованы в аналоговом виде без искажении.

Но ведь 20*2=40, почему 44.1? Все дело в совместимости с стандартами PAL и NTSC. Но сегодня не будем рассматривать этот момент. Что будет, если не следовать теореме Котельникова?

Когда в аудиосигнале встречается частота, которая выше чем 1/2 частоты дискретизации, тогда возникает алиасинг — эффект, приводящий к наложению, неразличимости различных непрерывных сигналов при их дискретизации.

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Как видно из предыдущей картинки, точки дискретизации расположены так далеко друг от друга, что при интерполировании (т.е. преобразовании дискретных точек обратно в аналоговый сигнал) по ошибке восстанавливается совершенно другая частота.

Аудиопример 4: Линейно возрастающая частота от

100 до 8000Hz. Частота дискретизации — 16000Hz. Нет алиасинга.

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Аудиопример 5: Тот же файл. Частота дискретизации — 8000Hz. Присутствует алиасинг

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Пример:
Имеется аудиоматериал, где пиковая частота — 2500Hz. Значит, частоту дискретизации нужно выбрать как минимум 5000Hz.

Следующая характеристика цифрового аудио это битрейт. Битрейт (bitrate) — это объем данных, передаваемых в единицу времени. Битрейт обычно измеряют в битах в секунду (Bit/s или bps). Битрейт может быть переменным, постоянным или усреднённым.

Следующая формула позволяет вычислить битрейт (действительна только для несжатых потоков данных):

Битрейт = Частота дискретизации * Разрядность * Количество каналов

Например, битрейт Audio-CD можно рассчитать так:
44100 (частота дискретизации) * 16 (разрядность) * 2 (количество каналов, stereo)= 1411200 bps = 1411.2 kbit/s

При постоянном битрейте (constant bitrate, CBR) передача объема потока данных в единицу времени не изменяется на протяжении всей передачи. Главное преимущество — возможность довольно точно предсказать размер конечного файла. Из минусов — не оптимальное соотношение размер/качество, так как «плотность» аудиоматериала в течении музыкального произведения динамично изменяется.

При кодировании переменным битрейтом (VBR), кодек выбирает битрейт исходя из задаваемого желаемого качества. Как видно из названия, битрейт варьируется в течение кодируемого аудиофайла. Данный метод даёт наилучшее соотношение качество/размер выходного файла. Из минусов: точный размер конечного файла очень плохо предсказуем.

Усреднённый битрейт (ABR) является частным случаем VBR и занимает промежуточное место между постоянным и переменным битрейтом. Конкретный битрейт задаётся пользователем. Программа все же варьирует его в определенном диапазоне, но не выходит за заданную среднюю величину.

При заданном битрейте качество VBR обычно выше чем ABR. Качество ABR в свою очередь выше чем CBR: VBR > ABR > CBR.

ABR подходит для пользователей, которым нужны преимущества кодирования VBR, но с относительно предсказуемым размером файла. Для ABR обычно требуется кодирование в 2 прохода, так как на первом проходе кодек не знает какие части аудиоматериала должны кодироваться с максимальным битрейтом.

Существуют 3 метода хранения цифрового аудиоматериала:

Несжатый (RAW) формат данных

Другой формат хранения несжатого аудиопотока это WAV. В отличие от RAW, WAV содержит заголовок файла.

Аудиоформаты с сжатием без потерь

Принцип сжатия схож с архиваторами (Winrar, Winzip и т.д.). Данные могут быть сжаты и снова распакованы любое количество раз без потери информации.

Как доказать, что при сжатии без потерь, информация действительно остаётся не тронутой? Это можно доказать методом деструктивной интерференции. Берем две аудиодорожки. В первой дорожке импортируем оригинальный, несжатый wav файл. Во второй дорожке импортируем тот же аудиофайл, сжатый без потерь. Инвертируем фазу одного из дорожек (зеркальное отображение). При проигрывании одновременно обеих дорожек выходной сигнал будет тишиной.

Это доказывает, что оба файла содержат абсолютно идентичные информации (рис. 11).

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Кодеки сжатия без потерь: flac, WavPack, Monkey’s Audio…

При сжатии с потерями

акцент делается не на избежание потерь информации, а на спекуляцию с субъективными восприятиями (Психоакустика). Например, ухо взрослого человек обычно не воспринимает частоты выше 16kHz. Используя этот факт, кодек сжатия с потерями может просто жестко срезать все частоты выше 16kHz, так как «все равно никто не услышит разницу».

Другой пример — эффект маскировки. Слабые амплитуды, которые перекрываются сильными амплитудами, могут быть воспроизведены с меньшим качеством. При громких низких частотах тихие средние частоты не улавливаются ухом. Например, если присутствует звук в 1kHz с уровнем громкости в 80dB, то 2kHz-звук с громкостью 40dB больше не слышим.

Этим и пользуется кодек: 2kHz-звук можно убрать.

Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть фото Что такое оцифровка есть ли потеря информации при оцифровке почему. Смотреть картинку Что такое оцифровка есть ли потеря информации при оцифровке почему. Картинка про Что такое оцифровка есть ли потеря информации при оцифровке почему. Фото Что такое оцифровка есть ли потеря информации при оцифровке почему

Кодеки сжатия с потерям: mp3, aac, ogg, wma, Musepack…

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *