Что такое оцифровка информации

Значение слова «оцифровка»

Что такое оцифровка информации. Смотреть фото Что такое оцифровка информации. Смотреть картинку Что такое оцифровка информации. Картинка про Что такое оцифровка информации. Фото Что такое оцифровка информации

Для оцифровки объект подвергается дискретизации (в одном или нескольких измерениях, например, в одном измерении для звука, в двух для растрового изображения) и аналогово-цифровому преобразованию конечных уровней.

Полученный в результате оцифровки массив данных («цифровое представление» оригинального объекта) может использоваться компьютером для дальнейшей обработки, передачи по цифровым каналам, сохранению на цифровой носитель. Перед передачей или сохранением цифровое представление, как правило, подвергается фильтрации и кодированию для уменьшения объема.

Иногда термин «оцифровка» используется в переносном смысле, в качестве замены для соответствующего термина[уточнить], при переводе информации из аналогового вида в цифровой. Например:

Оцифровка видео — перенос видеосигнала из внешнего источника с видеокассетой на цифровое устройство с последующей обработкой (сжатием, перекодировкой) и записью на цифровой носитель (dvd-диск, флеш-носитель, внешний жесткий диск);

Оцифровка книг — как сканирование, так и (в дальнейшем) распознавание.

Оцифровка бумажных карт местности — означает сканирование и, как правило, последующую векторизацию (растрово-векторное преобразование, т. е. перевод в формат векторного описания).

Оцифровка данных производится на специальном оборудовании, позволяющем захватить аналоговый сигнал и преобразовать его в цифровой. Оцифровкой занимаются специализированные профессиональные студии (ТВ- и звукозаписывающие) и частные компании.

оцифро́вка

1. техн. действие по значению гл. оцифровывать, оцифровать; преобразование (аналоговых) сигналов, данных и т. п. в цифровую форму, предназначенную для обработки или хранения в виде чисел

2. социол. определение количественных характеристик

Делаем Карту слов лучше вместе

Что такое оцифровка информации. Смотреть фото Что такое оцифровка информации. Смотреть картинку Что такое оцифровка информации. Картинка про Что такое оцифровка информации. Фото Что такое оцифровка информацииПривет! Меня зовут Лампобот, я компьютерная программа, которая помогает делать Карту слов. Я отлично умею считать, но пока плохо понимаю, как устроен ваш мир. Помоги мне разобраться!

Спасибо! Я стал чуточку лучше понимать мир эмоций.

Вопрос: вместилище — это что-то нейтральное, положительное или отрицательное?

Источник

Что значит Оцифровка?

Моя студия занимается оцифровкой почти всех существующих форматов, так что давайте разберемся что же это значит и зачем это нужно.

Оцифро́вка (англ. digitization) — описание объекта, изображения или аудио- видеосигнала (в аналоговом виде) в виде набора дискретных цифровых замеров (выборок) этого сигнала/объекта, при помощи той или иной аппаратуры, т. е. перевод его в цифровой вид, пригодный для записи на электронные носители. (©Википедия)

Проще говоря Что такое оцифровка информации. Смотреть фото Что такое оцифровка информации. Смотреть картинку Что такое оцифровка информации. Картинка про Что такое оцифровка информации. Фото Что такое оцифровка информациипроцесс оцифровки- это перевод какой-либо аналоговой величины в цифровую форму.
Полученный в результате оцифровки массив данных («цифровое представление» оригинального объекта) может использоваться компьютером для дальнейшей обработки, передачи по цифровым каналам, сохранению на цифровой носитель. Перед передачей или сохранением цифровое представление, как правило, подвергается фильтрации и кодированию для уменьшения объема.

Оцифровка бывает нескольких видов:
• Оцифровка звука;
• Оцифровка видео;
• Оцифровка киноплёнки;
• Оцифровка изображения;
• Оцифровка архивных документов — сканирование, каталогизацияи создание электронного архива
• Оцифровка книг — как сканирование, так и в дальнейшем распознавание;
• Оцифровка бумажных карт местности — означает сканирование и, как правило, последующую векторизацию (растрово-векторное преобразование, т. е. перевод в формат векторного описания).

Оцифровка данных производится на специальном оборудовании, позволяющем захватить аналоговый сигнал и преобразовать его в цифровой.Что такое оцифровка информации. Смотреть фото Что такое оцифровка информации. Смотреть картинку Что такое оцифровка информации. Картинка про Что такое оцифровка информации. Фото Что такое оцифровка информации

С тем что такое оцифровка мы разобрались, но зачем же она нужна?
А вот зачем. Информация представленная в аналоговой форме имеет свойство искажаться, портиться, а то и вовсе будет утеряна в результате старения носителя. Так, например, магнитные ленты в видеокассетах со временем размагничиваются, осыпаются, что несомненно отражается на качестве картинки, и спустя какое-то время видео может просто не поддаться восстановлению. В противовес аналоговому носителю возьмем цифровой DVD диск. Производители заявляют, что эксплуатационный срок диска составляет 100 лет. Так ли это? Возможно при правильном хранении, но в любом случае, срок хранения увеличивается в разы, а это десятки лет, да и цифровые данные всегда можно залить в интернет и на облако, где они уж точно будут храниться чуть ли не вечно. Однако срок хранения не единственное преимущество цифрового перед аналоговым, не менее важным фактором является то, что при копировании с цифры на цифру мы абсолютно не теряем качества, в то время как при перезаписи аналоговых данных с каждой новой копией теряется 15% и это число возрастает по экспоненте от копии к копии.

Что такое оцифровка информации. Смотреть фото Что такое оцифровка информации. Смотреть картинку Что такое оцифровка информации. Картинка про Что такое оцифровка информации. Фото Что такое оцифровка информации

Подведем итоги, цифровая революция свершилась. Аналоговые носители перешли в разряд ретро и используются в основном энтузиастами и художниками. Для лучшего качества, удобного хранения и быстрого доступа к данным используйте цифровые форматы данных, а если у вас есть что-то старое нуждающееся в оцифровке, то приносите нам, мы знаем что делать!

Источник

Оцифровка

Вы будете перенаправлены на Автор24

Человек сталкивается с технологиями оцифровки каждый раз, когда что-нибудь заправляет в сканер, делает фотографию, снимает видео (если камера не аналоговая, разумеется), разговаривает по сотовому телефону, пользуется Skype или Google Talk.

Для оцифровки объект подвергается дискретизации (в одном или нескольких измерениях, например, в одном измерении для звука, в двух для растрового изображения) и аналогово-цифровому преобразованию конечных уровней.

Полученный в результате оцифровки массив данных («цифровое представление» оригинального объекта) может использоваться компьютером для дальнейшей обработки, передачи по цифровым каналам, сохранению на цифровой носитель. Перед передачей или сохранением цифровое представление, как правило, подвергается фильтрации и кодированию для уменьшения объема.

Иногда термин «оцифровка» используется в переносном смысле при переводе информации из аналогового вида в цифровой. Например:

То есть оцифровывать можно какой угодно звук, любое изображение, чертёж, фотографию, рисунок, практически любое видео. Процесс представляет собой дискретизацию — разбиение всего на крошечные элементы, кванты или пиксели, описываемые нулями и единицами. В смысле, битами и байтами.

Готовые работы на аналогичную тему

Отдельный вид оцифровки — сканирование с распознаванием текста. То есть, сканер может узнавать буквы и представлять результат не в виде картинки, а как обычный электронный документ, словно его с клавиатуры напечатали, нередко даже с ошибками.

О том, что оцифровывается само (звук в телефоне, изображение в камере), особо заботиться не нужно. Достаточно подобрать качественные товары. Если же в биты и байты информация автоматически не превращается, то необходимо предпринять некоторые действия по самостоятельному осуществлению такого процесса.

Рассмотрим некоторые практические рекомендации, которые не помешают каждому.

Оцифровка звука

В простейшем случае линейный выход аналогового устройства (проигрывателя виниловых пластинок, например) подключается к микрофонному входу звуковой карты компьютера. Там происходит дискретизация — разбивка на кванты.

Каждый квант описывается битами, т.е. вышеупомянутыми нулями и единицами. Считывая эти биты, воспроизводящее устройство понимает, какие именно частоты нужно переводить обратно в аналоговый вид. Соответственно, чем больше битов выделено на каждый квант и каждую секунду, тем точнее описание.

Что касается программного обеспечения, в случае ограниченности бюджета, возможно, подойдёт кросс-платформенный свободный аудиоредактор Audacity.

Микрофоны, встроенные в карманные плееры, ноутбуки, сотовые телефоны, прицепленные к гарнитурам с наушниками, предназначены для передачи речи. Можно записать разговор и потом даже что-то разобрать при прослушивании, но особого качества звука не добьётесь.

Если вы оборудуете домашнюю студию, и вам требуется микрофон для пения (для по-настоящему качественной передачи частот звукового диапазона), можно приобрести конденсаторный, подключаемый к порту USB. У него на борту есть собственный аналого-цифровой преобразователь. Старайтесь при обработке звука в аудиоредакторе никогда не снижать частоту дискретизации и глубину описания звука (её ещё называют «разрешением»).

Оцифровка видео

Завалялись старые видеокассеты с семейным видео? Плёнка ещё не размагнитилась окончательно? Значит, понадобится пишущий DVD-плеер или TV-тюнер — устройство с аналого-цифровым преобразователем, способное осуществлять захват сигнала с аналоговых телевизора, видеомагнитофона, камеры.

TV-тюнер, как правило, даёт более качественный результат и позволяет осуществлять настройки параметров видео. Он может быть:

В комплекте с тюнером предоставляется софт для операционных систем Windows и Mac OS. Устанавливать его можно смело — будут и драйверы, и нужные пользовательские приложения.

Более того, при наличии драйверов оцифровку в разных форматах (используя разные кодеки) можно производить с помощью любого толкового видеоредактора, необязательно «родной» программы.

А вот пользователям Ubuntu повезло не так сильно. По крайней мере, на данном этапе развития свободных ОС.

Самым продвинутым приложением для GNU/Linux, умеющим осуществлять аудио- и видеозахват, считается TVTime. Однако прежде чем приобретать дополнительное «железо», следует изучить раздел «supported cards» на сайте разработчиков tvtime.sourceforge.net. Там рассказывается, какие платы как работают, какие драйверы в каком ядре Linux есть и хорошо ли они функционируют с теми или иными моделями.

Обладателям портативных устройств (ноутбуков и нетбуков) жить легче. Установили TVTime, отправились с компьютером в магазин — и проверили прямо там, поддерживает ли ядро Linux что-нибудь из предлагаемого ассортимента внешних TV-тюнеров.

В настройках программы желательно указать частую расстановку ключевых кадров (это полноценные картинки, между ними — только информация об их изменении, о движениях.) Пусть файл получится чуть больше, но прокручивать видео (и особенно редактировать) будет удобнее.

Впрочем, только на компьютере. Пишущий DVD-плеер и без дополнительных подсказок изготовит файлы со стандартными параметрами, вполне пригодные к употреблению.

Оцифровка изображений

Недостаточно положить картинку под крышку сканера и нажать на кнопку. Необходимо выставить хорошее разрешение.

Что касается софта. Для коммерческих операционных систем, как обычно, всё необходимое имеется на лазерных дисках, поставляемых в комплекте со сканером или многофункциональным устройством (МФУ), которое представляет собой гибрид принтера, сканера и ксерокса. Качественные программы есть и для GNU/Linux. В первую очередь, Simple Scan (для дистрибутивов с KDE —SkanLite). Выставили разрешение 300 dpi — и сканируйте сколько угодно.

Множеством параметров можно управлять в более сложной XSane (Sane с графическим интерфейсом). Тоже весьма качественная программа. Для распознавания текста обычно ищут пиратские копии коммерческих изделий. Но почему бы не использовать что-нибудь легальное? С 2008-го года программный комплекс CuneiForm является свободным (исходные коды открыты под лицензией BSD). Правда, это только ядро системы распознавания, нужен ещё и графический интерфейс (например, YAGF).

Итак, оцифровка представляет собой процесс разбиения чего-либо визуального или аудиовизуального на крошечные элементы и описание этих кусочков огромным количеством нулей и единиц.

Источник

Оцифровка, цифровизация и цифровая трансформация: разбираем понятия

Что такое оцифровка информации. Смотреть фото Что такое оцифровка информации. Смотреть картинку Что такое оцифровка информации. Картинка про Что такое оцифровка информации. Фото Что такое оцифровка информации

Бывает компании говорят, что они уже начали цифровую трансформацию, хотя в действительности они только оцифровали некоторые свои данные.

Бывает компании говорят, что они уже начали цифровую трансформацию, хотя в действительности они только оцифровали некоторые свои данные. XXI век открыл новую эру технологий, которая изменила повседневную жизнь, упростила устаревшие процессы и даже дала начало совершенно новым секторам бизнеса. Давайте разберемся, чем отличаются понятия оцифровка — цифровизация — цифровая трансформация. В статье использованы материалы сайтов CIOWaterCooler и CoreSystems.

Оцифровка: перевод данных из аналогового вида в цифровой

Если вы хоть раз сканировали бумажные документы, отказывались от кассет в пользу MP3-файлов или переходили на цифровые камеры вместо пленочного фотоаппарата, значит, вы оцифровывали свои данные.

Оцифровка — это перевод аналоговых данных в цифровую форму.

В качестве примера работы с аналоговыми данными Анна Ирнигер, автор статьи «Difference between Digitization, Digitalization and Digital Transformation» и эксперт в области Field Service Mаnаgement (управление выездными сотрудниками), приводит процесс починки сломанного устройства. Предположим, у вас сломался бытовой прибор. Вы звоните производителю, который вручную заполняет форму с описанием возникшей проблемы и отправляет технического специалиста к вам домой. Он приходит с кипой бумаг, где перемешаны контактные данные, инструкции по использованию продукта, список клиентов, которых нужно посетить сегодня, и целая куча других документов. Оцифровка же позволяет сделать эту информацию доступной в электронном виде.

Сандип Роту, автор статьи «Difference between Digitization and Digital Transformation» и эксперт, занимающий 7-е место в топ-100 влиятельных людей мира в области цифровой трансформации, под оцифровкой понимает не только перевод аналоговых данных в цифровую форму, но и автоматизацию процессов. Однако, последнее часто выделяют в отдельное понятие — цифровизация.

Цифровизация: используйте преимущества цифровой информации

У оцифрованных данных есть огромный потенциал для совершенствования стандартных способов работы. Если вернуться к примеру с починкой устройства, то для улучшения качества обслуживания клиентов производитель может внедрить специальное ПО, которое будет с умом использовать оцифрованную информацию. Например, централизованно хранить базу покупателей, их контактные данные, историю работы с конкретным клиентом. Разные технические специалисты могут делиться между собой приемами работы, а также просматривать инструкции по использованию продукта на любом мобильном устройстве. Все это позволит им легко получать доступ к нужной информации, а значит повысит вероятность починки прибора с первого раза.

Цифровизация — это встраивание новых технологий в существующие бизнес-процессы для повышения их эффективности.

В результате цифровизации не меняется бизнес-модель, а только повышается производительность труда.

Что такое оцифровка информации. Смотреть фото Что такое оцифровка информации. Смотреть картинку Что такое оцифровка информации. Картинка про Что такое оцифровка информации. Фото Что такое оцифровка информации

Цифровая трансформация: используйте цифровизацию для создания новых бизнес-моделей

Благодаря оцифровке и цифровизации данные становятся доступны с любых платформ, устройств и интерфейсов. Цифровая трансформация — это процесс интеграции всех оцифрованных данных и приложений, автоматизирующих бизнес-процессы. В качестве успешного примера цифровой трансформации автор приводит Netflix: оцифровка фильмов открыла компании дорогу к принципиально новой бизнес-модели — потоковому вещанию.

Перечислим несколько крупнейших двигателей цифровой трансформации на примере починки сломанного прибора:

Таким образом, цифровая трансформация — это процесс изменения существующих бизнес-моделей с помощью новых технологий. Она идет дальше, чем цифровизация, создавая новые стратегии, позволяющие приносить еще больше пользы клиентам, а также экономить самые ценные корпоративные ресурсы — время и деньги. Бизнес может использовать цифровую трансформацию для выхода на новые рынки, разработки новых продуктов и привлечения новых клиентов. Это процесс перехода к цифровому бизнесу.

Источник

Что такое оцифровка?

Что такое оцифровка информации. Смотреть фото Что такое оцифровка информации. Смотреть картинку Что такое оцифровка информации. Картинка про Что такое оцифровка информации. Фото Что такое оцифровка информации

Сканирование, ретроконверсия и сопутствующие услуги. Обзор технологий перевода документов в электронный вид.

Существует несколько вариантов организации процессов оцифровки. Они могут производиться самостоятельно или с аутсорсингом услуг, с вывозом документов или выполнением работ на своей территории. При оцифровке могут применяться офисные, профессиональные документные или планетарные сканеры. Данные могут извлекаться в ручном, полуавтоматическом или автоматическом режимах, с проведением предварительной архивной обработки бумажных документов или классификацией информации уже в электронном виде и т.д.

Какой путь выбрать?

Решение зависит от конкретной задачи, потому что каждое из вышеупомянутых «или» определяет качество получаемого результата и стоимость работ. Например, извечен вопрос сшитых документов: выгодней медленно отсканировать в сшитом состоянии или потратиться на расшивку, зато быстро оцифровать на документных сканерах?

Самый простой способ выбрать наиболее подходящий для вас путь – обратиться за экспертизой к специализирующейся на оцифровке организации. Заинтересованные в работах, крупные компании проведут обследование бесплатно, и за вас определят оптимальный подход. Не пренебрегайте этой возможностью и не ждите склонения к заказу услуг: большинство этих компаний также заинтересованы в поставке оборудования и ПО для самостоятельной оцифровки.

Сколько документов нужно сканировать?

Что такое оцифровка информации. Смотреть фото Что такое оцифровка информации. Смотреть картинку Что такое оцифровка информации. Картинка про Что такое оцифровка информации. Фото Что такое оцифровка информации

Определяющий параметр – объем документов.

Определяющий параметр – объем документов. Для ежедневного сканирования небольших пачек расшитых документов (например, первичной бухгалтерии) подойдет обычный офисный сканер, выдерживающий нагрузку в несколько тысяч страниц в день. Нужно лишь дополнить его удобной программой для индексирования.

Для регулярного сканирования больших объемов необходимо профессиональное оборудование. Это – промышленные сканеры, которые стоят немалых денег (подобное оборудование используют ФНС, ФТС, крупные банки). Поэтому менее дорогой альтернативой может стать рамочное соглашение на оказание периодических услуг оцифровки.

Перевод в электронный вид больших ретроспективных массивов своими силами экономически не обоснован: помимо закупки оборудования и обучения сотрудников, потребуются значительные трудовые и временные затраты. Однозначно эффективнее заказывать услугу, так как крупная компания может выделить большой штат и решить задачу оперативно.

Где сканировать документы?

Определяющий параметр – востребованность сканируемых документов. Влияет ли на деятельность организации изъятие документов на время сканирования? Особенно это критично при оцифровке документов, к которым регулярно обращаются сотрудники, либо которые могут быть внезапно запрошены контролирующим органом, а также для устранения связанных с документами ЧП. Примеры: финансовые и кадровые документы, техническая и эксплуатационная документация, книги ЗАГС и другие отраслевые фонды.

Что такое оцифровка информации. Смотреть фото Что такое оцифровка информации. Смотреть картинку Что такое оцифровка информации. Картинка про Что такое оцифровка информации. Фото Что такое оцифровка информации

Участок сканирования, организованный в помещениях компании-заказчика услуг.

Если необходимо оцифровать их достаточно быстро, то традиционным подходом является заказ услуг с выездом бригады сканирования на вашу территорию. Зачастую это оказывается дешевле, чем доставлять документы на производство исполнителя и обратно, но все определяет территориальная удаленность. Регламент выездных работ подразумевает сканирование выданного дела в течение одного-двух рабочих дней, без длительного изъятия из рабочего процесса.

Расшивать ли документы?

Определяющие параметры: состояние документов и возможность расшивки. Если есть такая возможность, и бумага пригодна для протяжки документным сканером, то следует расшивать. Дело в том, что сканирование сшитых документов на планетарном (книжном) сканере в несколько десятков раз медленнее потоковой оцифровки. Пропорционально увеличиваются время работ и стоимость труда. Сканирование на документных сканерах, даже с учетом расшивки, оперативнее и дешевле.

Что такое оцифровка информации. Смотреть фото Что такое оцифровка информации. Смотреть картинку Что такое оцифровка информации. Картинка про Что такое оцифровка информации. Фото Что такое оцифровка информации

Расшивать можно самостоятельно, а можно доверить это исполнителю.

Расшивать можно самостоятельно, а можно доверить это исполнителю: если выбрана авторитетная компания, опасаться утраты документов не стоит. Наоборот, жесткая регламентация всех процессов и качественные материалы позволяют компаниям застраховаться от дополнительных финансовых потерь и ущерба имиджу. Этому подходу доверяют даже российские суды: при организации сканирования обычно внутренним приказом разрешается расшивка и последующая сшивка судебных дел.

К слову, крупные компании параллельно могут провести профессиональную архивную обработку: во-первых, часть работ итак выполняется при подготовке к сканированию, во-вторых, архивная обработка помогает выявить невостребованные документы и сократить объемы сканируемых массивов, что может снизить стоимость работ.

Какое качество выбрать?

Что такое оцифровка информации. Смотреть фото Что такое оцифровка информации. Смотреть картинку Что такое оцифровка информации. Картинка про Что такое оцифровка информации. Фото Что такое оцифровка информации

Сегодня высококачественно можно отсканировать любой объект: от маленькой библиотечной карточки до карт формата 8А0 и театральных декораций.

Определяющие параметры: вид документа и объем получаемого ресурса в электронной форме. Сегодня сканирующее оборудование позволяет получать образы с разрешением от 200 до 1200 точек на дюйм (dpi). Для художественных произведений обычно применяется разрешение 400–600 dpi, позволяющее создавать высококачественные репродукции. Более высокое качество используется только при необходимости увеличения изображения и детализации мелких предметов, например, монет.

Детализированные и неконтрастные чертежи, часто выполненные на кальке и синьке, нуждаются в сканировании с разрешением 300-400 точек на дюйм и дополнительной обработке изображений в графических редакторах. Остальные документы обычно сканируются с разрешением 300 dpi, достаточным для распечатки копий без потери качества. Необходимая обрезка изображений, геометрическое исправление, цветокоррекция, конвертация в форматы pdf, tiff, jpegи др. может проводиться в полностью автоматическом режиме программами, встроенными в сканирующее оборудование или поставляемыми вместе с ним.

В большинстве случаев используется цветной режим съемки. Это нужно для всех документов, в которые вносились исправления или ставились печати поверх текста, для удостоверения того, что электронная копия снималась с оригинала документа с печатью и подписью, а также для читаемости угасающих текстов и передачи уникальных особенностей оригинала. Необходимость цветного сканирования художественных произведений не обсуждается. Режим «градации серого» применяется лишь в некоторых случаях: когда документы не содержат цветных атрибутов, либо когда необходимо сократить объем получаемого электронного ресурса.

Сканирование может осуществляться самостоятельно. Главной задачей становится обучение сотрудников правильной работе со сложной техникой, так как качество получаемых изображений важно для последующего индексирования: плохо отсканированный документ, тени, засветка и другие дефекты на электронном образе могут сделать нечитаемой важную информацию. Это не позволит применить технологии автоматического извлечения данных и может привести к ошибкам в индексировании. Загрузка ошибочных данных в некоторые системы (государственные реестры, бухгалтерские учетные системы) не позволительна.

Индексирование

Простое сканирование применяется редко, поскольку при последующей работе искать информацию в наборе графических файлов будет лишь немногим проще перелистывания бумаги. Для возможности поиска необходимо выделить в документе несколько атрибутов (индексных полей).

Что такое оцифровка информации. Смотреть фото Что такое оцифровка информации. Смотреть картинку Что такое оцифровка информации. Картинка про Что такое оцифровка информации. Фото Что такое оцифровка информации

Сотрудники, задействованные в массовом индексировании документов методом ручного ввода.

Выделенные атрибуты можно внести в имя файла. Такая практика сложилась в российских судах: для того чтобы оператор сканирования не имел доступа к внутренним системам суда, при оцифровке все необходимые реквизиты вносятся в имя файла. В последующем эти реквизиты распознаются системой судопроизводства при загрузке каждого документа по отдельности.

Но обычно оцифрованные документы загружаются в информационную систему группой, что требует создания базы данных. Так, если необходимо прикрепить документ к уже существующей карточке в учетной системе, бывает достаточно извлечь пару однозначно определяющих его реквизитов – обычно номер и дату.

Если же нужно сформировать поисковую базу на основании самих документов, то объем извлекаемых данных определяется задачей: от пары реквизитов для поиска файла в электронном архиве до переноса всей значимой информации в аналитическую БД (ФИО, адресов, ИНН, КПП, дат, номеров документов-приложений и т.д.).

Свои правила индексирования применяются в музеях, библиотеках и архивах при оцифровке единиц хранения и учетных документов. Отдельным направлением услуг также является векторизация, которая применяется, в частности, при оцифровке каротажных лент (автоматическая) и чертежей (ручная отрисовка в CAD-системах).

Сколько данных извлекать?Ответ на этот вопрос также лучше получить, воспользовавшись экспертизой, так как количество извлекаемых реквизитов зависит от функциональной задачи и в значительной мере определяет стоимость оцифровки. В некоторых случаях можно ограничиться подборками документов, когда электронные образы объединяются под эгидой основного документа (например, договора или реестра счетов). В других необходимо извлечение всех содержащихся в документе данных для заполнения карточки информационной системы.

Примеры извлекаемых данных

Анализ размещенных на портале zakupki.gov.ru заказов компаний с государственным участием и госучреждений (44-ФЗ, 223-ФЗ), показывает, что:

– Для привязки электронных копий ОРД к системе электронного документооборота достаточно номера, даты и типа документа.

– Сканирование финансовой документации часто сопровождается извлечением номера, даты, наименований и реквизитов плательщиков, сумм.

– Оцифровка архивных документов муниципалитетов (постановления администраций, горисполкомов, сельсоветов и т.д.) в целях оказания услуг и инвентаризации объектов земельно-имущественных отношений требует извлечения номера и даты документа, всех встречаемых ФИО и адресов. Причем адреса необходимо сопоставлять с текущими справочниками КЛАДР/ФИАС.

– Оцифровка документов Архивного фонда РФ сопровождается строгим заполнением НСА и описанием фондов в соответствии с архивным законодательством.

– Индексирование описей и реестров подразумевает распознаванием всех порядковых записей.

– Для работы с чертежами в электронном виде необходимо извлечь практически все поля штампа.

– Сканирование составных дел требует не только извлечения реквизита каждого документа, но и установления взаимосвязей. Наиболее сложен случай конструкторской документации, где формируемая база данных обладает многоуровневой иерархией и связями документов.

Источник: zakupki.gov.ru, 2015

Какие методы извлечения данных выбрать?

Определяющий параметр – качество текста. Применяемые технологии, скорость и стоимость формирования баз данных зависят от того, как написан и в каком состоянии находится текст документа.

Напечатанный на современном принтере текст может быть автоматически распознан, необходимые данные могут быть извлечены с использованием различных автоматизированных методов: применением шаблонов и автоэкстракцией индексов (алгоритмы определения ключевых слов, семантического анализа и т.д.). Эти методы быстрые, и в большинстве случаев их стоимость ниже цены ручного распознавания.

Напечатанные необычным шрифтом, в низком качестве или поврежденные тексты книг, газет, архивных документов распознаются не всегда или с недостаточной точностью. Поэтому в большинстве случаев требуется ручной ввод или, по крайней мере, ручная проверка сведений. Предварительно для каждого ресурса формируются или подключаются внешние справочники, которые помогают операторам индексирования и значительно ускоряют процесс.

Документы с рукописным текстом индексируются только вручную. Это гораздо более медленный и дорогой процесс. Поэтому крупные компании применяют уникальные технологии, служащие ускорению обработки и, соответственно, снижению цены без потери качества. Показателен пример официальной переписки: в этих документах традиционно реквизиты печатаются, а номер и дата проставляется вручную по факту, что делает невозможным полноценное программное индексирование.

Можно ли провести индексирование самостоятельно?

Что такое оцифровка информации. Смотреть фото Что такое оцифровка информации. Смотреть картинку Что такое оцифровка информации. Картинка про Что такое оцифровка информации. Фото Что такое оцифровка информации

Альтернативой является технология извлечения данных с помощью анализа текста, применимая для любых документов, в том числе неструктурированных. Этот метод зачастую более доступен по цене, но предлагается только парой крупных компаний, так как требует накопления серьезной семантическо-морфологической базы для каждой отрасли деятельности.

Можно также вносить данные напрямую в информационную систему. Однако этот способ связан с высокой вероятностью ошибок, отследить которые в системе крайне сложно. При самостоятельном индексировании рекомендуется сначала создавать определенную базу данных, которую перед загрузкой можно проверить.

Именно так работают специализирующиеся на оцифровке компании: жесткая регламентация процесса, с протоколированием всех действий, и обязательная проверка сформированного массива ОКК позволяет минимизировать количество возможных ошибок. Например, корпорацией ЭЛАР в официальных договорах и контрактах используется стандартный критерий качества ≥99,8%. Теме выборы критериев качества будет посвящена одна из следующих статей.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *