Что такое достоверность данных
Что такое достоверность в информатике: определение и пример
Источники и получатели информации
Информатика и достоверность информации
В информатике как в образовательной дисциплине можно обнаружить множество определений достоверности.
Менее достоверное определение, но крайне популярное в школьных программах:
Как правило, по определению школьных вариантов понять, что такое достоверность в информатике, не представляется возможным. Но ассоциации с китом и очевидными примерами достоверности для ребенка более-менее понятны.
Высшее образование редко апеллирует к термину «информатика», а изучение информации равномерно распределяет по всем другим дисциплинам, превращая вопрос «что такое достоверность в информатике» в абсолютно точный спектр ответов.
По сути, каждый предмет вуза дает студенту достоверные знания, но в своем контексте. Общее понимание достоверности и примеры по информатике уходят в какую-нибудь дисциплину, связанную с компьютерами и программированием.
Информация и ее определение
«Википедия» считает, что:
Определений информации существует множество, причем академик Н. Н. Моисеев даже полагал, что в силу широты этого понятия нет и не может быть строгого и достаточно универсального определения информации.
Другой, не менее авторитетный источник (сайт биржи «Автор24») исходит из действующего законодательства и словаря Ожегова:
Нет особенного смысла дискутировать о точности приведенных и им подобных определений, ограничимся простым собственным: если есть вопрос, то на него должен быть ответ. Что такое вопрос и что такое ответ, зависит от конкретной ситуации.
Достоверность информации и ее определение
Что такое достоверность в информатике?
В принципе, такое определение можно считать приемлемым на основании теории вероятностей, которая по частоте того или иного события обосновывает его достоверность. С одной стороны, сам факт множества подобных утверждений говорит о чем-то, но этот же факт дает достоверное основание утверждать, что информация может «сама определять» свою достоверность.
Этот момент имеет существенное значение. Если сообщение или данное, ожидаемое получателем, можно достоверно расписать по критериям и принять в этом контексте обоснованное решение, то в случае множественности сообщений и данных теория вероятности и методы математической статистики превращают вопрос достоверности в математически определяемое число.
Итак, в информатике количество информации определяется как достоверность через математические методы. При наличии достаточного объема данных можно не фантазировать с определением достоверности, а положиться на математический метод. Это работает: например, статистика ежегодных наблюдений за климатом, статистика по социальным опросам, анкетирование при приеме на работу, обобщение результатов тестирования школьников и проч.
Вопрос = ответ
Оставляя за пределами анализа вопрос о том, что такое информация, и ограничиваясь собственно вопросом, на который необходимо получить достоверный ответ, мы концентрируем внимание на:
В каждой конкретной ситуации все три позиции имеют свое значение.
Пример 1. Ключ от замка
Пример 2. Ключ на поляне или в водоеме
Если на полянке бьет ключ, то получить достоверный ответ (где?) можно посредством простого наблюдения. Если ключ бьет под водой в болоте или другом водоеме, то без надлежащего приспособления не обойтись.
Если рядом с рядом с водоемом (болотом) есть деревня, а у ее жителей можно собрать нужную информацию, то путем исследования или анализа различных мнений можно определить наиболее вероятное местонахождение ключа (родника).
Объективность и достоверность
Достоверность в информатике по определению апеллирует к объективному восприятию действительности. Школьный курс информатики не включает в себя теорию вероятностей и математическую статистику, то есть вопрос математического определения достоверности не стоит.
Информатика и программирование
Таким образом, что такое достоверность информации в информатике, показывают на простых и понятных примерах. Это не полноценное знание, но достаточное для приобретения нужного опыта.
Так уж сложилось в современном образовательном процессе, что информатика ассоциируется с программированием и компьютерной техникой. При этом далеко не все учащиеся становятся программистами. Обычно в школьном или ином курсе информатики учат использовать готовые программы и компьютеры. Достоверность информации, получаемой учеником, не является абсолютной, но она является практичным фундаментом.
Достоверность информации
Смотреть что такое «Достоверность информации» в других словарях:
достоверность информации — Свойство информации быть правильно воспринятой. Достигается: обозначением времени свершения событий, сведения о которых передаются; тщательным изучением и сопоставлением данных, полученных из различных источников; своевременным вскрытием… … Справочник технического переводчика
Достоверность информации — [reliability of information] соответствие принятого сообщения переданному. Количественное ее определение основывается на вероятности возникновения ошибок при передаче информации. Причем одни авторы считают, что достоверность величина,… … Экономико-математический словарь
Достоверность Информации — А. Адекватность передаваемой информации реальным событиям. Б. Идентичность полученного сообщения переданному. Словарь бизнес терминов. Академик.ру. 2001 … Словарь бизнес-терминов
достоверность информации — 3.3 достоверность информации: Качество информации, характеризуемое ее полнотой и необходимой точностью. Источник: ГОСТ Р 53797 2010: Геологическая информация о недрах. Основные положения и общие требования … Словарь-справочник терминов нормативно-технической документации
ДОСТОВЕРНОСТЬ ИНФОРМАЦИИ — свойство информации на выходе системы соответствовать информации, поступившей на ее вход. Количественно Д. и. оценивается такими показателями, как наработка на информационную ошибку, интенсивность информационных ошибок, вероятность безошибочности … Энциклопедический словарь по психологии и педагогике
Достоверность информации — соответствие полученной информации действительной обстановке. Достигается: обозначением времени свершения событии, сведения о которых передаются; тщательным изучением и сопоставлением данных, полученных из различных источников; проверкой… … Словарь военных терминов
ДОСТОВЕРНОСТЬ ИНФОРМАЦИИ — 1. соответствие принятого сообщения переданному 2. объективное отражение информацией реальных процессов … Большой экономический словарь
Достоверность информации — базовое понятие теории информационных систем, характеризуемое отношениями правды, лжи и неопределенности трехзначности … Теоретические аспекты и основы экологической проблемы: толкователь слов и идеоматических выражений
достоверность информации о надежности — Свойство информации отражать истинные сведения о наблюдаемых объектах, используемые для оценок показателей надежности. [http://sl3d.ru/o slovare.html] Тематики машиностроение в целом … Справочник технического переводчика
достоверность — 2.17 достоверность (reliability): Свойство соответствия предусмотренному поведению и результатам. Источник … Словарь-справочник терминов нормативно-технической документации
достоверность данных
3.1.11 достоверность данных: Свойство данных не иметь скрытых ошибок
Смотреть что такое «достоверность данных» в других словарях:
достоверность данных — Свойство данных не иметь скрытых ошибок. [ГОСТ Р 51170 98 ] Тематики качество служебной информации … Справочник технического переводчика
абсолютная достоверность (данных) — — [А.С.Гольдберг. Англо русский энергетический словарь. 2006 г.] Тематики энергетика в целом EN absolute reliability … Справочник технического переводчика
достоверность — 2.17 достоверность (reliability): Свойство соответствия предусмотренному поведению и результатам. Источник … Словарь-справочник терминов нормативно-технической документации
достоверность — В свойстве достоверности выделяют безошибочность данных и их истинность. Случайные ошибки в данных обусловлены, как правило, ненамеренными искажениями содержания сведений человеком, сбоями технических средств и ошибками программ ЭВМ. При анализе… … Справочник технического переводчика
ДОСТОВЕРНОСТЬ — обоснованность, доказательность, бесспорность знания. Достоверное суждение такое суждение, в котором выражается прочно обоснованное знание, напр.: «Луна спутник Земли», «Вода кипит при 100°С» и т.п. Достоверные суждения разделяются на два вида:… … Философская энциклопедия
достоверность информации — Свойство информации быть правильно воспринятой. Достигается: обозначением времени свершения событий, сведения о которых передаются; тщательным изучением и сопоставлением данных, полученных из различных источников; своевременным вскрытием… … Справочник технического переводчика
достоверность передачи данных — достоверность передачи информации — [Л.Г.Суменко. Англо русский словарь по информационным технологиям. М.: ГП ЦНИИС, 2003.] Тематики информационные технологии в целом Синонимы достоверность передачи информации EN data transmission validity … Справочник технического переводчика
Достоверность информации — в криптографии общая точность и полнота информации. Достоверность информации обратно пропорциональна вероятности возникновения ошибок в информационной системе. См. также: Информационная безопасность Финансовый словарь Финам. Достоверность… … Финансовый словарь
Достоверность передачи информации — взаимнооднозначное соответствие пакетов информации, переданных пользовательским (оконечным) оборудованием, являющимся одной стороной установленного соединения по сети передачи данных, и принятых пользовательским (оконечным) оборудованием,… … Официальная терминология
Достоверность информации — [reliability of information] соответствие принятого сообщения переданному. Количественное ее определение основывается на вероятности возникновения ошибок при передаче информации. Причем одни авторы считают, что достоверность величина,… … Экономико-математический словарь
Достоверность информации
Добавлено в закладки: 0
Что такое достоверность информации? Описание и определение понятия.
Достоверность информации является показателем качества информации, обозначающий её общую точность и полноту.
Критериями достоверной информации являются: отсутствие искажённых или ложных данных, разборчивость речи (как письменной, так и устной), низкая вероятность ошибочного употребления единиц информации (цифры, буквы, бита, символа).
Достоверность информации оценивают по шкалам, равно как и источник данной информации (чаще всего надёжный, полностью надёжный, довольно надёжный и так далее до абсолютно ненадёжного и того, у кого статус не определён).
Рассмотрим, более детально, что значит достоверность информации.
Достоверность информации — это характеристика ее неискаженности.
На достоверность информации влияет как достоверность данных, так и адекватность методов, использованных при ее получении. Недостоверность информации может означать то, что данные умышленно были подготовлены как ложные. Иногда бывает, что недостоверные данные в итоге дают достоверную информацию. Это происходит в том случае, когда на момент получения информации уже известна степень ее недостоверности. Однако, чем больше исходных данных, тем выше достоверность полученного результата. Из этого следует, что достоверность информации очень зависит от ее адекватности, объективности и полноты.
Свойство достоверности информации имеет очень важное значение особенно тогда, когда эти данные применяются для принятия решений. Поэтому недостоверная информация сулит принятию решений, имеющих негативные последствия с точки зрения экономики, социального строя и политической ситуации.
Как проверить достоверность информации
Так как достоверной информацией есть только та, которая соответствует действительности, важно уметь проверять полученные данные непосредственно на их достоверность. Таким образом можно избежать ловушки дезинформации.
Для начала необходимо выяснить какую смысловую нагрузку несет информация: факторную или оценочную. Первое, с чем приходится столкнутся при получении новой информации – это факты. Фактом называются сведения, уже проверенные на достоверность. Информация, не проверенная или которую невозможно проверить, фактом не является. К фактами причисляют даты, числа, имена или события. Все, что можно потрогать, измерить, перечислить, подтвердить. Обычно факты могут быть представлены научно-исследовательскими институтами, социологическими агентствами, статистики агентствами и т.п. Главное отличительное качество факта от оценки – это его объективность. Оценка всегда выражает чью-то собственную субъективную позицию, эмоциональное отношение, призыв к определенным действиям. Факт не дает никакой оценки и ни к чему не призывает.
Во-вторых, при получении информации необходимо разобраться с источниками. Большинство фактов не представляется возможным проверить самостоятельно, поэтому полученные сведения во многом основываются на доверии к источникам. Каким образом можно проверить источник информации? Фактором истинности является практика, другими словами истинно только то, что помогает в решении определенной задачи. Главный критерий информация – это ее эффективность. Эту эффективность отражает число субъектов, которые успешно применили данные сведения. Чем выше количество определенных лиц, которые доверяют источнику либо ссылаются на него, тем достовернее предоставляемая этим источником информация.
Полезным действием также есть сравнение источников информации, так, как популярность и авторитетность источника не гарантирует достоверность. Поэтому еще одним важным критерием является непротиворечивость достоверной информации. Таким образом каждый полученный факт должен быть подтвержден результатами независимых исследований, иными словами он должен повториться. В случае, если независимое исследование пришло к тем же выводам – значит непротиворечивость информации доказана. Это означает, что случайные единичные сведения не заслуживают высокого доверия. Чем выше число идентичных сведений, полученных из разных источников, тем эти сведения достовернее. Любой источник информации всегда несет морально-нравственную, а также вещественную ответственность за предоставляемые факты. Предоставляя сомнительные данные, источники, будь то организации или кто ни будь еще, могут легко лишиться положительной репутации, а в некоторых случаях и средств к существованию. Сюда включается потеря потребителей информации, штраф или даже тюремное заключение. Поэтому авторитетные источники, например солидные организации, никогда не станут рисковать своей репутацией, предоставляя недостоверную информацию. В случае, когда источником информации предстает не организация, а определенное физическое лицо, для определения степени доверия к предоставляемой им информации, важно узнать больше сведений о самом авторе. Чтобы такая информация не вызывала сомнений, можно ознакомится с другими работами автора, возможно известны его источники, либо выяснить имеет ли он свободу речи предоставлять определенного рода информацию (наличие научной степени, занимаемая должность, обладание опытом в конкретной сфере). Иначе сомнительная информация в конечном итоге может оказаться недостоверной, то есть бесполезной, либо вредоносной.
Информация, которую невозможно проверить на достоверность, является бессмысленной.
Прежде, чем искать информацию необходимо четко сформулировать проблему, которую нужно разрешить. Это уменьшит вероятность дезинформирования.
Мы коротко рассмотрели что такое достоверность информации и как проверить достоверность информации. Оставляйте свои комментарии или дополнения к материалу.
Показатели качества публичных данных
Проблема качества данных представляет собой достаточно серьезную тему и не только в связи с их обработкой и анализом. На данных в современном цифровом мире построено множество процессов, в том числе и связанных с безопасностью. Поэтому от того, насколько качественные данные используются в государственных и коммерческих организациях зависит эффективность и результат их работы.
Рассмотрим несколько показателей, которые могли бы составить интегрированную оценку качества публичных (открытых) данных.
Прежде чем начать.
Настоящая публикация является продолжением в общей серии по теме публичных данных. Многие понятия, встречающиеся в тексте рассматривались в предыдущих статьях. Несмотря на то, что речь идет о публичных (открытых, разделяемых) данных, предлагаемый набор показателей качества может использоваться и для оценки других категорий данных с некоторыми поправками. Предлагаемый список является в некотором смысле гипотезой и не претендует на звание «исчерпывающего».
Данные имеют ограниченный срок годности
Первичные данные всегда актуальны на какой-то конкретный момент времени в прошлом и очень редко актуальны в течение какого-либо длительного периода.
Это одна из проблем качества: цифровые данные, как регистрация исторического состояния объекта или системы постоянно теряют свою актуальность со временем и их приходится обновлять.
Качество данных – характеристика наборов цифровых данных, показывающая степень их пригодности к обработке и анализу и соответствия обязательным и специальным требованиям, в связи с этим к ним предъявляемым.
А что может составлять такое понятие как «качество публичных данных»? Выделим девять показателей.
1. Актуальность данных
Обозначенный или косвенно определяемый момент времени, на который данные отражают реальное состояние целевого субъекта (объекта, системы, явления, модели, события и т.п.).
Актуальность данных также может быть обозначена через период времени в течение которого они сохраняют свою значимость. Учитывая постоянные изменения экономических систем, публичные экономические данные имеют достаточно короткие сроки актуальности.
Актуальность данных чаще всего устанавливается поставщиком, в дополнение к которой он также может «дать обещание» периодического их обновления для её поддержания.
Получатель данных может самостоятельно оценивать их актуальность на основании информации от поставщика или иными способами.
2. Объективность данных
Точность отражения данными реального состояния целевого субъекта (объекта, системы, явления, модели, события и т.п.).
Объективность напрямую зависит от применяемого метода и процедур сбора информации, а также от плотности регистрируемых данных. В процессе обработки наборов цифровых данных, они теряют свою объективность и обогащаются агрегированными, округленными, приведенными и расчетными показателями. Однако за счет этого данные «насыщаются» знаниями, тем самым позволяя в последующем сокращать последовательность операций по извлечению из них значимых для практики сведений.
Поставщик может указать объективность публичных данных охарактеризовав их первичность и описав процедуру их получения.
Получатель вправе критично отнестись к вторичным данным, особенно если их объективность не доказана применяемыми формулами и математическими расчетными моделями.
3. Целостность данных
Полнота отражения данными реального состояния целевого субъекта (объекта, системы, явления, модели, события и т.п.).
В отличии от объективности, целостность показывает насколько полными и безошибочными являются данные как в части смыслового непротиворечия, так и в части соответствия заданной структуре или выбранного формата. Целостность зависит от корректного разделения на элементарные неделимые единицы, сохранения их неделимости, правильной идентификации и взаимной связанности.
Данные публикуемые добросовестным поставщиком по умолчанию должны являться целостными.
Получатель определяет целостность специальными проверочными методами оценивая смысловое содержание, корректность определения структуры и технически проверяя формат.
4. Релевантность данных
Соответствие данных о реальном состоянии целевого субъекта (объекта, системы, явления, модели, события и т.п.) решаемой задачи (поставленной цели) и возможность их применения с учетом имеющегося содержания, структуры и формата.
Понимание релевантности напрямую увязывается с целью пользователя данных и конкретной исполняемой им задачи, а значит и с располагаемым исходным набором данных.
Поставщик не может повлиять на релевантность данных, но может существенно упростить понимание данного показателя качества с помощью расширенных метаданных, применения распространенных форматов и традиционных структур, а также указанием рекомендаций по их использованию.
Получатель в каждом конкретном случае оценивает релевантность наборов данных исходя из тематики и рабочего формата (т.е. используемых инструментов).
5. Совместимость данных
Совместная обработка данных о реальном состоянии целевого субъекта (объекта, системы, явления, модели, события и т.п.) с имеющимися в рамках решаемой задачи (поставленной цели).
В отличие от релевантности, совместимость — это процедурный показатель, который характеризует возможность включить данные в обрабатываемый массив для дальнейшего анализа и не связан напрямую с сутью и критериями текущей задачи. С другой стороны, совместимость на содержательном уровне с тематикой исполняемой задачи важна для эффективной обработки цифровых данных. Публичные данные должны особенно тщательно оцениваться на совместимость, в том числе с точки зрения их разновидности. Допустимо ли для конкретных целей совмещение – взаимное использование — открытых данных и разделяемых данных или разделяемы и делегируемых данных зависит от оценки аналитика. Чаще всего необходимо соблюдать условия раздельного хранения и контроля разных видов публичных данных.
Поставщик публичных данных задает совместимость через метаданные и ссылки на контекст.
Получатель определяет возможность совместного использования данных для каждого набора как по содержанию и структуре, так и по формату. Но в отличие от релевантности, несовместимые данные можно попытаться привести к совместимому с помощью различных операций трансформации, перекодирования, перевода и т.п.
6. Измеримость данных
Присутствие в данных обрабатываемых качественных или количественных характеристик реального состояния целевого субъекта (объекта, системы, явления, модели, события и т.п.), а также подсчитанный конечный объем набора цифровых данных.
Содержательная измеримость данных является основой для выполнения последующих процедур их обработки и анализа. Измерение же общего объема данных необходимо для выбора инструментария и контроля их целостности в процессе обработки и по итогам анализа.
Поставщик может явно указывать «измерения», включенные в данные, как количественные, так и качественные. Как минимум, сопровождение наборов публичных данных записью об итоговом или пофайловом их размере в байтах почти является общепринятым стандартом.
Получатель публичных данных восстанавливает измеримость в содержании данных анализируя их и исследуя структуру и всегда точно или бегло проверяет насколько их физический размер соответствует заявленному.
7. Управляемость данных
Возможность целевым и осмысленным образом обработать, передать и контролировать данные о реальном состоянии целевого субъекта (объекта, системы, явления, модели, события и т.п.).
Управляемость обусловлена необходимостью изменять, исправлять, структурировать, организовывать, фильтровать, сохранять, пересылать, оценивать, распределять данные. Она во многом основывается на правильно выбранной структуре и формате.
Поставщик может заявить об управляемости данных через сопровождение их специальными метаданными, но получатель, как правило, самостоятельно проводит её оценку исходя из имеющихся у него компетенций и инструментов.
8. Привязка к источнику данных
Связанная и достоверная идентификация цепочки поставки данных о реальном состоянии целевого субъекта (объекта, системы, явления, модели, события и т.п.).
При этом в описание «цепочки поставки публичных данных» лучше включить указания на все субъекты, которые исполняли основные роли трансфера данных: генератор (автор), владелец, поставщик. Привязка к источнику позволяет поставщику и получателю сослаться и восстановить авторство, правоотношения, достоверность источника, доверие к распространителям.
Публичные данные почти всегда распространяются с указанием владельца и поставщика. И более того, одним из ограничений использования данных является необходимость указать первоисточник при их последующей публикации или использовании. Следует учитывать, что хорошая привязка данных позволяет по необходимости получить её повторно с уточнениями, дополнительной актуализацией или с восстановленной целостностью, т.е. – с повышенным качеством.
9. Доверие к поставщику данных
Оценка получателем деловых качеств поставщика публичных данных о целевом состоянии субъекта (объекта, системы, явления, модели, события и т.п.), как ответственного, авторитетного, организованного и относительно независимого издателя цифровой информации высокого качества.
Данный показатель выступает некоторой интегрированной ретроспективной оценкой всех предыдущих трансферов данных поставщика – репутация издателя публичных данных.
Получатель всегда исходит из внутренней убежденности при определении такого показателя качества данных, но у поставщика есть несколько путей по формированию и поддержанию нужного ему уровня доверия. К ним можно, например, отнести: тщательную подготовку данных для публичного трансфера, высокий уровень организации процессов издания «цифры», поддержку обратной связи с получателями, своевременную актуализацию и извещение об обнаруженных в данных проблемах, специальные мероприятия, участие в независимой оценке и ассоциациях.
Любой из указанных показателей качества данных субъективен, как в части смыслового содержания данных, так и в части его восприятия разными поставщиками и получателями.
Тем не менее все показатели можно разделить на:
Общая проблема качества публичных данных зависит как от каждого из перечисленных показателей, так и от интегрированной субъективной оценки получателя. В любом случае, качество важно в первую очередь получателю, как лицу выполняющему операции обработки и анализа.
В случае завершения обратной связи стороннего результативного пользователя данных с поставщиком, «проблема» качества данных возвращается последнему «бумерангом». Если данные были предоставлены «плохие» или с ошибками, то ожидать от тех, кто их использовал, сколь-либо хороших и адекватных итогов не приходится. Тогда утрачивается весь смысл усилий по выбору, подготовке и публикации данных – поставщик не получает никаких новых полезных решений и знаний (продуктов или сервисов).
Важнейший показатель качества данных – это их целостность
Он оказывает сильное влияние на совместимость и управляемость данных. А неоднократная публикация данных с нарушением целостности обязательно скажется на доверии к их поставщику. Целостность данных не является чем-то обособленным от смысла, структуры или формата и должна соблюдать на всех уровнях цифровой информации.
Нарушение целостности данных возможно:
За качество публикуемых данных, конечно же, отвечает поставщик. Но получатель вынужден выполнять проверку и по необходимости корректировать сами данные.
Если публичные данные оказываются низкого качества, то имеет смысл отказаться от их использования и направить подробное уведомление поставщику. Добросовестный и заинтересованный поставщик обязательно предпримет усилия по исправлению ситуации. Он как минимум должен закрыть доступ к некачественным данным на время разбирательства и маркировать их соответствующим образом.
Адресованная поставщику претензия относительно качества данных, в условиях максимальной открытости сетевого общения, вынуждает в обязательном порядке помещать специальный заявительный отказ от принятия претензии с обоснованием такого отказа, либо повышать качество данных и повторно их издавать с соответствующими разъяснениями. А в случае, если поддерживается адресная связь с получателями – уведомлять их специальным образом.
Поставщик, который не готов отвечать за качество данных достаточно быстро переходит в разряд «безответственных» и теряет все преимущества, предоставляемые сообществом аналитиков и экспертов, занятых в соответствующей предметной области.
Из вышесказанного вытекает необходимость постоянного контроля качества данных как со стороны получателя, так и со стороны поставщика. Что в свою очередь вынуждает разрабатывать и применять специальные контрольно-измерительные инструменты.
Исследование проблемы качества цифровых данных, а особенно качества открытых, разделяемых и делегируемых данных должно осуществляться аналитиками и экспертами как на микро-уровне заинтересованных бизнесов, так и на макро-уровне сообществ и государственных структур. Во многом безопасность будущей цифровой экономики будет базироваться на активном мониторинге качества используемых данных.