Что такое накопление в информатике
Хранение и накопление информации
Хранение и накопление информации вызвано многократным ее использованием, применением условно-постоянной, справочной и других видов информации, необходимостью комплектации первичных данных до их обработки.
Назначение технологического процесса накопления данных состоит в создании, хранении и поддержании в актуальном состоянии информационного фонда, необходимого для выполнения функциональных задач системы управления. Хранение и накопление информации осуществляется в информационных базах в виде информационных массивов, где данные располагаются по установленному в процессе проектирования порядку.
С хранением и накоплением непосредственно связан поиск данных, т. е. выборка нужных данных из хранимой информации, включая поиск информации, подлежащей корректировке или замене. Процедура поиска информации выполняется автоматически на основе составленного пользователем или ПЭВМ запроса на нужную информацию.
Указанные функции, выполняемые в процессе накопления данных, реализуются по алгоритмам, разработанным на основе соответствующих математических моделей.
Процесс накопления данных состоит из ряда основных процедур, таких, как выбор хранимых данных, хранение данных, их актуализация и извлечение.
Процедура хранения состоит в том, чтобы сформировать и поддерживать структуру хранения данных в памяти ЭВМ. Современные структуры хранения данных должны быть независимы от программ, использующих эти данные, и реализовывать вышеуказанные принципы (полнота и минимальная избыточность). Такие структуры получили название баз данных. Осуществление процедур создания структуры хранения (базы данных), актуализации, извлечения и удаления данных производится с помощью специальных программ, называемых системами управления базами данных.
В процессе накопления данных важной процедурой является их актуализация. Под актуализацией понимается поддержание хранимых данных на уровне, соответствующем информационным потребностям решаемых задач в системе, где организована информационная технология. Актуализация данных осуществляется с помощью операций добавления новых данных к уже хранимым, корректировки (изменения значений или элементов структур) данных и их уничтожения, если данные устарели и уже не могут быть использованы при решении функциональных задач системы.
Процедура извлечения данных из базы необходима для пересылки требуемых данных либо для преобразования, либо для отображения, либо для передачи по вычислительной сети.
При выполнении процедур актуализации и извлечения обязательно выполняются операции поиска данных по заданным признакам и их сортировки, состоящие в изменении порядка расположения данных при хранении или извлечении.
На логическом уровне все процедуры процесса накопления должны быть формализованы, что отображается в математических и алгоритмических моделях этих процедур.
Модель накопления данных формализует описание информационной базы, которая в компьютерном виде представляется базой данных.
Процесс перехода от информационного (смыслового) уровня к физическому описывается трехуровневой системой моделей представления информационной базы: концептуальной, логической и физической схем.
Концептуальная схема информационной базы описывает информационное содержание предметной области, т.е. какая и в каком объеме информация должна накапливаться при реализации информационной технологии.
Характеристика процессов сбора, передачи, обработки и накопления информации
Вы будете перенаправлены на Автор24
Можно выделить четыре основных вида информационных процессов: сбор, передача, обработка и накопление.
Накопление (хранение) информации
С накоплением информации связаны следующие понятия:
Носитель информации – это физическая среда, которое непосредственно хранит информацию.
Память человека можно условно назвать оперативной (понятие «оперативный» является синонимом понятию «быстрый»). Человек быстро воспроизводит сохраненные в памяти знания. Внутренней можно назвать память человека, а носителем информации – мозг. Внешними носителями (по отношению к человеку) являются все остальные носители: папирус, дерево, бумага, магнитный диск, флэш-накопитель и т.д.
Хранилище информации – это специальным образом организованная информация на внешних носителях, которая предназначена для длительного хранения и постоянного использования (к примеру, архивы документов, библиотеки, картотеки, базы данных). Единицей хранилища информации является физический документ: анкета, журнал, книга, диск и др. Под организацией хранилища понимается упорядочивание, структурирование, классификация хранимых документов для удобства работы с ними.
Основными свойствами хранилища информации является объем информации, надежность ее хранения, время доступа к ней (т.е. скорость поиска необходимых сведений), защита информации.
На устройствах компьютерной памяти информацию называют данными, а хранилища данных – базами и банками данных.
Т.к. человек может забыть какую-либо информацию, то внешние носители являются надежнее и на них можно дольше хранить необходимую информацию. Именно с помощью внешних носителей люди имеют возможность передавать свои знания из поколения в поколение.
Техническими средствами реализации накопления информации являются носители информации: оперативная память компьютера (ОЗУ), гибкие, оптические и жесткие диски, переносные запоминающие устройства – флэш-накопители и т.п.
Передача информации
Обмен информацией между людьми происходит в процессе ее передачи, которая может происходить при разговоре, с помощью переписки, используя технические средства связи: телефон, радио, телевидение, компьютерная сеть.
При передаче информации всегда существует источник и приемник информации. Источник передает информацию, а приемник ее получает. Смотря телевизор или слушая товарища, вы являетесь приемником информации, рассказывая выученный стих, при написании сочинения – источником информации. Каждый человек неоднократно из источника становится приемником информации и наоборот.
Готовые работы на аналогичную тему
Информация хранится и передается в виде последовательности сигналов, символов. От источника к приёмнику сообщение передается с помощью некоторой материальной среды: при разговоре – с помощью звуковых волн, при переписке – почтовой связи, при телефонном разговоре – системы телефонной связи. В случае передачи сообщения с помощью технических средств связи их называют информационными каналами (каналами передачи информации). Органы чувств человека являются биологическими информационными каналами.
Таким образом, передача информации происходит по следующей схеме:
В процессе передачи информация часто искажается или теряется, т.к. информационные каналы имеют плохое качество или на линии связи действуют помехи (шумы). Примером информационного канала плохого качества может быть плохая телефонная связь.
Передача информации происходит с какой-то скоростью, которая является информационным объемом сообщения, который передается в единицу времени. Поэтому единицы измерения скорости передачи информации бит/с, байт/с и др.
Обработка информации
Схема обработки информации:
При обработке информации решается информационная задача, которая изначально может быть представлена в традиционной форме: из некоторого набора исходных данных необходимо получить определенные результаты. Переход от исходных данных к результату является процессом обработки. Объект или субъект, осуществляющий обработку, является исполнителем обработки.
Пусть ученику нужно решить математическую задачу: в прямоугольном треугольнике даны длины двух катетов, нужно найти гипотенузу. Для ее решения ученику кроме исходных данных нужно знать математическое правило – теорему Пифагора. Применяя эту теорему, он получит искомую величину. Новые данные получаются путем вычислений, которые выполняются над исходными данными.
Вычисление является только одним из вариантов обработки информации. В качестве способа обработки информации можно использовать не только математические расчеты, но и логические рассуждения.
Результатом процесса обработки информации не всегда является получение каких-либо новых сведений. Например, при переводе текста с английского языка на русский происходит обработка информации, которая изменяет ее форму, но не содержание.
Для успешной обработки информации исполнитель должен использовать алгоритм обработки, т.е. последовательность действий, которую нужно выполнить для достижения нужного результата.
Существует два вида обработки информации:
Кодирование – преобразование информации в символьную форму, которая удобна для ее накопления, передачи, обработки и сбора. В начале XX столетия телеграфные сообщения кодировались и передавались с помощью азбуки Морзе. Кодирование активно используют при работе с информацией с помощью технических средств (телеграф, радио, компьютеры и т.д.).
Структурирование данных – упорядочивание информации в хранилище, классификация, каталогизация данных.
Ещё один вид обработки информации – поиск в некотором хранилище информации (в основном на внешних носителях: книгах, схемах, таблицах, карточках) нужных данных, которые удовлетворяют определенным условиям поиска (запросу).
Сбор (получение) информации
Получение информации – сбор сведений из различных источников (из хранилища данных, наблюдение за событиями и явлениями, общение, телевидение, компьютерная сеть и т.д.). Получение информации основано на отражении различных свойств процессов, объектов и явлений окружающей среды. Этот процесс выражается в восприятии с помощью органов чувств. Для улучшения восприятия информации существуют разнообразные индивидуальные устройства и приспособления – очки, бинокль, микроскоп, стетоскоп, различные датчики и т. д.
ИНФОРМАЦИИ НАКОПЛЕНИЕ И ПОИСК
ИНФОРМАЦИИ НАКОПЛЕНИЕ И ПОИСК. Информация является одной из основных потребностей современного человека; она нужна для работы, путешествий, приобретения товаров, принятия решений, выполнения школьных заданий, заботы о здоровье и многочисленных других видов деятельности. Человеческий мозг наделен удивительной эффективностью в отношении накопления и поиска информации. Однако в 20 в. информация накапливается человечеством такими темпами, что без специальных технических средств человеку и даже организации становится все труднее справиться с поиском необходимых данных.
Системы накопления и поиска информации собирают, анализируют, организуют, хранят, отыскивают и распространяют информацию. Традиционно много существующей информации было записано на бумаге, накапливалось в библиотеках и информационных центрах и отыскивалось вручную. С середины 1960-х годов для автоматического накопления и поиска информации начали использоваться различные механические и электронные помощники. Такие системы могут обрабатывать сотни миллионов элементов информации и отыскивать отдельные элементы практически мгновенно.
Компьютер и электронные средства связи составляют ядро современных систем накопления и поиска информации. Например, через настольный компьютер или другой терминал можно получить по телефону доступ к файлам местного или удаленного информационного центра и автоматически найти нужную информацию. Виды деятельности, требующие использования бумаги, такие, как чтение газет, написание писем и банковское дело, со временем будут заменены их электронными эквивалентами.
ТИПЫ ИНФОРМАЦИОННЫХ СИСТЕМ
Существуют три основных типа информационных систем: системы управления базами данных, системы поиска библиографических ссылок и запросно-ответные системы.
Системы управления базами данных.
Управление базой данных имеет дело с обработкой простых файлов (типа обычно используемых в бизнесе). Каждый файл содержит записи того или иного вида, например, информацию о служащих или о различных товарах на складе. Каждая запись, в свою очередь, хранит конкретную информацию; например, служащий может идентифицироваться по имени, адресу, специальности и зарплате. Таким образом, файл базы данных может быть представлен таблицей, строки которой содержат индивидуальные записи, а столбцы – конкретные данные, относящиеся к ним. Тогда управление базой данных состоит в установлении связей таблиц и записей для конкретных целей. Например, системы управления базами данных могут определять, сколько служащих, имеющих возраст 35 и более лет, выполняет определенные виды работ.
Системы поиска библиографических ссылок.
Эти системы обычно имеют дело с текстом, например названиями и аннотациями книг и статей, и осуществляют поиск ссылок на элементы конкретной предметной области, хранимой в библиотечном файле. Например, пользователь мог бы запросить все библиографические ссылки по теме «Проектирование современных систем поиска информации». Чтобы идентифицировать отдельные ссылки, сначала должно быть задано содержание упомянутых элементов в файле. Следовательно, анализ содержания, или индексация, играет важную роль в системах поиска ссылки. Кроме того, поскольку библиографические файлы могут содержать миллионы элементов, обязательно должен быть обеспечен быстрый доступ к каждому из них. Поэтому особую важность приобретают эффективные методы поиска файлов. Запросы и ответы во многих случаях выражаются на естественном, а не на машинном (компьютерном) языке.
Запросно-ответные системы.
Эти системы дают прямой ответ на запрос, формулируемый обычно на естественном языке. Запросно-ответные системы соединяют в себе характеристики как систем управления базами данных, так и систем библиографического поиска. Поскольку ответ на запрос, относящийся к фактам, дается напрямую, то запросно-ответная система нуждается в знании соответствующих приемов и методов лингвистики, в подробной информации о конкретных областях деятельности, а также в запасе общих знаний. По этой причине такие системы используются только в особых обстоятельствах и в определенных предметных областях.
ПРОЦЕСС НАКОПЛЕНИЯ И ПОИСКА ИНФОРМАЦИИ
В принципе запрос на информацию можно было бы сравнить с содержимым файлов и выявить наилучшее соответствие. На практике, однако, содержание как запроса, так и элементов хранимой информации надо сначала определить более четко. Таким образом, в управлении базой данных содержание каждой записи оценивается согласно некоторому масштабу значений; в системе поиска ссылки документ представляется набором терминов, каждый из которых имеет значение (вес), зависящее от важности термина в документе.
Процесс накопления и поиска информации состоит из некоторого вида индексации, записи в файл, формулирования запроса и операций просмотра и выборки, выполняемых над хранимыми записями при ответе на запрос об информации.
Индексация.
Обычно индексация осуществляется вручную. Индекс (предметный указатель, словарь) может содержать много терминов, взятых из естественного языка, или может быть ограничен некоторыми специальными терминами. Словарь специальных терминов может определять термины с более широкими границами применимости, чем некоторый заданный термин, а также более узкие термины, синонимы и т.д. Документу назначается от 6 до 20 терминов. Ручная индексация представляет собой своего рода искусство, и не следует ожидать какой-либо согласованности между результатами действий отдельных индексаторов.
Были разработаны разнообразные методы автоматической индексации. В простейшем случае для индексации используется каждое слово отрывка из документа, за исключением союзов и предлогов. В более сложных системах выбираются термины, и им назначается вес по частоте появления в отдельных документах: чем выше частота появления данного слова, тем больше назначаемый ему вес. Слова, часто появляющиеся на протяжении всего собрания данных, не представляются подходящими для индексации, поскольку при осуществлении поиска они могут создать ложное представление относительно предпочтительности одних элементов перед другими. В случае автоматической индексации содержание документа может быть представлено не более чем сотней терминов.
Формулирование запроса.
В запросах должны использоваться термины, имеющие вероятность совпасть с терминами-индексами, назначенными отыскиваемому документу. Формулировки запросов зачастую сложны. Так, запрос «А и В» означает, что должны отыскиваться документы, содержащие как термин А, так и термин В; запрос «А или В» относится к документам, содержащим либо термин А, либо термин В. В обычных системах поиска отыскиваются только те документы, в которых термины точно совпадают с терминами соответствующего запроса. В более совершенных системах формулировки запросов автоматически конструируются из формулировок, предъявляемых пользователем на естественном языке. Затем эти формулировки используются для идентификации документов на основе сходства терминов.
Организация и поиск файлов.
Последовательный просмотр, при котором запрос сравнивается с каждым хранимым элементом по очереди, является неприемлемо медленным, исключая случай малых файлов. Если бы файл состоял из терминов в алфавитном порядке, по одному на элемент, его можно было бы использовать как телефонную книгу, и поиск был бы быстрым. Когда каждому документу назначается много поисковых терминов, документы можно разбить на группы сходных терминов. Этот способ известен как кластерная организация файла. Затем каждой группе, или кластеру, может быть присвоена метка, и термины запроса сравниваются только с подходящей меткой.
Быстрый поиск можно осуществить путем использования справочных файлов, которые содержат список идентификаторов документов для каждого термина-индекса. Тогда выполняется просмотр справочных файлов на предмет обнаружения идентификаторов, соответствующих данному термину. Например, списки идентификаторов документов для терминов-индексов «ЯБЛОНЯ» и «ГРУША» могли бы выглядеть как
В ответ на запрос «ЯБЛОНЯ и ГРУША» были бы выданы документы 25 и 31, а на запрос «ЯБЛОНЯ или ГРУША» – документы 22, 23, 25, 26, 27, 31 и 38. Существует несколько методов для сравнения и слияния списков в файле этого типа, который известен как инвертированный файл.
Многие поисковые системы предлагают процедуры переформулировки запроса после первоначальной операции поиска. Переформулированный запрос включает некоторые релевантные термины, извлеченные из документов, найденных в ответ на первоначальный запрос.
АППАРАТНЫЕ СРЕДСТВА ПОИСКА ИНФОРМАЦИИ
Оборудование, используемое для автоматического накопления и поиска информации, включает устройства, которые хранят файлы, и терминалы, которые печатают или изображают запрашиваемую информацию.
Устройства хранения.
В прошлом для хранения файлов использовались перфокарты, перфоленты или магнитные ленты. Сегодня файлы можно хранить на магнитных дисках, магнитных картах или полосках, в виде микрофильма или на оптических дисках.
Магнитные диски являются высоконадежным средством хранения больших файлов. Информация записывается на дорожках поверхности диска с помощью магнитных импульсов, представляющих нули и единицы. Запись или считывание информации осуществляется при вращении диска на оси. Поскольку с помощью различных комбинаций нулей и единиц можно легко представить буквы и числа, на них можно записать и обычный текст. Информация на магнитных дисках поддается стиранию, и поэтому они могут использоваться там, где содержимое файлов время от времени необходимо изменять.
Для больших файлов на одну ось можно как бы нанизать несколько дисков, образующих дисковый пакет. Дисковый пакет обеспечивает произвольный доступ к миллиардам символов. «Произвольный доступ» означает немедленный доступ к любой дорожке на любом диске без необходимости последовательно просматривать весь файл.
Магнитные карты и полоски также предоставляют произвольный доступ к большим файлам. Однако оборудование для них не так надежно, как для дисков.
Микрофильмы используются для воспроизведения текстов или изображений в уменьшенном виде. Микрофиша (лист микрофильма) размером 10 ґ 15 см может хранить 98 обычных страниц данных или картинок. Хранение на микрофильмах обходится недорого и обеспечивает быстрый и надежный доступ к отдельным страницам, или фреймам. Однако с пленки нельзя стереть информацию, произвольный доступ дается нелегко, а технология трудна для комбинирования с магнитными запоминающими устройствами, используемыми в существующих компьютерах. См. также ФАКСИМИЛЬНАЯ СВЯЗЬ; МИКРОФИЛЬМИРОВАНИЕ.; КОМПЬЮТЕР.
Для хранения больших файлов все чаще используются оптические диски. Одиночный оптический диск, аналогичный компакт-диску, используемому для записи классической или популярной музыки, может хранить до одного миллиарда символов информации. Информация регистрируется посредством мелких углублений, выгравированных лазерным лучом на поверхности диска. Записанные данные считываются путем обработки лазерного луча, отраженного от диска. Оптические диски недороги и могут использоваться для хранения огромных баз данных. Поэтому в сфере поиска и хранения больших файлов информации оптические диски быстро заменяют магнитные. Однако записанная на оптических дисках информация, как правило, не поддается стиранию, а по скорости считывания они уступают магнитным. См. также ИЗОБРАЖЕНИЙ ЗАПИСЬ И ВОСПРОИЗВЕДЕНИЕ.
Терминалы.
Терминал представляет собой устройство, обычно оборудованное клавиатурой и средствами изображения и способное посылать и получать информацию. Различают терминалы консольные (простые) и интеллектуальные.
Для доступа к хранимой информации используются консольные терминалы двух типов. В обоих запросы обычно вводятся с помощью клавиатуры, аналогичной клавиатуре пишущей машинки. Терминал типа пишущей машинки запрошенную информацию распечатывает, графический же выводит ее на дисплей, похожий на экран телевизора.
Интеллектуальный, или программируемый, терминал может сохранять и обрабатывать информацию сам. Такие терминалы генерируют ответы и изображают их на экране в графической форме.
ПРИМЕНЕНИЕ СРЕДСТВ ПОИСКА ИНФОРМАЦИИ
Современные средства накопления и поиска информации могут использоваться для широкого класса задач обработки данных. Системы управления базами данных в сфере бизнеса обрабатывают простые структурированные файлы разных видов: файлы управления запасами на складах; бухгалтерские файлы в банках; файлы полисов в страховых компаниях; школьные регистрационные работы; записи о пациентах в больницах и т.д. С другой стороны, при хранении и обработке текстовых файлов приобретают важное значение процедуры поиска ссылок. Это относится к учреждениям, где архивируется и отыскивается корреспонденция; школам, где учебные материалы представляются в виде записей или книг; больницам, где краткие медицинские записи оформляются на естественном языке.
Многие библиотеки предлагают прямой доступ (через терминал) к услугам автоматического поиска. Обеспечивается автоматический просмотр многих библиотечных каталогов и указателей, входят в жизнь сети, предлагающие доступ к механически считываемым собраниям общенационального значения. Библиотека будущего будет содержать меньше бумаги – книг, каталожных карточек, журналов – и больше информации, просматриваемой электронным способом.
Услуги автоматизированного накопления и поиска данных все больше используются для индексации, классификации и поиска файлов и корреспонденции в современных учреждениях, которые могут быть оборудованы также компьютерами, помогающими составлять и исправлять текст, а также средствами автоматической обработки сообщений и электронной почты. См. также ОРГТЕХНИКА И КАНЦЕЛЯРСКОЕ ОБОРУДОВАНИЕ; БИБЛИОТЕКИ.
Ложе И. Информационные системы: методы и средства. М., 1979
Гукасов В.Г. и др. Техника поиска в информационных базах. М., 1981
Трофимова И.П. Системы обработки и хранения информации. М., 1989
Якубайтис Э.А. Информационные сети и системы. М., 1996