Что такое поиск информации в проекте
Что такое поиск информации в проекте
Код ОГЭ по информатике: 2.4.1. Компьютерные энциклопедии и справочники; информация в компьютерных сетях, некомпьютерных источниках информации. Компьютерные и некомпьютерные каталоги, поисковые машины, формулирование запросов
Поиск информации (информационный поиск) — это информационный процесс, цель которого — получение информации из информационного объекта или из хранилища информационных объектов. Поиск информации является разновидностью процесса обработки информации. Для ускорения информационного поиска создают и используют информационно-поисковые системы.
Информационно-поисковая система (ИПС) — система, выполняющая функции хранения больших объёмов информации, быстрого поиска требуемой информации и её вывода в удобном для человека виде.
Информационно-поисковые системы позволяют добавлять, удалять и изменять хранимую информацию. Существуют информационно-поисковые системы двух видов:
Справочные ИПС, в свою очередь, делятся на:
Документальные и фактографические ИПС. Документальными ИПС являются книжные фонды, открытые для доступа в читальных залах библиотек или в магазинах. Однотипные информационные объекты (книги) стоят на стеллажах чаще всего в порядке отраслей знаний (философия, математика, физика и т. п.). Читатель (покупатель), проходя вдоль стеллажей, ищет сначала названия отраслей знаний, а затем книги в разделах.
В словарях однотипные информационные объекты (слова и связанные с ними описания) расположены в алфавитном порядке, что существенно ускоряет поиск нужного слова или словосочетания. В энциклопедиях в аналогичном порядке расположены другие однотипные информационные объекты — статьи с описанием понятий. По такому же принципу организованы алфавитные книжки для записи телефонов и адресов, а также список учеников класса в классном журнале.
В другом порядке — хронологическом — организованы фактографические ИПС, которые называются расписаниями. Имеются в виду расписания занятий, расписания движения поездов, самолётов и т. п.
Адресные ИПС в документах. Адресные ИПС распространены гораздо шире документальных и фактографических. Каждый бумажный документ, исключая словари и энциклопедии, имеет собственную адресную ИПС в виде оглавления (содержания). В оглавлении записаны названия разделов документа и указаны их адреса — номера страниц, на которых эти названия находятся.
Поиск информации в документе состоит из трёх этапов:
Адресные ИПС в хранилищах информационных объектов. В хранилищах бумажных документов (библиотеках, архивах) создаются адресные ИПС, которые называются каталогами.
Традиционные каталоги содержат бумажные карточки с описаниями документов и их адресов в хранилище (номер хранилища, номер стеллажа и т. д.). Адрес документа в хранилище называется шифром. Аналогичным образом организуется хранение и адресация звуко-, кино- и видеозаписей.
Поиск информации в хранилище информационных объектов состоит также из трёх этапов:
Оценка результатов поиска информации. Поиск информации в информационных объектах или в хранилищах информационных объектов редко бывает однократным. Результат поиска всегда оценивается с точки зрения полноты требуемой информации. Если информации недостаточно, поиск других источников информации проводят снова и снова, пока результат не станет удовлетворительным.
Поиск внутри компьютера
Для поиска файлов и папок в компьютере используют поле поиска в меню кнопки Пуск или в окне программы «Проводник». В программе «Проводник» это делать удобнее, так как можно сузить область поиска. Для этого в «Проводнике» открывают папку, в которой предположительно содержится искомый файл или папка.
Для запуска процесса поиска в поле поиска вводят символы из имени файла или его содержимого. В области просмотра появляется список файлов и папок, которые отвечают запросу. В строке каждого файла указан реальный путь к нему.
Условия поиска можно сохранить, используя кнопку Сохранить условия поиска на панели в верхней части области просмотра программы «Проводник».
Список с результатами поиска анализируется пользователем самостоятельно. Одно можно сказать точно: если файл на самом деле находится в компьютере, то его имя непременно окажется в списке результатов поиска.
Чтобы просмотреть файл в содержащей его папке, по строке файла щёлкают левой, потом правой клавишей мыши, а затем в контекстном меню щёлкают по пункту Расположение файла. В области просмотра открывается папка, содержащая файл.
Поиск в Интернете
Существует несколько сайтов, которые представляют в Интернете поисковые системы (поисковые машины), в том числе русскоязычные:
Поисковые системы представляют собой адресные информационно-поисковые системы. Они обычно включают два компонента:
Процедура поиска информации. Для проведения автоматического поиска вводят текстовый запрос в поле поиска поисковой системы.
В поле поиска обычно вводят ключевые слова, которые отражают суть запроса, например «тезаурус». Запрос можно также сформулировать в виде вопроса, например: «Что такое тезаурус?». Поисковая система при этом игнорирует орфографические ошибки:
По умолчанию поисковые системы настроены на поиск в Интернете веб-страниц, которые содержат ключевые слова. Иногда требуется сузить область поиска, чтобы, например, найти новостную страницу или страницу-словарь, либо изменить объект поиска, чтобы, например, найти картинку, музыку, видео.
Для выбора объекта и области поиска поисковые системы в Интернете предлагают меню. После ввода данных щёлкают по кнопке Найти (или аналогичной). Через некоторое время окно браузера обновляется и в нём появляются результаты поиска в виде списка гиперссылок на документы. Этот список может содержать тысячи гиперссылок. По первой двадцатке списка всегда видно, точным ли был запрос. Иногда запрос следует уточнить и запустить поисковую систему ещё раз. В любом случае для получения ответа достаточно просмотреть первую сотню документов, обращаясь к ним с помощью гиперссылок из списка.
Поисковые каталоги. Многие поисковые системы на своих веб-страницах имеют поисковые каталоги, которые построены в виде меню, пунктами которого являются разделы каталога. Принцип построения поисковых каталогов аналогичен принципу построения дерева папок в компьютере. Выбор пункта каталога открывает новое меню, в котором также делают выбор. И так до тех пор, пока на экран не будет выведен список ссылок, входящих в конечный пункт каталога. В процессе поиска следует только правильно определяться с выбором пунктов каталога.
Сохранение информации из Интернета. Просмотр веб-страниц может сопровождаться сохранением информации с этих страниц.
Если сохранения требует вся веб-страница, находящаяся в браузере, то вводят команду меню Файл|Сохранить как. Появляется диалоговое окно сохранения. В поле «Тип файла» выбирают уровень полноты сохранения — полностью веб-страница с включением графики, файл веб-страницы без графики или только текст веб-страницы. Операцию заканчивают щелчком по кнопке Сохранить.
Если сохранение требуется только для части веб-страницы, то требуемую информацию выделяют в браузере буксировкой мыши, как в текстовом редакторе, копируют в буфер обмена, а затем вставляют из буфера обмена в новый документ в текстовом редакторе «Блокнот» или Word. Сохранение получившегося документа делают обычным способом.
Именно так в Интернете можно собрать информацию для подготовки реферата практически на любую тему.
Чтобы сохранить ссылку на веб-страницу, достаточно ввести команду меню Избранное|Добавить в «Избранное», в диалоговом окне подобрать папку для сохранения и щёлкнуть по кнопке Добавить. Ссылка войдёт в меню кнопки Избранное.
Конспект урока по информатике «Поиск информации. Поисковые системы».
Чек-лист по быстрому и эффективному поиску информации для курсовых, дипломных и научных работ
Написание любых проектов сводится в тотальной обработке информации. Притом важно, чтобы данная обработка сводилась не к банальному копированию, а поддавалась переосмыслению и изложению в новом виде (но обязательно с сохранением изначального смысла).
Написание любых проектов сводится в тотальной обработке информации. Притом важно, чтобы данная обработка сводилась не к банальному копированию, а поддавалась переосмыслению и изложению в новом виде (но обязательно с сохранением изначального смысла).
Студенты, сталкиваясь с выполнением курсовых и дипломных работ, мгновенно теряются. Первое, что приходит им на ум: «Что писать? Где искать? Как излагать?». Ответ на эти вопросы позволит моментально решить ключевые проблемы: определить цель исследования, источники информации и способы ее представления в проекте (пересказ, цитирование и копирование, графические материалы и их анализ и пр.).
Самый длительный процесс при выполнении любого научного исследования или студенческого проекта — это сбор и обработка информации. Порой он занимает до нескольких месяцев. Сегодня специалисты ОЦ Дисхелп расскажут, как ускорить реализацию данной процедуры и повысить ее эффективность.
Процедура «поиска информации»: что этого такое и из каких этапов состоит?
Тема курсовой/дипломной/научной работы выбрана и закреплена. Автору остается лишь найти подходящую литературу. В основу исследования должны лечь исключительно надежные, достоверные и обоснованные сведения, проверенные ресурсы. Поэтому к подбору информационной базы необходимо подходить с особой тщательностью и вниманием.
Поиск ресурсов для студенческой и научной работы представляет собой процесс изучения литературы, соответствующей теме исследования. От «качества» источников в дальнейшем будет зависеть и качество проекта.
Как правильно искать информацию?
Процедура подбора информационной базы для курсовой/дипломной или научной работы состоит из следующих этапов:
Чтобы упростить процедуру поиска и обработки информации, важно изначально использовать только качественные материалы. Для этого (еще на этапе поиска и первого изучения, знакомства) необходимо все источники анализировать на соответствие следующим критериями «качества»:
Нужна помощь преподавателя?
Мы всегда рады Вам помочь!
Разновидности источников информации, применяемых при выполнении студенческих и научно-исследовательских работ
В простом виде все информационные ресурсы можно разбить на две группы: белые и черные.
Белые представлены в виде доказанных и популярных работ, оформленных в виде научных статей, учебных пособий, справочников и энциклопедий, монографий и диссертаций. Они соответствуют принятым нормам (ГОСТам), имеют точную доказательную основу, признаны научным и мировым сообществом. Эти сведения легко перепроверяются и сопоставляются, а их авторы имеют определенную репутацию.
Откуда можно черпать информацию?
Черные данные представлены в виде сомнительных публикаций, фейковых «новостей», сомнительные интернет-источники (малоизвестные или неизвестные сайты, новые авторы и пр.). В них практически всегда отсутствуют ссылки на первоисточники, автор руководствуется преимущественно собственными суждениями доказательная база слабая или сомнительная, перепроверить факты невозможно.
Также информационную базу любого исследования можно разбить на следующие блоки:
Согласно текущим требованиям, предъявляемым к курсовым, дипломным и научным работам, текст новых проектов должен быть читабельным, логичным и последовательным, уникальным (оригинальность зависит от вида работ и варьируется в среднем от 65% до 85%), достоверным и проверяемым.
Как и где искать информацию для научно-исследовательского проекта?
Поиск информационной базы для студенческой или научной работы целесообразно начинать по следующему плану:
Шаг №1. Конкретизируем тему: цель, объект, предмет, задачи, методы, ключевые слова.
Шаг №2. Советуемся с научным руководителем: авторы, виды материалов, где искать.
Шаг №3. Поиск информации всеми возможными способами: библиотеки, интернет с учетом темы (шаг №1), точно формулируем поисковый запрос и пр.
Шаг №4. Обработка найденных источников: читаем, анализируем по «критериям качества», оставляем лишь проверенные и обоснованные достоверные данные. В дальнейшем перечитываем их и сортируем с учетом плана научной работы (кой фрагмент де уместен и пригоден) обязательно помечая первоисточник.
Алгоритм поиска информации
Шаг №5. Систематизация материалов. Формируем грамотный, логичный и последовательный текст, опираясь на конкретные факты и материалы.
Искать информацию нужно правильно: создайте список вопросов, которые помогут вам раскрыть, как отдельные моменты, так и тему в целом. Здесь можно ориентироваться на цель и задачи, план работы.
Искать материалы, которые в дальнейшем лягут в основу научно-исследовательского проекта, нужно исключительно на проверенных базах: научные журналы, сайты ВУЗов (там публикуют научные труды студентов и аспирантов), научные площадки (например, Google Scholar, Scopus, WoS, РИНЦ, КиберЛинка и пр.).
Не торопитесь скачивать и покупать готовые работы. По сути, данный вариант равносилен «коту в мешке». Полномасштабный текст будет доступен только после оплаты, а возврату он подлежать уже не будет. Поэтому лучше всего доверять только себе и/или проверенным исполнителям, которые помогут в подборе информационной базы для научного исследования или готовы выполнить проект за отдельную плату.
Найти таких профессионалов можно в образовательном центре DissHelp. Наши специалисты готовы сформировать список литературы, которая позволит глубоко изучить и раскрыть тему с учетом актуальности, достоверности и надежности данных. Также мы готовы выполнить любой проект «под ключ»: независимо от направления деятельности, ступени образования и уровня сложности. У нас трудятся высококвалифицированные эксперты, которым посильно все: педагоги ведущих ВУЗов страны кандидаты и доктора наук, доценты и профессора, практикующие специалисты.
Мы гарантируем высокое качество услуг, безопасность сделки, конфиденциальность данных и индивидуальный подход каждому клиенту. Убедиться в нашей легальности и честности можно, изучив многочисленные отзывы наших клиентов. Оформить заявку можно здесь и сейчас.
Трудности с учебой?
Помощь в написании студенческих и
аспирантских работ!
Поиск информации
Информационный поиск (ИП) (англ. Information retrieval ) — процесс поиска неструктурированной документальной информации и наука об этом поиске.
Содержание
История
Термин «информационный поиск» был впервые введён Кельвином Муром в 1948 в его докторской диссертации, опубликован и употребляется в литературе с 1950.
Сначала системы автоматизированного ИП, или информационно-поисковые системы (ИПС), использовались лишь для управления информационным взрывом в научной литературе. Многие университеты и публичные библиотеки стали использовать ИПС для обеспечения доступа к книгам, журналам и другим документам. Широкое распространение ИПС получили с появлением сети Интернет. У русскоязычных пользователей наибольшей популярностью пользуются поисковые системы Яндекс и Рамблер.
Информационный поиск как процесс
Поиск информации представляет собой процесс выявления в некотором множестве документов (текстов) всех таких, которые посвящены указанной теме (предмету), удовлетворяют заранее определенному условию поиска (запросу) или содержат необходимые (соответствующие информационной потребности) факты, сведения, данные.
Процесс поиска включает последовательность операций, направленных на сбор, обработку и предоставление необходимой информации заинтересованным лицам.
В общем случае поиск информации состоит из четырех этапов:
Виды поиска
Полнотекстовый поиск — поиск по всему содержимому документа. Пример полнотекстового поиска — любой интернет-поисковик, например www.yandex.ru,
Поиск по метаданным — это поиск по неким атрибутам документа, поддерживаемым системой — название документа, дата создания, размер, автор и т. д. Пример поиска по реквизитам — диалог поиска в файловой системе (например, MS Windows).
Поиск по изображению — поиск по содержанию изображения. Поисковая система распознает содержание фотографии (загружена пользователем или добавлен URL изображения). В результатах поиска пользователь получает похожие изображения. Так работают поисковые системы:
Методы поиска
Адресный поиск
Процесс поиска документов по чисто формальным признакам, указанным в запросе.
Для осуществления нужны следующие условия:
Адресами документов могут выступать адреса веб-серверов и веб-страниц и элементы библиографической записи, и адреса хранения документов в хранилище.
Семантический поиск
Процесс поиска документов по их содержанию.
Условия:
Документальный поиск
Процесс поиска в хранилище информационно-поисковой системы первичных документов или в базе данных вторичных документов, соответствующих запросу пользователя.
Два вида документального поиска:
Фактографический поиск
Процесс поиска фактов, соответствующих информационному запросу.
К фактографическим данным относятся сведения, извлеченные из документов, как первичных, так и вторичных и получаемые непосредственно из источников их возникновения.
Различают два вида:
Информационный поиск как наука
Информационный поиск — большая междисциплинарная область науки, стоящая на пересечении когнитивной психологии, информатики, информационного дизайна, лингвистики, семиотики, и библиотечного дела.
ИП рассматривает поиск информации в документах, поиск самих документов, извлечение метаданных из документов, поиск текста, изображений, видео и звука в локальных реляционных базах данных, в гипертекстовых базах данных таких, как Интернет и локальные интранет-системы.
Существует некоторая путаница, связанная с понятиями поиска данных, поиска документов, информационного поиска и текстового поиска. Тем не менее, каждое из этих направлений исследования обладает собственными методиками, практическими наработками и литературой.
В настоящее время ИП — это бурно развивающаяся область науки, популярность которой обусловлено экспоненциальным ростом объемов информации, в частности в сети Интернет. ИП посвящена обширная литература и множество конференций. Одной из наиболее известных является Министерством обороны США совместно с Институтом Стандартов и Технологий (NIST) с целью консолидации исследовательского сообщества и развития методик оценки качества ИП.
Запрос и объект запроса
Говоря о системах ИП, употребляют термины запрос и объект запроса.
Запрос — это формализованный способ выражения информационных потребностей пользователем системы. Для выражения информационной потребности используется язык поисковых запросов, синтаксис варьируется от системы к системе. Кроме специального языка запросов, современные поисковые системы позволяют вводить запрос на естественном языке.
Объект запроса — это информационная сущность, которая хранится в базе автоматизированной системы поиска. Несмотря на то, что наиболее распространенным объектом запроса является текстовый документ, не существует никаких принципиальных ограничений. В частности, возможен поиск изображений, музыки и другой мультимедиа информации. Процесс занесения объектов поиска в ИПС называется индексацией. Далеко не всегда ИПС хранит точную копию объекта, нередко вместо неё хранится суррогат.
Задачи информационного поиска
Центральная задача ИП — помочь пользователю удовлетворить его информационную потребность. Так как описать информационные потребности пользователя технически непросто, они формулируются как некоторый запрос, представляющий из себя набор ключевых слов, характеризующий то, что ищет пользователь.
Классическая задача ИП, с которой началось развитие этой области, — это поиск документов, удовлетворяющих запросу, в рамках некоторой статической коллекции документов. Но список задач ИП постоянно расширяется и теперь включает:
Оценки эффективности
Существует много способов оценить насколько хорошо документы, найденные ИПС, соответствуют запросу. К сожалению, понятие степени соответствия запроса, или другими словами релевантности, является субъективным понятием, а степень соответствия зависит от конкретного человека, оценивающего результаты выполнения запроса.
Точность (precision)
Определяется как отношение числа релевантных документов, найденных ИПС, к общему числу документов:
,
где Drel — это множество релевантных документов в базе, а Dretr — множество документов, найденных системой. По результатм исследований компании, оценивающей релевантность показателей основных русских и зарубежных поисковых систем.
0.698 Эти показатели были получены на основе анализа запроса на слово cat и по тому, как много релевантных ссылок выдаёт поисковик на 100 первых ответов.
Полнота (recall)
Отношение числа найденных релевантных документов, к общему числу релевантных документов в базе:
,
где Drel — это множество релевантных документов в базе, а Dretr — множество документов, найденных системой.
Выпадение (fall-out)
Выпадение характеризует вероятность нахождения нерелевантного ресурса и определяется, как отношение числа найденных нерелевантных документов к общему числу нерелевантных документов в базе:
,
где Dnrel — это множество нерелевантных документов в базе, а Dretr — множество документов, найденных системой.
F-мера (F-measure, мера Ван Ризбергена)
Традиционно F-мера определяется, как гармоническое среднее точности и полноты:
Часто ее также называют F1 мерой, потому что точность и полнота присутствуют в этой формуле с одинаковым весом.
Более общая формула для положительного вещественного α имеет вид:
См. также
Ссылки
Литература
Полезное
Смотреть что такое «Поиск информации» в других словарях:
Поиск информации — в узком смысле процесс выявления в массиве информации записей, удовлетворяющих заранее определенному условию поиска (запросу). По английски: Information retrieval Синонимы: Поиск данных См. также: Автоматизированный информационный поиск… … Финансовый словарь
поиск (информации) — — [http://slovarionline.ru/anglo russkiy slovar neftegazovoy promyishlennosti/] Тематики нефтегазовая промышленность EN retrieval … Справочник технического переводчика
поиск информации — — [http://www.iks media.ru/glossary/index.html?glossid=2400324] Тематики электросвязь, основные понятия EN information retreival … Справочник технического переводчика
поиск информации — informacijos paieška statusas T sritis automatika atitikmenys: angl. information retrieval vok. Informationserschließung, f; Wiederauffinden von Informationen, n; Wiedergewinnung von Nachrichten, f rus. информационный поиск, m; поиск информации,… … Automatikos terminų žodynas
ПОИСК ИНФОРМАЦИИ — совокупность логических и технических операций, конечной целью которых является извлечение из массива документов нужной информации или документа по заданным признакам в соответствии с запросом … Большой экономический словарь
Ретроспективный поиск информации — информационный поиск, проводимый во всем накопленном массиве документов или фактов по любому запросу, соответствующему тематике и виду информационного массива. По английски: Retrospective searching См. также: Информационный поиск Финансовый… … Финансовый словарь
ХРАНЕНИЕ И ПОИСК ИНФОРМАЦИИ — ХРАНЕНИЕ И ПОИСК ИНФОРМАЦИИ, отрасль КОМПЬЮТЕРНОЙ НАУКИ, изучающая функционирование массивов информации. Система поиска баз данных предполагает нахождение больших компьютерных файлов, содержащих необходимые ДАННЫЕ. Эти данные могут быть… … Научно-технический энциклопедический словарь
упорядоченный поиск информации — — [Л.Г.Суменко. Англо русский словарь по информационным технологиям. М.: ГП ЦНИИС, 2003.] Тематики информационные технологии в целом EN ordered retrieval … Справочник технического переводчика
хранение и поиск информации — — [http://www.iks media.ru/glossary/index.html?glossid=2400324] Тематики электросвязь, основные понятия EN information storage and retrievalISR … Справочник технического переводчика
Поиск подстроки — Поиск информации одно из основных использований компьютера. Одна из простейших задач поиска информации поиск точно заданной подстроки в строке. Тем не менее, эта задача чрезвычайно важна она применяется в текстовых редакторах,… … Википедия