Что такое поисковые каталоги в информатике
Поисковые системы
Поисковые системы (ПС) уже давно являются обязательной частью интернета и нашей повседневной жизни. Сегодня они громадные и сложнейшие механизмы, которые представляют собой не только инструмент для нахождения любой необходимой информации, но и довольно увлекательные сферы для бизнеса.
Функции и понятие ПС
Поисковая система – это аппаратно-программный комплекс, который предназначен для осуществления функции поиска в интернете, и реагирующий на пользовательский запрос который обычно задают в виде какой-либо текстовой фразы (или точнее поискового запроса), выдачей ссылочного списка на информационные источники, осуществляющейся по релевантности. Самые распространенные и крупные системы поиска: Google, Bing, Yahoo, Baidu. В Рунете – Яндекс, Mail.Ru, Рамблер.
Рассмотрим поподробнее само значение запроса для поиска, взяв для примера систему Яндекс.
Запрос обязан быть сформулирован пользователем в полном соответствии с предметом его поиска, максимально просто и кратко. К примеру, мы желаем найти информацию в данном поисковике: «как выбрать автомобиль для себя». Чтобы сделать это, открываем главную страницу и вводим запрос для поиска «как выбрать авто». Потом наши функции сводятся к тому, чтобы зайти по предоставленным ссылкам на информационные источники в сети.
Но даже действуя таким образом, можно и не получить необходимую нам информацию. Если мы получили подобный отрицательный результат, нужно просто переформировать свой запрос, или же в базе поиска действительно нет никакой полезной информации по данному виду запроса (такое вполне возможно при заданных «узких» параметров запроса, как, к примеру, «как выбрать автомобиль в Туле»).
Самая основная задача каждой поисковой системы – доставить людям именно тот вид информации, который им нужен. Приучить же пользователей создавать «правильный» вид запросов к поисковым системам, то есть фразы, которые будут соответствовать их принципам работы, практически, невозможно.
Именно поэтому специалисты-разработчики поисковиков делают такие принципы и алгоритмы их работы, которые бы давали пользователям находить интересующие их сведения. Это означает, что система, должна «думать» так же, как мыслит человек при поиске необходимой информации в интернете.
Когда он вводит свой запрос в поисковую машину, он желает найти то, что ему надо, как можно проще и быстрее. Получив результат, пользователь составляет свою оценку работе системы, руководствуясь несколькими критериями. Получилось ли у него найти нужную информацию? Если нет, то сколько раз ему пришлось переформатировать текст запроса, чтобы найти ее? Насколько актуальная информация была им получена? Как быстро поисковая система обработала его запрос? Насколько удобно были предоставлены поисковые результаты? Был ли нужный результат первым, или находился на 30-ом месте? Сколько «мусора» (ненужной информации) было найдено вместе с полезными сведениями? Найдется ли актуальная для него информация, при использовании ПС, через неделю, либо через месяц?
Основные характеристики поисковых систем
Полнота.
Точность.
Еще одна основная функция поисковой системы – точность. Она определяет степень соответствия запросу пользователя найденных страниц в Сети. К примеру, если по ключевой фразе «как выбрать автомобиль» найдется сотня документов, в половине из них содержится данное словосочетание, а в остальных просто есть в наличии такие слова (как грамотно выбрать автомагнитолу, и установить ее в автомобиль»), то поисковая точность равна 50/100 = 0,5.
Чем поиск точнее, тем скорее пользователь найдет необходимую ему информацию, тем меньше разнообразного «мусора» будет встречаться среди результатов, тем меньше найденных документов будут не соответствовать смыслу запроса.
Актуальность.
Это значимая составляющая поиска, которую характеризует время, проходящее с момента опубликования информации в интернете до занесения ее в индексную базу поисковика.
К примеру, на следующий день после возникновения информации о выходе нового iPad, множество пользователей обратилась к поиску с соответствующими видами запросов. В большинстве случаев информация об этой новости уже доступна в поиске, хотя времени с момента ее появления прошло очень мало. Это происходит благодаря наличию у крупных поисковых систем «быстрой базы», которая обновляется несколько раз за день.
Скорость поиска.
Наглядность.
Наглядное представление результатов является важнейшим элементом удобства поиска. По множеству запросов поисковая система находит тысячи, а в некоторых случаях и миллионы разных документов. Вследствие нечеткости составления ключевых фраз для поиска или его не точности, даже самые первые результаты запроса не всегда имеют только нужные сведения.
Это значит, что человеку часто приходится осуществлять собственный поиск среди предоставленных результатов. Разнообразные компоненты страниц выдачи ПС помогают ориентироваться в поисковых результатах.
История развития поисковых систем
Когда интернет только начал развиваться, число его постоянных пользователей было небольшим, и объем информации для доступа был сравнительно невеликим. В основном доступ к этой сети имели лишь специалисты научно-исследовательских сфер. В то время, задача нахождения информации не была столь актуальна как сейчас.
Одним из самых первых методов организации широкого доступа к ресурсам информации стало создание каталогов сайтов, причем ссылки на них начали группировать по тематике. Таким первым проектом стал ресурс Yahoo.com, который открылся весной 1994-ого года. Впоследствии когда количество сайтов в Yahoo-каталоге существенно увеличилось, была добавлена опция поиска необходимых сведений по каталогу. Это еще не было в полной мере поисковой системой, так как область такого поиска была ограничена только сайтами, входящими в данный каталог, а не абсолютно всеми ресурсами в интернете. Каталоги ссылок весьма широко использовались раньше, однако в настоящее время, практически в полной мере утратили свою популярность.
Ведь даже сегодняшние, громадные по своим объемам каталоги имеют информацию о незначительно части сайтов в интернете. Самым известным и большим каталогом в мире был DMOZ (прекратил работу 14 марта 2017 года) имеет информацию о пяти миллионах сайтов, когда база Google содержит информацию о более чем 25 миллиардов страниц.
Самой первой настоящей поисковой системой стала WebCrawler, возникшая еще в 1994-ом году.
В следующем году появились AltaVista и Lycos. Причем первая была лидером по поиску информации очень длительное время.
В 1997-ом году Сергей Брин вместе с Ларри Пейджем создал машину поисковую Google как исследовательский проект в Стэндфордском университете. Сегодня именно Google, самая востребованная и популярная поисковая система в мире.
В сентябре 1997-ом году была анонсирована (официально) ПС Yandex, которая в настоящий момент является самой популярной системой поиска в Рунете.
Доля поисковых систем
Принципы работы поисковой системы
Модуль индексирования.
Данный компонент состоит из трех программ-роботов:
Spider (по англ. паук) – программа которая предназначена для того чтобы скачивать веб-страницы. «Паук» скачивает определенную страницу, одновременно извлекая из нее все ссылки. Скачивается код html практически с каждой страницы. Для этого роботы используют HTTP-протоколы.
«Паук» функционирует следующим образом. Робот передает запрос на сервер “get/path/document” и иные команды запроса HTTP. В ответ программа-робот получает поток текста, который содержит информацию служебного вида и, естественно, сам документ.
Crawler, исследуя найденные ссылки, ищет новые документы, еще не ставшие известными поисковой системе.
Indexer (робот-индексатор) – это программа, анализирующая страницы, которые скачали пауки.
Индексатор полностью разбирает страницу на составные элементы и проводит их анализ, применяя свои морфологические и лексические виды алгоритмов.
Анализ проводится над разнообразными частями страницы, такими как заголовки, текст, ссылки, стилевые и структурные особенности, теги html и др.
Таким образом, модуль индексирования дает возможность проходить по ссылкам заданного количества ресурсов, скачивать страницы, извлекать ссылочную массу на новые страницы из полученных документов и делать подробный их анализ.
База данных
Поисковый сервер
Это самый важный элемент всей системы, потому что от алгоритмов, лежащих в основе ее функциональности, прямо зависит скорость и, конечно же, качество поиска.
Что такое поисковые каталоги в информатике
Код ОГЭ по информатике: 2.4.1. Компьютерные энциклопедии и справочники; информация в компьютерных сетях, некомпьютерных источниках информации. Компьютерные и некомпьютерные каталоги, поисковые машины, формулирование запросов
Поиск информации (информационный поиск) — это информационный процесс, цель которого — получение информации из информационного объекта или из хранилища информационных объектов. Поиск информации является разновидностью процесса обработки информации. Для ускорения информационного поиска создают и используют информационно-поисковые системы.
Информационно-поисковая система (ИПС) — система, выполняющая функции хранения больших объёмов информации, быстрого поиска требуемой информации и её вывода в удобном для человека виде.
Информационно-поисковые системы позволяют добавлять, удалять и изменять хранимую информацию. Существуют информационно-поисковые системы двух видов:
Справочные ИПС, в свою очередь, делятся на:
Документальные и фактографические ИПС. Документальными ИПС являются книжные фонды, открытые для доступа в читальных залах библиотек или в магазинах. Однотипные информационные объекты (книги) стоят на стеллажах чаще всего в порядке отраслей знаний (философия, математика, физика и т. п.). Читатель (покупатель), проходя вдоль стеллажей, ищет сначала названия отраслей знаний, а затем книги в разделах.
В словарях однотипные информационные объекты (слова и связанные с ними описания) расположены в алфавитном порядке, что существенно ускоряет поиск нужного слова или словосочетания. В энциклопедиях в аналогичном порядке расположены другие однотипные информационные объекты — статьи с описанием понятий. По такому же принципу организованы алфавитные книжки для записи телефонов и адресов, а также список учеников класса в классном журнале.
В другом порядке — хронологическом — организованы фактографические ИПС, которые называются расписаниями. Имеются в виду расписания занятий, расписания движения поездов, самолётов и т. п.
Адресные ИПС в документах. Адресные ИПС распространены гораздо шире документальных и фактографических. Каждый бумажный документ, исключая словари и энциклопедии, имеет собственную адресную ИПС в виде оглавления (содержания). В оглавлении записаны названия разделов документа и указаны их адреса — номера страниц, на которых эти названия находятся.
Поиск информации в документе состоит из трёх этапов:
Адресные ИПС в хранилищах информационных объектов. В хранилищах бумажных документов (библиотеках, архивах) создаются адресные ИПС, которые называются каталогами.
Традиционные каталоги содержат бумажные карточки с описаниями документов и их адресов в хранилище (номер хранилища, номер стеллажа и т. д.). Адрес документа в хранилище называется шифром. Аналогичным образом организуется хранение и адресация звуко-, кино- и видеозаписей.
Поиск информации в хранилище информационных объектов состоит также из трёх этапов:
Оценка результатов поиска информации. Поиск информации в информационных объектах или в хранилищах информационных объектов редко бывает однократным. Результат поиска всегда оценивается с точки зрения полноты требуемой информации. Если информации недостаточно, поиск других источников информации проводят снова и снова, пока результат не станет удовлетворительным.
Поиск внутри компьютера
Для поиска файлов и папок в компьютере используют поле поиска в меню кнопки Пуск или в окне программы «Проводник». В программе «Проводник» это делать удобнее, так как можно сузить область поиска. Для этого в «Проводнике» открывают папку, в которой предположительно содержится искомый файл или папка.
Для запуска процесса поиска в поле поиска вводят символы из имени файла или его содержимого. В области просмотра появляется список файлов и папок, которые отвечают запросу. В строке каждого файла указан реальный путь к нему.
Условия поиска можно сохранить, используя кнопку Сохранить условия поиска на панели в верхней части области просмотра программы «Проводник».
Список с результатами поиска анализируется пользователем самостоятельно. Одно можно сказать точно: если файл на самом деле находится в компьютере, то его имя непременно окажется в списке результатов поиска.
Чтобы просмотреть файл в содержащей его папке, по строке файла щёлкают левой, потом правой клавишей мыши, а затем в контекстном меню щёлкают по пункту Расположение файла. В области просмотра открывается папка, содержащая файл.
Поиск в Интернете
Существует несколько сайтов, которые представляют в Интернете поисковые системы (поисковые машины), в том числе русскоязычные:
Поисковые системы представляют собой адресные информационно-поисковые системы. Они обычно включают два компонента:
Процедура поиска информации. Для проведения автоматического поиска вводят текстовый запрос в поле поиска поисковой системы.
В поле поиска обычно вводят ключевые слова, которые отражают суть запроса, например «тезаурус». Запрос можно также сформулировать в виде вопроса, например: «Что такое тезаурус?». Поисковая система при этом игнорирует орфографические ошибки:
По умолчанию поисковые системы настроены на поиск в Интернете веб-страниц, которые содержат ключевые слова. Иногда требуется сузить область поиска, чтобы, например, найти новостную страницу или страницу-словарь, либо изменить объект поиска, чтобы, например, найти картинку, музыку, видео.
Для выбора объекта и области поиска поисковые системы в Интернете предлагают меню. После ввода данных щёлкают по кнопке Найти (или аналогичной). Через некоторое время окно браузера обновляется и в нём появляются результаты поиска в виде списка гиперссылок на документы. Этот список может содержать тысячи гиперссылок. По первой двадцатке списка всегда видно, точным ли был запрос. Иногда запрос следует уточнить и запустить поисковую систему ещё раз. В любом случае для получения ответа достаточно просмотреть первую сотню документов, обращаясь к ним с помощью гиперссылок из списка.
Поисковые каталоги. Многие поисковые системы на своих веб-страницах имеют поисковые каталоги, которые построены в виде меню, пунктами которого являются разделы каталога. Принцип построения поисковых каталогов аналогичен принципу построения дерева папок в компьютере. Выбор пункта каталога открывает новое меню, в котором также делают выбор. И так до тех пор, пока на экран не будет выведен список ссылок, входящих в конечный пункт каталога. В процессе поиска следует только правильно определяться с выбором пунктов каталога.
Сохранение информации из Интернета. Просмотр веб-страниц может сопровождаться сохранением информации с этих страниц.
Если сохранения требует вся веб-страница, находящаяся в браузере, то вводят команду меню Файл|Сохранить как. Появляется диалоговое окно сохранения. В поле «Тип файла» выбирают уровень полноты сохранения — полностью веб-страница с включением графики, файл веб-страницы без графики или только текст веб-страницы. Операцию заканчивают щелчком по кнопке Сохранить.
Если сохранение требуется только для части веб-страницы, то требуемую информацию выделяют в браузере буксировкой мыши, как в текстовом редакторе, копируют в буфер обмена, а затем вставляют из буфера обмена в новый документ в текстовом редакторе «Блокнот» или Word. Сохранение получившегося документа делают обычным способом.
Именно так в Интернете можно собрать информацию для подготовки реферата практически на любую тему.
Чтобы сохранить ссылку на веб-страницу, достаточно ввести команду меню Избранное|Добавить в «Избранное», в диалоговом окне подобрать папку для сохранения и щёлкнуть по кнопке Добавить. Ссылка войдёт в меню кнопки Избранное.
Конспект урока по информатике «Поиск информации. Поисковые системы».
Поисковые системы. Поисковые запросы. Полезные адреса Всемирной паутины
Урок 5. Информатика 7 класс (ФГОС)
В данный момент вы не можете посмотреть или раздать видеоурок ученикам
Чтобы получить доступ к этому и другим видеоурокам комплекта, вам нужно добавить его в личный кабинет, приобрев в каталоге.
Получите невероятные возможности
Конспект урока «Поисковые системы. Поисковые запросы. Полезные адреса Всемирной паутины»
На прошлых уроках мы узнали:
· Глобальная компьютерная сеть Интернет – самое большое хранилище информации, созданное людьми.
· Самая массовая служба интернета, Всемирная паутина (WWW), предоставляет пользователям доступ к информации в виде веб-страниц.
· Веб-страницы всемирной паутины связаны между собой гиперссылками.
· Веб-сайт – это несколько веб-страниц, которые связаны между собой по содержанию и имеют одного владельца.
· Поисковые системы и их разновидности.
· Полезные сайты всемирной паутины.
Итак, всемирная паутина связывает огромное количество информационных ресурсов по всему миру. Но как найти, среди этого огромного количества нужную нам информацию? Мы знаем, что для того, чтобы перейти к просмотру нужного сайта нам достаточно ввести его адрес в адресную строку браузера. Но допустим, что мы решили найти информацию о правилах игры в футбол, но не знаем ни одного адреса сайта, который содержит такую информацию. В этом случае нам нужно воспользоваться одной из поисковых систем.
Поисковые системы – это сервисы, которые предназначены для поиска веб-страниц содержащих необходимую информацию во всемирной паутине.
Из прошлого урока мы помним, что первый веб-сайт был создан создателем всемирной Тимом Бернерсом Ли в 1991 году. Чтобы пользователи могли наблюдать за ростом всемирной паутины и им было проще искать в ней информацию Бернерс Ли добавил на свой сайт раздел «What’s new…», что в переводе на русский язык означает «Что нового». В этом разделе публиковался список всех веб-сайтов, которые создавались во всемирной паутине, пока их было не много. Это раздел считается первым поисковым каталогом во всемирной паутине.
Рассмотрим, как устроен поисковый каталог сайта mail.ru. Допустим нам нужно найти информацию о коллекционировании почтовых марок (или филателии). Введём адрес поискового каталога в адресную строку браузера и нажмём клавишу «Энтер». Мы видим главную страницу поискового каталога. На ней изображены, категории, на которые разбита вся информация, содержащаяся в каталоге. Нам нужно найти информацию о филателии. Для этого выберем категорию «Отдых и досуг». Как видим в верхней части веб-страницы расположен список подкатегорий, которые содержатся в этой категории, а снизу – список сайтов этой категории. Выбираем подкатегорию хобби. И в ней выбираем подкатегорию «Филателия». Здесь мы видим список ссылок на сайты по интересующей нас теме.
Поисковый каталог list.mail.ru
Со времени создания первого поискового каталога количество веб-сайтов сильно увеличилось. Сейчас во всемирной паутине больше 1 млрд сайтов. Очевидно, что все их небольшому количеству людей просмотреть не под силу. Поэтому начали создаваться поисковые системы, которые пополняются без участия людей, компьютерными программами. Так появились поисковые указатели.
Для того чтобы найти нужную информацию с помощью поискового указателя, пользователь вводит некоторые слова в его поисковую строку. То, что пользователь вводит в поисковую строку, называется поисковым запросом. Поисковый запрос может состоять из одного или нескольких слов, или целой фразы. Кроме ключевых слов поисковый запрос может содержать и некоторые поисковые операторы. С их помощью можно задать один из режимов поиска:
· Поиск веб-страниц, в которых встречается хотя бы одно из ключевых слов запроса.
· Поиск веб-страниц, в которых встречаются все ключевые слова запроса.
· Поиск веб-страниц, содержащих целую фразу, указанную в запросе.
При помощи логических операторов можно задать логические связки для поиска. Рассмотрим некоторые операторы поисковых запросов для поискового указателя «Яндекс».
Оператор «логическое И» записывается между двумя словами. Если ввести в поисковую систему слова футбол и хоккей и поставить между ними оператор логическое И в виде &&, поисковый указатель будет искать веб-страницы в которых встречаются оба этих слова в любой форме не зависимо от расстояния между ними. Также есть похожий оператор, который содержит всего один знак &. Если его установить между словами, поисковый указатель найдёт те веб-страницы, в которых эти слова встречаются в одном предложении.
Диаграмма Эйлера-Вена для операторов «&&» и «&»
Оператор «логическое ИЛИ» обозначается |. Если поставить его между словами – поисковый указатель сначала найдёт те веб-страницы, в которых встречается первое слово, потом те, где встречается второе слово и выведет их все.
Диаграмма Эйлера-Вена для оператора «|»
Диаграмма Эйлера-Вена для оператора «-»
Для того, чтобы найти целую цитату на веб-странице, в поисковой строке она заключается в кавычки. Если заключить фразу в кавычки поисковый указатель будет искать веб-страницы в которых содержится эта фраза. При этом знаки препинания будут игнорироваться.
Сравним между собой поисковые каталоги и поисковые указатели. Так как поисковые каталоги пополняются людьми, информация в них отбирается более тщательно, они практически не содержат посторонних ссылок. В то же время людям не под силу просмотреть много сайтов. Поэтому они содержат мало ссылок на сайты. Поисковые указатели пополняются компьютерными программами. Они могут предоставлять много посторонних ссылок, потому что компьютерная программа не может точно определить тему веб-страницы. Поисковые указатели дают пользователю гораздо больше ссылок на сайты, чем поисковые каталоги, так как компьютерные программы обрабатывают информацию о веб страницах быстрее людей.
Как мы знаем во всемирной паутине можно найти веб-сайты на самые разные темы с самым разным содержанием. Рассмотрим некоторые сайты, которые могут быть нам полезны.
· Веб-сайт urokidoma.org предоставляет возможность улучшить свои знания по школьным предметам, пройдя целый ряд онлайн-курсов. Старшеклассникам этот сайт позволит подготовится к единому государственному экзамену, а учителям – почерпнуть нечто новое в преподавании. Курсы проводят опытные учителя, подготовившие множество участников и победителей международных предметных олимпиад.
· Сайт videouroki.net – образовательный портал для школьников и учителей. На сайте можно найти целый ряд видеоуроков, памяток и других учебных материалов по предметам для учеников любого класса и учителей. Изучение школьных предметов с помощью видеоуроков позволяет лучше запомнить и усвоить материал.
· Wikipedia.org – свободная интернет-энциклопедия. Она пополняется тысячами пользователей по всему миру и содержит миллионы статей на самые разные темы. Достаточно выбрать русский язык и ввести в поисковой строке название интересующей вас темы чтобы получить по ней информацию. Но так, как энциклопедия пополняется пользователями, не вся информация в ней может быть правдива, её стоит перепроверять с помощью других источников.
· Культурный институт Google (www.google.com/culturalinstitute) позволяет посетить множество исторических и культурных объектов, не выходя из дома. Доступно множество фотографий исторических объектов и ряд онлайн-экскурсий по многим музеям мира.
Кроме названных, существует ещё много полезных и интересных веб-сайтов. Каждый человек может найти во всемирной паутине, то что ему нужно.
· Поисковые системы – это сервисы, которые предназначены для поиска веб-страниц, содержащих необходимую информацию во всемирной паутине.
· Поисковые каталоги представляют собой списки веб-сайтов, разделённые на категории, они пополняются людьми.
· Поисковые указатели отвечают на запросы пользователей, они пополняются компьютерными программами.
· Поисковый запрос – это то, что пользователь вводит в поисковую строку поискового указателя.
· Всемирная паутина содержит множество полезных сайтов для людей разных возрастов и увлечений.






















