Что такое отбор информации

Принципы отбора информации

Что такое отбор информации. Смотреть фото Что такое отбор информации. Смотреть картинку Что такое отбор информации. Картинка про Что такое отбор информации. Фото Что такое отбор информации Что такое отбор информации. Смотреть фото Что такое отбор информации. Смотреть картинку Что такое отбор информации. Картинка про Что такое отбор информации. Фото Что такое отбор информации Что такое отбор информации. Смотреть фото Что такое отбор информации. Смотреть картинку Что такое отбор информации. Картинка про Что такое отбор информации. Фото Что такое отбор информации Что такое отбор информации. Смотреть фото Что такое отбор информации. Смотреть картинку Что такое отбор информации. Картинка про Что такое отбор информации. Фото Что такое отбор информации

Что такое отбор информации. Смотреть фото Что такое отбор информации. Смотреть картинку Что такое отбор информации. Картинка про Что такое отбор информации. Фото Что такое отбор информации

Что такое отбор информации. Смотреть фото Что такое отбор информации. Смотреть картинку Что такое отбор информации. Картинка про Что такое отбор информации. Фото Что такое отбор информации

Блок «Сам себе исследователь»

Данный блок направлен на изучение работы с поиском и исследованием различной информации и ресурсов. В структуру блока входит:

1. Что такое информационный поиск;

2. Где искать информацию;

3. Как выбирать достоверные источники;

4. Принципы отбора информации;

5. Работа с полученной информацией: конспекты, ментальные карты, опорные схемы и блок-схемы.

6. Рекомендуемые ресурсы

Что такое информационный поиск

Думаю, ни для кого не секрет, что это такое. Однако, я решила выделить ряд особенностей, чтобы вы с ними просто ознакомились.

По сути, поиск иинформации является процессом выявления в определенном массиве текстовых документов тех данных, которые касаются конкретной темы и удовлетворяют указанным условиях, и в которых имеются необходимые сведения и факты (к примеру, вся необходимая информация по теме образования).

Состоит процесс поиска информации из нескольких последовательных этапов, посредством которых обеспечивается сбор данных, их обработка и предоставление. Как правило, поиск осуществляется следующим образом:

― Определятся информационная потребность и формулирется запрос;

― Определяется комплекс источников, в которых может находиться нужная информация;

― Информация извлекается из выявленных источников;

― Происходит ознакомление с данными, и оцениваются результаты поиска.

Но, несмотря на то, что на первом этапе нужно как можно правильнее определиться с тем, какую конкретную инфорацию вы собираетесь искать (а это может показаться первостепенным), наибольшую важность представляет именно второй этап, ведь определиться с тем, где искать информацию, на порядок сложнее.

Где искать информацию

Чтобы найти то, что нужно в Интернете, требуется просто ввести запрос в строке поискового сервиса (вспоминаем первый этап), нажать кнопку «Найти» и выбрать наиболее подходящий из предложенных вариантов – интернет-страниц. О поиске информации в Интернете мы продолжим говорить чуть позже, а пока заметим, что пренебрегать традиционными способами поиска информации всё же не стоит, и время от времени можно наведываться в библиотеку, картотеку или архив. Ко всему прочему, это позволит вам разнообразить свою деятельность, развеяться и провести время необычно, с пользой и интересом.

Говоря о подборе источников для поиска информации, нельзя не затронуть вопрос о достоверности, что говорит о необходимости уметь анализировать источники данных и определять те, которым можно доверять.

Как выбирать достоверные источники

Любые рассуждения на тему того, какие источники могут быть, и какие следует считать достоверными, так или иначе, приведут нас к стилистическому пониманию источников информации, а их существует немалое количество. Представим лишь самые распространённые:

― Научные исследования, имеющие под собой реальные доказательства, полученные эмпирическим путём;

― Научно-популярные размышления, включающие в себя как фактические эмпирические данные, так и субъективные точки зрения людей, являющихся специалистами в той или иной области;

― Философские трактаты и рассуждения, отличающиеся наибольшей оригинальностью, субъективностью и формой подачи;

― Художественная литература, служащая, как правило, источником информации – пищи для размышления, но не достоверных эмпирических данных;

― Публицистические произведения – категория произведений, которые посвящены актуальным явлениям и проблемам текущей социальной жизни. Нередко в таких произведениях можно отыскать немало достоверных данных и фактов;

― Средства массовой информации – комплекс органов публичной передачи информации, таких как телевидение, радио, журналы и газеты, а также Интернет.

Всегда следует брать в расчёт то, что практически ни один источник информационных данных не может являться на 100% достоверным. Исключение составляют лишь научные исследования и, в некоторой степени, научно-популярные размышления, т.к., как уже и было подмечено, в них содержатся преимущественно факты, подтверждённые опытом и официально признанные научной общественностью (есть, конечно, и люди, и точки зрения, идущие вразрез с общепринятыми, но в данной статье частные случаи мы рассматривать не будем).

Что такое отбор информации. Смотреть фото Что такое отбор информации. Смотреть картинку Что такое отбор информации. Картинка про Что такое отбор информации. Фото Что такое отбор информации

Информацию же из любых других источников следует подвергать тщательной проверке, дабы удостовериться в её актуальности и правдивости. Но прежде чем перейти непосредственно к принципам отбора информации, не будет лишним сказать о том, что для самого процесса информационного поиска является очень удобным и эффективным использование идей особого философского направления – позитивизма, т.к. благодаря этому в ряде случаев (особенно если это касается поиска конкретно научных данных) множество вопросов отпадают сами собой.

Принципы отбора информации

Исследуемая информация, которая соответствует этому принципу, обладает следующими признаками:

1. Принцип наглядности

― Информация доступна для восприятия и понимания;

― Основные понятия, объекты и явления могут быть продемонстрированы;

― Информация соответствует запрашиваемым критериям.

2. Принцип научности

Принцип научности подразумевает, что исследуемая информация соответствует современным научным данным. Если такое соответствие соблюдается, то появляется возможность обнаруживать неточности и ошибки, воспринимать другие точки зрения, руководствоваться собственной аргументацией и преобразовывать информацию, сопоставляя её с другой.

Вкратце критерии принципа научности можно выразить так:

― Данные соответствуют научным представлениям современности;

― Если в массиве данных имеются ошибки и неточности, они не способны повлечь за собой искажения объективной картины, касающейся рассматриваемого вопроса;

― Информация может иметь вид исторического документа, который показывает путь развития конкретного научного знания.

3. Принцип актуальности

Согласно этому принципу, информация должна быть практичной, злободневной, соответствующей современным запросам, важной на текущий момент времени. Такая информация способна вызвать наибольший интерес, в отличие от неактуальной. Здесь нужно руководствоваться следующими соображениями:

― Желательно, чтобы информация была близка по времени и волновала исследователя;

― Информация может представлять собой документ, который расширяет представление об исследуемом объекте;

― Информация должна обладать исторической ценностью или быть важной по иным причинам;

― Информация может являться классическим примером чего-либо, что знают все.

4. Принцип систематичности

Если информация соответствует принципу систематичности, можно наблюдать её многократное повторение в той или иной интерпретации в рамках одного источника или в той же или другой подобной интерпретации в других источниках.

Таким образом, информация достойна внимания и может быть применена, если:

― Аналогичные данные можно найти в различных базах данных;

― Различные интерпретации не разрушают целостность представлений об одной и той же проблеме.

5. Принцип доступности

Нередко затруднения в поиске и обработке информации могут быть вызваны, во-первых, самим её содержанием, а, во-вторых, стилем, в котором она излагается. По этой причине, работая с информацией, необходимо учитывать, что:

Информация должна быть не только доступной для понимания с точки зрения терминологии, но и расширять тезаурус исследователя, по причине чего она будет восприниматься интересной, но не банальной;

Информация должна соответствовать той терминологии, которой обладает исследователь, но освещать конкретную тему она должна с разных сторон;

Информация должна предполагать и дидактическую обработку, которая снимает терминологический барьер, другими словами, информацию можно адаптировать под себя, при этом сохранив её смысл.

6. Принцип избыточности

Исследуемая информация должна позволять исследователю выделять основную мысль, находить скрытый смысл, если таковой имеется, приходить к пониманию авторской позиции, определять цели изложения и развивать умение соотносить содержание с назначением.

Принципы поиска информации, о которых мы поговорили, могут быть применены в работе с любыми источниками данных: книгами, документами, архивными материалами, газетами и журналами, а также интернет-сайтами. По сути, эти принципы универсальны, но здесь следует чётко понимать для себя, что для поиска информации в традиционных источниках их может быть вполне достаточно, но при поиске информации в сети Интернет во избежание ошибок необходимо соблюдать ещё один ряд правил.

Правила поиска информации в Интернете

Для опытного пользователя поиск информации в Интернете предельно прост, однако, для людей, столкнувшихся с вопросом автоматизированного информационного поиска впервые, этот процесс может показаться довольно сложным из-за обилия всевозможных поисковых операторов. Ниже мы рассмотрим простой поиск и расширенный поиск, а также укажем дополнительную информацию, которая будет полезна при поиске данных в Интернете.

Для начала стоит сказать, что наиболее популярной поисковой системой в мире является Google.. В России к нему добавляется Яндекс, поиск@mail.ru и Rambler.

При помощи специальных фильтров у пользователя есть возможность задать дополнительные условия для своего запроса. Это может быть ограничение по региону, конкретному сайту, нужному языку, форме слова или фразы, дате размещения материала или типу файла.

Чтобы активировать эти функции, нужно щёлкнуть по специальному значку, расположенному на странице поисковика. Откроется дополнительное меню, где и задаются ограничения. Сбрасываются фильтры (ограничения) нажатием кнопки «Очистить» на странице поисковика.

Источник

7. S. Отбор информации

7. S. Отбор информации

Потоки информации связывают между собой многие переменные в системе. Отбор информации из её потока не оказывает воздействия на ту переменную, о которой собирается информация. На рис. 7–5 отбор информации показан маленьким кружком в точке отбора и пунктирной линией информации.

Что такое отбор информации. Смотреть фото Что такое отбор информации. Смотреть картинку Что такое отбор информации. Картинка про Что такое отбор информации. Фото Что такое отбор информации

Рис. 7–5. Отбор информации от уровней и темпов.

Читайте также

7.4. Поиск и отбор документов

7.4. Поиск и отбор документов Поиск документовВ журнале документов можно осуществлять разные варианты поиска нужного документа:? Быстрый поиск в списке может производиться по дате документа. При начале набора даты в колонке «Дата» под нижней строкой открывается

1.5.1.1. Отбор в клубы

1.5.1.1. Отбор в клубы Первую из заявленных задач — вычисление потенциальных участников — интернет помогает решить уже сегодня. Однако в отсутствие прицельного запроса на это решение соответствующие приемы не доведены до ума. Они не заточены на клубный сервис, поэтому люди

Отбор партнеров по каналу

Отбор партнеров по каналу Итак, какие шаги должен предпринять поставщик, отбирая конкретных членов канала, чтобы добиться оптимального соотношения между стратегиями, целевыми рынками и франшизой потребителя? Проведение дистрибьюторского аудита в рамках анализа канала

Отбор продавцов

Отбор продавцов При отборе кандидатов в службу сбыта следует добиваться максимальной эффективности этой процедуры. Компания должна понимать, что процесс отбора повышает возможность принятия хорошего решения и снижает возможность принятия плохого. Психологи и

79 ОБУЧЕНИЕ И ОТБОР ПЕРСОНАЛА

79 ОБУЧЕНИЕ И ОТБОР ПЕРСОНАЛА В наше время одной из современных тенденций в области развития предприятий является обучение персонала. Это объясняется тем, что быстро устаревают и так же быстро обновляются практические знания.Организации, которые занимаются подобной

Глава 3. Жесткий отбор

Глава 3. Жесткий отбор Жесткие рамки рыночной экономики не оставляют предприятиям выбора. Конкуренция делает свое черное дело. На рынке труда могут выжить только самые способные и талантливые. И так хочется добавить – стойкие. Те, которые смогут вместе с фирмой пережить

Глава 3 Жесткий отбор

Глава 3 Жесткий отбор Жесткие рамки рыночной экономики не оставляют предприятиям выбора. Конкуренция делает свое черное дело. На рынке труда могут выжить только самые способные и талантливые. И так хочется добавить – стойкие. Те, которые смогут вместе с фирмой пережить

5.2.2. Многошаговый отбор менеджеров

5.2.2. Многошаговый отбор менеджеров Итак, мы поняли, что очень сложно найти подходящего работника. А найти подходящего менеджера по продажам – еще сложнее. А ведь в любом бизнесе продажи – это наше все. Более подробно маркетинг и элементы продаж мы рассмотрим в восьмой

РЕКРУТИНГ И ОТБОР

РЕКРУТИНГ И ОТБОР Язык компетенций используется многими организациями как основа личностной спецификации, сформулированной как виды компетенций и разработанной в ходе ролевого анализа. Виды компетенций, определенные для той или иной роли, используются как базовая

ЦЕЛЕВОЙ ПОДБОР И ОТБОР

ЦЕЛЕВОЙ ПОДБОР И ОТБОР Первый шаг заключается в том, чтобы определить, какого рода люди нужны организации в отношении их опыта, квалификации и вероятной степени соответствия культуре организации – ее ценностям и нормам. Это включает в себя анализ и оценку рабочих

ОТБОР АНКЕТ

ОТБОР АНКЕТ После того как было опубликовано объявление о вакансии или вакансиях и получено достаточное количество откликов, обычная последовательность действий, необходимых, чтобы обработать и отобрать анкеты, такова:1. Составьте рабочую таблицу со списком кандидатов,

Отбор компаний 10×

Отбор компаний 10? Первый год работы ушел на то, чтобы отобрать примеры для исследования. Мы искали реальные случаи, удовлетворяющие трем основным критериям:1. Показатели компании на протяжении пятнадцати и более лет устойчиво превышали средние фондовые показатели

Отбор компаний в группу 10×

Отбор компаний в группу 10? Мы применили три всеохватывающих принципа отбора, чтобы выделить для исследования исключительно успешные компании:1. Эти компании достигли выдающихся результатов, в период наблюдения они стали очевидными победителями на фондовом рынке и в

Отбор компаний для сравнения

Отбор компаний для сравнения На основании документов мы провели систематический обзор каждой отрасли, подбирая для наших компаний идеальные пары. Кандидатов в пары для сравнения мы оценивали по шести критериям. Критерии с первого по четвертый гарантируют сходный

4.4.3. Отбор, или предконтрактные методы

4.4.3. Отбор, или предконтрактные методы Когда все параметры, относящиеся к закупке, формально закреплены в контракте (в смысле, описанном в предыдущем разделе), высокая конкуренция по цене на стадии присуждения закупочного контракта всегда приветствуется.

9. Отбор

9. Отбор Все планы реализовать невозможно, поэтому неизбежно наступает момент, когда требуется отсеять большую часть идей, оставив только те, которые выполнимы.Для этого можно прибегнуть к голосованию. Всем нам знакомы поднятые руки и опускаемые в урну бюллетени, но для

Источник

Что такое отбор информации

Поиск и отбор информации в информационных системах

Поиск информации: основные понятия, виды и формы организации

Поиск информации или информационный поиск представляет один из основных информационных процессов. Человечество издревле занималось им. Цели, возможности и характер поиска всегда зависели от наличия, информации, её важности и доступности, а также средств организации поиска.

Предполагается, что в дальнейшем будут созданы ИПС, способные автоматически адаптироваться с учетом уровня знаний и запросов конкретных пользователей, воспринимать запросы на естественном языке и, используя искусственный интеллект, выдавать им релевантную и пертинентную информацию. Для создания таких ИПС потребуются интеллект и знания конкретных пользователей ИПС или их посредников. Пока же от широкого круга пользователей поисковых систем требуется достаточно хорошо владеть данной предметной областью.

Существуют различные толкования термина «поиск информации» или «информационный поиск».

Существуют и другие определения. В любом случае, информационный поиск вызван потребностью удовлетворения информационных запросов пользователей, ожидающих с помощью поисковых систем оперативно получить необходимые им данные или сведения. Он является методом нацеленного поиска и извлечения релевантных документов и (или) фактов из различных источников информации, например, банков данных или запоминающих устройств. В качестве таковых выступают живые и неживые объекты, представляющие различные источники и носители информации.

Системы, обеспечивающие реализацию подобного поиска информации, называются поисковыми системами (ПС). В традиционных технологиях ПС представляют картотеки и каталоги, адресные и иные справочники, указатели, энциклопедии, справочный аппарат к изданиям и другие материалы.

В 1945 годы американский ученый и инженер В. Буш в статье «Возможный механизм нашего мышления» впервые широко поставил вопрос о необходимости механизации информационного поиска. Начиная с 1960 годов, появляются автоматизированные поисковые системы, работающие с информацией. С этого периода ведутся интенсивные работы в области формирования и реализации принципов и методов информационного поиска.

» Поисковые системы » осуществляют поиск среди документов базы или иных массивов машиночитаемых данных, содержащих заданные слова.

Электронные ПС с помощью обычных или интеллектуальных терминалов (ПЭВМ) дают возможность пользователям производить поисковые запросы при помощи формальных и описывающих содержание элементов и с применением специальных логических операторов; осуществляют поиск среди документов базы или иных массивов машиночитаемых данных, содержащих заданные слова. Поисковые системы позволяют осуществлять только поисковые процедуры и связанные с ними процессы.

Информационно-поисковые системы
Поисковые системы с большим набором функций и возможностей обычно входят в состав СУБД и именуются информационно-поисковыми системами. Они также создаются и используются для эффективного нахождения пользователями необходимых им данных, в том числе в Интернете.

Функционирование современных ИПС основано на двух предположениях: 1) документы, необходимые пользователю, объединены наличием некоторого признака или комбинации признаков;
2) пользователь способен указать этот признак.

Оба эти предположения на практике не выполняются, и можно говорить только о вероятности их выполнения. Поэтому, процесс поиска информации обычно представляет собой последовательность шагов, приводящих при посредстве системы к некоторому результату, и позволяющих оценить его полноту. При этом поведение пользователя, как организующее начало управления процессом поиска, мотивируется не только информационной потребностью, но и разнообразием стратегий, технологий и средств, предоставляемых системой.

Пользователь обычно не имеет исчерпывающих знаний об информационном содержании ресурса, в котором проводит поиск. Оценить адекватность выражения запроса, как и полноту получаемого результата, он может, отыскав дополнительные сведения, или так организовав процесс, чтобы часть результатов поиска могла использоваться для подтверждения или отрицания адекватности другой части. В то же время, для пользователей-профессионалов характерна устойчивость тематического профиля. Когда они являются «информационно-ориентированными», то им свойственно желание и способность организовать информационное пространство проблемы. Это означает, что пользователь создаёт по существу новый, «самостоятельный» проблемно-ориентированный, индивидуально обновляемый и пополняемый ИР, включающий помимо подборок документов также и метаинформацию, например, словари специальной терминологии, классификаторы предметных областей, описания ресурсов и т.д.

ИПС делятся на: традиционные (ручные, механические, электромеханические) и автоматизированные (электронные).

Реализуемый метод построения ПОЗа должен обеспечивать эффективные способы построения запроса для достижения целей различного типа.

Процесс поиска информации представляет последовательность шагов, приводящих при посредстве системы к некоторому результату, и позволяющих оценить его полноту. Так как пользователь обычно не имеет исчерпывающих знаний об информационном содержании ресурса, в котором проводит поиск, то оценить адекватность выражения запроса, равно как и полноту получаемого результата, он может, основываясь лишь на внешних оценках или на промежуточных результатах и обобщениях, сопоставляя их, например, с предыдущими.

Процесс поиска можно представить в виде следующих основных компонент: 1) формулирование запроса на естественном языке, выбор поисковых системы и сервисов, формализация запроса на соответствующем ИПЯ;
2) проведение поиска в одной или нескольких поисковых системах;
3) обзор полученных результатов (ссылок);
4) предварительная обработка полученных результатов: просмотр содержания ссылок, извлечение и сохранение релевантных и пертинентных данных;
5) при необходимости, модификация запроса и проведение повторного (уточняющего) поиска с последующей обработкой полученных результатов.

Для уменьшения объёма отобранных материалов осуществляют фильтрацию результатов поиска по типу источников (сайтов, порталов), тематике и другим основаниям.

По используемым поисковым технологиям ИС можно разбить на 4 категории: 1. Тематические каталоги;
2. Специализированные каталоги (онлайновые справочники);
3. Поисковые машины (полнотекстовый поиск);
4. Средства метапоиска.

В Интернете ИПС размещается на одном или нескольких серверах. В ИПС собирается, индексируется и регистрируется информация о документах, имеющихся в обслуживаемой системой группе веб-серверов. В документах индексируются все значащие слова или только слова из заголовков.

Тематические каталоги предусматривают обработку документов и отнесение их к одной из нескольких категорий, перечень которых заранее задан. Фактически это индексирование на основе классификации. Индексирование может проводиться автоматически или вручную с помощью специалистов, просматривающих популярные веб-узлы и составляющих краткое описание документов-резюме (ключевые слова, аннотация, реферат).

Специализированные каталоги или справочники создаются по отдельным отраслям и темам, по новостям, по городам, по адресам электронной почты и т. п.

Поисковые машины (самое развитое средство поиска в Интернете) реализуют технологию полнотекстового поиска. Индексируются тексты, расположенные на опрашиваемых серверах. Индекс может содержать информацию о нескольких миллионах документов. Например, в индексе популярной ИПС «AltaVista» более 56 млн. URL-адресов.

При использовании средств метапоиска запрос осуществляется одновременно несколькими поисковыми системами. Результат поиска объединяется в общий, упорядоченный по степени релевантности список. Каждая система обрабатывает только часть узлов сети, что позволяет расширить базу поиска. К подобному классу можно отнести и «персональные программы поиска», позволяющие формировать свои собственные инструменты метапоиска (например, автоматически опрашивать часто посещаемые узлы).

Базы информационных данных могут содержать практически любые виды информации, в том числе в любой комбинации. Информационный поиск осуществляется как по существующим в полнотекстовых ЭИР терминам, так и по специальным элементам, входящим в состав ИПЯ. Для формирования запросов используются специальные информационно-поисковые языки.

ИПС внутри найденной выборки обычно пытаются расположить документы в порядке их » релевантности «, то есть близости к введенному пользователем запросу. Критериев такой близости много и выявление близких «по смыслу» к запросу документов не решает проблемы получения информации при отсутствии релевантного документа. Подобная ситуация достаточно тривиальна, в том числе и потому, что пользователь зачастую ищет документ, который сам собирается написать. Следует отметить, что в результате проведенного поиска пользователь может получить как релевантные, пертинентные, так и нерелевантные и непертинентные подмассивы данных.

ИПС фактически являются системами информационного обеспечения и представляют собой базы и банки данных. В качестве объекта в них выступает индивид, организация, отрасль, регион и т.п. Субъектом информационного обеспечения является специалист-информатик, любой потребитель информации.

Для проведения поиска первоначально на компьютере пользователя загружается интерфейс работы с соответствующей БД. Это может быть локальная или удалённая БД. Первоначально следует определиться с видом поиска (простой, расширенный и т.д.). Затем с набором предлагаемых для поиска полей. ИПС могут предложить для ввода одно или несколько полей. В последнем случае это обычно поля: автора, заглавия (названия), временного периода, вида документа, ключевых слов, рубрик и др. При формировании запроса практически все системы позволяют использовать логические элементы «И», «ИЛИ», «НЕТ».

Процесс поиска информации обычно носит эмпирический характер. Он представляет последовательность шагов, приводящих при посредстве системы к некоторому результату, позволяющих оценить его полноту. При этом поведение пользователя, как организующее начало управления процессом поиска, мотивируется не только информационной потребностью, но и разнообразием стратегий, технологий и средств, предоставляемых системой.

Обычно пользователь не имеет исчерпывающих знаний об информационном содержании ресурса, в котором проводит поиск, поэтому оценить адекватность выражения запроса, как и полноту получаемого результата, он может, отыскав дополнительные сведения, или организовав процесс так, чтобы часть результатов поиска могла использоваться для подтверждения или отрицания адекватности другой части.

Большинство ПС изначально предлагают пользователям либо БО, либо ссылки на полные или частичные документы, их описание и другое, хранящиеся в различных АИПС. Современные ПС позволяют определиться и указать какой и в каком виде источник информации интересует пользователя.

Методы обработки результатов поиска
По характеру преобразований (в контексте дальнейшего использования результатов обработки) методы обработки результатов поиска можно условно разделить на две группы:
1. Структурно-форматные преобразования;
2. Структурно-семантические преобразования (информационно-аналитические, логико-семантические).

Реализация поиска
Что обычно ищут в Интернете: персональные данные об индивидуумах и организациях; различные адресные данные; конкретные материалы (статьи, книги, фотографии, справочные данные, программное обеспечение и др.) в том числе место их хранения; где и сколько стоят те или иные материалы, услуги, продукты и т.п.; информационные сайты и порталы и др.

Общепринята организация поиска по начальным фрагментам слова (поиск с усечением справа), например, вместо слова «библиотечный» можно ввести его фрагмент «библиоте*». При этом будут найдены документы, в которых содержится не только слово «библиотечный», но и «библиотека», «библиотекарь», «бибилотековедение» и др. В каждом случае пользователь должен представлять, что именно он хочет найти, так как в предложенном ему варианте будет найдено гораздо большее количество документов, чем при задании данного слова полностью (без усечения). В подобном случае возможно в полученном массиве информации провести уточняющий поиск и в результате получить более релевантные и пертинентные данные.

Для проведения поиска в Интернете (в WWW) функционирует множество сайтов и поисковых систем, поэтому необходимо не только ориентироваться в таких системах, но и уметь осуществлять в них эффективный поиск, то есть использовать соответствующие технологии.

Каждая поисковая машина имеет свои алгоритмы сортировки результатов поиска. Чем ближе к началу списка, полученного в результате проведения поиска, оказывается нужный документ, тем выше релевантность и лучше работает поисковая машина.

Эффективный доступ к информации в Интернете обеспечивают такие зарубежные поисковые системы (машины), как Альта-Виста (AltaVista), «Lycos», «Yahoo», «Google», «OpenText», «Wais», «WebCrawler» и др. Их адреса в Интернете: www.altavista.com, www.yahoo.com, www.gogle.com, www.opentext.com,

К русскоязычным поисковым машинам относятся: Апорт («Aport» АО Агама), Rambler (фирма Stack Ltd.), Яндех («Yandex» фирма CompTek Int), «Русская машина поиска», «Новый русский поиск», и др. Их адреса в Интернете: www.aport.ru, www.rambler.ru, www.yandex.ru, search.interrussia.com, www.openweb.ru соответственно) и др.

Все эти поисковые машины позволяют по ключевым словам, тематическим рубрикам и даже отдельным буквам оперативно находить в сети, например, все или почти все тексты, где эти слова присутствуют. При этом пользователю сообщаются адреса сайтов, где найденные ИР постоянно присутствуют. Однако ни одна из них не имеет подавляющих преимуществ перед другими. Для проведения надежного поиска по сложным запросам специалисты рекомендуют использовать последовательно или параллельно (одновременно) различные ИПС.

Полнотекстовая поисковая машина индексирует все слова видимого пользователю текста. Наличие морфологии дает возможность находить искомые слова во всех склонениях или спряжениях. Кроме этого, в языке HTML существуют тэги, которые также могут обрабатываться поисковой машиной (заголовки, ссылки, подписи к картинкам и т.д.). Некоторые машины умеют искать словосочетания или слова на заданном расстоянии, что часто бывает важно для получения разумного результата.

Несмотря на общие принципы построения, поисковые системы отличаются тематикой, ее объемом, классификацией и интерфейсами. Для удобства перемещения (навигации) по имеющимся на поисковых машинах разделам некоторые из них используют специальный раздел «Карта».

При проведении поиска поисковые серверы обычно используют данные, хранящиеся в веб-страницах в тегах метаданных: (title), (meta name=”keywords”) и (meta name=”description”). Формируя свои страницы, следует отражать в этих тегах сведения о назначении сайта и его тематике.

При этом необходимо знать, что чем меньше количество ключевых слов включено в эти теги, тем с большей частотой они могут встречаться в текстах страниц сайта и, следовательно, тем выше их релевантность. Оптимальным считается частота таких слов не более 5%. Ключевых слов должно быть не очень много, они в большей степени должны состоять из одного или двух слов, образуя наиболее употребляемые термины. Чем большую релевантность имеют ключевые слова, тем большую конкурентоспособность они придают документу с точки зрения поисковых машин.

Полноту и точность ответа пользователь получает в зависимости от точности сформулированного им запроса. В результате поиска ему обычно предоставляется гораздо больше информации, чем ему необходимо, часть которой может вообще не иметь отношение к сформированному запросу. Легко заметить, что многое зависит не только от грамотно сформулированного запроса, но и от возможностей поисковых систем, которые весьма различны. При этом достаточно ярко проявляется » лесной синдром » (из-за леса не видно дров), заключающийся в том, что в полученных данных можно пропустить главные, необходимые сведения. Очевидно, никакие меры не являются исчерпывающими в условиях постоянного расширения среды и появления новых разнообразных ИР, что подтверждает трудности поиска в WWW.

Простые запросы в виде отдельных достаточно распространенных терминов приводят к извлечению тысяч (сотен тысяч) документов, абсолютное большинство которых пользователю не требуется ( информационный шум ).

Важным аспектом также является возможность таких систем поддерживать многоязычность, то есть способность обрабатывать запросы на различных языках. Пользователям предлагаются двуязычные словари, электронный переводчик и др. Кроме того, появились системы, осуществляющие мгновенный («на лету») перевод информационных ресурсов, найденных пользователем в Интернет и копируемых на его компьютер.

Создаются системы, позволяющие эффективно вести поиск в полнотекстовых БД. Они базируются на использовании технологий синтаксического и морфологического анализа текста (разбивка на элементы, распознаваемые программой) и оперативной обработки текстов на естественных языках.

Разработчики поисковых систем пытаются адаптировать их под начинающих и «средних» пользователей Интернета, количество которых неуклонно растет. В канадской системе (www.web-help.com), пользователям предлагается набор ссылок, подготовленных сотрудниками интернет-компании. На запрос пользователя сотрудник в реальном режиме времени находит и подключает на экран пользователя соответствующий (по его мнению) сайт. Метод удобен для нахождения конкретных фактов, статистики и т.п., которые другими способами непросто найти.

При организации одинакового запроса на разных поисковых машинах возможно получение различных по содержанию и широте охвата материалов. Искусство построения запроса требует знаний особенностей каждой конкретной поисковой системы и наличия опыта работы с Интернетом вообще. Некоторые поисковые машины предлагают квазиинтеллектуальные средства, позволяющие менее опытному пользователю, традиционно задавая вопросы на естественном языке, получать достаточно релевантные данные.

Обычно поиск в полнотекстовых БД осуществляется с использованием морфологических анализаторов (как правило, русских и английских), позволяющих автоматически находить существующие словоформы по фрагменту слова, слову, фразе, даже если в словах запроса присутствуют некоторые опечатки.

Важность проблемы информационного поиска в Интернете породила целую отрасль, задача которой заключается в том, чтобы помочь пользователю в его навигации в киберпространстве. Составляют эту отрасль специальные поисковые инструменты. Условно их можно разделить на поисковые средства справочного типа или просто справочники ( directories ) и поисковые системы в чистом виде ( search engines ).

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *