Что такое случайная и систематическая ошибки

Систематические и случайные ошибки

Что такое случайная и систематическая ошибки. Смотреть фото Что такое случайная и систематическая ошибки. Смотреть картинку Что такое случайная и систематическая ошибки. Картинка про Что такое случайная и систематическая ошибки. Фото Что такое случайная и систематическая ошибки Что такое случайная и систематическая ошибки. Смотреть фото Что такое случайная и систематическая ошибки. Смотреть картинку Что такое случайная и систематическая ошибки. Картинка про Что такое случайная и систематическая ошибки. Фото Что такое случайная и систематическая ошибки Что такое случайная и систематическая ошибки. Смотреть фото Что такое случайная и систематическая ошибки. Смотреть картинку Что такое случайная и систематическая ошибки. Картинка про Что такое случайная и систематическая ошибки. Фото Что такое случайная и систематическая ошибки Что такое случайная и систематическая ошибки. Смотреть фото Что такое случайная и систематическая ошибки. Смотреть картинку Что такое случайная и систематическая ошибки. Картинка про Что такое случайная и систематическая ошибки. Фото Что такое случайная и систематическая ошибки

Что такое случайная и систематическая ошибки. Смотреть фото Что такое случайная и систематическая ошибки. Смотреть картинку Что такое случайная и систематическая ошибки. Картинка про Что такое случайная и систематическая ошибки. Фото Что такое случайная и систематическая ошибки

Что такое случайная и систематическая ошибки. Смотреть фото Что такое случайная и систематическая ошибки. Смотреть картинку Что такое случайная и систематическая ошибки. Картинка про Что такое случайная и систематическая ошибки. Фото Что такое случайная и систематическая ошибки

Измеряя какую-нибудь физическую величину, не удается получить ее истинное значение. Поэтому необходимо указать, насколько полу­ченный результат может быть близким к истинному значению, т.е. указать, какова точность измерения. Для этого вместе с полученным результатом указывают приближенную ошибку измерения.

Оценивать ошибки необходимо, так как, не зная их величину, сде­лать определенных выводов из эксперимента нельзя.

Чаще всего с понятием «точность экспериментальных данных» связы­вают величину максимально возможной ошибки. Так, например, если ут­верждают, что точность полученных значений плотности 0,2%; то это значит, что величина максимально возможной ошибки в этих данных не превышает 0,25%.

Источники ошибок экспериментальных данных многочисленны, и здесь в первую очередь следует указать на имеющиеся всегда погрешности приборов, используемых при измерениях, несовершенство методики изме­рения, недостаточно строгое поддержание требуемого режима во время опыта, а также отдельные ошибки самого экспериментатора при работе на установке.

Ошибки измерения принято делить на систематические и случайные.

К систематическим ошибкам относят такие, которые получаются всегда на данной установке; они имеют одну и ту же величину, и в окончательный результат измерений вносят одну и ту же погрешность.

Систематические ошибки лучше всего могут быть обнаружены при срав­нивании экспериментальных данных, полученных на различных установках. Некоторые из них могут быть устранены, а другие устранить невозможно. Так, например, ошибка величиной не более 0,04 °С при измерении температуры термометром сопротивления устранена быть не может, так как гарантировать большую точность измерения температуры (при t = 500°С) просто невозможно.

Случайные ошибки проявляются в так называемом разбросе экспери­ментальных данных. Это означает, что при многократном измерении одной и той же величины на одной и той же установке и с теми же приборами (манометрами, термометрами и т.д.) получаются несколько отличающиеся друг от друга значения.

Полностью исключить случайные ошибки, т.е. полностью избавиться от разброса экспериментальных данных, невозможно: следует стремиться к более строгому поддержанию режима при измерении и тщательному вы­полнению отсчетов по приборам.

Источник

Ошибки выборки подразделяются на два типа – случайные и систематические.

Случайная ошибка – это статистические погрешности, присущие самому выборочному методу. Они уменьшаются при возрастании объема выборочной совокупности.

Систематические ошибкирезультат деятельности самого исследователя; вызваны неконтролируемыми перекосами в распределении выборочных наблюдений; предумышленным смещением выборки.

Например, если социолог решил узнать мнение всех жителей города о проводимой местными органами власти социальной политике, а опросил только тех, у кого есть телефон, то возникает предумышленное смещение выборки в пользу зажиточных слоев, т.е. систематическая ошибка.

Систематические ошибки возникают, когда:

1) выборка не соответствует задачам исследования (социолог решил изучить только работающих пенсионеров, а опросил всех подряд);

2) незнание характера генеральной совокупности (социолог думал, что 70% всех пенсионеров не работает, неработающих оказалось только 10%);

3) отбираются только «выигрышные» элементы генеральной совокупности (например, только обеспеченные пенсионеры). Для исследователя оценить последствия систематической ошибки – задача непростая.

Чтобы избежать ошибки репрезентативности:

1) каждая единица генеральной совокупности должна иметь равную вероятность попасть в выборку;

2) отбор желательно производить из однородных совокупностей;

3) надо знать характеристики генеральной совокупности;

4) при составлении выборочной совокупности надо учитывать случайные и систематические ошибки.

Если выборочная совокупность (или просто выборка) составлена правильно, то социолог получает надежные результаты, характеризующие всю генеральную совокупность. Если неправильно, то возникшая на этапе составления выборки ошибка возрастает на каждом следующем этапе проведения социологического исследования и достигает в конечном счете такой величины, которая обесценивает проведенное исследование.

Чтобы полученная первичная социологическая информация начала активно служить, ее необходимо обработать, обобщить, проанализировать и научно проинтерпретировать. Только после этих процедур появится реальная возможность сформулировать выводы и практические рекомендации, которые и откроют социологической информации выход на практику.

Обработка информации осуществляется вручную или с помощью ЭВМ, ее результат – социологические данные, т.е. показатели ответов на вопросы в числовом и процентном выражении. Обобщение информации идет путем группировки ответивших на вопросы и через ряды распределений (в том числе с помощью таблиц). Анализ и интерпретация данных проводятся в рамках теоретической обработки полученной информации и впрямую зависят от профессионализма социологов, их гипотез, проверка которых и производится прежде всего.

Итоги работы выливаются в служебные документы: отчет, приложение к отчету и аналитическая справка, содержащая выводы и рекомендации.

Использование результатов социологического исследования зависит от актуальности изучаемой социальной проблемы, анализа достоверности собранной информации и заинтересованности в ней общества.

Источник

Случайные и систематические ошибки

Уменьшение случайных ошибок при возрастании объема выборки и независимость систематических ошибок от величины массива. Сколько человек нужно опросить для получения репрезентативных данных? Примеры из практики исследовании. Почему предвыборный прогноз «Literary Digest» 1936 г. оказался ошибочным?

Ошибки выборки подразделяются на два типа. Случайные ошибки уменьшаются при возрастании объема выборочной совокупности. Так кубик при достаточно большом числе бросаний будет падать примерно равное количество раз на каждую грань. При нескольких бросаниях он может показать преимущественное выпадение, например «шестерки». Тогда мы говорим, что число наблюдений слишком мало, чтобы судить о неслучайности выпадения «шестерок». Но если «шестерки» выпадают постоянно при сотнях и тысячах бросаний, мы говорим: крайне маловероятно, чтобы это происходило случайно. Таким образом, случайная ошибка — это вероятность того, что выборочная средняя выйдет (или не выйдет) за пределы заданного интервала. При случайном отборе следует неукоснительно соблюдать следующую заповедь: критерии доступа к единицам исследования должны быть независимы от изучаемых переменных.

Чудесное свойство случайных ошибок уменьшаться при возрастании объема выборочной совокупности делает бессмысленными обследования огромных массивов, которые предпринимаются чаще всего с целью произвести впечатление на профессионально неподготовленного заказчика.

Даже национальные выборки достаточно малы. Первая национальная выборка в США, спроектированная в 1935 г. тогда только начинавшим карьеру «поллстера» Джорджем Гэллапом старшим, насчитывала 1327 человек и пропорционально отражала основные группы населения. Одной из наиболее важных тем общественного мнения тогда, в 1930-е гг., было возобновление запрета на производство и продажу спиртных напитков. Чтобы установить вариацию выборочной средней, обусловленную величиной массива, выборка была случайным образом разбита на три примерно равных по численности группы7. Посмотрим на распределение опрошенных в первой подвыборке (табл. 5.3).

Отношение американцев к возобновлению запрета на спиртные напитки, опрос Дж. Гэллапа, 1935 г., первая подвыборка: 442 человека

Количество опрошенных, абс

Аналогичные результаты Гэллап получил во второй и третьей подвыборках примерно такой же величины. Каждая из них показывала некоторое отклонение от общей выборочной средней, и, если проанализировать подвыборки накопленным итогом, можно установить степень приближения результатов малых выборок к результатам большой. Мысленная экстраполяция совершенно точно указывает предел точности выборочной средней — это генеральная средняя. Но и на промежуточных стадиях видно, что подвыборочные средние отклоняются от параметров большой национальной выборки незначительно (табл. 5.4).

Отношение американцев к возобновлению запрета на спиртные напитки, опрос Дж. Гэллапа, 1935 г., три подвыборки накопленным итогом, %

Первая выборка, 442 человека

Первая плюс вторая выборки, 884 человека

Первая плюс вторая плюс третья выборки, 1 327 человек

Третья строка таблицы показывает значения, полученные в проектной выборочной совокупности, — они ненамного отличаются от средней и малой подвыборок. А изменятся ли выборочные параметры при увеличении объема? Чтобы узнать это, Гэллап провел дополнительные обследования той же генеральной совокупности выборками нарастающего объема таким образом, что величина максимальной из них составила 12 494 человека. Каковы же результаты расширения выборки почти в десять раз (табл. 5.5)?

Отношение американцев к запрету спиртных напитков в дополнительных выборках большего объема, опрос Дж. Гэллапа, 1935 г., %

Мы видим, что самое большое расхождение между данными по двенадцатитысячной выборке и другим выборкам меньшего объема составляет два процентных пункта (по признаку несогласия с запретом спиртного). Отсюда следует, что в обследовании отношения американцев к запрету спиртного выборка может состоять из 442, равно как и из 12 494 человек, а результаты будут практически одинаковыми.

В практике массовых опросов относительная несущественность количества обследованных для получения точных результатов демонстрировалась неоднократно. Надо заметить, что предвыборные опросы — вероятно, единственная область социологических обследований, в которых выборочные параметры получают незамедлительное подтверждение либо опровержение: параметры генеральной совокупности обнаруживают себя сразу же после подсчета голосов. В остальных обследованиях такой возможности нет, генеральная совокупность ничем себя не показывает. В получении точных данных при минимальной выборке и проявляется мастерство «поллстера».

В лаборатории по исследованию общественного мнения Принстонского университета, которой руководил Хэрви Кентрил, изучались предпочтения избирателей штата Нью-Йорк. Шел 1942 г. За неделю до выборов один интервьюер, разъезжая по штату, опросил 200 человек. Они распределились в соответствии с плотностью населения в различных зонах территории штата (табл. 5.6).

Распределение выборочной совокупности в обследовании избирателей штата Нью-Йорк, опрос X. Кентрила, 1942 г., абс.

Зоны размещения выборки

Нью-Йорк Сити Манхеттен

Города с численностью населения свыше 500 тыс. человек

Города от 100 до 500 тыс. человек

Города от 10 до 100 тыс. человек

Города от 2,5 до 10 тыс. человек

Города до 2,5 тыс. человек

Респонденты были распределены также по расовой принадлежности, экономическому положению, возрасту. Эти переменные и определили структуру выборки. Избирательные предпочтения ньюйоркцев оказались следующими: за Дьюи собирались проголосовать 115 человек, за Беннета — 72, за Альфанжа — 12 и за Амстера — 1. Ошибка предсказания победы Дьюи составила 5%, средняя ошибка трех лидирующих кандидатов — 3,3% (табл. 5.7).

Данные опроса выборочной совокупности численностью 200 человек и результаты выборов в штате Нью-Йорк, опрос X. Кентрила, 1942 г., %

Кандидаты на выборах

Выборка Кентрила минимальна, зато точность его данных была всего на один процентный пункт меньше, чем в опросе «Нью-Йорк дейли ньюс», где численность опрошенных составила48 тыс. человек. Американский институт общественного мнения (Дж. Гэллап) основывал тогда свой прогноз на обследовании 2500 человек, и ошибка составила 1,3 процентных пункта8. Результаты неплохие.

Итак, даже очень маленькая выборка при условии, что она хорошо распределена в генеральной совокупности, может быть вполне репрезентативной. Чем больше объем выборки, тем выше точность ее результатов, однако очевидно, что огромная выборка не гарантирует стопроцентного попадания. Плохо распределенная выборка в десять миллионов человек хуже, чем хорошо распределенная выборка в сто человек.

Со времени своего создания в 1935 г. Американский институт общественного мнения провел сотни предвыборных опросов. Средняя ошибка репрезентативности в 1936—1940гг. составляла 5,6 процентных пункта, в 1940—1944 гг. — 3,4, в 1944—1947 гг. — 2,6. В 1944 г. прогноз Гэллапа на президентских выборах был выполнен с точностью до 1,8 процентных пункта, а средняя ошибка по 48 штатам составила 2,5. В 1950—1958 гг. ошибка прогноза была 1,7 процентных пункта, в 1960—1968 гг. — 1,5, в 1970—1978 гг. — 1,19.

Второй тип ошибок выборки — систематические ошибки. Это неконтролируемые перекосы в распределении выборочных наблюдений, которые приводят к «утере» проектируемого объекта исследования. В отличие от случайных систематические ошибки распределяются вокруг средней неравномерно, при возрастании объема выборки не уменьшаются. Число опрошенных здесь уже не имеет значения, потому что фактическая генеральная совокупность — та, что соответствует выборке, уже «уехала» от проектируемой, а исследователь продолжает надеяться на репрезентативность. Систематические ошибки в отличие от случайных не поддаются предварительному контролю.

Осенью 1936 г. в истории социологических исследований произошло событие, радикально изменившее представления о построении выборки для массовых опросов. В первые десятилетия XX в. американские газеты и журналы соревновались за то, чтобы стать выразителями общественного мнения. Журнал «Литерэри Дайджест» проводил «соломенные опросы» перед выборами с 1925 г. и никогда не ошибался. Рассылались миллионы почтовых бюллетеней — тем, кто числился в телефонных справочниках и списках автовладельцев. Система работала хорошо до тех пор, пока избиратели со средними и высокими доходами голосовали в равной степени и за демократов, и за республиканцев. И наоборот: избиратели с низкими доходами были склонны голосовать за любого кандидата.

С началом «Нового курса» американский электорат стал резко стратифицироваться: люди с доходами выше среднего, придерживавшиеся демократических взглядов, переменили их на республиканские, а те, кто принадлежал к малодоходным группам, стали симпатизировать демократической партии.

В 1936 г. на пост президента США претендовали Франклин Рузвельт — демократ и Альфред Лэндон — республиканец. Журнал «Литерэри Дайджест» разослал по почте десять миллионов бюллетеней — была охвачена примерно треть американских семей. Вернули бюллетени 2 376 523 человека. Очевидно, выборка «Литерэри Дайджест», состоящая из владельцев телефонов и автомобилей, была обречена на смещение в пользу республиканцев. Так и получилось. Предвыборный опрос показал, что за Лэндона собираются проголосовать 57% избирателей, а за Рузвельта — 43%. На выборах же победил Рузвельт с результатом 62,5%, а за Лэндона было подано 37,5% голосов.

К этому времени службы Дж. Гэллапа, Э. Роупера и А. Кроссли уже давно вели эксперименты с выборочными опросами. В частности, Гэллап в 1935 г. установил сдвиг политических ориентации состоятельных избирателей вправо, а бедных — влево. В 1936 г. он обнаружил, что большинство владельцев телефонов предпочитают Лэндона Рузвельту, в то время как только 18% получающих пособие собираются голосовать за Лэндона. 12 июля 1936 г., когда началась предвыборная кампания, Гэллап опубликовал статью с предупреждением об ошибке «Литерэри Дайджест», который, как считал автор, по всей вероятности, предскажет победу Лэндона над Рузвельтом со счетом 56: 44. Гэллап получил этот прогноз, разослав по почте всего 3 тыс. бюллетеней. Он подробно проанализировал причины возможной ошибки. В ответ в «Литерэри Дайджест» была опубликована сердитая статья, где редактор писал: «Никогда и никто еще не предсказывал результаты наших опросов еще до того, как они начались. Нашему доброму статистическому другу (имелся в виду Гэллап. — Г. Б.) можно было бы напомнить, что эти старомодные методы обеспечивают «Дайджесту» правильные прогнозы с точностью до одной сотой процента»10.

Основной источник систематической ошибки вопросе «Литерэри Дайджест» — использование для определения адресов респондентов телефонных справочников и регистрационных книг владельцев автомобилей. Естественно, выборка сместилась в сторону «верхних» слоев социальной структуры. Владельцы телефонов и автомобилей — группы, в значительной степени пересекающиеся, — и составили реальный объект исследования, в то время как проектируемый объект отождествлялся с электоратом США. В итоге сформировалась выборка из респондентов, избирательные предпочтения которых отличались от предпочтений среднего американца. Средневыборочные значения оказались смещенными в сторону более состоятельных и образованных слоев населения.

Эти социально-структурные параметры имели определяющее влияние на распределение доверия к Рузвельту среди электората. Проводимый президентом с 1932 г. «Новый курс» был основан на вмешательстве государства в сферу свободного предпринимательства, антимонопольной политике и защите интересов низших слоев населения, в том числе расширение избирательных прав для иммигрантов. Немаловажным фактором, обусловившим размежевание позиций избирателей, был и процесс крупных корпораций против Рузвельта в Верховном суде, который был выигран «капиталистами» в 1936 г. Это способствовало его популярности среди низших классов. Да и сам облик Рузвельта — человека, с молодых лет прикованного к инвалидной коляске, но сумевшего стать выдающимся политиком, импонировал демократическому большинству. Оптимальное размещение выборки в таких условиях было несовместимо с «уклоном» в сторону богатых. Этот «уклон» значительно усилился по причине пренебрежения со стороны аналитиков «Литерэри Дайджест» к динамике электоральных предпочтений в различных социальных стратах.

В предыдущих опросах «Литерэри Дайджест» анкеты рассылались тем же группам и прогнозы оправдывались, но в 1936г. не были учтены два исключительно важных обстоятельства: во-первых, дифференциация избирательных установок в зависимости от уровня доходов — эта тенденция усилилось с приходом в 1932 г. в Белый дом президента Рузвельта; во-вторых, значительное расширение избирательного ценза. Новые контингента электората в основном принадлежали к беднейшим классам — они и предпочитали видеть Рузвельта на посту президента.

Метод исследования — почтовый опрос — также усугубил ошибку. Вероятность возврата вопросника по почте была и остается намного выше у людей с высоким образованием и доходами выше среднего, а те, кто не возвратил заполненный вопросник, как правило, принадлежали к низшим классам. Поэтому, если бы даже поллстеры из «Литерэри Дайджест» использовали списки избирателей, а не телефонные справочники, выборка все равно оказалась бы смещенной в сторону богатых и образованных.

Против «Литерэри Дайджест» работал и фактор времени. Состоятельные и более образованные люди обычно определяют «своего» кандидата на президентских выборах еще летом и, вообще, заранее имеют по этому поводу обоснованную позицию, а «простые» люди ничего заранее не умышляют. «Литерэри Дайджест» опрашивал миллионы преуспевающих американцев как раз в начале сентября, когда богатые уже определились в своем выборе, а бедные еще нет. Ошибочно предполагалось, что полученная картина сохранится до ноября, в том числе сохранится и доля тех, кто не мог сказать ничего определенного. К осени ситуация стала меняться. Количество определившихся в своем «нет» Рузвельту осталось относительно стабильным, зато подгруппа не имеющих мнения начала резко сокращаться и перетекать в «да» Рузвельту. Так величайшая по объему выборка в истории массовых опросов оказалась ошибочной, и инцидент показал, что главное для репрезентативности — не объем, а хорошее размещение единиц отбора.

«Каждая единица имеет равный шанс попасть в выборку» — первый принцип выборочной процедуры. Тогда же, в июле 1936 г., молодые и еще неизвестные поллстеры (так стали называть тех, кто проводит массовые опросы, в отличие от социологов), опросив несколько тысяч человек, точно предсказали победу Рузвельту. С этого времени начался институциональный период в истории обследований общественного мнения. Институты Гэллапа, Роупера и Харриса к началу 1960-х гг. уже были международными корпорациями.

Поможем написать любую работу на аналогичную тему

Источник

СОДЕРЖАНИЕ

Наука и эксперименты

Каждый раз, когда мы повторяем измерение чувствительным прибором, мы получаем несколько разные результаты. Общая используемая статистическая модель состоит в том, что ошибка состоит из двух аддитивных частей:

Случайные ошибки против систематических ошибок

Ошибки измерения можно разделить на две составляющие: случайная ошибка и систематическая ошибка.

Случайная погрешность всегда присутствует в измерении. Это вызвано непредсказуемыми по своей природе колебаниями в показаниях измерительного прибора или в интерпретации экспериментатором показаний прибора. Случайные ошибки проявляются как разные результаты якобы одного и того же повторного измерения. Их можно оценить путем сравнения нескольких измерений и уменьшить путем усреднения нескольких измерений.

Стандарт испытаний производительности PTC 19.1-2005 «Неопределенность испытаний», опубликованный Американским обществом инженеров-механиков (ASME), подробно описывает систематические и случайные ошибки. Фактически, он концептуализирует свои основные категории неопределенности в этих терминах.

Источники систематической ошибки

Несовершенная калибровка

Расстояние, измеренное радаром, будет систематически завышаться, если не учитывать небольшое замедление волн в воздухе. Неправильная установка нуля прибора, приводящая к ошибке нуля, является примером систематической ошибки в приборах.

Количество

Систематические ошибки могут быть либо постоянными, либо связанными (например, пропорциональными или процентными) с фактическим значением измеряемой величины или даже со значением другой величины (на показания линейки может влиять температура окружающей среды). Когда он постоянный, это просто из-за неправильного обнуления прибора. Когда он непостоянен, он может менять знак. Например, если на термометр действует пропорциональная систематическая ошибка, равная 2% от фактической температуры, а фактическая температура составляет 200 °, 0 ° или −100 °, измеренная температура будет 204 ° (систематическая ошибка = + 4 °), 0 ° (нулевая систематическая ошибка) или −102 ° (систематическая ошибка = −2 °) соответственно. Таким образом, температура будет завышена, когда она будет выше нуля, и занижена, когда она будет ниже нуля.

Дрейф

Если закономерность в серии повторных измерений не очевидна, наличие фиксированных систематических ошибок может быть обнаружено только в том случае, если измерения проверены либо путем измерения известной величины, либо путем сравнения показаний с показаниями, полученными с помощью другого устройства, известного как более точным. Например, если вы несколько раз думаете о времени маятника с помощью точного секундомера, вам будут даны показания, случайно распределенные относительно среднего значения. Систематическая ошибка Hopings присутствует, если секундомер сравнивается с « часами разговора » телефонной системы и обнаруживается, что он работает медленно или быстро. Очевидно, что время маятника необходимо корректировать в зависимости от того, насколько быстро или медленно работает секундомер.

Измерительные приборы, такие как амперметры и вольтметры, необходимо периодически проверять на соответствие известным стандартам.

Систематические ошибки также можно обнаружить путем измерения уже известных величин. Например, спектрометр, снабженный дифракционной решеткой, можно проверить, используя его для измерения длины волны D-линий электромагнитного спектра натрия, которые находятся на 600 нм и 589,6 нм. Измерения можно использовать для определения количества линий на миллиметр дифракционной решетки, которые затем можно использовать для измерения длины волны любой другой спектральной линии.

Источники случайной ошибки

Обзоры

Влияние на регрессионный анализ

Если зависимая переменная в регрессии измеряется с ошибкой, регрессионный анализ и связанная с ним проверка гипотез не затрагиваются, за исключением того, что R 2 будет ниже, чем при идеальном измерении.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *