Существует ли закон малых чисел. Закон малых чисел (интересный копипаст). Алгебраическая теория чисел

Некоторые интуитивные представления о вероятности превалируют в процессе принятия решений индивидуумами. Канеман и Тверски ставили перед респондентами вопрос: "Какова вероятность того, что в роддоме на десять коек и в роддоме на тысячу коек в данный конкретный день родится 60% мальчиков?" . Обычно цифры назывались одинаковые , хотя закон больших чисел для данного случая утверждает, что при возрастании числа испытаний вероятность должна сходиться к 0,5. Если шестеро из десяти новорожденных окажутся мальчиками, то это не должно вызывать удивления. Но если мальчиками будут шестьсот из тысячи, то это уже заставит задуматься о приемлемости гипотезы симметричности в данном испытании. В то же самое время, нет никаких сомнений, что ответ был бы более правильным при постановке вопроса в терминах бросания симметричной монеты, а именно: "Какова вероятность того, что при десяти испытаниях 6 раз выпадет "орел"? А также - какова вероятность того, что "орел" выпадет 600 раз в серии из тысячи испытаний?"

Тем не менее, единичным событиям приписывается необходимость их подчиненности закону больших чисел. Как будто бы мы имеем дело не со статистическим законом, подтверждающимся только на больших выборках, а с законом вполне детерминированным. Канеман и Тверски определили этот психологический феномен как "психологический закон малых чисел" .

На этот "закон" очень часто возлагаются надежды азартными игроками. Многие из них слепо доверяются так называемому "закону уравнивания", который они надеются применить на неадекватно коротких отрезках игры. Данный "закон" вселяет надежду, что если достаточно долго придерживаться одной тактики, то уравнивание придет само собой. Другими словами, если необходимый для выигрыша "орел" не выпадает и не выпадает, то необходимо продолжать на него ставить, т.к. когда-нибудь его выпадение все равно произойдет. Мы убеждены в "справедливом уравнивании" вопреки фактам. Но на коротких сериях испытаний наблюдаемое отклонение может быть весьма велико, если расценивать его с точки зрения оценки риска для игрока. Не существует уравнивания без отклонений. У монеты нет "памяти", каждый бросок является независимым испытанием.

Другое следствие "закона малых чисел" заключается в том, что из индивидуального опыта, который не может претендовать на роль статистически значимого, делаются обобщающие выводы и на их основе формулируются несуществующие закономерности. Так например, Тверски вспоминает случай из своей карьеры инструктора в десантных войсках. Произошло столкновение двух противоположных мнений двух инструкторов, обучающих молодых солдат прыжкам с парашютом. Один из них утверждал, что грубое обращение с курсантами более эффективно мотивирует их к достижению результатов. Другой утверждал обратное. На самом же деле и тот и другой опыт не является статистически значимым. В этом случае более уместным будет вспомнить опыты Гальтона с селекцией гороха. Отбор все более крупных горошин в конечном счете, в одном из поколений, приводил к обратному результату. Потомство было более мелким, чем родительские горошины. Успехи и неудачи курсантов могут происходить не исключительно в результате усилий инструктора и не благодаря его грубому или мягкому руководству, а в соответствии со статистическим законом возврата к среднему. Но чисто внешне этот процесс выглядит следующим образом: после поощрения дела у курсанта пойдут хуже. Хоть и не вследствие поощрения, но вслед за ним . А вот после наказания результаты неуспешного курсанта вернутся к среднему уровню.

Мое сотрудничество с Амосом в 1970-е годы началось с дискуссии об утверждении, что люди обладают интуитивным статистическим чутьем, даже если их статистике не обучали. На семинаре Амос рассказал нам об исследователях из Мичиганского университета, которые в целом оптимистично относились к интуитивной статистике. Меня эта тема очень волновала по личным причинам: незадолго до того я обнаружил, что я – плохой интуитивный статистик, и мне не верилось, что я хуже других.
Для психолога-исследователя изменчивость выборки – не просто странность, это неудобство и помеха, которая дорого обходится, превращая любое исследование в игру случая. Предположим, вы хотите подтвердить гипотезу, что словарный запас шестилетних девочек в среднем больше, чем словарный запас мальчиков того же возраста. В объеме всего населения гипотеза верна, у девочек в шесть лет словарный запас в среднем больше. Однако девочки и мальчики бывают очень разными, и можно случайно выбрать группу, где за метной разницы нет, а то и такую, где мальчики набирают больше баллов. Если вы – исследователь, такой результат вам дорого обойдется, поскольку, потратив время и усилия, вы не подтвердите правильность гипотезы. Риск снижается только использованием достаточно большой выборки, а те, кто работает с маленькими выборками, отдают себя на волю случая.
Риск ошибки в каждом эксперименте оценивается при помощи довольно простой операции, однако психологи не пользуются вычислениями для определения размера выборки, а принимают решения в соответствии с собственным, зачастую ущербным, пониманием. Незадолго до дискуссии с Амосом я прочитал статью, прекрасно иллюстрирующую типичные ошибки исследователей. Автор отмечал, что психологи сплошь и рядом используют настолько маленькие выборки, что рискуют не подтвердить верные гипотезы с вероятностью 50 %! Ни один разумный исследователь не примет такой риск. Правдоподобным объяснением казалось то, что решения психологов относительно разм ера выборок отражали господствующие интуитивные заблуждения о диапазоне изменчивости.
Меня поразили содержащиеся в статье объяснения, проливающие свет на проблемы с моими собственными исследованиями. Как и большинство психологов, я постоянно использовал слишком маленькие выборки и часто получал бессмысленные, странные результаты, оказывавшиеся артефактами, которые порождал сам метод моих исследований. Мои ошибки были тем постыднее, что я преподавал статистику и умел вычислять размер выборки, необходимый для снижения риска неудачи до приемлемого уровня. Но я никогда этим не занимался при планировании экспериментов и, подобно другим исследователям, верил традиции и собственной интуиции, не задумываясь о проблеме всерьез. К моменту, когда Амос посетил мой семинар, я уже осознал, что моя интуиция не работает, а во время самого семинара мы быстро пришли к выводу, что ошибаются и оптимисты из Мичиганского университета.
Мы с Амосом решили выяснить, есть ли среди исследователей такие же наивные глупцы, как я, и допускают ли те же ошибки ученые, обладающие математическими знаниями. Мы разработали опросник с описанием реалистичных исследований и успешных экспериментов. Опрашиваемые должны были определить размеры выборок, оценить связанные с этими решениями риски и дать советы гипотетическим аспирантам, планирующим научно-исследовательскую работу. На конференции Общества математической психологии Амос провел опрос присутствующих (включая авторов двух учебников по статистике). Результаты оказались очевидны: я был не одинок. Почти все респонденты повторили мои ошибки. Выяснилось, что даже эксперты недостаточно внимательны к размеру выборки.
Первая статья, написанная мной в соавторстве с Амосом, называлась «Вера в закон малых чисел». В ней шутливо пояснялось, что «…интуитивная оценка размера случайных выборок, похоже, удовлетворяет закону малых чисел, гласящему, что закон больших чисел с тем же успехом применим и к малым». Также мы включили в статью настойчивую рекомендацию для исследователей относиться к своим «статистическим предчувствиям с недоверием и при любой возможности заменять впечатления вычислениями».

Термин "закон малых чисел" (law of small numbers), введенный в научный обиход нобелевским лауреатом и психологом Даниэлем Канеманом, как и исходный термин "закон больших чисел" (law of large numbers), условны, и их не стоит трактовать буквально.

Что же это за закон такой - закон малых чисел?

Чтобы ответить на этот вопрос, нам нужно ненадолго сосредоточиться на законе чисел больших.

А закон больших чисел, говоря предельно упрощенно, касается вот чего.

Допустим у нас есть огромный мешок с российскими монетами достоинством 1 рубль, 2 рубля, 5 рублей и 10 рублей. В мешке этих монет бесконечно много, причем монет каждого достоинства поровну. Предположим, что эти монеты не отличаются по размеру и весу. К мешку по очереди подходят люди и вынимают каждый по одной монете. Это происходит снова и снова: огромное количество людей получают свои монеты.

Наша задача - угадать, сколько денег получит каждый подошедший в среднем.

Закон больших чисел утверждает, что чем больше к мешку подойдет людей, тем больше среднее количество полученных ими денег будет приближаться к (1+2+5+10)/4=4,5 руб. т.е. к среднему арифметическому. И закон больших чисел, поверьте, истинен.

А вот закон малых чисел был бы истинным, если бы уже на основе подсчета среднего количества денег, полученных первыми несколькими людьми, мы получили бы результат 4,5 руб. А такой результат весьма маловероятен. Например, первые несколько человек вполне могут получить каждый по 10 рублей.

Таким образом, в отличие от закона больших чисел закон малых чисел ошибочен.

Напомню, что термины "закон больших чисел" и "закон малых чисел" - это условные термины, которые не стоит трактовать буквально.

Применительно к более реальным исследовательским задачам, чем приведенная выше условная задача с монетами, ошибочность закона малых чисел проявляется в том, что чем меньше выборка, тем менее точно она отражает свойства генеральной совокупности, т.е. тем менее она репрезентативна. И наоборот: чем больше выборка, тем более точно она отражает свойства генеральной совокупности, т.е. тем в большей степени она репрезентативна (при условии рандомизации, естественно, но, как говорится, это уже совсем другая история). Соответственно, если человек делает выводы о генеральной совокупности по слишком малой выборке, то он как бы верит в закон малых чисел, как бы не понимает его ложности.

Вот еще одна пояснительная иллюстрация. Когда я учился в школе, в кабинете математики у нас висел, среди прочих, небольшой плакат, на котором было написано:

Статистика. Верно, когда много.

Но нас интересует не сам по себе закон малых чисел, а то, как люди действуют (проводят исследования, формулируют выводы), если, условно говоря, верят в этот закон.

В этом смысле имеет место следующее. Вера в закон малых чисел (а такая вера, как правило, не осознается) порождает так называемое "скороспелое обобщение" (hasty generalization). Скороспелым является такое обобщение, при котором человек на основании всего лишь нескольких своих наблюдений за определенными объектами или явлениями делает однозначный вывод о свойствах всех таких объектов или явлений. Например, у девушки было трое парней, и каждый из них оказался козлом, из этого девушка заключает, что вообще все мужчины козлы. Конечно, такой вывод неверен, лежащее в его основе обобщение - скороспелое, а девушка как бы верит в то, что троих мужчин достаточно, чтобы судить обо все мужчинах, т.е. верит в закон малых чисел.

Другими словами, человек, верящий в закон малых чисел, преувеличивает репрезентативность малой выборки. Именно поэтому, кстати, веру в закон малых чисел Даниэль Канеман относил к

Чтобы лучше понять ошибочность закона малых чисел давайте решим небольшую задачу.

На столе стоит корзина. В ней находятся шары, причем 2/3 шаров одного цвета и 1/3 шаров другого цвета. К корзине подошли два гинеколога: молодой и старый. Каждый из них засовывает в корзину руку и, не видя шаров, вынимает их из корзины.

Молодой гинеколог вытащил 5 шаров. Причем 4 из них оказались красными и один - белым.

Старый гинеколог вытащил 20 шаров, причем 12 из них оказались красными и 8 - белыми.

Кто из гинекологов - молодой или старый - может с большей уверенностью заявить, что в корзине 2/3 красных шаров и 1/3 белых, а не наоборот?

Обычно люди (причем независимо от их пола) выбирают молодого гинеколога. Рассуждают они примерно так: у молодого гинеколога 80% шаров (4/5*100%) оказались красными, а у старого - только 60% шаров (12/20*100%), значит более уверен должен быть молодой гинеколог. Но такое рассуждение ошибочно и является примером веры в закон малых чисел: человек считает, что выборка в 5 шаров может быть более репрезентативной, чем выборка в 20 шаров. А это, конечно, не так.

Вера в закон малых чисел и идущее с ней рука об руку скороспелое обобщение распространены достаточно широко.

Для начала давайте обратим внимание на то, что вера в закон малых чисел и скороспелое обобщение могут быть присущи психологам-исследователям, которые, хотя и обучены математико-статистическим методам, все равно, например, выводят закономерность, исследовав всего 30 испытуемых. (Да-да, исследования Д. Канемана показывают, что даже обученные статистике люди могут верить в закон малых чисел).

Присущи вера в закон малых чисел и скороспелое обобщение и психоаналитикам, которые считают, условно говоря, что семи пациенток было достаточно Фрейду для формулировки основных положений психоанализа.

Влияет закон малых чисел и на повседневные выводы, которые формулируются обывателями и присущи житейскому уровню познания. Например, в следующих утверждениях, относящихся к житейскому уровню познания, легко заметить скороспелые обобщение: все блондинки - глупы, все русские - алкоголики, все москвичи - зазнавшиеся и т.д. и т.п.

Еще один отличный пример бытовой, повседневной веры в закон малых чисел можно увидеть в отечественном кинофильме "Статский советник". Помните эпизод, в котором Пожарский, выражая восхищение даром Фандорина всегда выигрывать, предлагает ему сыграть в карты - угадывать, красная или черная масть будет у вытянутой из колоды карты? Когда два раза выпало черное, Фандорин снова говорит "черное", Пожарский не соглашается с ним ("помилуйте, три раза "черное"?!."), выбирает "красное" и проигрывает.

В данном случае Пожарский как бы верит в закон малых чисел, т.е. считает, что уже выборка всего лишь из трех карт продемонстрирует закон больших чисел, под действием которого возникает последовательность карт, в которой чередование красных и черных мастей является равномерным. Но такая последовательность возникнет только в достаточно множественной серии игр и тасовок, причем чем больше будет игр, тем больше будет равномерность. (Конечно, если пренебречь износом карт и особенностями тасовки).

Этот пример, кстати, иллюстрирует не только веру в закон малых чисел, но и один из видов когнитивных искажений (cognitive biases) под названием "ошибка азартного игрока" (gambler"s fallasy).

Верит в закон малых чисел и игрок в "Дурака", который, видя, что у него на руках одни черные масти заявляет, что колода плохо перетасована.

И конечно, вера в закон малых чисел и скороспелое обобщение лежат в основе всяческих и, в частности, различных . Например, именно в режиме скороспелого обобщения сформулированы все соционические описания типов людей и соционических функций.

В заключение я бы хотел отметить, что вера в закон малых чисел - это всего лишь одно из множества когнитивных искажений (cognitive biases), присущих человеку. Причем в условиях научного исследования это искажение можно сравнительно легко скомпенсировать, применяя современные математико-статистические методы и надлежащим образом обеспечивая репрезентативность выборки.

ЛИТЕРАТУРА

Канеман Д., Словик П., Тверски А. Принятие решений в неопределенности: Правила и предубеждения. - Харьков: Издательство Институт прикладной психологии «Гуманитарный Центр», 2005. - 632 с.

Этот свойство человека делать интуитивные оценки и игнорировать малый размер статистической выборки.

«Мы представляем на обсуждение тезис о том, что люди рассматривают выборку отобранную случайным образом из совокупности как высоко репрезентативную, то есть подобную всей совокупности во всех существенных характеристиках.

Следовательно, они ожидают, что любые две выборки, взятые из ограниченной совокупности, будут более подобны друг другу и совокупности, чем предполагает теория выборок, по крайней мере, для малых выборок.

Тенденция расценивать выборку как репрезентативную наблюдается в самых разнообразных ситуациях. Когда тестируемых просят создать случайную последовательность гипотетических подбрасываний монеты, например, они создают последовательности, где пропорция «орла» на любом коротком отрезке гораздо ближе к 0.50, чем предсказала бы теория вероятности […]

Таким образом, каждый отрезок полученной последовательности высоко репрезентативен по отношению к «справедливости» монеты. Подобные эффекты наблюдаются, когда тестируемые последовательно предсказывают события в созданном случайным образом ряде событий, как в экспериментах по изучению вероятности […] или в других последовательных играх с шансами. Тестируемые действуют так, как будто, каждый отрезок случайной последовательности должен отражать правильную пропорцию: если последовательность отклонилась от пропорции во всей совокупности, ожидается корректирующее отклонение в другом направлении. Это получило название ошибки игрока казино.

Суть ошибки игрока казино - неправильное представление о справедливости закона случайности. Игрок чувствует, что равнозначность сторон монеты даёт ему право ожидать, что любое отклонение в одном направлении будет скоро компенсировано соответствующим отклонением в другую сторону. Даже самая сбалансированная монета, однако, обладая ограничениями морали и памяти, не может при подбрасывании выдавать столь же равновероятные результаты, как того ожидает игрок в казино. Эта ошибка свойственна не только игрокам. […]

В этом разделе, мы увидели, что сторонник закона малых чисел ведёт свою научную деятельность следующим образом:

1. Он подвергает риску свои исследовательские гипотезы на небольших выборках, не осознавая, что шансы в его пользу чрезвычайно низки. Он переоценивает мощность.

2. Он необоснованно уверен в ранних тенденциях (например, в данных, полученных на первых нескольких испытуемых) и в стабильности наблюдений (например, в количестве и идентичности значимых результатов). Он переоценивает значимость.

3. В оценке повторных исследований, своих собственных или чужих, он имеет необоснованно высокие ожидания относительно воспроизводимости значимых результатов. Он недооценивает величину доверительных интервалов.

4. Он редко объясняет отклонение от ожидаемых результатов выборки изменчивостью выборок, потому что он находит «объяснение» любому несоответствию. Таким образом, он имеет мало возможностей распознать изменчивость выборок в действии. Поэтому его вера в закон малых чисел, навсегда останется непоколебимой».

Амос Тверски, Даниель Канеман, Вера в закон малых чисел / Д. Канеман, П. Словик, А. Тверски, Принятие решений в неопределённости: правила и предубеждения, Харьков, «Гуманитарный центр», 2005 г., с. 40-41 и 46.

Существует несколько определений понятия «теория чисел». Одно из них гласит, что это специальный раздел математики (или высшей арифметики), которая подробно изучает целые числа и объекты, сходные с ними.

Другое определение уточняет, что этот раздел математики изучает свойства чисел и их поведение в различных ситуациях.

Некоторые ученые считают, что теория настолько обширна, что дать ее точное определение невозможно, а достаточно лишь разделить на несколько менее объемных теорий.

Установить достоверно, когда зародилась теория чисел, не представляется возможным. Однако точно установлено: на сегодня древнейшим, но не единственным документом, свидетельствующим об интересе древних к теории чисел, является небольшой обломок глиняной таблички 1800 годов до нашей эры. В нем - целый ряд так называемых Пифагоровых троек (натуральных чисел), многие из которых состоят из пяти знаков. Огромное количество таких троек исключает их механический подбор. Это свидетельствует о том, что интерес к теории чисел возник, видимо, намного раньше, чем изначально предполагали ученые.

Самыми заметными лицами в разработке теории считаются пифагорейцы Евклид и Диофант, жившие в Средние века индийцы Ариабхата, Брахмагупта и Бхаскары, а еще позже - Ферма, Эйлер, Лагранж.

В начале ХХ века теория чисел привлекла внимание таких математических гениев, как А. Н. Коркин, Е. И. Золотарёв, Б. Н. Делоне, Д. К. Фаддеев, И. М. Виноградов, Г.Вейль, А. Сельберг.

Разрабатывая и углубляя выкладки и исследования древних математиков, они вывели теорию на новый, значительно более высокий уровень, охватывающий множество областей. Глубокие исследования и поиски новых доказательств привели и к открытию новых проблем, некоторые из которых не изучены до сих пор. Открытыми остаются: гипотеза Артина о бесконечности множества простых чисел, вопрос о бесконечности количества простых чисел, множество других теорий.

На сегодня основными составляющими, на которые делится теория чисел, являются теории: элементарная, больших чисел, случайных чисел, аналитическая, алгебраическая.

Элементарная теория чисел занимается изучением целых чисел, не привлекая методы и понятия из других разделов математики. малая - вот самые распространенные, известные даже школьникам понятия из этой теории.

Теория больших чисел (или Закон больших чисел) - подраздел теории вероятностей, стремящийся доказать, что среднее арифметическое (по другому - среднее эмпирическое) большой выборки приближается к математическому ожиданию (которое еще называют теоретическим средним) этой выборки при условии фиксированного распределения.

Теория случайных чисел, разделяя все события на неопределенные, детерминированные и случайные, пытается определить по вероятности простых событий вероятность сложных. В этот раздел входят свойства и теорема их умножения, Теорема гипотез (которую часто называют формулой Байеса) и пр.

Аналитическая теория чисел, как это понятно из ее названия, для изучения математических величин и числовых свойств применяет методы и приемы Одно из главных направлений этой теории - доказательство теоремы (при помощи комплексного анализа) о распределении простых чисел.

Алгебраическая теория чисел работает непосредственно с числами, их аналогами (например, алгебраическими числами), изучает теорию дивизоров, когомологии групп, функции Дирихле и т.п.

К появлению и развитию этой теории привели многовековые попытки доказать теорему Ферма.

До ХХ века теория чисел считалась отвлеченной наукой, "чистым искусством от математики", не имеющим абсолютно никакого практического или утилитарного применения. Сегодня ее выкладки используют в криптографических протоколах, при расчете траекторий спутников и космических зондов, в программировании. Экономика, финансы, информатика, геология - все эти науки сегодня невозможны без теории чисел.