Классы
Предметы

Статистика. Решение задач по комбинаторике и вычислению вероятностей

Этот видеоурок доступен по абонементу
Подробнее об абонементе, платных и бесплатных уроках

У вас уже есть абонемент? Войти

Оплатить абонементот 150 руб. в месяц
У вас уже есть абонемент? Войти
Статистика. Решение задач по комбинаторике и вычислению вероятностей

На этом уроке мы поговорим о способах сбора и анализа информации. Наша задача – понять, какие математические инструменты может использовать в своих целях статистика. Кроме того, мы решим несколько задач по комбинаторике, теории вероятностей и математической статистике.

Сбор и анализ информации в повседневной жизни

Всю жизнь человек получает, обрабатывает и анализирует различную информацию. Эволюция человека привела к тому, что первичные (натуральные) функции органов чувств (заметить опасность, чтобы успеть спрятаться или убежать) во многом уступили место культурным (чтение книг, просмотр балета и фильмов, прослушивание музыки и т. д.).

Более того, мы не просто используем полученную разными способами информацию для накопления знаний. Мы научились собирать необходимую нам информацию.

Например, фитнес-браслеты измеряют, сколько человек проходит в день. В результате мы можем корректировать наши физические нагрузки. Кто-то считает количество калорий, которые он «съедает» в день, чтобы соблюдать определенный режим питания.

Но сбор и анализ информации нужен не только одному конкретному человеку. Магазину, чтобы определить объем закупок, нужно собирать и анализировать спрос покупателей на товар в течение некоторого времени. И затем на основании полученных данных спрогнозировать, сколько товаров купят посетители на следующей неделе.

И такие задачи решают многие организации: сколько нужно снегоуборочных машин, чтобы успевать убирать город зимой (слишком много – плохо, дорого и при закупке, и в обслуживании – их нужно где-то хранить, ремонтировать, поддерживать их исправное состояние и т. д.), сколько нужно станций скорой помощи и т. д.


 

Закон больших чисел

Может показаться странным, что можно предсказать поведение покупателей магазина. Ведь каждый человек принимает решение о покупке товаров индивидуально. Особенно это касается не жизненно необходимых товаров (скажем, конфет, мороженого). Да и, к примеру, сегодня я захотел приготовить макароны, а послезавтра – картошку. Как тут «угадать»?

Оказывается, что, несмотря на свободу воли и непредсказуемость поведения каждого потребителя, в среднем поведение большого количества потребителей можно предсказать с большой точностью. Помогает в этом закон больших чисел – общий принцип, согласно которому совместное действие большого числа случайных факторов приводит при некоторых условиях к результату, почти не зависящему от случая.

Чем больше посетителей в магазине, тем меньше вклад каждого из них в общую статистику. А значит, тем меньше его личные предпочтения влияют на общую картину.

Представьте, что вы решили посчитать средний рост людей в своем городе. Если взять  человек, то среди них может оказаться, к примеру, баскетболист, и его высокий рост сильно повлияет на итоговый результат. Для  человек влияние таких «крайних» случаев будет меньше. Для  – еще меньше и т. д.

Это объясняет, почему многие люди предпочитают переезжать в крупные города. Даже если вам понадобится редкая вещь (вы интересуетесь какой-то редкой темой, заболели редкой болезнью и т. д.), велика вероятность, что в городе с населением несколько миллионов человек найдутся люди с аналогичной ситуацией. А значит, для кого-то возникнет финансовый интерес в том, чтобы заняться продажей таких вещей – на них будет пусть небольшой, но устойчивый спрос.

Конечно, развитие интернета (и транспортной доступности) может привести к смене этой тенденции: уменьшается роль территориальной близости (достаточно создать группу по интересам в социальной сети и организовать доставку).

Другой вопрос: как же проводят различные опросы? К примеру, анализ политических предпочтений избирателей всей страны часто делают на основе опроса всего нескольких тысяч жителей. Неужели в этом случае закон больших чисел не работает и небольшая выборка не вносит существенную погрешность в результаты таких опросов?

Здесь важно обратить внимание на то, что к выборке предъявляют дополнительное требование – репрезентативность. Т. е. подбираются такие люди, которые по своим различным данным (профессия, пол, социальный статус и т. д.) в точности представляют население страны (к примеру, мужчин и женщин среди этих нескольких тысяч будет, как и в целом по России:  женщин,  мужчин и т. д.). Этими задачами занимается специальная наука – социология. Ее роль очень велика, ведь на основании социологических исследований и прогнозов принимаются, в том числе, важные решения о направлениях развития государства.


 

Табличный способ представления информации

Сегодня мы с вами научимся работать с числовой информацией. Это может быть рост, вес, возраст, количество населения, цены на товары, объемы производства, часы работы и многое-многое другое. Оценки в школе – это также числовая информация. И, зная эту информацию, вы можете сделать соответствующие выводы: получив 5 баллов, вы понимаете, что отлично справились с работой; а если вы получили 3 балла – значит, вам плохо далась эта тема.

Начнем с представления информации. Когда у нас мало численных значений – тут и не о чем говорить. Например, вы записали в анкету свой рост и вес. Вот и все – вы представили информацию о себе.

А если это сделают все ученики школы? Да, вся информация есть, но разобраться в этой таблице крайне сложно! Как мы уже знаем, основная задача – это не просто собрать информацию, но и проанализировать ее, сделать выводы.

Поэтому для большого количества численных значений нужно научиться представлять информацию более наглядно. Это можно сделать с помощью таблиц, графиков и диаграмм. Рассмотрим пример.

 

Пример 1.

У учителя есть список оценок учеников за контрольную работу:

Для наглядности оценки можно упорядочить. Обычно это делают в порядке возрастания:

  1.  учеников получили тройки;
  2.  учеников – четверки;
  3. остальные  учеников получили пятерки.

Получили упорядоченный ряд:

Количество повторяющихся значений еще называют частотой. Т. е. частота четверки равна , а частота тройки и пятерки равна . На основе этих данных можно составить таблицу частот:

Оценка

Частота

Можно считать не количество учеников, а их процент от общего количества. Это называется относительная частота. Всего учеников , из них  учеников составляют около  от общего количества,  учеников – . Таблица относительных частот будет выглядеть следующим образом:

Оценка

Относительная частота

Естественно, что сумма относительных частот должна быть равна .


 

Относительная частота и округление

Внимательные ученики могли заметить, что, посчитав относительную частоту оценки 4, мы получим:

Поскольку в разряде сотых стоит цифра 5, то, по правилам округления, мы должны получить:

Но в таблице записано ! Почему так?

Мы отталкиваемся от того, что сумма всех относительных частот должна быть равна . Если бы мы записали , то вышло бы:

Получили бы лишнюю , возникшую из-за округления вверх.

Чтобы избежать этого, мы применили округление вниз. Но почему именно здесь? Можно было бы вычислить относительную частоту тройки , затем четверки – по правилам округления . Тогда оставшиеся  можно было бы записать в относительную частоту пятерки.

Но возникло бы некоторое недоразумение: относительная частота тройки и пятерки получилась бы различной. Хотя эти оценки получило одинаковое количество учеников. Именно поэтому, чтобы все числа «сошлись», мы округлили относительную частоту четверки в удобную нам сторону.

Понятно, что в данной задаче такие «манипуляции» со статистикой не повлияют на общую оценку ситуации для постороннего наблюдателя. Можно было вообще оценить так: .

Но представьте, что такую статистику подает директор каждой школы, затем их усредняют в районе, статистику по районам усредняют в городе, по городам – в области, по областям – на федеральном уровне. Если в исходных данных были неточности, то они могли «приумножиться» во время промежуточных вычислений и привести к тому, что итоговые результаты по стране существенно исказились. Именно поэтому важно выбрать степень точности на каждом из промежуточных уровней, чтобы итоговые округления отражали реальную ситуацию.

Чтобы понять суть ошибки при округлении, можно привести такой пример: пусть есть две реки, которые впадают в водохранилище. Известно, что при определенном критическом уровне водного потока  нужно перекрыть водосток, чтобы не допустить наводнения. Предположим, что уровень воды в первой реке , во второй: .

Если каждый из операторов округлит значения до десятых и передаст их нам, то мы получим:  и не будем опускать решетку, что приведет к наводнению. Хотя, на самом деле, реальный уровень воды:

Можем сделать вывод: в многозвенной системе суммарная ошибка при округлении может быть очень большой (хотя в каждом отдельном звене отклонение при округлении будет маленьким, но большое количество звеньев приведет к накоплению), и, как следствие, может быть принято неправильное решение.


 

Графический способ представления информации

Эти же данные можно представить графически. Для этого можно использовать следующие инструменты.

1. Полигон частот: вдоль горизонтальной оси отмечаем значения оценок, вдоль вертикальной – частоту (или относительную частоту). Наносим соответствующие точки и соединяем линией (см. рис. 1).

Рис. 1. Полигон частот

2. Столбчатая диаграмма. Оси те же, а значения отмечаем прямоугольником соответствующей высоты (см. рис. 2).

Рис. 2. Столбчатая диаграмма

3. Для наглядности можно использовать и круговую диаграмму. Для ее построения круг необходимо разбить на секторы, центральные углы которых пропорциональным частотам (и, соответственно, относительным частотам). Углы удобно считать через относительные частоты: полный круг () соответствует , тогда одному проценту соответствует центральный угол  (см. рис. 3).

В нашем примере оценкам 3 и 5 соответствует угол , а оценке 4:

Рис. 3. Круговая диаграмма

Итак, мы увидели, что для увеличения наглядности информации, данные можно:

  1. упорядочить;
  2. записать в таблицу;
  3. представить графически.

В рассмотренном примере у нас было всего 3 различных значения оценки. Если же различных значений будет больше, то все эти способы потеряют наглядность.

Представление информации при большем количестве различных значений

Вернемся к примеру с ростом всех детей в школе. Если минимальный рост школьника 142 см, а максимальный – 189 см, то у нас будет целых 48 столбцов в таблице и на диаграмме. Не очень наглядно (см. рис. 4).

Рис. 4. 48 столбцов на диаграмме

В таком случае данные удобно объединить по интервалам. Например, весь диапазон разбить на интервалы по 10 см: от 140 до 150, от 150 до 160 и т. д. Для каждого интервала будем считать количество школьников, рост которых попадает в данный интервал. Естественно, каждого ученика нужно учесть только в одном интервале, поэтому нужно заранее оговорить, куда включать данные, которые попадают на границы интервалов. Объединив данные по интервалам, получим наглядное представление данных:

Рост, см

Частота

Графическое представление также будет выглядеть более наглядно, чем до объединения в интервалы (см. рис. 5).

Рис. 5. Гистограмма и круговая диаграмма

Отметим отличия гистограммы от столбчатой диаграммы:

  1. Прямоугольники принято рисовать сомкнутыми.
  2. Основание прямоугольника соответствует длине интервала, а не выбирается произвольно.

Выбор графического представления информации зависит от самой информации и от наших целей. Так, к примеру, полигон частот удобно использовать при изменении некоторой величины с течением времени: объемы производства, численность населения (см. рис. 6).

Рис. 6. Объем производства автомобилей в России

Круговую диаграмму лучше использовать, когда нужно сравнить процентное соотношение составляющих некоторого целого. Например, этнический состав населения страны (см. рис. 7).

Рис. 7. Этнический состав населения России

Существуют и другие виды диаграмм, они также имеют свое применение в различных ситуациях. Например, для сравнения объектов по нескольким характеристикам сразу удобно использовать лепестковую диаграмму (см. рис. 8).

Рис. 8. Диаграмма команд

Характеристики среднего значения

Мы рассмотрели способы наглядного представления числовых данных. Теперь перейдем ко второму вопросу – обработке информации. Для анализа числовых данных существует множество различных характеристик. Рассмотрим некоторые из них на следующем примере:

Количество ошибок в диктанте

Количество учеников

Во-первых, оценим значения, которые может принимать исследуемая величина – количество ошибок в диктанте: максимальное значение – 4, минимальное значение – 0.

В среднем…вот тут нет однозначного ответа. Выделяют несколько характеристик, которые можно назвать «средним значением».

1. Среднее арифметическое – сумма всех численных значений, деленная на их количество. Всего было сделано ошибок:

Всего учеников: 40, тогда среднее арифметическое равно:

Но среднее арифметическое не всегда будет давать правильное представление о выборке. Например, если 9 человек написали диктант без ошибок, а 1 человек сделал в нем 20 ошибок, то среднее арифметическое количества ошибок будет равно:

Т. е. может показаться, что эта группа написала диктант хуже, чем первая, хотя, фактически, ее «утянул на дно» один человек. В таком случае можно использовать другие характеристики, которые уменьшают влияние таких крайних значений, например медиану ряда.

2. Медиана – значение среднего элемента в упорядоченном ряду данных. Учеников 40, значит, в упорядоченном ряду данных о количестве ошибок будет 40 элементов:

Средними элементами будут 20-й и 21-ый. Посмотрим, что это за элементы: первые 5 чисел – нули, затем – 14 единиц. Т. е. 19-й элемент – еще единица, далее идут 7 двоек. Значит, 20-й и 21-ый элементы – это двойки:

Медиана равна 2. Если же средние элементы различны, то медианой обычно считают их полусумму. У нечетного количества данных медианой будет просто центральный элемент упорядоченного ряда (например, медиана ряда  равна 3).

Другим минусом среднего арифметического как величины, которая характеризует выборку, является то, что ее не всегда можно использовать. Действительно, если среднее значение размера обуви у клиентов фабрики , это не значит, что фабрика должна выпускать обувь такого размера – в таком случае она попадет в «дырку от бублика» (центр тяжести бублика находится в его центре – но использовать это, чтобы подвесить его или каким-то другим способом обеспечить положение равновесия, не получится). Поэтому для обувной фабрики более полезной будет информация о наиболее часто встречающихся размерах обуви – самых популярных.

3. Для этого можно использовать моду – величину, имеющую наибольшую частоту (отсюда и название). В нашем примере мода равна 1 (частота 14 наибольшая):

Мода обычно равна или близка средним значениям. Если сразу несколько значений ряда встречаются одинаково наиболее часто, то обычно говорят, что моды у ряда нет.

Мы выделили 3 характеристики, которые можно назвать «средними значениями». Но чаще всего под «средним значением» понимают именно среднее арифметическое.

Характеристики разброса значений

Второй критерий оценки – это разброс значений исследуемой величины. Действительно, если вы один раз выстрелили в самый верх мишени, а затем – в самый низ, то в среднем вы оба раза попали в центр мишени. Но, согласитесь, вряд ли в реальной жизни кто-то признал бы вас в такой ситуации хорошим стрелком.

Посмотрите на две мишени стрелков  и  (см. рис. 9).

Рис. 9. Мишени стрелков  и

Явно видно, что стрелок  «кучнее» стреляет, т. е. является лучшим стрелком. Можно ли это как-то измерить?

Для оценки разброса есть несколько основных характеристик:

1. Размах –  разность между максимальным и минимальным значениями. В нашем примере с диктантом размах равен:

2. Дисперсия – это среднее арифметическое квадратов отклонений данной величины от ее среднего значения:

где  – значения исследуемой величины:

Дисперсия показывает, насколько сильно данные отклоняются от их среднего значения. Чем больше дисперсия, тем больше разброс данных. Для вычисления дисперсии данную формулу удобно преобразовать к виду:

где:


 

Преобразование формулы для дисперсии

Раскроем квадраты по формуле разности квадратов. Сгруппируем соответствующие слагаемые. Первые слагаемые – это квадраты величин .:

Далее – удвоенные произведения. В них можно вынести за скобки общий множитель . В скобках останется сумма :

Последние слагаемые – это квадраты . Всего таких слагаемых , получим :

Почленно разделим:

Первая дробь – это сумма величин , деленная на их количеств, т. е. среднее значение квадрата величины:

Вторая дробь не что иное как среднее арифметическое данной величины:

Получаем:


 В нашем примере:

3. Стандартное (или среднеквадратичное) отклонение – это корень квадратный из дисперсии:

В нашем примере:

Отметим, что дисперсия имеет размерность квадрата величины, в то время как стандартное отклонение имеет размерность самой величины.

Понятие размаха и стандартного отклонения можно проиллюстрировать, изобразив полигон частот. Чем больше размах, тем больший диапазон значений может принимать величина (см. рис. 10). Чем больше стандартное отклонение, тем значения дальше удалены от среднего (см. рис. 11). 

Рис. 10. Чем больше размах, тем больший диапазон значений может принимать величина

Рис. 11. Чем больше стандартное отклонение, тем значения дальше удалены от среднего

Принятие решений на основе полученных данных

Мы научились наглядно представлять числовые и вычислять их характеристики. Но главной задачей является не это, а возможность давать прогнозы и принимать верные решения на основе этих данных. Как это сделать? Рассмотрим примеры.

Можно собирать данные о том, сколько людей ежедневно проходит по некоторой улице. Вычисляем среднее арифметическое, получаем, к примеру, . Исходя из этого, можно предположить, что каждый последующий день по этой улице будет проходить около  людей. Поэтому более выгодно открыть кафе или магазин именно на этой улице, чем на другой, по которой в среднем проходит .

Еще пример. Магазин может провести исследование, сколько товаров покупают у них за одно посещение. Считаем моду: к примеру, если она равна 2, то выгодно сделать акцию : купи 3 вещи, получи 4-ю в подарок, тем самым стимулируя покупателей брать дополнительную третью вещь. Делать акцию  будет менее выгодно: большинство и так покупает 2 вещи, т. е. 3-я будет доставаться им бесплатно и магазин получит меньше прибыли.

В физических, химических, биологоческих, экономических исследованиях и экспериментах результатами могут быть числа. Причем обычно проводят серию экспериментов и получают множество чисел. И вполне естественно, что эти числа будут различаться. Причина кроется в том, что нельзя идеально провести измерение, всегда будут некоторые погрешности. И чем сложнее эксперимент, тем больше в нем измерений, тем больше будет погрешностей.

На основе полученных данных можно сделать вывод о проведенном эксперименте. Их среднее арифметическое можно считать искомым значением, а величина стандартного отклонения скажет нам о точности проведенных расчетов.

Делая выводы на основе статистических данных, нужно понимать несколько важных моментов.

1. Полученные на выходе результаты полностью определяются данными, которые мы подаем на вход.

Так, если мы будем собирать статистику о количестве людей, которые проходят по некоторой улице в период новогодних праздников, то нельзя сделать вывод, что и в остальные дни по этой улице будет ходить столько же людей. Ведь количество людей на улицах на праздники возрастает. Будет некорректно обобщать результаты исследований на все остальные дни в году.

Кроме того, чем больше у нас есть исходных данных, тем точнее мы сможем сделать вывод. Например, вы подбросили монетку всего 4 раза. Выпало 3 «орла» и 1 «решка». Здесь нельзя сделать вывод, что «орел» выпадает в 3 раза чаще «решки», данных слишком мало. А вот если вы подкинете монетку около 1000 раз, то такая статистика уже будет ближе к истине, к шансам 50 на 50.

2. Второй важный момент. Выводы из статистических данных – это не точные предсказания, а лишь предположения, которые верны с некоторой вероятностью. Мы не можем предсказать, что вот по этой улице пройдут Петя и Ира, мы не можем предсказать, что завтра всего по улице пройдет  человек. Но мы можем предположить на основе статистики, что завтра по ней пройдет около  человек. А более подробные расчеты могут нам дать информацию, что с вероятностью  завтра по улице пройдет от  до  человек.

Решение задач по комбинаторике

Вторую часть нашего занятия мы посвятим решению задач по комбинаторике и теории вероятностей. Все эти темы непосредственно связаны между собой. Напомним, что вероятность события  можно рассчитать как отношение количества благоприятных исходов  к общему количеству исходов этого события :

В случае когда речь идет о равновозможных испытаниях, значения  и  можно вычислить, используя комбинаторику. В остальных случаях значения  и  берутся из статистических данных.

 

Задание 1. 18 человек разбиты на три команды по 6 человек для игры «Что? Где? Когда?». Сколько может быть различных составов команд?

Решение.

Для решения задачи представим поочередный выбор:

  1. сначала 6 человек в одну команду;
  2. из оставшихся – 6 человек во вторую;
  3. в последнюю команду попадут оставшиеся 6 человек.

Порядок игроков внутри команды не важен (нам не сказано выбирать капитана или какие-либо другие особенные должности). Поэтому на каждом этапе выбора имеем классическую задачу – подсчет числа сочетаний . В первую команду выбираем 6 человек из 18:

Во вторую команду выбираем 6 из оставшихся 12 человек:

В третью команду остаются последние 6 человек. Т. е. здесь выбора нет, останется только 1 вариант. С помощью формулы для числа сочетаний получим такой же вывод:


 

Почему

В формуле мы получили выражение . Но ведь мы определили понятие факториала  как произведение всех натуральных чисел от  до , а ноль не натуральное число. Как же тогда быть? Необходимо дополнительно определить, чему равно значение .

Рассмотрим свойство факториала:

Если расписать понятие факториала, можно убедиться в его правильности:

Рассмотрим это равенство для . Получим:

 (произведение всех натуральных чисел до 1). Теперь можно выразить непонятную конструкцию :

Когда мы определили, что , мы сохранили указанное выше свойство факториала. Кроме того, такое значение полностью согласуется с расчетами. В нашей задаче мы должны были получить, что , мы это и получили.


Мы выбираем состав и первой, и второй, и третьей команд, значит, полученные значения нужно перемножить:

Это и будет ответ? Нет, неверно. Важно убедиться в том, что мы не посчитали по несколько раз одинаковые варианты! Обратите внимание, что между собой команды не различаются: у нас нет их четкой нумерации  или чего-то подобного. Порядок команд, в котором мы делали выбор, определяли мы сами. И получается, что, например, если поменять местами первую и вторую команды, такие варианты считаются различными, хотя состав команд один и тот же.

Вариант 1:

Команда 1

Борис

Ольга

Антон

Дарья

Никита

Ким

Команда 2

Алена

Дмитрий

Алексей

Иван

Денис

Юрий

Команда 3

 Вариант 2:

Команда 1

Алена

Дмитрий

Алексей

Иван

Денис

Юрий

Команда 2

Борис

Ольга

Антон

Дарья

Никита

Ким

Команда 3

Переставляя местами номера команд, мы не получим новых составов. Всего вариантов перестановки 3 элементов – . Значит, полученный ранее результат нужно еще разделить на . Получим ответ:

Можно упростить это выражение:

Для вычисления значения можно расписать факториалы по определению и сократить одинаковые множители. А можно воспользоваться способностями современной вычислительной техники и сразу получить ответ:

Ответ: .

 

Задание 2. Сколько четырехзначных чисел, делящихся на 5, можно составить из цифр , если каждую цифру можно использовать не более 1 раза?

Решение.

Внимательно посмотрим на условие задачи. Она не является классической задачей выбора 4 элементов из 5 без повторений, поскольку у нас есть определенные условия:

  1. Число должно делиться на 5.
  2. Число не может начинаться с 0.

Поэтому для решения применим правила «И» и «ИЛИ». Наша задача, по сути, сводится к тому, чтобы расставить 5 цифр на 4 местах при этих двух условиях.

Начнем с первого условия. Чтобы число делилось на 5, оно должно заканчиваться на 0 или на 5. Получаем 2 варианта цифры, которую можно поставить на последнее место.

Перейдем ко второму условию. Мы уже выбрали одну цифру. Осталось 4 варианта. Но ноль не может быть первым. Остается 3 варианта. Или нет? Оказывается, что нет, не всегда. Если на последнее место мы выбрали 5, то на первое место будет 3 варианта: 1, 3 или 5. Но, если мы выбрали на последнее место 0, то на первое место у нас будет 4 варианта: 1, 3, 5 или 7.

Итак, мы не можем однозначно сказать, сколько существует способов выбрать цифру на первое место.

В случаях когда нет однозначного ответа, необходимо по отдельности рассмотреть варианты.

а. На последнее место выбрали цифру 5 (1 способ). Тогда на первое место можно выбрать цифру тремя способами. Осталось 3 цифры. На второе место можем выбрать любую из них (3 способа). Теперь осталось 2 цифры, т. е. на третье место – 2 способа. По правилу «И» получаем количество вариантов:

б. На последнее место выбрали цифру 0 (1 способ). Тогда на первое место можно выбрать любую из 4 оставшихся цифр. Аналогично на второе место – 3 способа, на третье – 2 способа. По правилу «И» получаем:

Что делать с полученными значениями? При составлении числа у нас может сложиться или ситуация а, или ситуация б. По правилу «ИЛИ» складываем количество вариантов:

Это число и будет ответом к данной задаче.

Ответ: .

Удобно проиллюстрировать решение выше следующей схемой:

Рис. 12. Иллюстрация к заданию 2

Когда происходит выбор «ИЛИ» мы записываем это в разные ветки; когда происходит выбор «И» – продолжаем ветку. Для подсчета ответа нужно перемножить числа вдоль каждой ветки и сложить полученные результаты. Эта схема пригодится нам и для решения задач на расчет вероятностей.

Решение задач по теории вероятности

Рассмотрим задачу на вычисление вероятности.

 

Задание 3. За круглый стол на  стул в случайном порядке рассаживаются  мальчиков и  девочки. Найти вероятность того, что две девочки будут сидеть рядом.

Решение.

Дети рассаживаются в случайном порядке, поэтому все варианты рассадки можем считать равновероятными. Для расчета вероятности воспользуемся формулой:

где  – число благоприятных исходов,  – общее число возможных исходов.

Вычислим значения этих величин с помощью комбинаторики. Всего выбирается  человек, которые сядут на  стул. Эта классическая задача на число перестановок  элемента. Оно равно :

Теперь вычислим число благоприятных исходов (в нашем случае это те исходы, при которых две девочки будут сидеть рядом). Для удобства пронумеруем стулья за столом (рис. 13).

Рис. 13. Иллюстрация к заданию 3

Для начала выберем места для девочек. Это могут быть -, - и т. д. до -. Всего  вариант. В каждом варианте у девочек (пусть их зовут Аня и Лена) есть  способа сесть: Аня – справа от Лены или наоборот. Получаем, что выбрать место девочкам можно  способами.

Оставшиеся  мест должны занять  мальчиков. Они это могут сделать  способами. По правилу «И» получаем число благоприятных исходов:

Вычисляем вероятность:

Ответ: .

Решив эту задачу, мы сразу можем ответить и на вопрос «какова вероятность того, что две девочки не будут сидеть рядом». События «будут сидеть рядом» и «не будут сидеть рядом» являются противоположными, значит:

Обратите внимание, что считать количество событий, которые благоприятны условию «две девочки не будут сидеть рядом» достаточно сложно. Поэтому в таких ситуациях всегда проще считать вероятность противоположного события, а затем уже находить нужную вероятность.

В качестве следующих примеров рассмотрим несколько ситуаций, в которых люди чаще всего интуитивно делают неправильный выбор. Но, если не спешить с выводами и использовать имеющиеся у нас знания из теории вероятностей, можно таких ошибок избежать.

 

Задание 4. Линда – зрелая женщина  лет, она полна сил и энергии. На торжественных мероприятиях она любит говорить красивые тосты, при этом может не моргнув глазом осушить стакан вина. Кроме того, ее раздражают любые проявления дискриминации и она с удовольствием участвует в демонстрациях в защиту африканских носорогов. Вопрос: что более вероятно, что Линда – бухгалтер или что Линда – бухгалтер и феминистка?

Решение.

Большая часть людей отвечает, что, конечно, бухгалтер и феминистка (ведь в задаче явно перечислены характеристики, указывающие на то, что Линда – феминистка). Но давайте подойдем к этой задаче, основываясь на наших знаниях о вероятности.

Тут равновероятных событий у нас нет, поэтому рассмотрим статистический подход к вероятности. Вероятность, что нам встретится бухгалтер, можно оценить как отношение количества бухгалтеров к общему количеству людей:

Аналогично можно оценить вероятность, что встретится бухгалтер и феминистка:

Но ясно, что количество бухгалтеров-феминисток не больше, чем бухгалтеров в целом (см. рис. 14).

Рис. 14. Иллюстрация к заданию 4

Соответственно и вероятность, что Линда – бухгалтер и феминистка, меньше.

Можно рассуждать еще и так. Чтобы Линда была бухгалтером и феминисткой, должно одновременно выполняться два условия. Поскольку можно считать, что работа бухгалтером и феминистические взгляды не связаны между собой, то эти два события можно считать независимыми. Получаем, что:

Но  – в силу определения вероятности, то:

Ответ: 1. Линда – бухгалтер.

 

Задание 5

Нам сообщили, что анализ домашнего животного, собаки, на какую-то болезнь дал положительный результат. При этом мы знаем, что точность анализа не . Как оценить, заболело ли наше животное на самом деле?

Решение.

Решим задачу в общем виде. Пусть вероятность ложного анализа равна , а болезнь у собак встречается с вероятностью . Рассмотрим всевозможные варианты событий. Для этого нарисуем схему и расставим вероятности событий (см. рис. 15).

Рис. 15. Иллюстрация к заданию 5

Эта схема аналогична той, что мы рисовали в комбинаторной задаче: на разных ветках – несовместные события, вдоль одной ветки – независимые.

Мы знаем, что анализ положительный. Но этот результат мог быть получен одним из двух способов: собака больна и анализ правдивый. Вероятность этого:

Или собака здорова и анализ ложный, вероятность:

Сравним эти вероятности в случае, если . Например, этой болезнью болеет каждая сотая собака, а вероятность ошибки при анализе составляет  Получим:

Видим, что эти вероятности равны. Это значит, что если мы получили положительный анализ, то это еще ничего не означает: одинаковы вероятности того, что собака больна или не больна. Поэтому лучше сделать повторный анализ, тогда точность будет больше. Подставляя различные значения в полученные выражения, можно убедиться, что если болезнь очень редкая, то положительный анализ практически ничего не скажет о наличии болезни.

Именно поэтому в таких случаях рекомендуют сделать несколько анализов, независимо друг от друга. Это существенно уменьшит вероятность ошибки. Это касается и рекомендаций проконсультироваться у другого врача, если поставлен редкий диагноз. Если независимая оценка специалистов совпадет, то вероятность ошибки будет минимальной.

 

Список литературы

  1. Никольский С.М., Решетников Н.Н., Потапов М.К., Шевкин А.В. Алгебра, 9 класс. Учебник. ФГОС. – М.: «Просвещение», 2018.
  2. Дорофеев Г.В., Суворова С.Б., Бунимович Е.А. Алгебра, 9 класс. Учебник. – М.: издательство «Просвещение», 2018.
  3. Макарычев Ю.Н., Миндюк Н.Г., Нешков К.И., Суворова С.Б. Алгебра, 9 класс. Учебник. – М.: издательство «Просвещение», 2018.

 

Дополнительные рекомендованные ссылки на ресурсы сети Интернет

  1. Интернет-портал yaklass.ru (Источник)
  2. Интернет-портал mathprofi.ru (Источник)
  3. Интернет-портал ru.solverbook.com (Источник)

 

Домашнее задание

1. Каждые полчаса гидролог замеряет температуру воды в водоеме и получает следующий ряд значений:

Найти моду, медиану и размах этого ряда.

2. Сколько существует шестизначных чисел, в которых все цифры, стоящие на четных местах, различны?

3. Из натуральных чисел от  до  включительно ученик наугад называет одно. Какова вероятность того, что это число является делителем числа ?