Классы
Предметы

Экспериментальные данные и вероятности событий

Этот видеоурок доступен по абонементу
Подробнее об абонементе, платных и бесплатных уроках

У вас уже есть абонемент? Войти

Оплатить абонементот 75 руб. в месяц
У вас уже есть абонемент? Войти
Экспериментальные данные и вероятности событий

На сегодняшнем уроке мы с вами попытаемся провести связь между вероятностями случайных событий и характеристиками экспериментальных статистических данных. Сначала мы ознакомимся с понятием модельного представления, затем рассмотрим несколько примеров, а также узнаем, что такое статистическая устойчивость

Введение, объяснение проблематики

Из прошлых уроков вы могли выяснить, что экспериментальные статистические данные, как правило, представляют собой результат некоторого измерения, проведенного в реальности, а математическая вероятность случайного события – это результат некоего моделирования реальности.

Давайте, для начала, поговорим с вами о том, что такое модельные, или их еще называют идеализированные, представления о вероятностях и чем они отличаются от реальности. Для этого мы вновь обратимся к примеру из прошлого урока, который был связан с бросанием монеты. В реальном эксперименте монета может не только упасть на одну из своих сторон, но и может, к примеру, прислониться к стене. Ясно, что при подсчете вероятности мы не можем учесть все подобные случаи, поэтому мы их просто отбрасываем. При этом мы полагаем, что монета может упасть либо только так, чтобы выпал орел, либо только так, чтобы выпала решка, причем оба этих случая считаются равновероятными. То есть мы полагаем, что вероятность выпадения орла равна  и вероятность выпадения решки также равна . Получается некая идеализированная монета, которая сильно отличается от монет реальных.

Ситуация здесь примерно такая же, как при решении задач о движении моторной лодки по реке. Обычно, в условиях таких задач предполагается, что моторная лодка, например, движется от пункта  к пункту , против течения реки с постоянной скоростью по прямолинейной траектории. Совершенно яcно, что в реальности ни прямолинейность траектории, ни постоянство скорости не будут наблюдаться. То есть мы применяем, так называемое, модельное представление. И также совершенно ясно, что решить задачу в модельном представлении гораздо легче, чем решать задачу при полном учете всех условий реальности.

Для того чтобы прочувствовать количественную разницу между теоретически подсчитываемой вероятностью и реальными экспериментами, обратимся к следующей задаче. В ней мы снова будем использовать наиболее распространенный пример из теории вероятностей, то есть эксперимент с подбрасыванием монеты.

Пример «Подбрасывание монеты»

На практических занятиях по обработке данных каждый из 20 школьников подбросил монету 50 раз, подсчитал количество выпадений орла и записал это количество в процентах от общего числа своих бросаний.

Полученные данные показаны в таблице.

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

Орел

21

30

28

23

22

27

25

27

23

24

27

24

23

26

25

27

23

26

24

23

Орел, %

42

60

56

46

44

54

50

54

46

48

54

48

46

52

50

54

46

52

48

46

Первая строка – это номер школьника, вторая – количество выпадений орла в испытаниях каждого школьника, третья – количество выпадений орла в процентах от общего количества бросаний монеты, то есть от 50. Здесь мы имеем дело с достаточно широким размахом измерений. Видно, что есть результаты от 21 до 30 выпадений орла. Или если перевести частоту выпадения орла в проценты, то результат получится от 42 до 60 процентов. Видно, что ровно половина от общего числа бросаний получилась только у двух учеников.

Объединим результаты 1-го и 2-го учеников, 3-го и 4-го и так далее, результаты запишем в таблицу:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

Орел

21

30

28

23

22

27

25

27

23

24

27

24

23

26

25

27

23

26

24

23

Орел, %

42

60

56

46

44

54

50

54

46

48

54

48

46

52

50

54

46

52

48

46

Из 100

51

51

49

52

47

51

49

52

49

47

Будем считать, что в каждом испытании проведено ровно 100 бросаний. Видно, что у первой группы, например, орел выпал в 51 случае из 100 и так далее. Из последней таблицы можно видеть, что теперь половина от общего числа в сто бросаний вообще не встретилась, но отклонения от этой половины стали не меньше, чем в прошлой таблице. Продолжим укрупнение: объединим полученные результаты в группы по 200 бросков, то есть 1, 2, 3 и 4 учеников объединим в одну группу, 5, 6, 7 и 8 – в одну группу и так далее.

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

Орел

21

30

28

23

22

27

25

27

23

24

27

24

23

26

25

27

23

26

24

23

Орел, %

42

60

56

46

44

54

50

54

46

48

54

48

46

52

50

54

46

52

48

46

Из 100

51

51

49

52

47

51

49

52

49

47

Из 200

102

101

98

101

96

Снова видно, что при увеличении количества бросаний частота появления орла приближается к половине. Особенно это будет видно, если все проведенные броски объединить в общий результат.

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

Орел

21

30

28

23

22

27

25

27

23

24

27

24

23

26

25

27

23

26

24

23

Орел, %

42

60

56

46

44

54

50

54

46

48

54

48

46

52

50

54

46

52

48

46

Из 100

51

51

49

52

47

51

49

52

49

47

Из 200

102

101

98

101

96

Из 1000

498

Общее количество испытаний равно 1000, орел появился в 498 случаях. Процентная частота появления орла в таком случае равна 49,8 %. То есть отклонение от половины, то есть от 50 %, составляет 0,02 %.

Проведение заметного числа экспериментов показывает, что частота выпадения орла при достаточно большом количестве бросаний почти неотличима от 50 %.

В большинстве учебной литературы приводятся результаты английского математика Карла Пирсона (1857–1936).

 – количество бросков монеты.

 – выпадение орла.

 – количество выпадений орла.

 – частота выпадений орла.

Эксперимент показывает, что при неограниченном увеличении числа проведенных испытаний при соблюдении одних и тех же условий частота проявления некоего фиксированного случайного события сближается с постоянным числом. Этот факт называется статистической устойчивостью, а постоянное число, с которым сближается частота, называется статистической вероятностью данного события.

Следует сделать одно замечание: статистическая устойчивость не гарантирует того, что при проведении конкретной серии испытаний частота появления нужного вам случайного события окажется равной вероятности этого события. Явление статистической устойчивости гарантирует лишь то, что при увеличении числа испытаний частота будет стремиться к подсчитанной вероятности.

Явление статистической устойчивости как раз и перебрасывает тот логический мостик, о котором шла речь в начале урока, то есть именно благодаря ему мы и можем обнаружить связь между моделями случайных событий, то есть теми вероятностями, которые мы научились подсчитывать на прошлом уроке и частотами появления этих событий в реальных экспериментах.

Может возникнуть такой простой вопрос: а какая же практическая польза от явлений статистической устойчивости? Зачем нужно обсуждать эту тему? А польза состоит в следующем: существует большое количество примеров, в которых вероятность случайного события подсчитать либо очень сложно, либо вообще невозможно. Как поступить в этом случае, если нужно оценить значение вероятности наступления случайного события? А поступают следующим образом: необходимо произвести реальные измерения, то есть провести ряд опытов или испытаний, как мы их называли в прошлом уроке, и в этих испытаниях подсчитать частоту наступления нужного нам случайного события, далее искомую вероятность можно считать приближенно равной частоте наступления случайного события. В этом случае мы уходим от необходимости подсчитывать вероятность, а просто предполагаем ее равной частоте. Рассмотрим еще один пример.

Пример «Литературные тексты»

Статистические исследования большого количества литературных текстов показали, что частоты появления той или иной буквы или пробела между словами стремятся при увеличении объема текста к некоторым определенным константам.

Частотные таблицы языка – это таблицы, в которых собраны буквы того или иного языка и соответствующие им константы.

Частотная таблица русского языка:

О

9,28 %

 

 

П

3,35 %

 

 

Й

1,31 %

А

8,66 %

 

 

М

3,29 %

 

 

Ч

1,27 %

Е

8,10 %

 

 

У

2,90 %

 

 

Ю

1,03 %

И

7,45 %

 

 

Д

2,56 %

 

 

Х

0,92 %

Н

6,35 %

 

 

Я

2,22 %

 

 

Ж

0,78 %

Т

6,30 %

 

 

Ы

2,11 %

 

 

Ш

0,77 %

Р

5,53 %

 

 

Ь

1,90 %

 

 

Ц

0,52 %

С

5,45 %

 

 

З

1,81 %

 

 

Щ

0,49 %

Л

4,32 %

 

 

Б

1,51 %

 

 

Ф

0,40 %

В

4,19 %

 

 

Г

1,41 %

 

 

Э

0,17 %

К

3,47 %

 

 

 

 

 

 

Ъ

0,04 %

У каждого автора есть своя частотная таблица использования букв, слов, специфических литературных оборотов и т. п.

Частотная таблица А.С.Пушкина:

О

8,3 %

 

 

М

2,8 %

 

 

[ ]

1,7 %

Е

7,1 %

 

 

К

2,4 %

 

 

Ч

1,1 %

А

6,1 %

 

 

У

2,4 %

 

 

Ж

0,09 %

Н

5,9 %

 

 

П

2,1 %

 

 

Ф

0,08 %

И

5,2 %

 

 

Ы

1,9 %

 

 

Х

0,08 %

Т

4,7 %

 

 

Б

1,4 %

 

 

Э

0,07 %

Л

4,3 %

 

 

З

1,4 %

 

 

Ш

0,06 %

С

4,2 %

 

 

Г

1,5 %

 

 

Ю

0,06 %

В

3,7 %

 

 

Я

1,6 %

 

 

Ц

0,03 %

Р

3,7 %

 

 

Ь

1,7 %

 

 

Ъ

0,02 %

Д

2,9 %

 

 

Й

1,8 %

 

 

Щ

0,01 %

По этой частотной таблице можно определить автора текста примерно так же, как по отпечаткам пальцев.

Теория вероятности и шифрование данных

Приведем пример использования статистики для расшифровки текста. Один из самых старых способов шифровки состоит в следующем: каждая буква алфавита заменяется либо другой буквой этого же алфавита, либо каким-то независимым внешним значком. Рассмотрим пример:

Предположим, вы перехватили некоторое зашифрованное сообщение, при этом таблицы, которая была приведена ваше, у вас в распоряжении нет. Как поступать в этом случае? Здесь приходит на помощь статистика.

Расшифровка текста при помощи частотной таблицы

Пусть текст послания состоит из  страницы машинописного текста, то есть около  строк по  букв в каждой, или примерно около  шифрованных букв.

Составим для этого текста частотную таблицу встречаемости различных букв. Сравним эту таблицу с частотной таблицей русского языка. Если мы видим, что частота появления какого-то символа составляет около , то с заметной долей уверенности мы можем говорить, что этим символом зашифрована буква «о» из начального текста. Если частота какого-то символа оказалась равной , то, скорее всего, там зашифрована буква «е».

Таким образом, мы можем приблизительно расшифровать весь текст. На первом шаге получится неправильная расшифровка. Но потом можно будет учесть грамматику русского языка и составить таблицу встречаемости не только отдельных букв, но и устойчивых сочетаний слов и т. д. В итоге мы получим методику для расшифровки всего полученного текста.

Конечно же, на сегодняшний день подобные методы шифрования и дешифрования являются устаревшими. Однако статистика все равно может бать полезной при анализе, например, авторства какого-либо текста.

Подведение итогов

В начале урока мы задались вопросом: в чем отличие между двумя ситуациями, с одной стороны мы проводим реальный эксперимент, в котором в каждом испытании может наступить или не наступить некоторое случайное событие. В результате проведения большого числа испытаний мы получаем некоторую частоту появления этого случайного события. С другой стороны мы можем представить себе некоторую модель этого случайного события без проведения реального эксперимента и подсчитать классическим способом вероятность наступления некоторого случайного события. Вопрос как раз заключается в том, как соотносятся между собой эти две величины – частота и вероятность. Сегодняшний урок дал нам ответ на этот вопрос. И ответ заключается в том, что у нас наблюдается так называемая статистическая устойчивость, то есть мы можем считать вероятность приближенно равной частоте наступления случайного события в том случае, если проводим достаточно большое количество испытаний, при этом чем больше количество испытаний, тем слабее отличается частота от вероятности. Также мы решили ряд задач, которые подтвердили данный вывод.

 

Список литературы

  1. Алгебра. Элементы статистики и теоретической вероятности. 7–9 класс (Макарычев Ю.Н., Миндюк Н.Г)
  2. Алгебра. 9 класс. В 2 ч. Ч. 2. Задачник для учащихся общеобразовательных учреждений (А. Г. Мордкович, Л. А. Александрова, Т. Н. Мишустина и др.)
  3. Алгебра 7–9. Элементы статистики и вероятности. Ткачев М.В., Федоров М.Е. – М.: Просвещение, 2003.

 

Дополнительные рекомендованные ссылки на ресурсы сети Интернет

  1. Interneturok.ru (Источник).
  2. Interneturok.ru (Источник).
  3. Yaklass.ru (Источник).
  4. Yaklass.ru (Источник).

 

Домашнее задание

  1. № 8,16; 8,18; 8,19 (Уч. «Алгебра. Элементы статистики и теоретической вероятности. 7-9 класс» Макарычев Ю.Н., Миндюк Н.Г.)