想要知道答案吗?先让我们耐心学习probability的基础知识,再来告诉大家如何解答这个问题~
本文目录
#Basic Terminologies of Probability
#Three Approaches of Probability
#Basic Probability Rules
#Conditional Probability
#Important Tips
Independent Events & Disjoint/Mutually Exclusive Events
Calculation of Union and Intersection
01Basic Terminologies of Probability
在正式进入probability的世界前,先让我们通过了解几个基本概念热热身吧~
Concept 1 --- Chance Experiment
Chance Experiment指的是任何能够导致两种或两种以上可能的结果,而不确定到底哪一种结果会发生的活动。最简单的例子就是抛硬币,抛硬币有可能得到硬币正面朝上或者反面朝上两种结果,然而在硬币落地之前我们并不能未卜先知哪面朝上,那么抛硬币就是一种chance experiment。
Concept 2 --- Sample Space
假如我们现在要抛一个六面的骰子,落地后朝上的数字有几种可能性呢? 既然是六面骰子,很明显就有六种可能性嘛。我们可以这样表示六种不同的可能结果:
S = {1, 2, 3, 4, 5, 6}
这里的S指代的就是sample space —— 一个chance experiment的所有可能结果的集合。 因为sample space包含了所有可能的结果,所以一个sample space中所有结果的概率之和肯定是等于1的!
Concept 3 --- Event
假如我们现在又要抛一次六面骰子,我想知道双数朝上的可能性是多少。那我首先得先列出双数朝上的可能结果有哪些:
E = {2, 4, 6}
这里的E代表的是event,它指的是任何sample space的子集。比如在我们抛骰子的例子中,双数朝上的可能结果的集合(E)就是所有可能结果的集合(S)的其中一个子集。
不过这里event是可以由我们自行定义的,这取决于我们关心的问题是什么。比如刚才我想知道双数朝上的可能性,那我定义的event就是双数朝上的可能结果的集合。但如果我想知道数字<=4的可能性,那我可以根据这个新问题可以定义event为数字<=4的可能结果的集合:
E = {1, 2, 3, 4}
Concept 4 --- Complement
Complement有补充的意思,在概率中指的是补集。它的含义就包含在名称中:所有不在event中的可能结果。所以complement和event是互相补充的关系,两个集合中的结果出现的概率之和等于1。
再回到前面的例子,如果我关心双数朝上的结果,那么我定义的E就是{2, 4, 6}。那补充这个event的complement是什么呢? 既然所有可能的情况是S = {1, 2, 3, 4, 5, 6},在event里的结果包括{2, 4, 6}, 能剩下的不在event里的结果就是:
EC = {1, 3, 5}
EC就是我们的complement。
Concept 5 --- Venn Diagram
Venn Diagram是一种可以展示sample space、event、completement之间的关系的图(见图1):
图1
整个大长方形代表sample space,中间的橙色椭圆表示event(E),而剩下的部分就是completement(EC)啦~(看起来莫名有点像荷包蛋是怎么回事…)
虽然它看起来挺简单的,但用来分析两个或两个以上不同的events之间的关系,很有用!(详见下文例题)
Concept 6 --- Union
请让我们继续扔六面骰子。现在我又对新事件产生好奇了——我想知道朝上的数字是奇数(odd number)或是素数(prime number)的概率是多少。 我们会发现六个数字属于单数或是属于素数其实是两个不同的集合,也就是两个不同的events,而且还是两个有交集的集合。如果我们用O表示骰子朝上的数字属于奇数这一事件,P来表示数字属于素数这一事件,可以得到:
O = {1, 3, 5}
P = {2, 3, 5}
一个描述O或P发生的event应该是什么样的呢?“或”意味着某个数字只要存在于O或P其中一个event,这个数字就应该被包含在这个描述O或P发生的event里,那么:
O or P = {1, 2, 3, 5}
O or P就是O与P这两个事件的union(并集)——非常显而易见的,两个事件里的元素被“并”在一起,形成了O or P这个union,在O中或在P中或在两者中的元素都被包含在O和P的union里。
并集有它的专属符号:∪(正好对应Union)。A∪B = A or B = {elements in A,elements in B, elements in both A and B}。 如果用Venn Diagram来展示O∪P(= O or P)就应该是这样的(见图2):
图2
绿色圆圈是event O,包含所有的奇数;红色圈圈是event P,包含所有的素数;整个篮框框是sample space,包含所有可能的结果{1,2,3,4,5,6}。 那么O or P的意思就是在绿圆圈或在红圆圈里的所有元素,也就是涂黄的两个圆圈并在一起的区域。4和6孤零零地呆在外面,是因为它俩很可怜的既不是奇数也不是素数。
Concept 7 --- Intersection
现在,让我们换个跟上一个问题很像的新问题:朝上的数字既是奇数(odd number)又是素数(prime number)的概率是多少? 换句话说,就是问这两个events(O和P)同时发生的可能性是什么。“和”与“同时发生”意味着只有既存在于event O又存在于event P的元素才被包含在描述O和P一起发生的event里,那么:
O and P = {3, 5}
O and P就是O与P这两个事件的intersection(交集)——同样显而易见,两个事件里的元素相交的部分被提取出来,形成了O and P这个intersection,只有同时在两者中出现的元素会被包含在O和P的intersection里。
交集也有它的专属符号:∩(正好和并集的符号上下颠倒了,别弄混了喔)。A∩B = A and B = { elements in both A and B}。 用来表示O∩P(= O and P)的Venn Diagram应该怎么画呢?你可以试一试嘛?(见图3)
图3
O ∩ P 也就是代表两个events的两个圆圈相交的浅黄色面积,落在相交部分的3和5正好既是奇数又是素数。
02Three Approaches of Probability
获得某事件发生的概率的方式主要有三种,让我们来逐一看看~
(1)Classical Approach
当在一个sample space中所有结果出现的可能性相等时,如果我们把其中任意一种结果称为事件E,那么E发生的概率P(E) = 出现此结果的次数/sample space中所有可能结果的数量。
比如抛硬币一共有两种结果,而且从理论上讲两种结果出现的可能性是相等的,出现任意其中一种结果的概率P(E)=50%,这是从理论出发的非常理想的情况。
(2)Subjective Approach
概率有时可以被看作对个人对某一特定结果将发生的信念强度的衡量。比如AP马上就要出分了,小明觉得他统计必5分,他认为这个事件发生的概率是99.99%。而当他妈妈听到他的狂言后,开始抖落出他考前两天才翻开的巴郎、昼夜苦读才勉强翻完了三分之二、第三天顶着大大的黑眼圈进考场的事实,并笃定他能有3分就该谢天谢地了,5分就是做梦,发生的概率大概就是0.1%吧。 很明显,这种基于主观信念得到的某事件发生的概率很不牢靠,不同的人可能会根据自己的主观观点对同一结果分配不同的概率,比如上文某些极端自信的同学。
(3)Empirical Approach
在第三种方式中,概率是由实验或历史数据确定的,是一种比较常见的方式。因为主观推断太不可靠,像抛硬币、掷骰子这种可能结果非常明确的事件少之又少,大部分概率还是得通过过往数据推测。
此时事件E出现的概率P(E),被定义为在很长一串试验中,E出现的相对频率。如果试验的次数很多很多,那么P(E)≈number of times E occurs/number of trials。 这就涉及到了Law of Large Numbers (LLN)。如果只通过观察下图(图4)和LLN这个名字,你是否能推断出这个定律的含义呢?
图4 相信你已经猜到了,LLN指的就是:随着随机实验重复次数的增加,某一事件发生的相对频率将趋近于真实概率。
如图4所示,如果我们想要通过试验的方式得到硬币落地朝上的概率,我们进行的试验越多,得到的结果就越接近于事件出现的真实概率50%。
结 语
好啦,本期的内容就先到这里结束了~是不是还有些意犹未尽?那就请期待下一期对probability更深入的讲解吧!(题目里的答案也将会在下期揭晓哦~) 别忘了收下这份思维导图总结噢