概率论在实际⽣活的例⼦_烧脑预警!5个⽣活中的概率问题,
告诉你直觉多不靠谱...
50部高智商烧脑电影推荐⽊果读书会·⾏业探秘 NO.22
内容提要
从疾病检测、抽样调查、⾦融投资、到天⽓预报、⽣物遗传,甚⾄到抢红包、对象、玩抽卡⼿游,概率已经深⼊我们⽣活的每个⾓落,但很多时候,我们凭借直觉做出的概率判断,都与结果相差很⼤。
本期⽊果读书会,数学爱好者乔柯通过5个⽣活中的概率问题,带你发现数学之美,看看靠直觉算出的概率有多么的不靠谱。
分享嘉宾
乔柯
(友情提⽰,下⽂含有⼤量烧脑、计算、逻辑判断等问题,请按⼤脑承受程度酌量服⽤
)
数学中好玩的问题实在是太多了,⽐如说“哥尼斯堡七桥问题”,也就是著名的⼀笔画问题,它促使了图论和⼏何拓扑的诞⽣;⽐如说“四⾊定理”——任何⼀张地图只⽤四种颜⾊就能使具有共同边界的国家着上不同的颜⾊,但它的证明⽤了两台计算机算了1200个⼩时,再⽐如说你⼀定听过的哥德巴赫猜想,陈景润攻克了“1+2”,这⾥的“1+2”可不是“=3”的意思哦。
上⾯这些问题看起来简单,讲起来就很难了。作为⼀个数学爱好者,我今天想讲点概率论。⼀来,概率论与我们的⽣活⽐较贴近。⼆来,⼈习惯于⽤确定的眼光看世界,如果你的⽕车票写着30%概率7点开车,70%概率8点开,你⼀定会抓狂的。
我们对于确定性的偏爱促使了我们对于终极真理的追求,但也让我们对很多现实中发⽣的不确定事件产⽣困惑,我们时常凭直觉推算概率,但这些直觉往往都是错的。
为了证明这⼀点,我们不妨来看⼏个在⽣活中也会遇到的概率问题。
三门问题
假设你去参加⼀个电视综艺节⽬。台上准备了三扇门。主持⼈告诉你,其中⼀扇门后藏有轿车,⽽另外两扇门后只有⼭⽺,你可以选择⼀扇门,赢得门后的奖品。我们假设你更想要车⽽不是⽺。
接下来,你做出了选择,我们假设你选了A门,主持⼈事先知道门后有什么,于是他从剩下的两扇门中打开了⼀扇后⾯是⽺的门,我们假设他开的是B,最后⼀扇是C。
主持⼈关切的问你,我已经帮你去掉⼀个错误答案了,你是否要从A换成C呢?”
请⼤家在不百度的情况下考虑⼀下,做出⾃⼰的选择。
1.不换,依然选择A。因为换门也不会提⾼赢得轿车的概率。
2.换,选择C,赢得轿车的概率会提⾼。
“三门问题”也称“蒙提霍尔问题”,他的原型来⾃马丁·加德纳(Martin Gardner)在1959年的《数学游戏》专栏中提出的“三囚犯问题”。两个问题虽然描述上差得很远,但实质是⼀样的。
1990年,有⼈结合主持⼈蒙提霍尔的电视节⽬将之改编成如上形式寄给了《展⽰杂志》(Parade Magazine)的专栏作家玛丽莲·沃斯·莎凡特(Marilyn vos Savant)。这位玛丽莲来头也不⼩,10岁时智商就⾼达228,被吉尼斯世界纪录认定为拥有最⾼智商⼥性(2008年为⽌)。她在专栏⾥回答应该选择“换”。结果引起了轩然⼤波。
近万名读者写信表⽰反对,其中有博⼠头衔的有上千⼈,其中92%认为她错了。65%来⾃⼤学的信中,
多数是来⾃数学和科学的院系,他们都反对她的答案,认为这只是⼥⼈的直觉,劝她修了概率课后再谈这问题。
反对者们认为,当主持⼈去掉⼀个错误的门后,⽺和车分别在余下没打开的门中随机放置,每扇门后有车的概率都是50%。
然⽽事实是这样吗?我先告诉⼤家答案,⼀定要换,因为你获得汽车的概率会从1/3上升到2/3。
为什么呢?我们来具体计算⼀下。⼤家⾼中时⼀定学过概率论,但估计也都忘的差不多了,所以我们不使⽤公式,⽽是强调思考的⽅法。
解法⼀:
先明确⼀下——我们的⽬标是要轿车,所以要考察换门赢得轿车的可能性,与不换门赢得轿车的可能性,哪个更⾼?
不换门并猜中,意味着我们⼀开始就需要猜中,这个概率是1/3。
换门并猜中,意味着我们⼀开始只需要选错门就可以了,主持⼈会从剩下的⼀对⼀错中帮我们去掉⼀个错误答案,剩下的⼀个⼀定是对的,那么我们换门就⼀定可以换到轿车,⽽⼀开始就选错的概率是三分之⼆。
因此,我们发现换门策略的胜率是不换门策略的胜率的两倍。
如果你觉得这个逻辑听起来很绕,或者还是不愿相信,我还准备了更为直观的说明。
解法⼆:
假设我们玩900次(或更多),车随机放在三扇门后,期望上来看,应该有300次放在A门后,300次放在B门后,300次放在C门后。分别记No.1~300,No.301~600,No.601~900。
你⼀开始也是随机地选,这意味着在No.1~300中,你有100次选到A,100次选到B,100次选到C,其他情况以此类推。
我们来考察你选择A,主持⼈打开B的情形下,究竟换还是不换。(其他情形同理)
在No.1~100中,主持⼈会等概率的打开B或者C,假设No.1~50中打开了B,No.51~100中打开了C。
No.301~400中,不会打开B,只能打开C。
No.601~700中,不会打开C,⼀定会打开B。
因此在我们的假设情况下。只有No.1~50和No.601~700这些情况成⽴。
这之中车在A后有50个,车在C后有100个。
因此选C(即换)的胜率为100/(50+100)=2/3 是选A(不换)的两倍。
其实在后⼀种证明中,我们通过⾮常直观的⽅式引⼊了⼀个重要的思想,就是条件概率。我们计算的并不是,A与C中有车的概率。⽽是在主持⼈打开了B的情况下,A与C中有车的概率。前者的确是等概率的随机分布,但后者,当主持⼈打开了B这⼀情况实际发⽣
后,No.51~100这些情况就不能发⽣了,数学上讲,也就是从我们的样本空间⾥被剔除了。
有这样⼀则笑话,据说⼀个飞机上有的概率为⼗万分之⼀,有个⼈觉得这个概率还是不够⼩,毕竟每天升空的飞机也不是⼩数⽬。他从来不敢坐飞机。但他的朋友突然有⼀天在飞机上遇到了他,吃惊地问,你咋不害怕了?
他说,飞机上有⼀个的概率不是⼗万分之⼀么?那么飞机上同时有两个的概率就是⼀百亿分之⼀吧?
朋友说,对。
这⼈说,⼀百亿分之⼀⾜够⼩了,因为我已经带了⼀颗上来。
事实上,当他⾃⼰带着上飞机后,存在⼀个这件事就确定了下来,是必然发⽣的。所以存在两颗的可能性不再是⼗万分之⼀乘以⼗万分之⼀。⽽是1乘以是按⼗万分之⼀。
从条件概率的⾓度考虑的话,由于他⾃⼰带了⼀颗,因此样本空间中不存在的情况已经剔除了,样本空间缩⼩了⼗万分之⼀,所以,飞机上同时出现两个的概率会变⼤⼗万倍,依然是⼗万分之⼀,⽽不是⼀百亿分之⼀。
星期⼆男孩问题
你偶遇多年没见的⽼同学,发现她早已结婚⽣⼦。你便打听是男孩⼥孩。
⽼同学卖着关⼦说道。
其中⼀个是男孩,另⼀个是男孩的可能性有多⼤呢?
你感到挺莫名,按照上⾯所说的,⼀个男孩是已经发⽣的条件,不会对另⼀个孩⼦的性别产⽣影响。那么另⼀个是男还是⼥的概率,不是50%吗?
我问过的所有⼈⼏乎都这么认为。这不是⼀个⽣物学题,咱们就考虑理想情况,⽣男⽣⼥完全随机。其实正确的答案是1/3。听我⼀点⼀点分析。
我们假设有10000对夫妇都⽣了两个孩⼦,那么应该有2500个家庭是两个男孩、2500个家庭是两个⼥孩,5000个家庭是⼀男⼀⼥。
但是我们知道⼀定有⼀个是男孩,所以(⼥,⼥)这种情况不存在,因此,另⼀个是男孩的概率只有(男,男)也就是
2500/(2500+2500+2500)=1/3。⽽⼥孩的概率是2/3。
如果我把问题改⼀下呢?
⼀对夫妻有两个⼩孩,已知其中⼀个是⽩天出⽣的男孩,请问另⼀个是男孩的概率是多少?
⼀对夫妻有两个⼩孩,已知其中⼀个是⿊⽪肤的男孩,请问另⼀个是男孩的概率是多少?
⼀对夫妻有两个⼩孩,已知其中⼀个是O型⾎的男孩,请问另⼀个是男孩的概率是多少?
⼀对夫妻有两个⼩孩,已知其中⼀个出⽣在星期⼆的男孩,请问另⼀个是男孩的概率是多少?
⼀对夫妻有两个⼩孩,已知其中⼀个符合某种筛选条件n(该条件必须概率均等,如⼀周每天出⽣概率都⼀样),请问两个都是男孩的概率是多少?还是1/3吗?
我给出⼀个计算,有兴趣的话可以看看。我这⾥假设筛选条件是n,⽐如⾎型,就是n=4,⽩天⿊天n=2,星期n=7故对于⼀般的n,答案为(2n-1)/(4n-1)。
实际上,随着n的变⼤,结果越来越趋近1/2。也就是说,如果我说其中⼀个男孩是2000年1⽉2⽇出⽣,喜欢画画,叫⼩明。这么多筛选条件下,另⼀个⼈⼏乎可以确定50%的概率是男孩。
⼤家⼀定超级疑惑,你说得好像都对,可我怎么就是不愿意相信。这不应该啊!
⼤家直觉的答案都是1/2。但其实你弄错了问题。我只需要稍微改动⼏个字,答案就是50%了。
你的⽼同学指着眼前的孩⼦告诉你,“他是我⼉⼦”。再问你,你猜我家⾥另⼀个孩⼦是男孩的概率是多少?毫⽆疑问答案是50%,因为⾯前的孩⼦和家⾥的孩⼦毫⽆关系。
那么这两个问题差在哪⾥了呢。就在于⼀开始问的题⽬,实际上是缺少信息量的。你只知道其中有⼀个,但你不知道是哪⼀个。在这样的情况下,你需要考虑两个孩⼦之间的顺序问题。⽽当我明确告诉你⾯前的孩⼦是男孩时,他被确定了下来,不存在顺序问题。
这个问题是不是有点毁三观,⼤家可以慢慢消化⼀下
。
艾滋病检测,阳性就是患病吗?
其实这是概率论教材中的经典例题,理科⽣可能会很熟悉。我也就简单的介绍⼀下。
⽬前,检测HIV感染的⽅式是⾎清学HIV抗体检测,根据数据,真正感染HIV的病⼈接受检测后结果呈阳性的概率为99.8%,也就是说可以⼏乎百分百判断出艾滋病的感染。如果⼀个⼈不患病那么接受检测后结果呈阴性的概率为99%,也就是说健康⼈⼏乎不会被误诊。这个检测⽅法看起来还是很靠谱的。
⼩明是A国居民,A国的艾滋病感染率0.0825%,也就是平均⼀百万个⼈才会有825个患者。有⼀天他进⾏检测结果是阳性,你觉得他有多⼤可能真的得了艾滋病?
答案可能会出乎你的想象。
我们⽤贝叶斯公式计算在检测结果呈阳性的条件下,患艾滋病的概率。答案仅有7.613%,也就是即便检查结果为阳性,真正感染HIV的可能性仅有不到8%,但是我们的检测⽅法明明看起来⼗分可靠?
实际上,问题出现在感染率上,检验出错的可能性的确很⼩,但是相⽐于艾滋病的感染率,这种出错的量级实际上就很⼤了。我们来举例⼦看看。
假设有⼀百万⼈,按照艾滋病的发病率,他们中实际上感染的⼈有825⼈。让他们都接受检测,因为健康⼈接受检测后仍有1%的可能性结果呈阳性,即其中约9992名健康⼈被误诊⽽呈阳性。825名感染的病⼈经过检测后,约823⼈结果为阳性(2⼈被误诊为阴性)。那么我们来观察所有结果是阳性的⼈中,实际患有艾滋病的⽐例为823/(823+9992)约为7.6%。
⼀百万⼈中,真阳性只有823⼈,但是假阳性有近1万⼈,这就导致了即便结果是阳性,⼤多数情况是“误诊”。
这也就是为什么在艾滋病例的筛查中,我们要采取多次检测。同样的数据下,如果某⼈检测三次都显⽰阳性,可以计算出他患病的概率⾼达99.878%,这也就是为什么艾滋病毒检查通常需要初筛试验、复检、最终确认试验,并且已确认试验的结果为最终结果。
彭尼的游戏
⼈们对概率的⼀个常发⽣的误解,叫做赌徒谬误。简单地说就是我连续输了⼀晚上了,虽然赢了的概率不⾼,但是连续输的概率更低,那么我接下来就该要赢了!
这种想法更多见于抽卡类⼿游中,⽐如某游戏ssr的出货率是1%,有⼈抽了100发没有出,此时已经超过了期望次数,于是觉得之后⼀定会出,⼜⼤⼒氪⾦抽了100,然⽽还是⽆事发⽣。最后⽓急败坏地⼤骂官⽅作假。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论