概率分布

扶醉桌前 提交于 2019-12-05 12:16:19

基本概念

随机变量

在做实验时,常常是相对于试验结果本身而言,我们主要还是对结果的某些函数感兴趣。

例如,在掷骰子时,我们常常关心的是两颗骰子的点和数,而并不真正关心其实际结果;

就是说,我们关心的也许是其点和数为7,而并不关心其实际结果是否是(1,6)或(2,5)或(3,4)或(4,3)或(5,2)或(6,1)。

我们关注的这些量,或者更形式的说,这些定义在样本空间上的实值函数,称为随机变量。

古典概率

概率依其计算方法不同,可分为古典概率、试验概率主观概率 
人们最早研究概率是从掷硬币掷骰子和摸球等游戏和赌博中开始的。
这类游戏有两个共同特点:
一是试验的样本空间(某一试验全部可能结果的各元素组成的集合)有限,如掷硬币有正反两种结果,掷骰子有6种结果等;
二是试验中每个结果出现的可能性相同,如硬币和骰子是均匀的前提下,掷硬币出现正反的可能性各为1/2,掷骰子出出各种点数的可能性各为1/6,具有这两个特点的随机试验称为古典概型或等可能概型。
计算古典概型概率的方法称为概率的古典定义或古典概率。
 
定义:
关于古典概率是以这样的假设为基础的,即随机现象所能发生的事件是有限的、互不相容的,而且每个基本事件发生的可能性相等。
例如,抛掷一枚平正的硬币,正面朝上与反面朝上是唯一可能出现的两个基本事件,且互不相容。
如果我们把出现正面的事件记为E,出现事件E的概率记为p(E),则:P(E)=1/(1+1)=1/2
一般说来,如果在全部可能出现的基本事件范围内构成事件A的基本事件有a个,不构成事件A的事件有b个,则出现事件A的概率为:
P(A)=a/(a+b)

条件概率

基本概念:

条件概率是指事件A在事件B发生的条件下发生的概率。

条件概率表示为:P(A|B),读作“A在B发生的条件下发生的概率”。若只有两个事件A,B,那么,

参考:https://baike.baidu.com/item/%E6%9D%A1%E4%BB%B6%E6%A6%82%E7%8E%87

离散变量

可取值能一个个列出来的变量称为离散变量,可取值能充满一个区间的变量称为连续变量。
10名患者痊愈人数 

, 及掷币结果 

 是离散变量。正常人体温的测定值 

 是连续变量。 
10名患者,服用甲药痊愈人数 

 ,服用乙药痊愈人数也是 

  ,可见,仅有随机变量的可取值无法全面反映药效,还必须考虑取每一个值的概率。

连续变量

符号x如果能够表示对象集合S中的任意元素,就是变量。
如果变量的域(即对象的集合S)是离散的,该变量就是离散变量;如果它的域是连续的,它就是连续变量 
 
连续变量由于不能一一列举其变量值,只能采用组距式的分组方式,且相邻的组限必须重叠
如以总产值、商品销售额、劳动生产率、工资等为标志进行分组,就只能是相邻组限重叠的组距式分组。 

期望值

期望值是随机试验在同样的机会下重复多次的结果计算出的等同“期望”的平均值。

需要注意的是,期望值并不一定等同于常识中的“期望”——“期望值”也许与每一个结果都不相等。

(换句话说,期望值是该变量输出值的平均数。期望值并不一定包含于变量的输出值集合里。)

参考:https://baike.baidu.com/item/%E6%9C%9F%E6%9C%9B%E5%80%BC

大数定律

大数定律(law of large numbers),是一种描述当试验次数很大时所呈现的概率性质的定律

但是注意到,大数定律并不是经验规律,而是在一些附加条件上经严格证明了的定理,它是一种自然规律因而通常不叫定理而是大数“定律”。

而我们说的大数定理通常是经数学家证明并以数学家名字命名的大数定理,如伯努利大数定理。

参考:https://baike.baidu.com/item/%E5%A4%A7%E6%95%B0%E5%AE%9A%E5%BE%8B

离散变量概率分布

二项分布

概率论和统计学中,二项分布是n个独立的是/非试验中成功的次数的离散概率分布,其中每次试验的成功概率为p。

这样的单次成功/失败试验又称为伯努利试验。实际上,当 

 时,二项分布就是伯努利分布,二项分布是显著性差异的二项试验的基础 。

参考:https://baike.baidu.com/item/%E4%BA%8C%E9%A1%B9%E5%88%86%E5%B8%83

伯努利分布

伯努利分布指的是对于随机变量X有, 参数为p(0<p<1),如果它分别以概率p和1-p取1和0为值。EX= p,DX=p(1-p)。

伯努利试验成功的次数服从伯努利分布,参数p是试验成功的概率。

伯努利分布是一个离散型机率分布,是N=1时二项分布的特殊情况,为纪念瑞士科学家詹姆斯·伯努利(Jacob Bernoulli 或James Bernoulli)而命名。

参考:https://baike.baidu.com/item/%E4%BC%AF%E5%8A%AA%E5%88%A9%E5%88%86%E5%B8%83

泊松分布

泊松分布的概率函数为:

泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生次数。
泊松分布适合于描述单位时间内随机事件发生的次数。
 
泊松分布的期望和方差均为 

特征函数为 

分布的形状

均匀分布

概率论和统计学中,均匀分布也叫矩形分布,它是对称概率分布,在相同长度间隔的分布概率是等可能的。

均匀分布由两个参数a和b定义,它们是数轴上的最小值和最大值,通常缩写为U(a,b)。

参考:https://baike.baidu.com/item/%E5%9D%87%E5%8C%80%E5%88%86%E5%B8%83/954451

正态分布

正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),最早由A.棣莫弗在求二项分布的渐近公式中得到。
C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质。是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。
 
正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线
 
随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。
概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。
当μ = 0,σ = 1时的正态分布是标准正态分布

指数分布

在概率理论和统计学中,指数分布(也称为负指数分布)是描述泊松过程中的事件之间的时间的概率分布,即事件以恒定平均速率连续且独立地发生的过程。这是伽马分布的一个特殊情况。
它是几何分布的连续模拟,它具有无记忆的关键性质。 除了用于分析泊松过程外,还可以在其他各种环境中找到。
 
指数分布与分布指数族的分类不同,后者是包含指数分布作为其成员之一的大类概率分布,也包括正态分布,二项分布,伽马分布,泊松分布等等。
 
指数函数的一个重要特征是无记忆性(Memoryless Property,又称遗失记忆性)。
这表示如果一个随机变量呈指数分布,当s,t>0时有P(T>t+s|T>t)=P(T>s)。
即,如果T是某一元件的寿命,已知元件使用了t小时,它总共使用至少s+t小时的条件概率,与从开始使用时算起它使用至少s小时的概率相等。
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!