泊松分布

数据类型与数据分布

流过昼夜 提交于 2020-04-03 14:54:05
1.离解数据与离散分布 离解数据通常是那些只能用整数表现的数据。比如某省的人口数,宇宙中单位体积内的星球个数等。 1.1统计中常见的描述离散型数据的离散分布: 1.退化分布: 一个随机变量X以概率1取某一常数,即 P{X=a}=1,则称X服从a处的退化分布。确定分布。 2. 两点分布 : 一个随机变量只有两个可能取值, 设其分布为 P { X = x 1 } = p , P { X = x 2 } = 1 - p , 0 < p < 1, 则称 X 服从 x 1 , x 2 处参数为 p 的两点分布。 当如果 X只取 0 , 1两个值, 其概率分布为P { X = 1} = p , P { X = 0} = 1 - p , 0 < p < 1。则称 X服从参数为 p的 0 - 1分布 , 也称 X是参数为 p的伯努利随机变量. 此时EX = p , DX = p (1 - p)。【抛一枚硬币】 3.n个点上的均匀分布: 设随机变量X取n个没不同的值,且其概率分布为 P { X = x i } = 1/n,(i=1,2,3,...,n),则称X服从n个点{x1,x2,...,xn}上的均匀分布。【抛一枚骰子】 古典概型中经常出现此类分布情形。 4. 二项分布 :n重伯努利试验,成功k次的概率分布。 【判断是否为伯努利试验的关键是每次试验事件A的概率不变

二项分布和泊松分布的关系

只愿长相守 提交于 2020-02-26 06:14:18
定义 二项分布:P(X=k)=C n k p k (1-p)(n-k) 抛硬币,假设硬币不平整,抛出正面的概率为p,那么在n次抛硬币的实验中,出现k次正面的概率 泊松分布: p(X=k)=λ k e -λ /k! 公共汽车站在单位时间内,来乘车的乘客数为k 的概率。假定平均到站乘客数为λ 二项分布和泊松分布的关系 n很大,p很小时泊松分布可以用来近似二项分布,此时 λ=np 二者关系的直观解释: 从泊松分布说起。把单位时间分成n等分,称为n个时间窗口。那么在某个时间窗口来一个客人的概率为λ/n.(稍后解释,其实这是不对的)那么我们可以将泊松分布和二项分布对应起来:在某个时间窗口里来了乘客 对应 抛出正面硬币;来了k个客人 对应 抛出k个正面。因此,泊松分布和二项分布近似了。 问题 :为什么n要足够大,p要足够小? 因为在分时间窗口的时候有个假设:每个时间窗口最多只有一个乘客到达。 来源: https://www.cnblogs.com/englefly/archive/2012/05/18/2507707.html

统计学:几何分布、二项分布、泊松分布

人走茶凉 提交于 2020-01-25 21:58:15
一、几何分布 假设某种赌博游戏的胜率为 0.2 ,那么意味着你玩第一次就胜出的概率为 0.2 。 那玩第二次才胜出呢?“玩第二次才胜出”就意味着玩 第一次是失败的 ,而直到第二次才胜出,那么这件事发生的概率就是 0.8×0.2=0.16 。 那么第三次、第四次呢? 如果用 p 代表某件事发生的概率,则它不发生的概率为 1-p ,我们将此概率称为 q ,于是可以用下式计算任何具有这一性质的概率: 这个公式叫做概率的 几何分布 。变量 X 表示为了取得第一次成功所需进行的试验次数,为了在第 r 次试验时取得成功,首先要 先失败r-1次 。 几何分布同样适用于不等式。 P(X > r) 指的是为了取得第一次成功需要试验 r 次以上的概率。为了让需要进行的试验次数大于 r ,意味着前 r 次试验必须以失败告终。也就是说,将失败概率乘上 r 次就是所求的概率: 利用这个,可以求出 P(X ≤ r) ,即为了取得一次成功而需要尝试 r 次或 r 次以下的概率: 如果一个变量 X 的概率符合几何分布,且单次试验的成功概率为 p ,则可以写作: 几何分布的期望模式 在数学期望已知的情况下,就可以得出试验在成功之前需要试验的次数的期望值。 假设 X~Geo (0.2) ,那么: 如果将 x P (X=x )的累计总和画成图形: 将 xP (X=x) 的累计总和画成图形后,可以看出,随着 x 的变大

概率统计15——泊松分布

↘锁芯ラ 提交于 2020-01-20 22:04:07
  很多场合下,我们感兴趣的试验进行了很多次,但其中成功的却发生的相当稀少。例如一个芯片的生厂商想要把生产出的芯片做一番检测后再出售。每个芯片都有一个不能正常工作的微小概率p,在数量为n的一大批芯片中,出现r个故障芯片的概率是多少? 相关阅读 单变量微积分30——幂级数和泰勒级数 概率统计13——二项分布与多项分布 二项式的泊松近似   问题似乎很简单,芯片故障的概率符合二项分布X~B(n,p),我们可以用二项分布计算出现r个故障芯片的概率:   实际问题是,芯片的数量很大,但故障率又是一个很小的数值,虽然二项分布提供了一个精确的概率模型,但计算起来并不容易,而且在计算时还会丢掉大量的精度。既然这样,还不如一开始就使用一个近似式计算预期的概率。   我们首先看看全部芯片都合格(每次试验都不成功)的概率:   等号两边同时取对数:   接下来需要利用一点无穷级数和积分的知识:   同时我们也知道∫dx/1-x的精确表达:   由此可以得到:   当p远远小于1,且np2远远小于1时,可以忽略p的高阶项,得到近似式:   n个芯片全部合格的概率约等于e-np,出现r个故障芯片的概率又是多少呢?直接计算并不容易,幸运的是,我们可以用二项分布精确表达r个和r-1个故障芯片的概率的比值:   当n很大时,对于少量r个故障芯片来说,n-(r-1) ≈ n;对于很小概率p来说,p/(1-p) ≈

概率统计15——泊松分布

若如初见. 提交于 2020-01-20 20:55:20
  很多场合下,我们感兴趣的试验进行了很多次,但其中成功的却发生的相当稀少。例如一个芯片的生厂商想要把生产出的芯片做一番检测后再出售。每个芯片都有一个不能正常工作的微小概率p,在数量为n的一大批芯片中,出现r个故障芯片的概率是多少? 相关阅读 单变量微积分30——幂级数和泰勒级数 概率统计13——二项分布与多项分布 二项式的泊松近似   问题似乎很简单,芯片故障的概率符合二项分布X~B(n,p),我们可以用二项分布计算出现r个故障芯片的概率:   实际问题是,芯片的数量很大,但故障率又是一个很小的数值,虽然二项分布提供了一个精确的概率模型,但计算起来并不容易,而且在计算时还会丢掉大量的精度。既然这样,还不如一开始就使用一个近似式计算预期的概率。   我们首先看看全部芯片都合格(每次试验都不成功)的概率:   等号两边同时取对数:   接下来需要利用一点无穷级数和积分的知识:   同时我们也知道∫dx/1-x的精确表达:   由此可以得到:   当p远远小于1,且np 2 远远小于1时,可以忽略p的高阶项,得到近似式:   n个芯片全部合格的概率约等于e -np ,出现r个故障芯片的概率又是多少呢?直接计算并不容易,幸运的是,我们可以用二项分布精确表达r个和r-1个故障芯片的概率的比值:   当n很大时,对于少量r个故障芯片来说,n-(r-1) ≈ n;对于很小概率p来说,p/(1

八种概率分布模型

╄→尐↘猪︶ㄣ 提交于 2020-01-14 02:43:58
一、0-1分布 X 0 1 P p 1 − p \def\arraystretch{1.5} \begin {array}{c:c:c} X & 0 & 1 \\ \hline P & p & 1-p \end {array} X P ​ 0 p ​ 1 1 − p ​ ​ 0-1分布概率为: P { X = k } = p k ( 1 − p ) 1 − k , 其 中 k = { 0 , 1 } P\{X=k\}=p^k(1-p)^{1-k},其中k=\{0,1\} P { X = k } = p k ( 1 − p ) 1 − k , 其 中 k = { 0 , 1 } 例: 二、几何分布 事件发生的概率为 p p p ,前 k − 1 k-1 k − 1 次不发生,第 k k k 次发生的概率为: P { X = k } = ( 1 − p ) k − 1 × p , 其 中 k = 1 , 2 , 3... P\{X=k\}=(1-p)^{k-1}\times p,其中k=1,2,3... P { X = k } = ( 1 − p ) k − 1 × p , 其 中 k = 1 , 2 , 3 . . . 例如:射击中,射中的概率为0.6,连续射击,第 k k k 次射中的概率 三、二项分布 事件发生的概率为 p p p ,做了 n n n 次实验,发生了 k k k

泊松分布的期望和方差推导

ぃ、小莉子 提交于 2019-12-09 05:23:49
泊松分布是一个离散型随机变量分布,其分布律是: P ( X = k ) = λ k e − λ k ! //--> 根据离散型随机变量分布的期望定义,泊松分布的期望: E ( X ) = ∑ k = 0 ∞ k ⋅ λ k e − λ k ! //--> 因为k=0时: k ⋅ λ k e − λ k ! = 0 //--> 所以: E ( X ) = ∑ k = 1 ∞ k ⋅ λ k e − λ k ! //--> 做一下变换: E ( X ) = ∑ k = 1 ∞ k ⋅ λ k e − λ k ! = ∑ k = 1 ∞ λ k e − λ ( k − 1 ) ! = ∑ k = 1 ∞ λ k − 1 λ e − λ ( k − 1 ) ! = λ e − λ ∑ k = 1 ∞ λ k − 1 ( k − 1 ) ! //--> 这里需要用到泰勒展开式,我们知道常用的泰勒展开式中: e x = 1 + x + x 2 2 ! + x 3 3 ! + . . . + x n n ! + . . . = ∑ k = 1 ∞ x k − 1 ( k − 1 ) ! //--> 因此,泊松分布的期望为: E ( X ) = λ e − λ ∑ k = 1 ∞ λ k − 1 ( k − 1 ) ! = λ e − λ e λ = λ //--> 对于方差 D ( X ) //

Probability Theory and Mathematical Statistics

你。 提交于 2019-12-05 15:19:23
概率论 事件的差 \(P(B-A) = P(B)-P(AB)\) 古典概型 可能性相同 个数有限 独立性 乘法公式 \(P(AB) = P(A)P(B|A)\) 推广: \(P(A_1A_2A_3...A_n) = P(A_1)P(A_2|A_1)...P(A_n|A_1A_2...A_{n-1})\) 独立性 若 \(P(A_1A_2A_3...A_n) = P(A_1)P(A_2)...P(A_n)\) 则称 \(A_1,A_2,...,A_n\) 相互独立 独立性相当于:内在没有联系,它们不会影响彼此的发生 推论: 性质1:$P(B) = P(B|A) $ 性质2:这些事情取反也是相互独立,很好证明 全概率公式和贝叶斯公式 全概率公式 \(P(B) = \sum_{i=1}^{n} {P(A_i)P(B|A_i)}\) "全"概率公式, \(P(B)\) 被分解成多部份之和 贝叶斯公式 \(P(A_i |B) = \frac{P(A_iB)}{P(B)}\) \(P(B) = \sum_{i=1}^{n} {P(A_i)P(B|A_i)}\) \(P(A_i |B) = \frac{P(A_iB)}{\sum_{i=1}^{n} {P(A_i)P(B|A_i)}}\) 我们要知道一个概念: \(P(A_i)\) 叫做”先验概率“; 随机变量 离散型随机变量 0-1分布 又名

11- 常见的分布

强颜欢笑 提交于 2019-12-04 04:28:34
目录 常见的分布 1. 0-1分布 2. 几何分布 3. 二项分布 4. 泊松分布 泊松分布与二项分布 5. 超几何分布 6. 均匀分布 7. 指数分布 8. 正太分布 常见的分布 参考: https://www.cnblogs.com/pinking/p/7898313.html 1. 0-1分布 概率函数为: \[P\{X=k\}=p^k(1-p)^k\] , 其中k取0或者1. 只有两种结果 试验只做一次 2. 几何分布 \(P(A)=p\) , 第 \(k\) 次首次发生,前 \(k-1\) 次未发生,概率函数为: \[P\{X=k\}=p^k(1-p)^{k-1}\] 3. 二项分布 \(P(A)=p\) , \(n\) 次试验, 发生了 \(k\) 次, 概率函数为: \[P\{X=k\}=C_n^kp^k(1-p)^{n-k}\] 二项分布最可能的值 $如果(n+1)p为整数 , 那么最可能的值就是(n+1)p , (n+1)p-1 $ \(如果(n+1)p不为整数 , 那么最可能的值就是[(n+1)p] 取整.\) 4. 泊松分布 概率函数为: \[P\{X=k\}=\frac{\lambda^k}{k!}e^{-\lambda}, 其中\lambda >0, k=0,1,2,3,4,....\] 泊松分布的参数 \(λ\) 是单位时间(或单位面积

概率分布汇总

此生再无相见时 提交于 2019-12-03 07:11:24
首先我们需要搞清楚几个概念:概率函数、概率分布、概率密度 我这里只做简单阐述,意在理解概念,可能不严谨。 我们知道变量可分为离散随机变量和连续随机变量; 概率函数 :随机变量取某个值的概率 pi=P(X=ai)(i=1,2,3,4,5,6);以骰子为例,每次摇骰子取值为 1-6,取每个数字的概率为 1/6,这就是离散概率函数; pi=P(X<170);以身高为例,小于 170 的概率,这就是连续概率函数 描述了取某个值或者某一个区间的概率 概率分布 :也叫累积概率函数,随机变量取某些值的概率,也就是取这些值的概率的累加和 pi=P(X=[1, 2]) pi=P(X<170 and X>165) 描述了取某些值或某些区间的概率 概率密度 :它 只针对连续型随机变量 ,连续型随机变量的概率函数也叫概率密度 数学上用如下公式表示概率密度 可以看到 X 的取值是连续的,P 是一个积分 F(x) 左图表示连续型随机变量的概率分布;f(x) 右图表示连续型随机变量的概率密度; f(x) 是 F(x) 的导数 均匀分布 应该说是最简单的分布,它是指在一个取值范围内取到每个值的概率相等; 对于离散型随机变量, 概率函数 为 P(X)=1/a-b  a<b 代表取值范围 对于连续型随机变量,就是可以等概率地取 a b 之间的任一个数 期望:u=(a+b)/2;方差:var=(a-b) 2 /12