正态分布

np.random.normal()函数

China☆狼群 提交于 2019-12-15 16:07:21
这是的np是numpy包的缩写,np.random.normal()的意思是一个正态分布,normal这里是正态的意思。我在看孪生网络的时候看到这样的一个例子:numpy.random.normal(loc=0,scale=1e-2,size=shape) ,意义如下: 参数loc(float):正态分布的均值,对应着这个分布的中心。loc=0说明这一个以Y轴为对称轴的正态分布, 参数scale(float):正态分布的标准差,对应分布的宽度,scale越大,正态分布的曲线越矮胖,scale越小,曲线越高瘦。 参数size(int 或者整数元组):输出的值赋在shape里,默认为None。 这是的np是numpy包的缩写,np.random.normal()的意思是一个正态分布,normal这里是正态的意思。我在看孪生网络的时候看到这样的一个例子:numpy.random.normal(loc=0,scale=1e-2,size=shape) ,意义如下: 参数loc(float):正态分布的均值,对应着这个分布的中心。loc=0说明这一个以Y轴为对称轴的正态分布, 参数scale(float):正态分布的标准差,对应分布的宽度,scale越大,正态分布的曲线越矮胖,scale越小,曲线越高瘦。 参数size(int 或者整数元组):输出的值赋在shape里,默认为None。 来源

2019-12-12-随笔

好久不见. 提交于 2019-12-13 02:09:25
SPSS 1双总体检验:双总体检验是检验两个样本平均数与其各自所代表的总体的差异是否显著 2该检验用于检验两组非相关样本被试所获得的数据的差异性 应用两独立样本T检验的前提条件: 3独立性:两样本所来自的总体互相独立 4正态性:样本来自的两个总体应服从正态分布,样本所来自的总体不满足正态性条件时,如果两个样本的分布形状相似,样本量相差不大,样本量较大,仍可以应用T检验 5方差齐性:指比较的两个样本方差相同 6单样本T检验:单样本T检验即检验某个变量的总体均值和某指定值之间是否存在显著性差异 7如果是大样本的单样本检验,统计教科书上称为U检验,采用服从正态分布的U统计量作为检验统计量。如果是小样本并且样本服从正态分布,则采用服从t分布的t统计量进行单样本T检验,否则,采取非参数检验 8 T检验稳健性较好,如果样本分布偏离正态分布不太严重,也可以采用T检验 计算机英语 1RCN(remote computer network远程网 ) 2telephone line(电话线 ) 3communication channel(通信信道 ) 4Internet(互联网 ) 5Web(环球网 ) 6World Wide Web(万维网) 7Internet service(互联网服务 ) 8remote login(远程登录 ) 9file transfer(文件传输 )

Batch normalization批标准化

心已入冬 提交于 2019-12-11 14:40:51
Batch normalization 深度学习尤其是在CV上都需要对数据做归一化,因为深度神经网络主要就是为了学习训练数据的分布,并在测试集上达到很好的泛化效果,但是,如果我们每一个batch输入的数据都具有不同的分布,显然会给网络的训练带来困难。另一方面,数据经过一层层网络计算后,其数据分布也在发生着变化,此现象称为Internal Covariate Shift。 机器学习领域有个很重要的假设:IID独立同分布假设,就是假设训练数据和测试数据是满足相同分布的,这是通过训练数据获得的模型能够在测试集获得好的效果的一个基本保障。BatchNorm的作用就是在深度神经网络训练过程中使得每一层神经网络的输入保持相同分布的(标准正态分布)。 Internal covariate shift 的概念:训练深度网络的时候经常发生训练困难的问题,因为,每一次参数迭代更新后,上一层网络的输出数据经过这一层网络计算后,数据的分布会发生变化,为下一层网络的学习带来困难(神经网络本来就是要学习数据的分布,要是分布一直在变,学习就很难了),此现象称之为Internal Covariate Shift。 对于深度学习这种包含很多隐层的网络结构,在训练过程中,因为各层参数不停在变化,所以每个隐层都会面临covariate shift的问题,也就是在训练过程中,隐层的输入分布老是变来变去,这就是所谓的

正态分布简单介绍

丶灬走出姿态 提交于 2019-12-11 00:48:57
摘要 若随机变量X服从一个数学期望为μ、标准方差为 σ 2 σ^2 σ 2 的高斯分布,记为:X∼N(μ, σ 2 σ^2 σ 2 )。 其概率密度函数为: f ( x ) = 1 σ 2 π e − ( x − μ ) 2 2 σ 2 , − ∞ < x < ∞ f(x) = {1 \over{σ \sqrt{2 \pi}}}e^{-{(x-μ)^2 \over 2σ^2}}, -\infty<x<\infty f ( x ) = σ 2 π ​ 1 ​ e − 2 σ 2 ( x − μ ) 2 ​ , − ∞ < x < ∞ 正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。因其曲线呈钟形,因此人们又常常称之为钟形曲线。我们通常所说的标准正态分布是μ = 0,σ = 1的正态分布。 X的分布函数为: F ( x ) = 1 σ 2 π ∫ − ∞ x e − ( t − μ ) 2 2 σ 2 d t , − ∞ < x < ∞ F(x) = {1 \over σ \sqrt{2 \pi}} \int_{- \infty}^xe^{- {(t-μ)^2 \over 2σ^2}}dt, -\infty<x<\infty F ( x ) = σ 2 π ​ 1 ​ ∫ − ∞ x ​ e − 2 σ 2 ( t − μ ) 2 ​ d t , − ∞ < x < ∞

正态分布的前世今生

◇◆丶佛笑我妖孽 提交于 2019-12-10 03:26:22
文章链接: 正态分布的前世今生 神说,要有正态分布,就有了正态分布。 神看正态分布是好的,就让随机误差服从了正态分布 创世纪——数理统计 个人认为非常好的一篇文章,共35页,能在我的博文中出现的绝对是优秀的文章,希望对于想要了解正态分布的同学能够有所收获。 来源: CSDN 作者: ALTLI 链接: https://blog.csdn.net/weixin_43360801/article/details/103433635

正态分布

只谈情不闲聊 提交于 2019-12-05 21:40:37
英国生物统计学家法兰西斯·高尔顿做了一个实验。他在一块木板上画了一块等腰三角形,并在三角形区域内钉上n+1层钉子。第1层钉2个钉子,第2层钉3个钉子,下面每一层都比上一层增加一个钉子,上一层的每个钉子都在下一层两个钉子的中间位置。之后,在第n+1层的下面,放入n+2个球槽。 建成后,高尔顿从顶端逐个扔下小球,这些小球在下落过程中与众多钉子发生碰撞,每次碰撞都会使得小球随机向左或向右下落。随着小球个数的增加,掉入各个球槽内的小球的个数会越来越多,堆积的高度也会不断增加。最终,如图2所示,各球槽将呈现出“中间高,两边低”的分布。 图 2 并且,如果进一步增加钉子的层数和小球个数,球槽中小球分布形成的曲线就会越来越光滑,最终趋向于图3“中间高,两边低”的“钟型”曲线,我们将这条曲线称为正态分布密度曲线,简称正态曲线。 来源: https://www.cnblogs.com/RogerLu/p/11946699.html

高斯分布的采样

强颜欢笑 提交于 2019-12-05 11:33:17
高斯分布的采样 任意高斯分布都可以由正态分布通过拉伸和平移得到,所以这里只考虑标准正态分布 逆变换法 产生 \([0, 1]\) 上的均匀分布随机数 \(\mu\) 令 \(z = \sqrt{2} erf^{-1}(2\mu - 1)\) ,则 \(z\) 服从标准正态分布。其中erf是高斯误差函数,它是标准正态分布的累积分布函数经过简单平移和拉升变换后的形式,定义如下 \[erf(x) = \frac{2}{\sqrt{\pi}} \int_0^x e^{-t^2}dt\] erf的逆函数不好求解 Box-Muller算法 考虑两个独立的高斯分布的联合分布 假设 \(x,y\) 是两个服从标准正态分布的独立随机变量 具体采样过程如下: 产生 \([0, 1]\) 上的两个独立的均匀分布随机数 \(\mu_1, \mu_2\) 令 \(\begin{cases} x = \sqrt{-2\ln(\mu_1)}\cos2\pi \mu_2 \\ y = \sqrt{-2\ln(\mu_1)}\sin2\pi \mu_2 \end{cases}\) ,则 \(x,y\) 服从标准正态分布,并且是相互独立的 需要计算三角函数,比较耗时 Marsaglia polar method 在单位圆盘上产生均匀分布随机数对 \((x,y)\) 令 \(s = x^2 + y^2\) ,则 \(x

MATLAB函数histfit

梦想与她 提交于 2019-12-05 11:31:44
histfit是带正态拟合的频率直方图 我们用命令normrnd生成符合正态分布的随机数. normrnd(u,v,m,n) 其中,u表示生成随机数的期望,v代表随机数的方差. 运行: a=normrnd(10,2,10000,1); histfit(a) %% 我们可以得到正态分布的统计直方图与其正态分布拟合曲线.    来源: https://www.cnblogs.com/liuhaiqing/p/11890165.html

使用高斯混合模型建立更精确的聚类

笑着哭i 提交于 2019-12-04 16:19:30
介绍 我很喜欢研究无监督学习问题。它们为监督学习问题提供了一个完全不同的挑战,用我拥有的数据进行实验的发挥空间要比监督学习大得多。毫无疑问,机器学习领域的大多数发展和突破都发生在无监督学习领域。 无监督学习中最流行的技术之一就是聚类。这是一个我们通常在机器学习的早期学习的概念,它很容易理解。我相信你曾经遇到过,甚至参与过顾客细分、购物篮分析等项目。 但问题是聚类有很多方面。它并不局限于我们之前学过的基本算法。它是一种强大的无监督学习技术,我们可以在现实世界中准确地使用它。 > 高斯混合模型就是我想在本文中讨论的一种聚类算法。 想预测一下你最喜欢的产品的销售情况吗?或许你想通过不同客户群体的视角来理解客户流失。无论用什么方法,你都会发现高斯混合模型非常有用。 在本文中,我们将采用自下而上的方法。因此,我们首先来看一下聚类的基础知识,包括快速回顾一下k-means算法。然后,我们将深入讨论高斯混合模型的概念,并在Python中实现它们。 目录 聚类简介 k-means聚类简介 k-means聚类的缺点 介绍高斯混合模型 高斯分布 期望最大化EM算法 高斯混合模型的期望最大化 在Python中实现用于聚类的高斯混合模型 聚类简介 在我们开始讨论高斯混合模型的实质内容之前,让我们快速更新一些基本概念。 注意:如果你已经熟悉了聚类背后的思想以及k-means聚类算法的工作原理

易初大数据 2019年11月14日 spss笔记 王庆超

荒凉一梦 提交于 2019-12-04 12:20:18
“均匀分布”的随机数 需要打开本章的数据文件“sim.sav.”。 1、设置随机数种子 1选择【转换】--【随机数字生成器】,勾选‘设置起点’,并在‘固定值’ 的下‘值’中输入一个用户给定的数值。该数值用于记录随机数生成的起点,下次如果需要重复生成,同样的结果,只要重新进入该过程,把活动生成器初始化中的‘固定值’设置成同一个数,就可以生成同一组随机数。在统计模拟中,这个设定的数值被称为随机数种子。当然,如果以后不需要重复生成该组随机数,就可以不用进行该步骤。这里我们设置活动生成器,初始化的部分固定值为‘123456’。 2选择【转换】--【计算变量】,在目标变量框中输入变量名‘Spinn’ 在‘数字表达式’框中输入‘TRUNC(RV.UNIFORM(1,5))’,然后单击 【确认】按钮,在spss数据编辑器中生成了1000个随机数,他们是在1和4之间等可能的取值。 (1)选择【分析】--【描述统计】--【频率】,然后把变量‘Spinn’选入‘变量’框中。 (2)单击【图表】按钮,‘频率:图表’对话框,勾选‘直方图’选项 (3)单击【继续】按钮,返回‘频率’对话框,然后单击【确认】按钮。 1,正态分布的随机变量是连续型随机变量,其可能取值是所有实数数据分析的所有模型和,理论都要求数据服从正态分布,因此正态分布的随机数在模拟中,有广泛应用正态分布的随机数的生成和4