正态分布

numpy 随机数

时光怂恿深爱的人放手 提交于 2019-12-04 06:02:00
pd.date_range('20161213', periods=2) Python工具包numpy,其中的random模块包含了很多产生随机数和随机数组的函数 也能产生特定分布的随机数,如正态分布、泊松分布等 常用函数 rand函数,产生0到1的随机数,参数是shape randn函数,产生标准正态分布,均值为0,方差为1,参数也是shape randint函数,产生指定范围的随机整数,前两个参数表示范围,最后一个参数是size=(shape) 特定分布 numpy.random能产生特定分布的随机数,如normal分布、uniform分布、poisson分布等 这些函数中前面几个参数是分布函数的参数,最后一个参数是shape 如正态分布normal就是均值和方差,uniform就是上下界,泊松分布就是 λ 来源: https://www.cnblogs.com/zknublx/p/11834497.html

数据不正态分布如何办?

感情迁移 提交于 2019-12-04 05:42:45
在实际研究中,很多时候都需要数据满足正态分布才可以。比如说回归分析,其实做回归分析有一个前提条件即因变量需要满足正态分布性。也比如说方差分析,其有一个潜在的前提假定即因变量 Y 需要满足正态分布。还有很多种情况,比如 T 检验,相关分析等等。 但这种情况往往被分析人员忽略掉,或者是数学基本不够扎实,也或者无论如何数据均不满足正态分布等客观条件,也或者其它情况等。如果说没有满足前提条件,分析的结果会变得不科学严谨,分析结论会受到置疑。 哪些研究方法需要数据满足正态分布才行呢?以及如果不满足正态分布时应该如何处理呢?接下来会逐步说明。 第一:需要满足正态分布的几类常见研究方法: 常见会涉及五种研究方法,它们对正态性要求相对较高,如果不满足正态性则会有对应的处理。 线性回归分析 线性回归分析,很多时候也称回归分析。其对正态性的要求较为严格,包括因变量 Y 需要满足正态性要求,同时残差也需要满足正态性。如果说因变量 Y 不满足正态分布,通常情况下有以下几种处理办法。 第 1 :对因变量 Y 取对数处理(包括自然对数和 10 为底的对数);这可以在 SPSSAU 的生成变量功能里面找到; 第 2 :如果数据接近于正态分布,则接受其为正态分布性。此种情况较多,因为在研究影响关系时,线性回归最适合,如果不进行线性回归,通常情况下很难有更适合的研究方法。因而很多时候只要数据接受于正态性即可

tensorflow 生成随机数 tf.random_normal 和 tf.random_uniform 和 tf.truncated_normal 和 tf.random_shuffle

杀马特。学长 韩版系。学妹 提交于 2019-12-04 03:28:04
转载: https://blog.csdn.net/tz_zs/article/details/75948350 tf.random_normal 从正态分布中输出随机值。 random_normal(shape,mean=0.0,stddev=1.0,dtype=tf.float32,seed=None,name=None) shape:一个一维整数张量或Python数组。代表张量的形状。 mean:数据类型为dtype的张量值或Python值。是正态分布的均值。 stddev:数据类型为dtype的张量值或Python值。是正态分布的标准差。 dtype: 输出的数据类型。 seed:一个Python整数。是随机种子。 name: 操作的名称(可选) 官网api地址: https://www.tensorflow.org/versions/r1.3/api_docs/python/tf/random_normal tf.random_uniform 从均匀分布中返回随机值。 random_uniform( shape, # 生成的张量的形状 minval= 0, maxval= None, dtype=tf.float32, seed= None, name= None ) 返回值的范围默认是0到1的左闭右开区间,即[0,1)。minval为指定最小边界,默认为1

使用numpy生成二维正态分布

我是研究僧i 提交于 2019-12-04 00:27:39
   参考资料:    https://www.zhihu.com/question/39823283?sort=created    https://www.zhihu.com/question/288946037/answer/649328934   一维正态分布样本可以使用numpy.random.normal函数很轻松的产生。那么二维正态分布应该怎么生成呢?以上的参考资料写的很详细,有时间copy过来研究研究。 来源: https://www.cnblogs.com/chester-cs/p/11825310.html

微信红包随机算法实现

狂风中的少年 提交于 2019-12-03 12:24:54
看了 微信红包的算法实现探讨(基于PHP) 一文,我尝试使用C++重现,代码如下: #include <iostream> #include <cstdlib> #include <ctime> int Random(int _max) { _max = _max > 0 ? _max : 1; static bool begin = false; if (!begin) { srand((unsigned)time(nullptr)); //用于保证是随机数 begin = true; } return rand() % _max; //用rand产生随机数并设定范围 } int main() { using namespace std; double total_money = 10; int total_people = 8; double min_money = 0.01; double *per_money = new double[total_people]; for (int i = 0; i < total_people - 1; i++) { double safe = (total_money - (total_people - i)*min_money) / (total_people - i); double var_money = min_money +

Jarque-Bera test|pp图|K-S检验|

橙三吉。 提交于 2019-12-03 05:04:22
Jarque-Bera test: 如何绘制 pp 图 ? 找该直线的截距和斜率,通过截距和斜率的值找到正态参数均值和方差,可对这些正态参数进行正态检验。 K-S 检验的的特点? 并不是只针对正态分布,是针对某一分布。在大样本时针对正态分布。 来源: https://www.cnblogs.com/yuanjingnan/p/11779152.html

Numpy-np.random.normal()正态分布

怎甘沉沦 提交于 2019-12-03 05:02:52
X ~ :随机变量X的取值 和其对应的概率值P(X = ) 满足正态分布(高斯函数) 很多 随机现象 可以用正态分布描述或者近似描述 某些 概率分布 可以用正态分布近似计算 正态分布 (又称高斯分布)的概率密度函数 numpy中 numpy.random.normal( loc= 0.0 , scale= 1.0 , size= None ) 参数的意义为:    loc:float   概率分布的均值,对应着整个分布的中心center    scale:float   概率分布的标准差,对应于分布的宽度,scale越大越矮胖,scale越小,越瘦高    size:int or tuple of ints   输出的shape,默认为None,只输出一个值   我们更经常会用到np.random.randn(size)所谓标准正态分布(μ=0, σ=1),对应于np.random.normal(loc=0, scale=1, size) 来源: https://www.cnblogs.com/cpg123/p/11779117.html

Batch Normalization

心已入冬 提交于 2019-12-03 02:36:43
Batch Normalization作为最近一年来DL的重要成果,已经广泛被证明其有效性和重要性。虽然有些细节处理还解释不清其理论原因,但是实践证明好用才是真的好,别忘了DL从Hinton对深层网络做Pre-Train开始就是一个经验领先于理论分析的偏经验的一门学问。 本文是对论文《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》的导读(看看看, 这是通过减少内部协变量移位加速神经网络训练)。 机器学习领域有个很重要的假设:IID独立同分布假设,就是假设训练数据和测试数据是满足相同分布的,这是通过训练数据获得的模型能够在测试集获得好的效果的一个基本保障。那BatchNorm的作用是什么呢?BatchNorm就是在深度神经网络训练过程中使得每一层神经网络的输入保持相同分布的(相同分布是怎样的?是什么的相同分布?参数吗?)。 接下来一步一步的理解什么是BN。 为什么深度神经网络随着网络深度加深,训练起来越困难,收敛越来越慢?这是个在DL领域很接近本质的好问题。很多论文都是解决这个问题的,比如ReLU激活函数,再比如Residual Network,BN本质上也是解释并从某个不同的角度来解决这个问题的(这个解释还是很妙的)。

数据的偏态分布

匿名 (未验证) 提交于 2019-12-03 00:22:01
https://www.cnblogs.com/gczr/p/6802998.html 在数据分析中如果某个数据服从正态分布的话,我们可以利用正态分布的性质做出很多有意义的分析,例如t-检验。。 一、何为数据的偏态分布? 频数分布有正态分布和偏态分布之分。正态分布是指多数频数集中在中央位置,两端的频数分布大致对称。 偏态分布 是指频数分布不对称,集中位置偏向一侧。若集中位置偏向数值小的一侧,称为 正偏态分布 ;集中位置偏向数值大的一侧,称为 负偏态分布 。 如果频数分布的高峰向左偏移,长尾向右侧延伸称为 正偏态分布 ,也称 右偏态分布 ;同样的,如果频数分布的高峰向右偏移,长尾向左延伸则成为 负偏态分布 ,也称 左偏态分布 。 峰左移,右偏,正偏 峰右移,左偏,负偏 偏态分布只有满足一定的条件(如样本例数够大等)才可以看做近似正态分布。 与正态分布相对而言,偏态分布有两个特点 :   一是左右不对称(即所谓偏态);   二是当样本增大时,其均数趋向正态分布。 二、构建模型时为什么要尽量将偏态数据转换为正态分布数据?   数据整体服从正态分布,那样本均值和方差则相互独立。正态分布具有很多好的性质, 很多模型假设数据服从正态分布 。例如线性回归(linear regression),它假设误差服从正态分布,从而每个样本点出现的概率就可以表示成正态分布的形式,将多个样本点连乘再取对数

多元高斯分布的MLE、贝叶斯条件概率和线性判别分析LDA的生成方法总结

匿名 (未验证) 提交于 2019-12-03 00:22:01
Gaussian model 给出 d d 维随机向量(pattern) x x ,即随机变量 { x 1 , x 2 , . . . , x n } { x 1 , x 2 , . . . , x n } 其高斯分布表示: q ( x ; μ , ∑ ) = 1 ( 2 π ) d 2 det ( ∑ ) 1 2 exp ( 1 2 ( x μ ) T ∑ 1 ( x μ ) ) (1) (1) q ( x ; μ , ∑ ) = 1 ( 2 π ) d 2 det ( ∑ ) 1 2 exp ( 1 2 ( x μ ) T ∑ 1 ( x μ ) ) 其中 μ μ 是 d d 维度的列向量代表期望(expectation), ∑ ∑ 是 d × d d × d 的协方差矩阵(variance-covariance matrix),即: μ = E [ x ] = ∫ x q ( x ; μ , ∑ ) d x (2) (2) μ = E [ x ] = ∫ x q ( x ; μ , ∑ ) d x ∑ = V [ x ] = ∫ ( x μ ) ( x μ ) T q ( x ; μ , ∑ ) d x (3) (3) ∑ = V [ x ] = ∫ ( x μ ) ( x μ ) T q ( x ; μ , ∑ ) d x 假设 n n 个样本之间 i . i . d .