正态分布

连续型概率分布――正态分布(二维)

匿名 (未验证) 提交于 2019-12-03 00:19:01
1. 定义:设二维连续型随机变量(X,Y)的联合概率密度为 其中μ1,μ2,σ1,σ2,ρ均为常数,且σ1>0, σ2>0, |ρ|<1则称(X,Y)服从参数为μ1,μ2,σ1,σ2,ρ的二维正态分布。 二维正态分布的密度函数如下图 显然f(x,y)>=0 可以验证 2. 关于二维正态分布,需掌握如下结论: (1)二维正态分布的两个边缘分布均为一维正态分布。 证明:略 (2)若(X,Y)服从二维正态分布,则X与Y相互独立的充要条件为X与Y的相关系数ρ等于零(即不相关)。 独立和不相关的关系:独立不一定相关,不相关不一定独立。 但是,对于二维正态分布:独立=不相关 答案:略 文章来源: 连续型概率分布――正态分布(二维)

numpy之随机数模块---random模块

匿名 (未验证) 提交于 2019-12-02 23:47:01
一、二项分布 ''' 随机数:模块为random模块---生成服从特定统计规律的随机数序列 1.二项分布(binomial):就是重复n次的伯努利实验,每次实验只有两种可能的结果,而且两种结果发生与否相互独立。 事件发生与否的概率在每次实验中都是保持不变的 ----numpy中实现:np.random.binomial(n,p,size)-->产生size个随机数,符合二项分布, 每个随机数来自n次尝试中成功的次数,其中每次尝试成功的概率为p ''' import numpy as np r = np.random.binomial(10, 0.8, 1) print(r) # 求:命中率0.8时,投10球进8球的概率、 # 投100000轮看看有多少轮进了10个球 r = np.random.binomial(10, 0.8, 100000) print(r[r == 8].size / r.size) print((r == 0).sum()/r.size) print((r == 1).sum()/r.size) print((r == 2).sum()/r.size) print((r == 3).sum()/r.size) print((r == 4).sum()/r.size) print((r == 5).sum()/r.size) print((r == 6)

假如按照正态分布来计算工资分布(不要认真,写着玩的)

匿名 (未验证) 提交于 2019-12-02 23:34:01
工资分布未必是符合正态分布,但假如是的话,(很多基本概念不记得了,本文用词可能不准确) 工资没有负值,我们就把标准正态分布去掉左边来计算, 可直接参考表 https://www.shuxuele.com/data/standard-normal-distribution-table.html 如果是工资中位数,那么对应正态分布的基数,大致为0.68, 也就是如果你的工资是工资中位数,这里就按你的换算值为0.68 如果你的工资是在工资中位数的一半,那对应值就是0.34,你的工资可以超过26.6%的人 如果你的工资是工资中位数附近,那对应值就是0.68,你的工资可以超过50%的人 如果你的工资是工资中位数的 两倍 ,那对应值就是1.36,你的工资可以超过82%的人 如果你的工资是工资中位数的 三倍 ,那对应值就是2.04,你的工资可以超过96%的人 如果你的工资是工资中位数的 四倍 ,那对应值就是2.72,你的工资可以超过99.3%的人 如果你的工资是工资中位数的 五倍 ,那对应值就是3.4,你的工资可以超过99.96%的人 当然这个结果不准确,因为我不是按统计数据来展示的,只是根据臆想,所以不必太认真 而这里的中位数,我就进一步不准确的替换为平均工资好了,因为网上没查到中位数, http://tjj.beijing.gov.cn/tjsj/cysj/201905/t20190516

matplotlib模块

匿名 (未验证) 提交于 2019-12-02 22:51:30
Ŀ¼ Matplotlib是一个强大的Python绘图和数据可视化的工具包。数据可视化也是我们数据分析的最重要的工作之一,可以帮助我们完成很多操作,例如:找出异常值、必要的一些数据转换等。完成数据分析的最终结果也许就是做一个可交互的数据可视化。 安装方式: pip install matplotlib 引用方法: import matplotlib.pyplot as plt import numpy as np import pandas as pd from numpy.random import randn import matplotlib.pyplot as plt # 一般使用下面的这个语句设置字体,不然会乱码 plt.rcParams['font.sans-serif'] = ['SimHei'] plt.rcParams['axes.unicode_minus'] = False 函数 说明 plt.plot(x,y,fmt) 坐标系 plt.boxplot(data,notch,position) 箱型图 plt.bar(left,height,width,bottom) 柱状图 plt.barh(width,bottom,left,height) 横向柱状图 plt.polar(theta,r) 极坐标系 plt.pie(data,explode) 饼图 plt

python3-正态分布

匿名 (未验证) 提交于 2019-12-02 22:11:45
loc 平均值 scale (scale) 标准差 pdf(x, loc=0, scale=1) 正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),最早由A.棣莫弗在求二项分布的渐近公式中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质。是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。 正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。 若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。 from scipy.stats import norm import numpy as np import matplotlib.pyplot as plt dmean=0.5 dstd=1 x=np.arange(-5,5,0.01) y=norm.pdf(x,dmean,dstd) plt.plot(x,y) plt.xlabel('x') plt.ylabel('y') plt.show()

数据分析

一个人想着一个人 提交于 2019-12-02 06:23:45
@ TOC 不懂统计和数据分析讲的是什么?看这篇就够了 python爬虫人工智能大数据 今天 以下文章来源于Ray的数据分析自习室 ,作者Ray Ray的数据分析自习室 Ray的数据分析自习室 数据干货 | 商业评论 | 职业发展 1 数据分析概述 数据分析是基于某种业务目的,有目的的处理数据,提取有价值的信息,解决各种业务问题的过程。 目的/出发点:设立目标或业务需求,明确问题 方法:根据不同场景选定分析方法 结果:目标解释或业务应用(to do),创造价值 1.1 数据分析流程 目的和内容:明确项目整体框架或业务问题 数据收集:根据假设或问题树收集相应数据,要求数据准确、有效;SQL、业务调整信息 数据预处理:检验-清理,可比(例如标准化、得分转换等),论证 数据分析:方法、工具的选取 数据表达:图表 数据报告:结论、建议&解决方案 1.2 数据分析方法 预处理加工:描述性统计分析(数据分布、数据趋势)、相关分析(正负相关、拟合、相关系数) 基于数理统计:方差分析、回归分析、因子分析 数据挖掘:聚类(层次分析、K均值、模糊聚类、高斯回归)、分类(决策树、神经网络、贝叶斯分类、SVM、随机森林)、回归分析(线性回归、logistic回归) 1.3 数据分析工具 Excel-SQL、R、Python、BI、HADOOP、Spark… 2 数据趋势 2.1 计量尺度

Batch Normalization

可紊 提交于 2019-12-01 23:30:59
转自 https://blog.csdn.net/qq_42823043/article/details/89765194 简介 Batch Normalization简称BN,是2015年提出的一种方法《Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》,已经广泛被证明其有效性和重要性。虽然有些细节处理还解释不清其理论原因,但是实践证明好用才是真的好。 原论文地址:https://arxiv.org/abs/1502.03167 机器学习领域有个很重要的假设:IID独立同分布假设,就是假设训练数据和测试数据是满足相同分布的,这是通过训练数据获得的模型能够在测试集获得好的效果的一个基本保障。而BN就是在深度神经网络训练过程中使得每一层神经网络的输入保持相同分布的。 为什么深度神经网络随着网络深度加深,训练起来越困难,收敛越来越慢?这是个在DL领域很接近本质的好问题。很多论文都是解决这个问题的,比如ReLU激活函数,再比如ResNet等,BN本质上也是解释并从某个不同的角度来解决这个问题的。 一、Internal Covariate Shift 现象: 从论文名字可以看出,BN是用来解决“Internal Covariate Shift”问题的

对数正态分布的随机数

不问归期 提交于 2019-12-01 09:55:12
一、功能 产生对数正态分布的随机数。 二、方法简介 对数正态分布的概率密度函数为 \[ f(x)=\left\{\begin{matrix} \frac{1}{x\sqrt{2\pi }\sigma }exp\left ( - \frac{(lnx-\mu )^{2}}{2\sigma ^{2}} \right ) & x> 0\\ 0 & x \leqslant 0 \end{matrix}\right. \] 对数正态分布的均值为 \(e^{\mu + \sigma ^{2} / 2}\) ,方差为 \((e^{\sigma ^{2}}-1)e^{2\mu + \sigma ^{2}}\) 。 首先产生正态分布的随机变量 \(y\) ,然后通过变换 \(x=e^{y}\) ,产生对数正态分布的随机变量 \(x\) ,具体方法如下: 产生正态分布的随机数 \(y\) ,即 \(u \sim N(\mu , \sigma )\) ; 计算 \(x=e^{y}\) 。 三、使用说明 是用C语言实现产生对数正态分布分布随机数的方法如下: /************************************ u ---对数正态分布的参数mu sigma ---对数正态分布的参数sigma s ---随机数种子 ************************************

tf.get_variable函数的使用

那年仲夏 提交于 2019-11-30 23:00:20
maxwell_tesla tf.get_variable函数的使用 tf.get_variable(name, shape, initializer): name就是变量的名称,shape是变量的维度,initializer是变量初始化的方式,初始化的方式有以下几种: tf.constant_initializer:常量初始化函数 tf.random_normal_initializer:正态分布 tf.truncated_normal_initializer:截取的正态分布 tf.random_uniform_initializer:均匀分布 tf.zeros_initializer:全部是0 tf.ones_initializer:全是1 tf.uniform_unit_scaling_initializer:满足均匀分布,但不影响输出数量级的随机值 转自: https://www.cnblogs.com/baochen/p/8991163.html tf.get_variable(name, shape, initializer): name就是变量的名称,shape是变量的维度,initializer是变量初始化的方式,初始化的方式有以下几种: tf.constant_initializer:常量初始化函数 tf.random_normal_initializer

opencv图像处理之常见滤波器

大兔子大兔子 提交于 2019-11-30 15:12:24
图像平滑 Smoothing, also called blurring, is a simple and frequently used image processing operation. 平滑,也叫模糊. 本质就是把某点的像素值转换为其及其周围像素值的不同权重的叠加.h(k,l)即为卷积核,或者叫滤波器filter. 有几种常见的filter Normalized Box Filter Gaussian Filter Median Filter Bilateral Filter 均值滤波 权重矩阵如上. img2= cv2.blur(img,(5,5)) The call blur(src, dst, ksize, anchor, borderType) is equivalent to boxFilter(src, dst, src.type(), anchor, true, borderType). https://docs.opencv.org/master/d4/d86/group__imgproc__filter.html#ga8c45db9afe636703801b0b2e440fce37 效果如下: 高斯滤波 即假设某一位置的像素和其邻域像素符合高斯分布.具体的说的话,就是每一位置的像素的权重符合高斯分布.这样的话,给定一个高斯分布,及高斯核的大小