omega

数学物理中的常见误区

夙愿已清 提交于 2020-11-01 17:49:51
多元函数求偏导数时注意区分那些是自变量,那些是函数,以及函数的自变量是什么。自变量之间的偏导都是零,而针对函数的偏导则不一定是零。 例:在计算阿尔芬波色散关系的时候有这样的式子: $$\frac{d}{dx}[(\omega^2-\omega_A^2(x))\frac{dU(x)}{dx}]$$ 上式中$\frac{d}{dx}$作用到$\omega^2$上就是0,但是作用到$\omega_A^2(x)$则非零,因为$x,\omega$都是自变量,而$\omega_A^2$则是函数。 多元傅立叶变换中的等价性: 对于$U(\vec{r},t)\to U(x)e^{i(k_y y+k_z z-\omega t)}$,这时如果有梯度算符$\nabla$作用到U上,则梯度算符$\nabla$与波数$\vec{k}=k_y\vec{e_y}+k_z\vec{e_z}$并不等价。而是有等价关系: $$\nabla\Leftrightarrow (\vec{e_x}\frac{d}{dx}+i\vec{k})$$ 平衡量的微分 物理中的平衡量一般而言都是针对时间的平衡量$A_0=A_0(\vec{r})$,所以对空间变量的微分未必是零。 $\frac{\partial A}{\partial t}=0,\ \frac{\partial A}{\partial x}\neq 0$

【深度学习】L1正则化和L2正则化

放肆的年华 提交于 2020-10-28 09:32:42
在机器学习中,我们非常关心模型的预测能力,即模型在新数据上的表现,而不希望过拟合现象的的发生,我们通常使用正则化(regularization)技术来防止过拟合情况。正则化是机器学习中通过显式的控制模型复杂度来避免模型过拟合、确保泛化能力的一种有效方式。如果将模型原始的假设空间比作“天空”,那么天空飞翔的“鸟”就是模型可能收敛到的一个个最优解。在施加了模型正则化后,就好比将原假设空间(“天空”)缩小到一定的空间范围(“笼子”),这样一来,可能得到的最优解能搜索的假设空间也变得相对有限。有限空间自然对应复杂度不太高的模型,也自然对应了有限的模型表达能力。这就是“正则化有效防止模型过拟合的”一种直观解析。 L2正则化 在深度学习中,用的比较多的正则化技术是L2正则化,其形式是在原先的损失函数后边再加多一项:$\frac{1}{2}\lambda\theta_{i}^2$,那加上L2正则项的损失函数就可以表示为:$L(\theta)=L(\theta)+\lambda\sum_{i}^{n}\theta_{i}^2$,其中$\theta$就是网络层的待学习的参数,$\lambda$则控制正则项的大小,较大的取值将较大程度约束模型复杂度,反之亦然。 L2约束通常对稀疏的有尖峰的权重向量施加大的惩罚,而偏好于均匀的参数。这样的效果是鼓励神经单元利用上层的所有输入,而不是部分输入

被传“疯”了!GitHub上都在找的分布式核心笔记终于来了

微笑、不失礼 提交于 2020-10-24 07:58:26
什么是Java分布式? 简单的来说就是一个大型的系统往往被分为几个子系统来做,一个子系统可以部署在一台机器的多个 JVM 上,也可以部署在多台机器上。但是每一个系统不是独立的,不是完全独立的。需要相互通信,共同实现业务功能。 一句话来说:分布式就是通过计算机网络将后端工作分布到多台主机上,多个主机一起协同完成工作。 分布式作为现在作为Java开发必知必会的技术,同时分布式技术也属于面试中的必问题,那么我们就需要十分明白分布式,今天就为大家整理了一份Java分布式核心原理笔记,GitHub上人人都在找的分布式核心技术笔记终于终于免费开源了! 这份笔记涵盖了:分布式协调与同步、分布式资源管理与负裁调度、分布式计算技术、分布式通信技术、分布式数据存储、分布式高可靠(这份分布式笔记已经整理完毕,免费的领取方式在文末!) 分布式协调与同步 分布式互斥 什么是分布式互斥? I霸道总裁:集中式算法 民主协商:分布式算法 轮值CEO:令牌环算法 分布式选举 为什么要有分布式选举? 分布式选举的算法 长者为大: Bully算法 民主投票: Raft 算法 具有优先级的民主投票: ZAB算法 三种选举算法的对比分析 分布式共识 什么是分布式共识? 分布式共识方法 PoW PoS DPoS 三种分布式共识算法对比分析 分布式事务 什么是分布式事务? 如何实现分布式事务? 基于XA协议的二阶段提交方法

【图神经网络】图卷积网络 GCN

天涯浪子 提交于 2020-10-22 17:55:15
本文为图神经网络的学习笔记,讲解图卷积网络 GCN。欢迎在评论区与我交流👏 前言 传统卷积方式在非欧式的数据空间无法保持“平移不变性”,因此将卷积推广到 Graph 等非欧式数据空间的拓扑图上。 先给出 GCN 的公式: H ( l + 1 ) = D ^ − 1 / 2 A ^ D ^ − 1 / 2 H l W l H^{(l+1)}=\hat{D}^{-1/2}\hat{A}\hat{D}^{-1/2}H^lW^l H ( l + 1 ) = D ^ − 1 / 2 A ^ D ^ − 1 / 2 H l W l 卷积和傅里叶变换关系紧密。数学上的定义是两个函数的卷积等于各自傅里叶变换的乘积的逆傅里叶变换。此时卷积与傅里叶变换产生了联系 传统的傅里叶变换可通过类比推广到图上的傅里叶变换。此时傅里叶变换又与 Graph 产生了联系 由傅里叶充当桥梁,卷积与 Graph 产生联系 【 论文链接 】。 拉普拉斯矩阵与 GCN 拉普拉斯矩阵及其变体 拉普拉斯矩阵 简单图 G G G 的节点数为 n n n , D D D 是 G G G 的度矩阵, A A A 是 G G G 的邻接矩阵,则 G G G 的拉普拉斯矩阵可以表示为 L = D − A L=D-A L = D − A 。 度矩阵 D D D 定义为: d i , j : = { d e g ( v i ) if i =

《DSP using MATLAB》Problem 9.5

你。 提交于 2020-10-22 17:47:27
和P9.4思路一样,只是D=5,这里只放第1小题。 代码: %% ------------------------------------------------------------------------ %% Output Info about this m-file fprintf('\n***********************************************************\n'); fprintf(' <DSP using MATLAB> Problem 9.5.1 \n\n'); banner(); %% ------------------------------------------------------------------------ % ------------------------------------------------------------ % PART 1 % ------------------------------------------------------------ % Discrete time signal n1_start = 0; n1_end = 100; n1 = [n1_start:1:n1_end]; xn1 = cos(0.15*pi*n1); % digital

深入理解计算机系统:期末整理与复习

房东的猫 提交于 2020-10-14 14:59:39
文章目录 前言 第一章:概述 知识点 编译 系统硬件组成 系统之间的网络通信 操作系统的抽象表示 操作系统的几个基本抽象概念 Admahl定律 练习题 例1.1 第二章:信息的表示和处理 知识点 进制转换 字数据的大小 字节顺序 移位运算 位级运算 整数表示 编码方式 整数数据类型 编码 无符号数编码 反码编码 补码编码 有符号数和无符号数之间的转换 扩展数字的位表示 截断数字 整数运算 无符号加法 补码加法 无符号乘法 补码乘法 无符号和补码的乘法的位级等价性 乘以常数 除以2的幂 舍入 无符号除法 补码除法(向下舍入) 补码除法(向上舍入) 浮点数 二进制小数 IEEE浮点表示 规格化 非规格化 特殊值 示例 舍入 浮点运算 浮点乘法 浮点加法 C语言中的浮点数 练习题 第三章:程序的机器级表示 知识点 机器级代码 数据类型 访问信息 整数寄存器 操作数指示符 数据传送指令 压入和弹出栈数据 算术和逻辑操作 加载有效地址 一元操作 二元操作 特殊的算术操作 控制 条件码 设置条件码 访问条件码 条件分支 跳转指令 用条件控制来实现条件分支 条件传送指令 用条件传送来实现条件分支 循环 do-while循环 while循环 跳转到中间 guarded-do for循环 switch语句 过程 运行时栈 栈操作 pushq Src popq Dest 转移控制 数据传送

数字图像处理复习

大兔子大兔子 提交于 2020-10-06 09:26:16
简答题:8’*3 1、图像的数字化过程:采样,分色,量化,编码相关概念。 采样:采样的实质就是用多少点来描述一幅图像,采样结果质量的高低就是图像分辨率,连续图像的空间样本实际上就是用采样函数与连续图像相乘的结果。空间采样函数为: 分色:指RGB图像数据被转换为最接近等量的青、品红、黄、黑(CMYK)数值的工艺。 量化:量化指将采样后离散图像的值表示为与其幅度成比例的整数。 编码:图像数字化后得到的图像数据量十分巨大,由于图像数据本身固有的冗余性和相关性,可以使用编码将大的图像数据文件转换成较小的图像数据文件。 2、图像压缩算法:给出两个压缩算法(符号编码,统计编码,变换编码,模型编码)各种编码包括哪些,简单描述基本原理。 统计编码: huffman编码:赫夫曼编码是一种依据变长最佳编码定理,基于统计的无损编码。步骤如下: (1)将信源符号 x i x_i x i ​ 按出现概率从大到小排序;(2)将最小的两个信源相加,重复这一步骤,始终将概率较大的分支放在上部,直到只剩下一个信源符号且概率为1;(3)对每对组合的上边与下边标号1与0;(4)由每个信源到概率1.0处的路径形成的0、1逆序列为赫夫曼编码。 香农-费诺编码:基于统计的变长编码算法: (1)将信源符号按出现的概率从大到小排列;(2)将信源分成两部分,使两部分的概率尽可能接近,重复直至不可再分;(3

NIPS 2017 | QSGD: Communication-Efficient SGD via Gradient Quantization and Encoding

本小妞迷上赌 提交于 2020-10-02 15:58:06
由于良好的可扩展性,随机梯度下降(SGD)的并行实现是最近研究的热点。实现并行化SGD的关键障碍就是节点间梯度更新时的高带宽开销。因此,研究者们提出了一些启发式的梯度压缩方法,使得节点间只传输压缩后的梯度。尽管这些启发式方法在实践中很有效,但它们有时并不会收敛。 本文提出了量化SGD(Quantization SGD,QSGD),它是一类具有收敛保证且在实践中性能良好的压缩模式。QSGD允许用户平滑得权衡通信带宽和收敛时间:节点可以在每轮迭代时调整发送的比特数,代价可能是更高的方差。这种权衡是固有的,因为将其提高到某个阈值会违反信息理论的下限。QSGD在异步情况下保证了凸与非凸目标函数的收敛性,并且可以使用随机方差削减技术扩展。 当在图像识别与语音识别任务上训练深度神经网络时,QSGD显著地降低了端到端的训练时间。 1. Introduction 目前,许多研究者正在研究如何扩展大规模SGD算法。SGD算法的定义如下。令 \(f:\mathbb{R}^n\rightarrow\mathbb{R}\) 是我们要最小化的目标函数。我们可以得到随机梯度 \(\widetilde{g}\) ,即 \(\mathbb{E}[\widetilde{g}(x)]=\triangledown f(x)\) 。通过多次迭代,SGD可以收敛到最小值。 \[\boldsymbol{x}_{t+1}=

Graph Convolution Neural Network

无人久伴 提交于 2020-09-26 13:37:23
文章目录 往期文章链接目录 Convolutional graph neural networks (ConvGNNs) GCN Framework GCN v.s. RecGNN What is Convolution Spatial-based ConvGNNs Message Passing Neural Network (MPNN) Introduction to MPNN Shortage of the MPNN framework GraphSAGE (SAmple and aggreGatE) Overview of GraphSAGE Aggregator Fuctions PATCHY-SAN Overview of PATCHY-SAN Two problems considered in PATCHY-SAN Steps of PATCHY-SAN 往期文章链接目录 往期文章链接目录 Convolutional graph neural networks (ConvGNNs) Convolutional graph neural networks (ConvGNNs) generalize the operation of convolution from grid data to graph data. The main idea is to

手把手教系列之移动平均滤波器实现

梦想与她 提交于 2020-08-20 06:55:44
[导读]:前面一篇文章关于IIR设计的文章,还是有朋友点开来阅读。虽不知看官们的感想如何,但想着总还是有赏光一读,所以决定继续这个系列。本文来聊一聊平均滤波器,这题目咋一看非常容易。但个人觉得里面一些关键要点未必都明了,本文主要关注xx一维平均滤波器设计内在机理、应用场景。 注:尽量在每篇文章写写摘要,方便阅读。信息时代,大家时间都很宝贵,如此亦可节约粉丝们的宝贵时间。 理论理解 学习一样东西,个人建议须从三个维度进行: What Why How 这里的内容主要参考胡广书编写的<<数字信号处理导论>>7.5.1节,加了一些自己的理解。 提到平均滤波器,做过单片机应用开发的朋友,马上能想到将一些采样数据进行加和求平均。诚然如此,从其时域数学描述而言也很直观: \[\begin{align*} y(n)&=\frac{1}{N}\sum_{k=0}^Nx(n-k)\\&=\frac{1}{N}[x(n)+...+x(n-N+1)] \end{align*} \] 其中 \(x(n)\) 代表当前测量值,对于单片机应用而言,可以是当前ADC的采样值或者当前传感器经过一系列处理的物理量(比如在工业控制领域中的温度、压力、流量等测量值),而 \(x(n-1)\) 表示上一次的测量值,以此类推, \(x(n-N+1)\) 则是前第N-1次测量值。 为了揭示其更深层次的机理