矩阵转置 | 易学教程

是时候搞定矩阵微分了！

阅读更多关于是时候搞定矩阵微分了！

前言与感谢以前就对矩阵求导有心理阴影，到底要不要转置，哪个矩阵放在前面，哪个矩阵放在后面，链式法则怎么搞，由产生此类一系列让人头大的问题。其中，最令人智熄的是经常网上的一些算法公式推导根本是错误的，因为矩阵维数根本不匹配，故这些无良的发布者可能根本就没有手推过，天天搞复制黏贴大法，很多时候都是大量重复错误的内容。最近读了一些材料，感觉心中有了一些数，因此想通过本文总结，一次性梳理清楚。是时候搞定矩阵微分了！参考材料： Kaare Brandt Petersen, Michael Syskind Pedersen. "The Matrix Cookbook", 2008 Thomas P. Minka. "Old and New Matrix Algebra Useful for Statistics", 2000 Searle Shayle R. "Matrix Algebra Useful for Statistics", 1982 Jan R. Magnus, Heinz Neudecker. "Matrix Differential Calculus with Applications in Statistics and Econometrics", 2007 "Matrix Vector Derivatives for Machine Learning", (作者邮箱

矩阵

阅读更多关于矩阵

矩阵矩阵运算加法数乘乘法转置特殊矩阵对角阵单位阵数量阵上下三角阵对称阵反对称阵正交阵初等矩阵行阶梯矩阵行最简矩阵伴随矩阵矩阵逆矩阵转置数乘行列式秩可逆矩阵求逆矩阵的方法通过伴随矩阵（行列式好求时）初等变化（行列式不好求时）初等变换初等矩阵等价矩阵的秩子式公式分块矩阵运算来源： https://www.cnblogs.com/vergilwu/p/11769432.html

c++刷题（15/100）矩阵转置，最深子树

阅读更多关于 c++刷题（15/100）矩阵转置，最深子树

题目一：矩阵转置 A A 矩阵的转置是指将矩阵的主对角线翻转，交换矩阵的行索引与列索引。示例 1：输入：[[1,2,3],[4,5,6],[7,8,9]] 输出：[[1,4,7],[2,5,8],[3,6,9]] 示例 2：输入：[[1,2,3],[4,5,6]] 输出：[[1,4],[2,5],[3,6]] 思路：比较简单，但要注意对矩阵的初始化，如果不初始化会报错--》reference binding to null pointer of type ‘struct value_type‘ class Solution { public : vector <vector< int >> transpose(vector<vector< int >>& A) { if (A.size()== 0 ){ return A ; } vector <vector< int >> Ar(A[ 0 ].size()); for ( int i = 0 ; i < Ar.size(); i++ ) Ar[i].resize(A.size()); for ( int i = 0 ; i<A[ 0 ].size(); i++ ) { for ( int j = 0 ; j<A.size(); j++ ) { Ar[i][j] = A[j][i]; } } return Ar ; } };

数据挖掘学习（三）――文本挖掘

阅读更多关于数据挖掘学习（三）――文本挖掘

对情感进行分析，对评论数据进行相应的分析。可以用结巴进行分词，主要是划分各文本之间的关系，进行分词操作。 Dict.txt是指结巴使用的分词，也可以自己定义相应的结巴词典，也可以下载一些好用的词典。第一个参数：我们的词汇；第二个参数：词频（即重要的程度）；第三个参数：词性 1）使用jieba进行分词： #!/usr/bin/env python # _*_ UTF-8 _*_ import jieba sentence = " 我喜欢东方明珠 " # cut_all=True ：为全模式。 # cut_all=FALSE ：精准模式。 words = jieba.cut(sentence , cut_all = True ) print (words) # 全模式分词，用的是循环才能获取相应的结果，如果直接 print 则显示不成功。 for item in words: print (item) print ( "----------------" ) # 精准模式分词。 words2 = jieba.cut(sentence , cut_all = False ) for item in words2: print (item) print ( "----------------" ) # 搜索引擎分词： words3 = jieba.cut_for_search

5求解Ax=0：主变量、特解

阅读更多关于 5求解Ax=0：主变量、特解

本课时将讲解如何计算那些空间中的向量，从概念定义转向算法，求解Ax=0的算法是怎样的，即如何求解零空间。消元法解Ax=0 消元过程中，方程通过加减消元本质上是线性变换，解是不会改变的。实际上，消元法改变了系数矩阵的列空间，而不改变系数矩阵的行空间。所以，注意消元过程中不变的是什么，随消元不变的是方程组的解。行向量或者列向量之间的相关性可以在消元过程中表现出来。A中第一列和第二列共线，A的第三行是第一行和第二行的线性组合。看例子： A矩阵第一阶段的消元是把主元1那一列下面的元素变为0，第二阶段的消元是把主元2那一列下面的元素变为0，最终得到阶梯型echelon的矩阵U。图中圈出来的为主元，个数为2，这里引出一个重要概念：矩阵的秩Rank(A)：矩阵主元的个数。如此，我们在解Ax=0，现在变为了Ux=0，但解和零空间不变，现在进行回代找出“主变量”pivot variables，主列，即主元所在的列，其他列，称为自由列。（自由列表示可以自由或任意分配数值，列2和列4的数值是任意的，因此x2和x4是任意的，可以自由取）。当我们把x2和x4分别取1和0时，可得到解x=c(-2 1 0 0)，c是常数，表示第二列减去2倍第一列为0。此时解是四维空间中穿过原点的一条直线。因此，解Ax=0的新算法： 1）A矩阵消元，确定主元，解出主变量，也就确定主列，其余为自由列

Caffe中如何计算卷积

阅读更多关于 Caffe中如何计算卷积

1.caffe中通过构造两个矩阵实现： Caffe中的卷积计算是将卷积核矩阵和输入图像矩阵变换为两个大的矩阵A与B，然后A与B进行矩阵相乘得到结果C（利用GPU进行矩阵相乘的高效性），三个矩阵的说明如下：（1）在矩阵A中 M为卷积核个数，K=k*k，等于卷积核大小，即第一个矩阵每行为一个卷积核向量（是将二维的卷积核转化为一维），总共有M行，表示有M个卷积核。（2）在矩阵B中 image_h：输入图像的高度 image_w：输入图像的宽度 pad_h：在输入图像的高度方向两边各增加pad_h个单位长度（因为有两边，所以乘以2） pad_w：在输入图像的宽度方向两边各增加pad_w个单位长度（因为有两边，所以乘以2） kernel_h：卷积核的高度 kernel_w：卷积核的宽度 stride_h：高度方向的滑动步长； stride_w：宽度方向的滑动步长。因此，N为输出图像大小的长宽乘积，也是卷积核在输入图像上滑动可截取的最大特征数。 K=k*k，表示利用卷积核大小的框在输入图像上滑动所截取的数据大小，与卷积核大小一样大。（3）在矩阵C中矩阵C为矩阵A和矩阵B相乘的结果，得到一个M*N的矩阵，其中每行表示一个输出图像即feature map，共有M个输出图像（输出图像数目等于卷积核数目）（在Caffe中是使用src/caffe/util/im2col

R语言函数总结

阅读更多关于 R语言函数总结

R语言与数据挖掘：公式；数据；方法 R语言特征对大小写敏感通常，数字，字母，. 和 _都是允许的(在一些国家还包括重音字母)。不过，一个命名必须以 . 或者字母开头，并且如果以 . 开头，第二个字符不允许是数字。基本命令要么是表达式（expressions）要么就是赋值（assignments）。命令可以被 (;)隔开，或者另起一行。基本命令可以通过大括弧({和}) 放在一起构成一个复合表达式（compound expression）。一行中，从井号(#)开始到句子收尾之间的语句就是是注释。 R是动态类型、强类型的语言。 R的基本数据类型有数值型（numeric）、字符型（character）、复数型（complex）和逻辑型（logical），对象类型有向量、因子、数组、矩阵、数据框、列表、时间序列。基础指令程序辅助性操作：运行 q()――退出R程序 tab――自动补全 ctrl+L――清空console ESC――中断当前计算调试查错 browser() 和 debug()―― 设置断点进行，运行到此可以进行浏览查看（具体调试看browser（）帮助文档（c,n,Q）） stop('your message here.')――输入参数不正确时，停止程序执行 cat（）――查看变量？帮助 help(solve) 和 ?solve 等同 ??solve―

机器学习---梯度下降算法

阅读更多关于机器学习---梯度下降算法

参考文章： http://ruder.io/optimizing-gradient-descent/ tensorflow-梯度下降（代码）深度解读最流行的优化算法：梯度下降（精简版）这里主要进行梯度公式推导，基本知识和内容可参考上述博客： (一)、Cost Function 线性回归是给出一系列点假设拟合直线为h(x)=theta0+theta1*x, 记Cost Function为J(theta0,theta1) 之所以说单参数是因为只有一个变量x，即影响回归参数 θ1, θ0的是一维变量，或者说输入变量只有一维属性。下图中为简化模式，只有theta1没有theta0的情况，即拟合直线为h(x)=theta1*x 左图为给定theta1时的直线和数据点 × 右图为不同theta1下的cost function J(theta1) cost function plot: 当存在两个参数theta0和theta1时，cost function是一个三维函数，这种样子的图像叫 bowl-shape function 将上图中的cost function在二维上用不同颜色的等高线映射为如下右图，可得在左图中给定一个(theta0,theta1)时又图中显示的cost function. 我们的目的是最小化cost function,即上图中最后一幅图，theta0=450

协方差矩阵

阅读更多关于协方差矩阵

首先我们给你一个含有n个样本的集合，依次给出数理统计中的一些相关概念：标准差和方差一般是用来描述一维数据的，但现实生活我们常常遇到含有多维数据的数据集，以考试成绩为例，若要统计多个学科的考试成绩，就要用协方差，协方差就是一种用来度量两个随机变量关系的统计量，其定义为：来度量各个维度偏离其均值的程度，标准差可以这么来定义：需要注意的是，协方差也只能处理二维问题，那维数多了自然就需要计算多个协方差，比如n维的数据集就需要计算个协方差，那自然而然的我们会想到使用矩阵来组织这些数据。给出协方差矩阵的定义：这个定义还是很容易理解的，我们可以举一个简单的三维的例子，假设数据集有三个维度，则协方差矩阵为可见，协方差矩阵是一个对称的矩阵，而且对角线是各个维度上的方差。上面涉及的内容都比较容易，协方差矩阵似乎也很简单，但实战起来就很容易让人迷茫了。必须要明确一点，协方差矩阵计算的是不同维度之间的协方差，而不是不同样本之间的。这个我将结合下面的例子说明，以下的演示将使用Matlab，为了说明计算原理，不直接调用Matlab的cov函数(蓝色部分为Matlab代码)。首先，随机产生一个10*3维的整数矩阵作为样本集，10为样本的个数，3为样本的维数。 mysample = fix(rand( 10 , 3 )* 50 ) 根据公式，计算协方差需要计算均值，那是按