权重

BP 算法之一种直观的解释

喜夏-厌秋 提交于 2020-01-10 07:15:11
本文转载自: https://www.cnblogs.com/daniel-d/archive/2013/06/03/3116278.html 作者:daniel-D 转载请注明该声明。 0. 前言 之前上模式识别课程的时候,老师也讲过 MLP 的 BP 算法, 但是 ppt 过得太快,只有一个大概印象。后来课下自己也尝试看了一下 stanford deep learning 的 wiki, 还是感觉似懂非懂,不能形成一个直观的思路。趁着这个机会,我再次 revisit 一下。本文旨在说明对 BP 算法的直观印象,以便迅速写出代码,具体偏理论的链式法则可以参考 我的下一篇博客 (都是图片,没有公式)。 1. LMS 算法 故事可以从线性 model 说起(顺带复习一下)~在线性 model 里面,常见的有感知机学习算法、 LMS 算法等。感知机算法的损失函数是误分类点到 Target 平面的总距离,直观解释如下:当一个实例点被误分,则调整 w, b 的值,使得分离超平面向该误分类点的一侧移动,以减少该误分类点与超平面的距离,在 Bishop 的 PRML一书中,有一个非常优雅的图展现了这个过程。但是了解了 MLP 的 BP 算法之后,感觉这个算法与 LMS 有点相通之处。虽然从名字上 MLP 叫做多层感知机,感知机算法是单层感知机。 LMS (Least mean squares)

语音处理的分帧,帧移,加窗,滤波,降噪,合成

烂漫一生 提交于 2020-01-09 12:32:03
一、分帧 语音数据和视频数据不同,本没有帧的概念,但是为了传输与存储,我们采集的音频数据都是一段一段 的。为了程序能够进行批量处理,会根据指定的长度(时间段或者采样数)进行分段,结构化为我们编程 的数据结构,这就是分帧。 二、帧移 由于我们常用的信号处理方法都要求信号是连续的,也就说必须是信号开始到结束,中间不能有断开。然 而我们进行采样或者分帧后数据都断开了,所以要在帧与帧之间保留重叠部分数据,以满足连续的要求, 这部分重叠数据就是帧移。 三、加窗 介绍帧移的时候我们说了,我们处理信号的方法都要求信号是连续条件,但是分帧处理的时候中间断开 了,为了满足条件我们就将分好的帧数据乘一段同长度的数据,这段数据就是窗函数整个周期内的数据, 从最小变化到最大,然后最小。 四、滤波 我们知道,我们处理的语音其实是一种声波,声波是一种物质波。滤波的字面意思理解为过滤一些不同频 率的波。根据傅里叶变换,我们知道任意波可以分解为几种正弦波和余弦波的叠加,从概率论的角度,滤 波即加权。 滤波的作用就是给不同的信号分量不同的权重。最简单的loss pass filter, 就是直接把低 频的信号给0权重,而给高频部分1权重。对于更复杂的滤波,比如维纳滤波, 则要根据信号的统计知识来 设计权重。 当允许信号中较高频率的成分通过滤波器时,这种滤波器叫做高通滤波器。 当允许信号中较低频率的成分通过滤波器时

从零开始编写AI程序

时光总嘲笑我的痴心妄想 提交于 2020-01-07 15:45:54
数据与赋权 如果你是一个十分了解旅游业行情的人,并且想选择跟团游,要让机器学会选择符合自己经济条件的目的地,你会怎样构思? 首先,肯定是建立数据集 你会收集旅行社提供的的报价、出发地与目的地之间的距离、游玩的天数、服务的配置、淡季旺季等等。然后你会考虑到,发达国家的景点普遍要比发展中国家的贵,它们的报价可以归纳为两个计算体系。这样,你便可以制作成一个可供参考的集合。 按照传统编程,你这时候或许会根据这个数据集算出不同因素的权重,然后运用乘法等等手段,算出一个估价,并利用估价筛选合适的目的地。 但我们都知道,汇率在变化,机票酒店均有涨有跌,这样一来,每一次小的变动,权重都需要重新计算,才能较为准确地估计出价格 这时候,最好的办法就是让机器学会自主分配权重。 有一个很好的方法可以应用到其中:你可以将权重全部设为“1”,然后将每个影响参数都带入公式,算出一个初始值。当然,这个值有极大的概率和实际值相差千里,那么怎么减少误差呢?我们可以运用最小二乘法等手段,寻找数据的最佳函数匹配。 那么如果你是一个旅游行业方面的小白,并不知道什么因素影响着旅游价格呢?你也同样可以运用AI选择适合自己经济条件的旅游目的地。 这时候,你的数据集可能就会变成一个由目的地、不同时间的价格、区域组成的集合。通过机器学习,计算机同样也会为这几个大的影响因素赋予权重,从而估算出大体的价格。 最精确的权重 当然

多值类别特征加入CTR预估模型的方法

对着背影说爱祢 提交于 2020-01-06 21:48:47
我们都知道一般单值类别特征加入到CTR预估模型的方法是先对单值类别特征进行one-hot,然后和embedding 矩阵相乘转换成多维稠密特征,如下图 1 所示: ▲ 图1. 单值类别特征处理方法 上篇文章 稠密特征加入CTR预估模型的方法 中又总结了稠密特征加入到CTR预估模型中的方法。而在现实实际问题中,往往还会出现多值类别特征,比如我接触到的2019腾讯广告算法大赛中用户的行为兴趣特征就是多值类别特征,也就是一个用户可以有多个类别的兴趣,比如打篮球,乒乓球和跳舞等,并且不同用户的兴趣个数不一样。还有2019知乎看山杯比赛中的用户感兴趣的话题特征,也就是一个用户感兴趣的话题可以有多个,并且不同的用户感兴趣的话题个数不一,这些特征的形式都一般是如下结构(拿用户感兴趣的话题特征来说): 在CTR预估模型中,对这种多值类别特征的常用处理方法总结归纳如下: ▌非加权法 最常规的也最简单的是先对所有‘话题’集合进行one hot编码,然后按照图 1 方式对多值类别特征中的每一项进行稠密特征的转换,最后对转换后的稠密特征向量进行拼接,然后按项求均值或最大值或最小值等,整个过程可以用如图 2 表示: ▲ 图2. 常见多值类别特征处理方法 可以看出,这样对多值类别特征进行处理之后,可以把每个多值类别特征转换在同一维度空间中,这样输入到神经网络中不用为了保持输入维度一致而进行padding

Oh-My-Zsh及主题、插件安装与配置

[亡魂溺海] 提交于 2020-01-05 19:04:39
切换zsh Manjaro linux默认安装了zsh,其他可能需要先安装 cat /etc/shells #查看本地有哪几种shell chsh -s /bin/zsh #切换到zsh 默认终端启动zsh需要在终端中进行配置 打开终端,编辑>>>>首选项>>>>命令 勾选 “运行自定义命令而不是shell” 选项 在下面的 “自定义命令” 中填写 "zsh" 安装 oh-my-zsh 配置文件 ** 注意: root用户和普通用户需要单独安装配置,即分别切换到普通和root用户安装 ** # via curl sh -c "$(curl -fsSL https://raw.githubusercontent.com/robbyrussell/oh-my-zsh/master/tools/install.sh)" # via wget sh -c "$(wget https://raw.githubusercontent.com/robbyrussell/oh-my-zsh/master/tools/install.sh -O -)" # 想要卸载oh-my-zsh 输入以下命令 uninstall_oh_my_zsh 更改zsh主题 vim ~/.zshrc # 修改配置文件中的 " ZSH_THEME ",例如设置为随机主题 ZSH_THEME = "random" #

[SEO] - [DeDe]优化SEO

六月ゝ 毕业季﹏ 提交于 2020-01-04 09:28:39
dede如何做SEO DEDE是同类型CMS系统里面SEO做的比较好的一个了,但是还是有些地方不能尽人 意,下面就给大家具体讲讲针对DEDE可以做的一些优化,一些SEO 本文是最好网总结实践DEDE SEO 的经验,分享给各位DeDe的站长们的礼物! 希望大家一起努力,搞好DEDE SEO 让搜索更快收录你的站点,提升你的网站流量! 本文 技术参数不高,简单才是美. 本文将 DeDe CMS SEO 优化共分五部分: 1.网址优化 技术参数: 2.标签优化 技术参数: 3.Tag优化 技术参数: 4.结构优化 技术参数: 5.权重优化 技术参数: 一.DEDE SEO 之一:网址优化 案例: 最好网 方法详 解: 全站采用静态html,如:内容页(文章,图片,软件下载等),这样利于搜索的收录,且打开速度比动态页面快多了. 但 这远远不够, 因为如果用默认的模板生成文件后,网址会变得极长.我们接下来要做的就是:把文件移动到根目录,减少URL路径中的 / 的数目,理论上来讲, / 的次数越少,意味着页面所在搜索引擎中的权重越高. 说白了也就是距离网站根目录越近,权重越大! 要如何实现呢? 简单得很,在DEDE 后台: 栏目管理 修改栏目 高级选项中: 文章命名规则:改为:news/{aid}.html 这是我的做法, [你可以根据你的目录名来改news为你自己想要的名

011带权重的无向边数据类型Edge实现

夙愿已清 提交于 2020-01-03 15:24:10
带权重的无向边数据类型Edge实现 图学习笔记索引 本文参考《算法(第4版)》 1.加权无向图数据类型EdgeWeightedGraph实现 2.总结 图学习笔记索引 图学习笔记索引(全部) 001自定义输入流In类实现 002背包数据类型Bag实现 003无向图数据类型实现 004基于图的深度优先搜索 005使用深度优先搜索找图中的所有连通分量 005-1基于深度优先搜索查找图中连通路径 006基于深度优先搜索判断图中是否存在环 007基于深度优先搜索判断一个无向图图是否是一个二分图 008广度优先搜索查找连通图中的最短路径 009有向图数据类型实现 010有向图的可达性 011带权重的无向边数据类型Edge实现 012加权无向图数据类型实现 本文参考《算法(第4版)》 1.加权无向图数据类型EdgeWeightedGraph实现 1)图文件读取 点击文字获取:流读取类In参考链接 从文件中读取图的顶点关系。 tinyEWG.txt文件中的第一行为顶点数,第二行为边数。 第三行到最后是两个相邻的顶点即边的权重: 8 16 4 5 0.35 4 7 0.37 5 7 0.28 0 7 0.16 1 5 0.32 0 4 0.38 2 3 0.17 1 7 0.19 0 2 0.26 1 2 0.36 1 3 0.29 2 7 0.34 6 2 0.40 3 6 0.52 6 0 0

yolo-tiny预测时使用的权重文件(ckpt格式)

旧时模样 提交于 2020-01-02 12:05:13
这是ckpt格式的权重文件,需要的可以下载使用: https://pan.baidu.com/s/1MxpP-ctwfCQ-731xnB8M9A 我是使用一下github项目测试的。它还包含其它例子,非常适合学习: https://github.com/gliese581gg/YOLO_tensorflow 来源: CSDN 作者: UFO_SERIESOFSOFT 链接: https://blog.csdn.net/UFO_SERIESOFSOFT/article/details/103799935

Django--CRM--菜单排序等

狂风中的少年 提交于 2020-01-02 02:56:27
一 . 菜单排序    1. 我们想把菜单排序.首先给菜单加上权重,权重大的排在上面, 这就要在菜单表上加上一个权重字段.       2. 我们在菜单表里面把权重改一下       3. 需要把权重字段的信息拿出来放到session中去    4. 在自定义过滤器里面进行排序 然后其他的不用改就会显示成排序后的菜单 from django import template from django.conf import settings from collections import OrderedDict register = template.Library() @register.inclusion_tag('menu.html') def my_menu(request): url = request.path # 二级菜单 menu_dict = request.session[settings.MENU_SESSION_KEY] # 不能在这循环,需要模板里面循环 # 按照添加的顺序进行展示 有序字典 ordered_dict = OrderedDict() # ret是按照权重排完序的key ret = sorted(menu_dict, key=lambda x: menu_dict[x]['weight'], reverse=True) for i in ret: