epoch | 易学教程

Paper：He参数初始化之《Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet C》的翻译与解读

阅读更多关于 Paper：He参数初始化之《Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet C》的翻译与解读

Paper：He参数初始化之《Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification》的翻译与解读目录 Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification 4. Experiments on ImageNet Comparisons between ReLU and PReLU Comparisons of Single-model Results Comparisons of Multi-model Results Analysis of Results Comparisons with Human Performance from [22] 相关文章 Paper：Xavier参数初始化之《Understanding the difficulty of training deep feedforward neural networks》的翻译与解读 Paper：He参数初始化之《Delving Deep into Rectifiers: Surpassing Human-Level Performance on

使用GAN 进行异常检测——anoGAN，TODO，待用于安全分析实验

阅读更多关于使用GAN 进行异常检测——anoGAN，TODO，待用于安全分析实验

先说实验成功的代码： git clone https://github.com/tkwoo/anogan-keras.git mkdir weights python main.py --mode train 即可看到效果了！核心代码：main.py from __future__ import print_function import matplotlib matplotlib.use('Qt5Agg') import os import cv2 import numpy as np import matplotlib.pyplot as plt from keras.datasets import mnist import argparse import anogan os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2' parser = argparse.ArgumentParser() parser.add_argument('--img_idx', type=int, default=14) parser.add_argument('--label_idx', type=int, default=7) parser.add_argument('--mode', type=str, default='test', help='train,

神经网络中的 Epochs, Batchsize, Iterations 具体是什么

阅读更多关于神经网络中的 Epochs, Batchsize, Iterations 具体是什么

在看神经网络相关的论文时，总是能看到Epochs, Batchsize, Iterations 这些字眼，要弄明白这些专业术语，不得不先讲下梯度下降的概念。梯度下降梯度下降法是机器学习中经典的优化算法之一，用来求解复杂曲线的最小值。“梯度”是指某一函数在该点处的方向导数沿着该方向取得最大值，即函数在该点处沿着该方向（此梯度的方向）变化最快，变化率最大（为该梯度的模）。“下降”是指下降递减的过程。梯度下降法是多次迭代求解的，梯度下降的迭代质量有助于使模型尽可能拟合训练数据。梯度下降中有一个叫做学习率的参数，如上图左所示，在迭代开始时，步长越大，学习率就越高。随着点的下降，步长变短，即学习率变小。此外，误差函数也在不断减小。我们在训练模型时，如果训练数据过多，无法一次性将所有图像数据输入网络，为了解决这个问题，我们会将数据分成几个部分进行分批训练，即batch，使得每个批次的数据量是可以负载的。将这些batch的数据逐一输入到网络中，更新神经网络的参数，使得网络收敛。 Epoch 一个Epoch指的是将所有的数据输入网络完成一次向前计算及反向传播。由于完成一个epoch训练的周期较长（数据量大），一次性输入所有数据计算机无法负荷，所以将其分成多个batches。那么为什么还需要训练多个epochs呢？我们知道，训练网络时，仅仅将所有数据迭代训练一次是不够的

【Libra 技术解读】详解Libra共识源码

阅读更多关于【Libra 技术解读】详解Libra共识源码

本文作者：nonoren1985 Libra技术系列解读往期回顾： move语言简介 move语法、解释器和验证器 LibraBFT共识机制本期由百度超级链颜值与才华并存的“小X姐姐”带来 “Libra共识源码”详解快来围观吧！一、LibraBFT算法简介上一篇对于LibraBFT进行了相关的介绍，本文在正式开始前，先再介绍一下相关的概念和流程：基本概念： 1. SMR(State Machine Replication)：在计算机领域，SMR是在网络中不同副本间进行状态复制的一种协议。 2. Safety: 简单地理解就是共识的一致性保证，即诚实的节点能够达到状态一致； 3. Liveness: 简单地理解为区块链网络的可用性，类似于分布式系统中的分区可用性； 4. Epochs，实际的应用中，参与协议的节点的状态是随着时间而发展的，LibraBFT中通过epoch来支持这种状态更迭。 a. 每个epoch都是基于他的前一个epoch发展的。或者基于一个系统定义的初始epoch； b. 每个epoch有一个唯一的epochid所标识； c. 每当一个新的epochid被提交，当前这个epoch会结束，下一个epoch会开始； 5. LibraBFT假设网络是一个有全局稳定时间（GST），并且最大延时（ΔT）可控的 Partial Synchrony的网络； 6.

(DeepLearning Classification)Bengali.AI Handwritten Grapheme Classification

阅读更多关于 (DeepLearning Classification)Bengali.AI Handwritten Grapheme Classification

Bengali.AI Handwritten Grapheme Classification 1st Place Solution — Cyclegan Based Zero Shot Learning 第一名的工作真的是Impressive , 我还是第一次见到GAN应用到数据增强方向, 严格来讲也不算是是数据增强; Data 比赛的任务是对孟加拉语的手写字进行识别; 孟加拉语由三个部分组成: 168*字根( grapheme root), 11*元音 (vowel diacritic), 7*辅音 (consonant diacritic) 每张手写图片的大小是137 x 236 ; 在训练集中的大小是: 200840 Public A的大小是: 36 其中, Private test的数据中有可能出现train中没有出现过的手写字, 但是168个字根,11个元音,7个辅音在训练集中全部出现过了; 所以这有一点zero-shot的感觉. Model 思路最重要的依据在于, 将测试的数据分为两部分: 一部分为见过的数据(Seen), 一部分为没见过的数据(Unseen); 那么怎么将数据划分为见过和还是没见过的呢? 作者通过设置一个Out of distribution CNN模型,输出1295个置信度, 如果所有的置信度都低于设定的超参数阈值, 那么认定为Unseen;

【pytorch-ssd目标检测】训练自己创建的数据集

阅读更多关于【pytorch-ssd目标检测】训练自己创建的数据集

制作类似pascal voc格式的目标检测数据集： https://www.cnblogs.com/xiximayou/p/12546061.html 代码来源：https://github.com/amdegroot/ssd.pytorch 拷贝下来的代码好多坑要踩。。。我将其上传到谷歌colab上，当前目录结构如下：需要说明的是，虽然我们只有2类，但是，要加上背景一类，所以总共我们有3类。首先我们要读取自己的数据集在config.py中 # config.py import os.path # gets home dir cross platform # HOME = os.path.expanduser("~") HOME = os.path.expanduser("/content/drive/My Drive/pytorch_ssd/") # for making bounding boxes pretty COLORS = ((255, 0, 0, 128), (0, 255, 0, 128), (0, 0, 255, 128 ), (0, 255, 255, 128), (255, 0, 255, 128), (255, 255, 0, 128 )) MEANS = (104, 117, 123 ) mask = { 'num_classes': 3, 'lr

Introduction to Advanced Machine Learning, 第三周，week3_task2_fine_tuning_clean（hse-aml/intro-to-dl 答案）

阅读更多关于 Introduction to Advanced Machine Learning, 第三周，week3_task2_fine_tuning_clean（hse-aml/intro-to-dl 答案）

这是俄罗斯高等经济学院的系列课程第一门，Introduction to Advanced Machine Learning，第三周编程作业。任务是利用pre-trained InceptionV3架构，使用花朵分类训练集，经过fine tune之后，能够用于花朵的识别。这个作业一共两个部分，难易程度：容易。 1. prepared images for the model，图片剪裁 2. implemented your own batch generator，分批 3. fine-tuned the pre-trained model，训练 Fine-tuning InceptionV3 for flowers classification In this task you will fine-tune InceptionV3 architecture for flowers classification task. InceptionV3 architecture ( https://research.googleblog.com/2016/03/train-your-own-image-classifier-with.html ): Flowers classification dataset ( http://www.robots.ox.ac.uk/~vgg/data

MongoDB分片迁移原理与源码（4）

阅读更多关于 MongoDB分片迁移原理与源码（4）

MongoDB分片迁移原理与源码异步删除数据在from shard将迁移结果提交到config服务器成功后，from shard就会执行删除原数据的操作；如果迁移的参数"waitForDelete"为false，则触发异步删除。"waitForDelete"的默认参数即是false，即异步删除是默认设计。将此次迁移的数据范围调用cleanUpRange()函数进行后续处理。默认情况下，900s 以后开始清理 chunks 的数据，每次清理 128 个文档，每隔 20ms 删除一次。具体通过以下参数设置： rangeDeleterBatchDelayMS: 删除每个 chunk 数据的时候分批次删除，每批之间间隔的时间，单位 ms，默认 20ms； internalQueryExecYieldIterations: 默认为 128； rangeDeleterBatchSize：每次删除数据的数量，默认即为0；为0时，则每次删除的数量为max(internalQueryExecYieldIterations，1)， orphanCleanupDelaySecs: moveChunk 以后延迟删除数据的时间，单位 s ，默认 900 s const ChunkRange range(_args.getMinKey(), _args.getMaxKey()); auto

飞桨手势识别带你玩转神庙逃亡

阅读更多关于飞桨手势识别带你玩转神庙逃亡

随着经济社会的进步，人们对美好生活的追求也不断地刺激着电子娱乐行业的发展。但这些应用场景的人机交互方式却一直被束缚在通过键盘、鼠标、触摸屏的物理接触方式上。这些传统的交互方式将玩家的操作范围局限在简单的二维平面空间，也限制了游戏开发者创意的发挥。因此，我们引入了一种新的人机交互模式——手势识别交互。手势交互方式符合人类思维逻辑，具有自然性和直观性等特点。使用者不需要有过高的门槛，便可以很好地体验到人机交互的乐趣。手势识别技术具有良好的应用前景——包括电子娱乐、智能家居、VR及自动驾驶等热点领域。这个项目设计的目的就是实现简单直观的人机交互方式，并促使该技术和产品在未来大规模民用成为可能。我们的项目基于飞桨及其高性能端侧推理引擎Paddle Lite开发，实现了在基于Android系统的手机、平板电脑、嵌入式开发板上利用手势来实时控制贪吃蛇、神庙逃亡、地铁跑酷等交互式游戏，并可在大屏幕端进行投屏展示。下载安装命令 ## CPU版本安装命令 pip install -f https://paddlepaddle.org.cn/pip/oschina/cpu paddlepaddle ## GPU版本安装命令 pip install -f https://paddlepaddle.org.cn/pip/oschina/gpu paddlepaddle-gpu 项目内容

PyTorch 分布式训练教程

阅读更多关于 PyTorch 分布式训练教程

3 月，跳不动了？>>> 感谢参考原文- http://bjbsair.com/2020-03-27/tech-info/7154/ 神经网络训练加速的最简单方法是使用GPU，对弈神经网络中常规操作（矩阵乘法和加法）GPU运算速度要倍超于CPU。随着模型或数据集越来越大，一个GPU很快就会变得不足。例如，BERT和GPT-2等大型语言模型是在数百个GPU上训练的。对于多GPU训练，需要一种在不同GPU之间对模型和数据进行切分和调度的方法。 PyTorch是非常流行的深度学习框架，它在主流框架中对于灵活性和易用性的平衡最好。Pytorch有两种方法可以在多个GPU上切分模型和数据：nn.DataParallel和nn.distributedataparallel。DataParallel更易于使用（只需简单包装单GPU模型）。然而，由于它使用一个进程来计算模型权重，然后在每个批处理期间将分发到每个GPU，因此通信很快成为一个瓶颈，GPU利用率通常很低。而且，nn.DataParallel要求所有的GPU都在同一个节点上（不支持分布式），而且不能使用Apex进行混合精度训练。nn.DataParallel和nn.distributedataparallel的主要差异可以总结为以下几点（译者注）： DistributedDataParallel支持模型并行

订阅 epoch