fluid

词向量word2vec之CBOW算法

二次信任 提交于 2020-04-28 20:39:31
词向量模型之CBOW模型的原理与实现 关于词向量模型word2rec,平台里只有skip-gram一个模型的代码实现,本项目将对word2rec算法的第二个模型——CBOW模型进行补充 此项目用于交流与学习,如有问题,请大家积极指出,作者将第一时间在后续的版本中进行改正与优化,感谢大家支持! 欢迎大家来逛我的主页 来AI Studio互粉吧~等你哦~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/218138 CBOW的原理 2013年,Mikolov提出了经典的word2vec算法,该算法通过上下文来学习语义信息。word2vec包含两个经典模型,CBOW(Continuous Bag-of-Words)和Skip-gram. 我们重点介绍一下CBOW模型的原理: 举个例子:Two boys are playing basketball. 在这个句子中我们定'are'为中心词,则Two,boys,playing,basketball为上下文。CBOW模型的原理就是 利用上下文来预测中心词 ,即利用Two,boys,playing,basketball预测中心词:are。这样一来,are的语义就会分别传入上下文的信息中。不难想到,经过大量样本训练,一些量词,比如one,two就会自动找到它们的同义词,

语义表示模型ELMo之PaddlePaddle版实现

旧时模样 提交于 2020-04-28 16:27:54
介绍 ELMo(Embeddings from Language Models) 是重要的通用语义表示模型之一,以双向 LSTM 为网路基本组件,以 Language Model 为训练目标,通过预训练得到通用的语义表示,将通用的语义表示作为 Feature 迁移到下游 NLP 任务中,会显著提升下游任务的模型性能。本项目是 ELMo 在 Paddle Fluid 上的开源实现, 基于百科类数据训练并发布了预训练模型。模型结构如下: 原文链接: Deep contextualized word representations 参考博客: https://blog.csdn.net/triplemeng/article/details/82380202 注意 本项目代码需要使用GPU环境来运行: 并且检查相关参数设置, 例如use_gpu, fluid.CUDAPlace(0)等处是否设置正确. In[2] # 解压数据 !tar xf /home/aistudio/data/data9504/data.tar.gz -C /home/aistudio 数据预处理 将文档按照句号、问号、感叹切分成句子,然后对句子进行切词。预处理后的数据文件中每行为一个分词后的句子。我们给出了示例训练数据 data/train 和测试数据 data/dev ,数据示例如下: 本 书 介绍 了 中国

十余行代码完成迁移学习,百度PaddleHub实战解读

旧城冷巷雨未停 提交于 2020-04-27 18:04:36
来源:百度 PaddlePaddle 迁移学习 (Transfer Learning) 是属于深度学习的一个子研究领域,该研究领域的目标在于利用数据、任务、或模型之间的相似性,将在旧领域学习过的知识,迁移应用于新领域中。迁移学习吸引了很多研究者投身其中,因为它能够很好的解决深度学习中的以下几个问题: 一些研究领域只有少量标注数据,且数据标注成本较高,不足以训练一个足够鲁棒的神经网络 大规模神经网络的训练依赖于大量的计算资源,这对于一般用户而言难以实现 应对于普适化需求的模型,在特定应用上表现不尽如人意 为了让开发者更便捷地应用迁移学习,百度 PaddlePaddle 开源了预训练模型管理工具 PaddleHub。开发者用使用仅仅十余行的代码,就能完成迁移学习。本文将为读者全面介绍 PaddleHub 并其应用方法。 项目地址:https://github.com/PaddlePaddle/PaddleHub PaddleHub 介绍 PaddleHub 是基于 PaddlePaddle 开发的预训练模型管理工具,可以借助预训练模型更便捷地开展迁移学习工作,旨在让 PaddlePaddle 生态下的开发者更便捷体验到大规模预训练模型的价值。 PaddleHub 目前的预训练模型覆盖了图像分类、目标检测、词法分析、Transformer、情感分析五大类别

百度PaddlePaddle入门-9(建模)

回眸只為那壹抹淺笑 提交于 2020-04-27 10:07:09
本节介绍使用飞桨快速实现“手写数字识别”的建模方法。 与“房价预测”的案例类似,我们以同样的标准结构实现“手写数字识别”的建模。在后续的课程中,该标准结构会反复出现,逐渐加深我们对深度学习模型的理解。深度学习模型的标准结构分如下五个步骤: 数据处理 :读取数据和预处理操作。 模型设计 :搭建神经网络结构。 训练配置 :配置优化器、学习率、训练参数。 训练过程 :循环调用训练过程,循环执行“前向计算 + 损失函数 + 反向传播”。 保存模型并测试 :将训练好的模型保存并评估测试。 下面我们使用飞桨框架,按照五个步骤写“手写数字识别”模型,体会下使用飞桨框架的感觉。 在数据处理前,首先要加载飞桨平台、与“手写数字识别”模型相关类库,代码如下: 1 # 加载飞桨和相关类库 2 import paddle 3 import paddle.fluid as fluid 4 from paddle.fluid.dygraph.nn import FC 5 import numpy as np 6 import os 7 from PIL import Image 1. 数据处理 飞桨提供了多个封装好的数据集API,覆盖计算机视觉、自然语言处理、推荐系统等多个领域,可以帮助我们快速完成机器学习任务。比如,在“手写数字识别”模型中,我们可以通过调用 paddle.dataset.mnist

用PaddlePaddle实现基于LSTM的动漫评论情感分类

我的未来我决定 提交于 2020-04-26 16:09:21
Paddlepaddle实现基于LSTM的动漫评论情感分类 背景介绍 通过网络搜集资料发现大多情感分析案例都是基于影评和购物网站评论的, 对于动漫评论的情感分析几乎没有相关的案例出现; 动漫是本人的爱好之一, 于是本次课程实验就通过学习基于fluid的情感分析来进行B站动漫的情感分析. 本次课程实验的学习资料大多参考paddlepaddle官方提供的情感分析教程.数据为自己爬取并预处理之后得到的类似IMDB数据集的数据. 本次实验分流程如下: 引用库的导入 数据集及数据处理 模型训练 模型预测 总结 1 - 引用库 首先载入需要用到的库,它们分别是: os:用于对文件和路径进行操作 sys:提供了一系列有关Python运行环境的变量和函数 gzip:压缩与解压模块,用于读写压缩文件 math:包含进行各种数学运算的函数 paddle:PaddlePaddle深度学习框架 matplotlab: 用于画图 from future import print_function:在开头加上from future import print_function这句之后,即使在python2.X,使用print就得像 python3.X那样加括号使用. In[14] from __future__ import print_function import os import sys import

Jump Desktop 8 for Mac 8.5.10 远程桌面连接软件

此生再无相见时 提交于 2020-04-23 15:06:03
Jump Desktop 8 Mac版是一款远程桌面连接软件,可以快速轻松地找到远程桌面并通过简单的鼠标点击连接到它们。 地址: https://www.macdown.com/mac/6500.html 功能介绍 易于设置和可靠: Jump Desktop非常易于配置; 任何人都可以做到!只需访问:PC或Mac上的https://www.jumpdesktop.com,单击“自动设置”链接并按照分步说明操作。你马上就会跑起来。 安全: Jump会加密计算机之间的连接,以确保***和安全。默认情况下,自动连接始终加密。支持RDP的NLA,TLS / SSL加密。用于VNC的SSH隧道和SSL / TLS加密。Fluid Remote Desktop使用DTLS进行安全连接。 增强的生产力: 在Windows中使用Mac键盘快捷键。在不改变键盘使用方式的情况下,在计算机之间无缝切换。极大地提高了生产力。完全可自定义:配置您自己的快捷方式或使用内置默认值。没有其他应用程序接近。 强大的协作功能: 协作屏幕共享允许许多用户连接到同一桌面。每个用户都有自己的鼠标光标,可以点击并指向同一光标而无需争吵。非常适合与同事一起编辑文档,与远程团队成员调整设计,一起创建演示文稿,以及教授奶奶如何清理她的电子邮件。 远程支持 通过要求他们安装免费的Jump Desktop

PaddlePaddle/PGL

≡放荡痞女 提交于 2020-04-17 00:56:02
【推荐阅读】微服务还能火多久?>>> 文档 | 快速开始 | English Paddle Graph Learning (PGL)是一个基于 PaddlePaddle 的高效易用的图学习框架 在最新发布的PGL中引入了异构图的支持,新增MetaPath采样支持异构图表示学习,新增异构图Message Passing机制支持基于消息传递的异构图算法,利用新增的异构图接口,能轻松搭建前沿的异构图学习算法。而且,在最新发布的PGL中,同时也增加了分布式图存储以及一些分布式图学习训练算法,例如,分布式deep walk和分布式graphsage。结合PaddlePaddle深度学习框架,我们的框架基本能够覆盖大部分的图网络应用,包括图表示学习以及图神经网络。 特色:高效性——支持Scatter-Gather及LodTensor消息传递 对比于一般的模型,图神经网络模型最大的优势在于它利用了节点与节点之间连接的信息。但是,如何通过代码来实现建模这些节点连接十分的麻烦。PGL采用与 DGL 相似的 消息传递范式 用于作为构建图神经网络的接口。用于只需要简单的编写 send 还有 recv 函数就能够轻松的实现一个简单的GCN网络。如下图所示,首先,send函数被定义在节点之间的边上,用户自定义send函数 会把消息从源点发送到目标节点。然后,recv函数 负责将这些消息用汇聚函数 汇聚起来。

Bootstrap4网格系统+文字排版+颜色 简单练习

旧街凉风 提交于 2020-04-15 16:57:32
【推荐阅读】微服务还能火多久?>>> 我现在学bootstrap是不是太迟了哈哈哈 先来个小案例熟悉下 <! DOCTYPE html > < html lang ="en" > < head > < meta charset ="UTF-8" > < title > demo1 </ title > < link rel ="stylesheet" href ="https://cdn.staticfile.org/twitter-bootstrap/4.3.1/css/bootstrap.min.css" > < script src ="https://cdn.staticfile.org/jquery/3.2.1/jquery.min.js" ></ script > < script src ="https://cdn.staticfile.org/popper.js/1.15.0/umd/popper.min.js" ></ script > < script src ="https://cdn.staticfile.org/twitter-bootstrap/4.3.1/js/bootstrap.min.js" ></ script > </ head > < body > < div class ="jumbotron text-center" > < h1 >

【百度飞浆AI Studio】2、感性快速体验深度学习的线性归回预测房价

旧街凉风 提交于 2020-04-15 16:15:39
【推荐阅读】微服务还能火多久?>>> 百度学习原文地址: https://www.paddlepaddle.org.cn/documentation/docs/zh/1.5/beginners_guide/basics/fit_a_line/README.cn.html import paddle import paddle.fluid as fluid import numpy import math import sys from __future__ import print_function BATCH_SIZE = 20 train_reader = paddle.batch( paddle.reader.shuffle( paddle.dataset.uci_housing.train(), buf_size=500), batch_size=BATCH_SIZE) test_reader = paddle.batch( paddle.reader.shuffle( paddle.dataset.uci_housing.test(), buf_size=500), batch_size=BATCH_SIZE) x = fluid.layers.data(name='x', shape=[13], dtype='float32') # 定义输入的形状和数据类型 y =

一文看尽飞桨PaddlePaddle最新升级:5大优势,更低门槛使用深度学习

我只是一个虾纸丫 提交于 2020-04-13 23:49:33
【今日推荐】:为什么一到面试就懵逼!>>> 本文作者:杨蕊1002 飞桨(PaddlePaddle)是国内唯一功能完备的端到端开源深度学习平台,集深度学习训练和预测框架、模型库、工具组件、服务平台为一体,其兼具灵活和效率的开发机制、工业级应用效果的模型、超大规模并行深度学习能力、推理引擎一体化设计以及系统化的服务支持,致力于让深度学习技术的创新与应用更简单。 从Paddle Fluid v1.0以来,飞桨致力于打造更好的用户体验,趁着百度开发者大会,也为用户精心准备了一份大礼,在开发、训练及部署全流程上进行了全新升级,发布了飞桨的五大特性。接下来小编为您一一解读。 一、动态图&静态图 - 兼具动态图和静态图两种计算图的优势 从飞桨核心框架Padlde Fluid v1.5开始,飞桨同时为用户提供动态图和静态图两种机制。静态图是先定义网络结构而后运行,对定义好的图结构进行分析,可以使运行速度更快,显存占用更低,在业务部署上线上的具有非常大的优势,为用户的AI应用落地提供高效支持。但是静态图组网和执行阶段是分开,对于新用户理解起来不太友好。 飞桨从最新版本开始,提供了更方便的动态图模式,所有操作可以立即获得执行结果,而不必等到执行阶段才能获取到结果,这样可以更方便进行模型的调试,同时还减少了大量用于构建Executor等代码,使得编写、调试网络的过程变得更加便捷