语言翻译

详解从 Seq2Seq模型、RNN结构、Encoder-Decoder模型 到 Attention模型

不羁岁月 提交于 2019-12-15 18:53:35
欢迎点击参观我的 ——> 个人学习网站 注:本文的所有模型只涉及自然语言处理领域,同时本文不涉及太多复杂公式推导。 一、 Seq2Seq 模型 1. 简介 Sequence-to-sequence (seq2seq) 模型,顾名思义,其输入是一个序列,输出也是一个序列,例如输入是英文句子,输出则是翻译的中文。 seq2seq 可以用在很多方面:机器翻译、 QA 系统、文档摘要生成、 Image Captioning (图片描述生成器)。 2. 基本框架 第一种结构 [参考1]论文中提出的 seq2seq 模型可简单理解为由三部分组成: Encoder、Decoder 和连接两者的 State Vector (中间状态向量) C 。 上图中 Encoder 和 Decoder 可以是一个 RNN ,但通常是其变种 LSTM 或者 GRU 。 Encoder 和 Decoder 具体介绍请见第三部分。 第二种结构 该结构是最简单的结构,和第一种结构相似,只是 Decoder 的第一个时刻只用到了 Encoder 最后输出的中间状态变量 : 应用: 在英文翻译中,将英文输入到 Encoder 中, Decoder 输出中文。 参考1:-原创翻译- 基于RNNEncoder–Decoder的机器翻译L(earning Phrase Representations using RNN

论文翻译-语音合成:Tacotron 2

北战南征 提交于 2019-12-14 09:10:34
原论文地址:https://arxiv.org/abs/1712.05884 摘要 这篇论文描述了Tacotron 2, 一个直接从文本合成语音的神经网络架构。系统由两部分构成,一个循环seq2seq结构的特征预测网络,把字符向量映射到梅尔声谱图,后接一个WaveNet模型的修订版,把梅尔声谱图合成为时域波形。我们的模型得到了4.53的平均意见得分(MOS),而专业录制语音的MOS得分是4.58。为了验证模型设计,我们对系统的关键组件作了剥离实验研究,并且评估了使用梅尔频谱替代语言学、音长和F0特征作为WaveNet输入带来的影响。我们进一步展示了使用紧凑的声学中间表征可以显著地简化WaveNet架构。 索引词: Tacotron 2, WaveNet, text-to-speech 1. 介绍 从文本生成自然语音(语音合成,TTS)研究了几十年[1]仍然是一项有挑战的任务。这一领域的主导技术随着时代的发展不断更迭。单元挑选和拼接式合成方法,是一项把预先录制的语音波形的小片段缝合在一起的技术[2, 3],过去很多年中一直代表了最高水平。统计参数语音合成方法[4, 5, 6, 7],是直接生成语音特征的平滑轨迹,然后交由声码器来合成语音,这种方法解决了拼接合成方法中出现的边界人工痕迹的很多问题。然而由这些方法构造的系统生成的语音与人类语音相比,经常模糊不清并且不自然。 WaveNet

免费翻译API

百般思念 提交于 2019-12-12 22:24:06
google http://translate.google.cn/translate_a/single?client=gtx&dt=t&dj=1&ie=UTF-8&sl=auto&tl=zh_TW&q=calculate { "sentences": [ { "trans": "計算", "orig": "calculate", "backend": 1 } ], "src": "en", "confidence": 0.9609375, "ld_result": { "srclangs": [ "en" ], "srclangs_confidences": [ 0.9609375 ], "extended_srclangs": [ "en" ] } } Bing http://api.microsofttranslator.com/v2/Http.svc/Translate?appId=AFC76A66CF4F434ED080D245C30CF1E71C22959C&from=&to=en&text=考勤计算 <string xmlns="http://schemas.microsoft.com/2003/10/Serialization/">Attendance calculation</string> 不添加from参数或者from为空都自动检测语言 Baidu http:

神经网络机器翻译技术及应用(下)

▼魔方 西西 提交于 2019-12-12 14:20:19
何中军,百度机器翻译技术负责人。本文根据作者2018年12月在全球架构师峰会上的特邀报告整理而成。 神经网络机器翻译技术及应用(上)篇,我们为大家介绍了神经网络机器翻译的基本原理和挑战,(下)篇继续为大家讲述机器翻译的应用与未来。 前面我们讲了机器翻译的原理以及神经网络翻译的发展、以及面临的挑战,我们现在看一看,机器翻译现在有哪些应用? 机器翻译在越来越多地帮助和影响我们的生活。上图中列出了几个利用机器翻译来进行日常学习和交流的例子。左边两位是明星,一位是电影明星,利用翻译系统翻译化妆品成分,一位是公交司机,利用翻译APP学习英文,并运用到工作中去。右边是交警、售票员利用机器翻译与外国人进行交流。 这只是机器翻译应用的一个缩影。随着技术的发展和交流的需要,机器翻译已经深切地融入我们的生活。 机器翻译除了能做翻译之外还可以做一些很有意思的事情,比如说白话文和文言文的翻译,其实用的技术是类似的,从一种语言表达翻译成另外一种语言表达,或者从一个字串变换为另外一个字串,甚至是从一幅图产生文字说明,凡是这样的工作都可以用机器翻译的技术来做。 机器翻译还可以做什么,作诗。这是机器翻译写的两首诗,大家可以看一下,右边这个,“腊梅开时独自寒,幽香一缕为哪般。东风不解相思意,吹落梨花雪满天。”意境是不错的。而它的原理也是机器翻译的原理,从上一句翻译到下一句,可以认为上一句是原文,下一句是目标译文

python爬虫学习---爬取微软必应翻译(中英互译)

梦想的初衷 提交于 2019-12-12 00:35:00
前言 本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。 作者:OSinooO 本人属于python新手,刚学习的 python爬虫基础迫不及待地想试一试,看了论坛里大佬们写的在线翻译爬虫程序,想着自己把它写出来,以下是我爬微软翻译的过程,作为笔记记录下来: 1.获取信息 要实现在线翻译过程,首先要获得目标网站的信息,我们先打开微软必应翻译的官网( https://cn.bing.com/translator ): 我们需要获得它的翻译请求和响应信息,操作如下: (1)右键“检查”(用的Google Chrome浏览器),进入这个界面: 也可以通过右上角》更多工具》开发者工具进入。 (2)选择“Network” (3)输入我们想翻译的内容,先输入“hello”,选择简体中文: 可以看到右边出了很多抓到的包,点开看一下。 (4)找到response(响应)里面出现了翻译结果的包 (5)接下来就是获取URL和data信息了,在“Headers”部分就可以看到。这里的URL是处理我们请求翻译的网页地址,当网页请求方式为POST时,请求参数存放在data(类型为字典)里。 URL:https://cn.bing.com/ttranslate?&category=&IG

【翻译】Knowledge-Aware Natural Language Understanding(摘要及目录)

浪子不回头ぞ 提交于 2019-12-10 15:00:05
翻译Pradeep Dasigi的一篇长文 Knowledge-Aware Natural Language Understanding 基于知识感知的自然语言理解 摘要 Natural Language Understanding (NLU) systems need to encode human gener- ated text (or speech) and reason over it at a deep semantic level. Any NLU system typically involves two main components: The first is an encoder, which composes words (or other basic linguistic units) within the input utterances compute encoded representations, which are then used as features in the second component, a predic- tor, to reason over the encoded inputs and produce the desired output. We argue that the utterances themselves

SAP翻译问题

笑着哭i 提交于 2019-12-10 14:45:47
SE63:(此方式不需要传请求,可直接在PRD环境中修改需要翻译的内容) 可以根据不同需要选择不同数据对象进入 输入程序名称、屏幕编号,点击编辑进入,修改后保存。 SLXT:此方式创建请求,可传输。 目标语言:enUS英文 描述:(根据需要输入内容) 工作台请求:选中 处理日期:选择翻译时的日期 执行后可在SE09中查看该请求号码。 来源: https://www.cnblogs.com/kang2008/p/12016229.html

Drupal 7 国际化和多语言网站的建立

血红的双手。 提交于 2019-12-10 03:27:52
Drupal 是一个自由的国度,其跨语言的发布能力自然不会有问题。今天我们看一下Drupal 7当前的现状。 在Drupal 7之前的版本中,国际化是通过一系列特定的模块组合来实现的,这些模块被统称为I18N(Internationalization)模块。当前正式发布的Drupal 6系列产品,就需要使用这一模块,其中的翻译和发布功能已经非常完善,无论是网页内容,还是菜单和导航界面,翻译过程中都没有什么问题。有了这些模块,就能建立多双语种,甚至多语种的Web站点。不同语种之间的可以自由切换。无论是内容的发布,还是管理,都非常容易。 经过对Drupal 7的测试,发现过去这些国际化模块的很多功能,在Drupal 7中都已经集成到核心模块。内容翻译的功能,只要启用标准安装时自带的两个模块,Locale和Content Translation就能实现了。不过为了方便不同语种网页之间的切换设置,最好再安装上Language Switcher这个模块,以控制网站的缺省输出语言,如:只显示单语种网页、根据语言模块的选择显示特定语种,或显示所有语种的网页。 遗憾的是,目前Drupal 7的这几个模块,还不能自动翻译Home菜单项的内容,缺省情况下,只有一种语言的首页链接生效,看来需要别的方法来处理。如果那们过路的大侠知道如何解决这一问题,请在这里与大家共享一下...... 启动上述三个模块以后

[翻译完成] Pi+Raspbian+CGMiner+TightVNC+WIFI五合一矿机超级教程

大憨熊 提交于 2019-12-09 19:29:12
哈喽, 朋友们, 今天的教程是用树莓派和USB ASIC板来做一个自动挖矿机 , 教程里用的是Butterfly Labs的ASIC板, 如果你想用其他的USB设备其实大差不离. 本教程会把树莓派和ASIC板设成自动模式, 即插即开挖, 就算中途你家停电了也没问题. 如果碰到出错情况, 即时插拔一下就行. 开始教程前, 你需要知道树莓派的IP地址并在路由器里将其设为固定IP. 需要的软件: - Raspbian, 系统.img文件 ( http://downloads.raspberrypi.org/images/raspbian/2013-05-25-wheezy-raspbian/2013-05-25-wheezy-raspbian.zip ) - SD Formatter, 格式化SD卡 ( https://www.sdcard.org/downloads/formatter_4/ ) - Win32imager, 把.img文件 复制 到SD ( http://sourceforge.net/projects/win32diskimager/ ) - Putty, 用SSH连接到树莓派 ( http://www.chiark.greenend.org.uk/~sgtatham/putty/download.html? ) - TightVNC, 用远程桌面连接到树莓派 (

[翻译]Android接口定义语言 (AIDL)

孤人 提交于 2019-12-09 15:00:55
AIDL(Android接口定义语言)与你可能使用过的其它的IDLs是类似的。它允许你定义客户端与service协调一致的编程接口,以便于彼此之间使用进程间通信(IPC)机制进行通信。在Android上,一个进程通常不能访问另一个进程的内存。可以说,它们需要把它们的对象分解为操作系统能够理解的原始数据类型,并在进程之间按次序排列对象。那种排列对象的代码写起来是很乏味的,因此Android通过AIDL来为你处理这些事情。 注意: 只有在你允许来自于不同的应用的客户端访问你的service以实现IPC,并想要在你的service中处理多线程时,才需要使用AIDL。如果你不需要跨不同应用执行并发IPC,你应该通过 实现一个Binder 来创建你的接口,或者如果你想要执行IPC,但不需要处理多线程,可以 使用一个 Messenger 来实现你的接口。无论哪种,请确保在实现一个AIDL之前,你理解了 Bound Services 。/ 在开始设计你的AIDL接口之前,请意识到对于一个AIDL接口的调用是 直接的函数调用 (大概指的是阻塞调用,在调用一个IPC方法时,客户端线程会一直等待,直到service端处理完成并返回) 。你不应该假设调用所发生的线程。依赖于调用是来自于本进程的一个线程,还是一个远端进程,则会发生不同的事情。特别地: 发起于本进程的调用将在发起调用相同的线程中执行