语言翻译

开发谷歌浏览器插件(原创)

淺唱寂寞╮ 提交于 2019-11-28 19:50:56
今天早上打开博客园.看到一文章" 开发chrome扩展程序 " 自己看看,也还很简单,就自己动手写一个翻译插件 来看看效果 以前用谷歌的翻译接口做了一个翻译功能的网页 http://liuju150.cacacoo.com 所以我就打算把这个功能做成一个谷歌浏览器的插件 这个翻译功能就一个页而.代码也很简单 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>翻译</title> <style type="text/css"> #MainTable { width:100%; text-align:center; } </style> <script type="text/javascript" src="http://www.google.com/jsapi?v=1&key=ABQIAAAACqGEg_EWjzyatp5DcvOejRR4W90b60fHZvOCS2noQmQiRb84KxQixoel7iEIiOVRigOQjXi2AyU3yQ"></script>

编译性语言、解释性语言和脚本语言的区别

北慕城南 提交于 2019-11-28 14:46:47
一、翻译和解释的不同 翻译的方式有两种,一个是编译,一个是解释。两种方式只是翻译的时间不同。编译型语言写的程序在被执行之前,需要一个专门的编译过程,把程序编译成为机器语言的文件,比如exe文件,以后要运行的话 就不用重新翻译了,直接使用编译的结果就行了(exe文件),因为翻译只做了一次,运行时不需要翻译,所以编译型语言的程序执行效率高。解释则不同,解释性语言的程序不需要编译,省了道工序,解释性语言在运行程序的时候才翻译,比如解释性basic语言,专门有一个解释器能够直接执行basic程序,每个语句都是执行的时候才翻译。这样解释性语言每执行一次就要翻译一次,效率比较低。 二、脚本语言 ①脚本语言(JavaScript,VBscript等)介于HTML和C,C++,Java,C#等编程语言之间 HTML通常用于格式化和链结文本。而编程语言通常用于向机器发出一系列复杂的指令。 ②脚本语言与编程语言也有很多相似地方,其函数与编程语言比较相象一些,其也涉及到变量。与编程语言之间最大的区别是编程语言的语法和规则更为严格和复杂一些。 ③与程序代码的关系:脚本也是一种语言,其同样由程序代码组成. 注:脚本语言一般都有相应的脚本引擎来解释执行。 他们一般需要解释器才能运行。JAVASCRIPT,ASP,PHP,PERL都是脚本语言。C/C++编译、链接后,可形成独立执行的exe文件。

[翻译]CI从2.2升级到3.0

烈酒焚心 提交于 2019-11-28 11:09:47
英文原文 从2.2 升级到3.0 更新之前先保证网站处于离线状态. 步骤 1: 更新 CI 所有文件 替换 system 目录下所有文件,然后替换index.php文件,如果之前有更新index.php,请在新的文件上做更改. 你必须先删除旧的system/目录,然后把它放到其它 的地方.直接简单的复制过去可能会导致问题. 如果您在这些文件夹中有任何自定义功能的文件,请先复制它们. 步骤 2: 更新你的类的文件名 从CI 3.0开始,所有的类文件名(库,驱动,控制器,模型)必须首字母大写的形式,必须大写字母开头. 例如: application/libraries/mylibrary.php 需要更改成 application/libraries/Mylibrary.php 同样的有,驱动库,扩展和对CI 核心库的扩展 application/libraries/MY_email.php application/core/MY_log.php 上述文件应分别改名为以下: application/libraries/MY_Email.php application/core/MY_Log.php 控制器: application/controllers/welcome.php -> application/controllers/Welcome.php 模型: application

如何完成中英文语音翻译?

女生的网名这么多〃 提交于 2019-11-28 08:38:16
如何完成中英文语音翻译? 在平时面对一些英语的语音对话,因为英语的学习的不好,感到完成英语的对话有一些压力。 那么如何才能够轻松的完成英语对话,这里有一个很简单的方法,不用学习英语就可以完成将英语对话的方法。 在应用市场或者浏览器里面找到"录音转文字助手"来进行中英文英语语音的翻译,这样就可以不用学习英语就可以完成英语对话了。 使用的方法也非常的简单,在应用市场或者浏览器里面找到这个软件之后,将它下载安装在手机的桌面。 在桌面点击启动这个软件之后,进入到界面里面找到"语音翻译"的功能,来帮助完成中英文语音翻译 在点击功能之后,可以看到进入到了语音翻译的界面。选择下方的语言按钮即可完成对应的语音翻译 比如想要将中文翻译成英文就可以点击"中文"按钮;想要将英文翻译成中文就可以按下"English"按钮 是不是非常的简单,轻松的就完成了中英文的语音翻译 来源: https://blog.csdn.net/JingCsong/article/details/100046342

python

跟風遠走 提交于 2019-11-28 07:47:01
 创始人:吉多·范罗苏姆   1. 解释器:将其它语言翻译成机器可以识别的语言(0,1)     不同类型的解释器,工作方式不同     编译型:编写代码---------- 编译器 将代码统一翻译成机器码,并生成可执行文件------------机器识别,系统中执行可执行文件     解释型:编写代码---------- 解释器 读取一行代码翻译成机器码,翻译后交给机器执行,之后再读取一行翻译。。。直到执行完成。      来源: https://www.cnblogs.com/leafchen/p/11399919.html

有关大数据(如有侵权请联系博主删除)

只谈情不闲聊 提交于 2019-11-28 04:12:39
一、大数据的初步理解 似乎一夜之间,大数据(Big Data)变成一个IT行业中最时髦的词汇。 首先,大数据不是什么完完全全的新生事物,Google的搜索服务就是一个典型的大数据运用,根据客户的需求,Google实时从全球海量的数字资产(或数字垃圾)中快速找出最可能的答案,呈现给你,就是一个最典型的大数据服务。只不过过去这样规模的数据量处理和有商业价值的应用太少,在IT行业没有形成成型的概念。现在随着全球数字化、网络宽带化、互联网应用于各行各业,累积的数据量越来越大,越来越多企业、行业和国家发现,可以利用类似的技术更好地服务客户、发现新商业机会、扩大新市场以及提升效率,才逐步形成大数据这个概念。 有一个有趣的故事是关于奢侈品营销的。PRADA在纽约的旗舰店中每件衣服上都有RFID码。每当一个顾客拿起一件PRADA进试衣间,RFID会被自动识别。同时,数据会传至PRADA总部。每一件衣服在哪个城市哪个旗舰店什么时间被拿进试衣间停留多长时间,数据都被存储起来加以分析。如果有一件衣服销量很低,以往的作法是直接干掉。但如果RFID传回的数据显示这件衣服虽然销量低,但进试衣间的次数多。那就能另外说明一些问题。也许这件衣服的下场就会截然不同,也许在某个细节的微小改变就会重新创造出一件非常流行的产品。 还有一个是关于中国粮食统计的故事。中国的粮食统计是一个老大难的问题。中国的统计,虽然有组织

On Using Very Large Target Vocabulary for Neural Machine Translation

限于喜欢 提交于 2019-11-28 00:53:58
neural machine translation的优点: (1)要求比较少的domain knowledge(比如说源语和目标语的特征) (2)joint tuned, 以往 phrase-based 系统是 tuned separately (3)要求少量的内存 尽管存在很多优点,但是也不可避免第存在缺点: target words受限, 随着target words 数量的增加,模型的训练复杂性增加 因为我的目的就是要了解机器翻译的大概流程,所以就大概说下目前机器翻译的做法,针对这样的做法,本文提出了那些改进: 因为目标语言的词汇量巨大,所以通常的做法是选取选取频率最高的K个词作为target vocabulary(通常也称为shortlist), K的选取范围30000到80000词之间, 其他不在shortlist中的词统称为UNK. 当只有一少部分的词作为UNK时,方法的效果就非常好,随着不在shortlist中的词的增加翻译的性能大幅下降。 但是如果一味地增加shortlist的单词量会使得计算的复杂性增加,主要体现在: 在计算Z的时候因为单词量巨大而使得训练难度增加。 为了解决这个问题,文章提出了一种 importance sampling 的方法,每次更新时,使用目标词汇集中的小部分子集,近似得到Z的值

【论文阅读】Prior Knowledge Integration for Neural Machine Translation using Posterior Regularization

﹥>﹥吖頭↗ 提交于 2019-11-28 00:50:16
本文在参考一些网上资料的基础上,对该论文的思想和重要步骤作出了总结,也加入了在与身边朋友讨论的过程中对文章更细致深入的理解的内容,同时包含了自己在阅读中发现需要了解的背景知识的简单介绍。 目录 概述 背景知识 先验 后验 似然估计 正则化 KL散度 EM算法 log-linear model对数线性模型 Posterior Regularization后验正则化 模型 特征设计 训练 目标 编码 解码 结果 结论 参考资料 概述 这篇搜狗联合清华信息科学与技术国家实验室进行研究、入选ACL 2017的论文提出了将 先验知识 集成到NMT中并保持模型结构不变的一般框架。使用的主要方法是 后验正则化 ,将先验知识表征为对数线性模型中的特征,用来指导NMT的过程。 论文希望解决的问题就是如何将多个重叠的、任意的先验知识集成到神经网络中。一方面,神经网络中用来表示翻译过程中涉及的语言结构的向量的值是连续的。虽然这些向量的表示确实隐含着翻译规则,但很难从语言学的角度来解释。作者对此提出了 四种特征设计方式 对语言学中的先验知识进行编码; 另一方面,在将先验知识编码成翻译规则时,一般都用离散的表达形式(比如词典),将这种离散形式转化为神经网络所要求的连续表示是一件困难的事情。因此作者采用了 对数线性模型 ,代替原来的离散集合表示。 论文链接 背景知识 在了解论文主要工作之前

深度学习中的attention机制

南楼画角 提交于 2019-11-28 00:25:16
最近两年,注意力模型(Attention Model)被广泛使用在自然语言处理、图像识别及语音识别等各种不同类型的深度学习任务中,是深度学习技术中最值得关注与深入了解的核心技术之一。本文以机器翻译为例,深入浅出地介绍了深度学习中注意力机制的原理及关键计算机制,同时也抽象出其本质思想,并介绍了注意力模型在图像及语音等领域的典型应用场景。 注意力模型最近几年在深度学习各个领域被广泛使用,无论是图像处理、语音识别还是自然语言处理的各种不同类型的任务中,都很容易遇到注意力模型的身影。所以,了解注意力机制的工作原理对于关注深度学习技术发展的技术人员来说有很大的必要。 人类的视觉注意力 从注意力模型的命名方式看,很明显其借鉴了人类的注意力机制,因此,我们首先简单介绍人类视觉的选择性注意力机制。 图1 人类的视觉注意力 视觉注意力机制是人类视觉所特有的大脑信号处理机制。人类视觉通过快速扫描全局图像,获得需要重点关注的目标区域,也就是一般所说的注意力焦点,而后对这一区域投入更多注意力资源,以获取更多所需要关注目标的细节信息,而抑制其他无用信息。这是人类利用有限的注意力资源从大量信息中快速筛选出高价值信息的手段,是人类在长期进化中形成的一种生存机制,人类视觉注意力机制极大地提高了视觉信息处理的效率与准确性。 图1形象化展示了人类在看到一副图像时是如何高效分配有限的注意力资源的

常用EXE文件反编译工具【转】

岁酱吖の 提交于 2019-11-27 21:51:50
常用EXE文件反编译工具【转】 http://www.cnblogs.com/happyday56/p/3740108.html PE Explorer V1.99 R5 绿色汉化特别版_强大的可视化汉化集成工具 功能极为强大的可视化汉化集成工具,可直接浏览、修改软件资源,包括菜单、对话框、字符串表等; 另外,还具备有 W32DASM 软件的反编译能力和PEditor 软件的 PE 文件头编辑功能,可以更容易的分析源代码,修复损坏了的资源,可以处理 PE 格式的文件如:EXE、DLL、DRV、BPL、DPL、SYS、CPL、OCX、SCR 等 32 位可执行程序。 该软件支持插件,你可以通过增加插件加强该软件的功能, 原公司在该工具中捆绑了 UPX 的脱壳插件、扫描器和反汇编器,非常好用。 唯一遗憾的是欠缺字典功能…… 点击这里下载文件 eXeScope V6.5 修改QQ版本号 绿色汉化版 小巧但功能极其强大的本地化工具,可以直接修改 VC++ 及 DELPHI 编制的 PE 格式文件的资源,包括菜单、对话框、字符串和位图等,也可与其它本地化工具配合使用。 在汉化中不推荐使用 eXeScope 作为汉化工具,仅作为汉化辅助工具。6.50 版主要对 DELPHI 7 编译的程序支持较好,对 DELPHI 7 以前版本编译的程序,建议使用 6.30 版本,因为该程序对 Unicode