翻译理论

提高CSDN博客的搜索引擎排名

蓝咒 提交于 2020-03-17 10:32:42
介绍一下SEO 我们知道搜索引擎都有一套自己的算法来查找网页,我们可以主动去适应这个算法以提高网页在自然搜索中的收录数量以及排序位置,这就是SEO优化。 markdown与html的翻译规则 用markdown编辑的文章最后会转化为html: 标题语法 # 、 ## 、 ### 、 #### 、 ##### 分别翻译成``<h*></h*>`系列 链接语法 []() 翻译成 <a href="" ></a> 粗体语法 **** 翻译成 <strong></strong> 斜体语法 ** 翻译成 <em></em> 列表语法 * 翻译成 <li></li> 行内代码语法 `` 翻译成 <code></code> ,当然还有一个段内代码语法。 图片插入语法 ![]() 会被翻译成 <img src="" alt=""> SEO优化的建议 标题的优化 markdown的 # 语法,对应了html的h系列语法,蜘蛛认为h1是最重要的关键字,其次是h2,再是h3… 根据SEO的规则, h1只能有一个 ,csdn的markdown编辑器的正文部分是不需要加h1级别的标签的,因为已经有一个h1标签在标题栏里了。 适当使用h标签 可以增加SEO排名,但是不要弄太多,反而会降低排名。 强调语句的优化 strong和em标签会增强这句话的重要性, strong比em重要等级要高 。

DialogueGCN论文翻译

半城伤御伤魂 提交于 2020-02-09 20:10:58
对话GCN:对话中情感识别的图卷积神经网络 绪论 会话中的情感识别(ERC)最近受到了研究者的广泛关注,因为它在医疗,教育和人力资源等各个领域都有潜在的广泛应用。 在本文中,我们介绍了对话图卷积网络(DialogueGCN),这是一种基于图神经网络的ERC方法。 我们利用对话者的自我和说话者之间的依存关系来为情感识别建模会话上下文。 通过图网络,DialogueGCN解决了当前基于RNN的方法中存在的上下文传播问题。 我们凭经验表明,这种方法可以缓解此类问题,同时在许多基准情感分类数据集上的表现要优于当前水平。 1 引言 几十年来,情绪识别一直是一个活跃的研究主题(K. D’Mello等,2006; Busso等,2008; Strapparava和Mihalcea,2010)。 然而,最近在社交媒体平台(例如Facebook,Twitter,Youtube和Red dit)上开放式对话数据的激增引起了热烈的关注(Poria等人,2019b; Majumder等人,2019; Huang等人。 (2019年),从研究人员转向对话中的情感识别(ERC)。 不可否认,ERC在情感对话系统(如图1所示)中也很重要,在这种对话中,机器人可以理解用户的情绪并产生连贯和移情反应的情绪。 图1:情感对话的插图,其中情感取决于上下文。 健康助手了解用户的情感状态,以生成情感和移情反应

【论文翻译】Neural Architectures for Named Entity Recognition

痞子三分冷 提交于 2020-02-07 03:58:30
Abstract   处于领先水平的命名实体识别系统严重依赖于人工设计的特征与特定领域的知识,从而更高效地学习小型、带标记的语料库 。在这篇论文里我们介绍了两种神经结构——一种结构是基于双向LSTM与条件随机场,另一种结构是通过一种基于转换、Shift-Reduce解析的算法构造并标记了单词。我们的模型依赖于单词信息的两个来源:一是从带监督语料库中学习的基于单字的词表示,二是从无注释语料库中学习的非监督词表示。对于NER(命名实体识别),在使用四种语言且没有任何术语资源(比如Gazetteers,斯坦福开源的地名数据库)的前提下,我们的模型表现出了较好的性能。 1 Introduction   NER 是一个具有挑战性的学习问题。一方面,在大多数的语言和领域中可获取的监督训练数据都是很少的。另一方面,对于可以命名的单词种类限制很少,所以很难从这么小的数据集中泛化出好的模型。因此精心构造的词素特征和术语资源,比如Gazetteers(地名数据库),被广泛用于解决本次任务。不幸地是,在新语言与新领域的发展过程中术语资源与特征是很昂贵的,这给新语言与新领域的发展带来了挑战。利用无注释语料库进行的无监督学习提供了一个可替代策略,以便于即使学习的是小规模的监督数据集,也有较好的泛化能力。然而,甚至那些广泛依赖于无监督特征的系统(Collobert et al., 2011; Turian

一个程序员的2014年总结

*爱你&永不变心* 提交于 2020-01-05 04:50:07
又是一年过去了,看着周围90后在飞速成长,不得不感叹自己这一年轻的优势已经损失殆尽。唯有快马加鞭,不断努力,才能确保自己在战场上了不落后于别人,保持甚至增加自己的核心竞争力。 2013年底的时候写了一篇个人总结 http://www.huangbowen.net/blog/2014/01/02/my-conclusion-of-2013/ ,阅读起来,一年前的我经过各种洗礼已经模糊,前途望去也是有些迷茫,希望能早日拨开云雾见阳天。 考取了AWS的助理级架构师认证,再也不是无证的程序员了,在云计算和DevOps也算是取得了一定的成绩。俗话说,站得高,看的远,明年要学习的东西还有很多。 总共出差了5个月。跑到异国他乡的澳洲,体验着另一种风土人情,在客户现场也学到了平时很难接触到的知识。在此期间老婆辛苦了,表示感谢。 翻译了两本书。一本是《响应式Web设计:HTML5和CSS3实践指南》,另一本是《Multithreading in C# 5.0 cookbook》(1月份出版)。翻译速度比去年那本快多了。以后接书还是想找些自己感兴趣的技术方面,翻译起来动力也足些。 撰写了50+篇博客,大部分以技术类型为主。基本实现了每周一篇的既定目标。这些博客都是自己不断进步的见证者,希望我能一直写下去。 读了10+本书。其实有些汗颜,后半年基本没认真读过什么技术类书籍

【翻译】理解 LSTM 网络

折月煮酒 提交于 2020-01-05 02:01:10
目录 理解 LSTM 网络 递归神经网络 长期依赖性问题 LSTM 网络 LSTM 的核心想法 逐步解析 LSTM 的流程 长短期记忆的变种 结论 鸣谢 本文翻译自 Christopher Olah 的博文 Understanding LSTM Networks ,原文以图文并茂的形式,深入浅出地为初学者介绍了 LSTM 网络。 【翻译】理解 LSTM 及其图示 或许可以进一步帮助理解。 理解 LSTM 网络 Understanding LSTM Networks 递归神经网络 Recurrent Neural Networks 人类并不是时刻都从头开始思考。如果你阅读这篇文章,你是在之前词汇的基础上理解每一个词汇,你不需要丢掉一切从头开始思考。你的思想具有延续性。 传统的神经网络无法做到这样,并且这成为了一个主要的缺陷。例如,想像一下你需要对一部电影中正在发生的事件做出判断。目前还不清楚传统的神经网络如何根据先前发生的事件来推测之后发生的事件。 递归神经网络正好用来解决这个问题。递归神经网络的内部存在着循环,用来保持信息的延续性。 Humans don't start their thinking from scratch every second. As you read this essay, you understand each word based on your

翻译: Clustered Index Design Considerations 聚集索引设计注意事项

你。 提交于 2020-01-01 04:56:03
原文出自: 《Pro SQL Server Internals, 2nd edition》 的CHAPTER 7 Designing and Tuning the Indexes中的Clustered Index Design Considerations一节(即P155~P165) ,Dmitri Korotkevitch,侵删 每次更改聚集索引键的值时,都会发生两件事。 首先,SQL Server将行移动到聚集索引页链和数据文件中的不同位置。 其次,它更新了row-id,它是聚集索引键。 存储的行id,需要在所有非聚集索引中更新。 就I / O而言,这可能是昂贵的,特别是在批量更新的情况下。 此外,它可以增加聚集索引的碎片,并且在行ID大小增加的情况下,可以增加非聚集索引的碎片。 因此,最好有一个静态聚集索引,其中键值不会改变。 所有非聚集索引都使用聚集索引键作为row-id。 过宽的聚集索引键会增加非聚集索引行的大小,并且需要更多空间来存储它们。 因此,SQL Server需要在索引或范围扫描操作期间处理更多数据页,这会降低索引的效率。 在非唯一非聚集索引的情况下,row-id也存储在非叶索引级别,这反过来会减少每页索引记录的数量,并可能导致索引中的额外中间级别。 尽管非叶索引级别通常缓存在内存中,但每次SQL Server遍历非聚集索引B-Tree时

翻译之:设计和调整索引

风格不统一 提交于 2020-01-01 04:55:38
文章选自:《Pro SQL Server Internals, 2nd edition》CHAPTER 2 Tables and Indexes 作者:Dmitri Korotkevitch 第七章 设计和调整索引 It is impossible to define an indexing strategy that will work everywhere. Every system is unique and requires its own indexing approach based on workload, business requirements, and quite a few other factors. However, there are several design considerations and guidelines that can be applied in every system. 我们无法定义可在任何地方使用的索引策略。 每个系统都是独一无二的,需要基于工作负载,业务需求和其他一些因素定义自己的索引方法。但是,还是有几个设计考虑因素和指南可以应用于每个系统。 The same is true when we are optimizing existing systems. While optimization is an

翻译:设计和优化索引

筅森魡賤 提交于 2020-01-01 04:55:20
定义一个索引方法在每一处都能有效这是不可能的,每一个系统都是独一的,需要基于工作负载的索引方法,商业要求和很多其他的因素,然而,有很多的设计考虑和指导都能够呗应用到每一个系统,当我们在优化系统时也是同样的,虽然优化是一个迭代过程,在每一个的系统中都是独特的,在每一个数据系统中有一组技术能够用于侦探出无效性。在这一章节中,我们将会介绍很多当你在设计新的索引和优化现有的数据库,你必须要记住的重要因素; 集群索引设计注意事项 每次更改聚集索引键的值时,都会发生两件事情。首先,SQL Server将行移动到集群索引页链和数据文件中的不同位置。其次,它更新行id,这是聚集索引键。行id存储在所有非集群索引中,需要更新。就I/O而言,这可能很昂贵,尤其是在批量更新的情况下。此外,它还可以增加聚集索引的碎片,并且在行id大小增加的情况下,还可以增加非聚集索引的碎片。因此,最好在键值不变的情况下使用静态聚集索引。 所有非聚集索引都使用聚集索引键作为行id。太宽的聚集索引键会增加非聚集索引行的大小,并需要更多的空间来存储它们。因此,SQL Server在索引或范围扫描操作期间需要处理更多的数据页,这会降低索引的效率。 对于非惟一的非集群索引,行id也存储在非叶索引级别,这反过来减少了每页索引记录的数量,并可能导致索引中额外的中间级别。尽管非叶索引级别通常缓存在内存中,但每次SQL

翻译:设计和优化索引

不问归期 提交于 2020-01-01 04:55:07
定义一个索引方法在每一处都能有效这是不可能的,每一个系统都是独一的,需要基于工作负载的索引方法,商业要求和很多其他的因素,然而,有很多的设计考虑和指导都能够呗应用到每一个系统,当我们在优化系统时也是同样的,虽然优化是一个迭代过程,在每一个的系统中都是独特的,在每一个数据系统中有一组技术能够用于侦探出无效性。在这一章节中,我们将会介绍很多当你在设计新的索引和优化现有的数据库,你必须要记住的重要因素; 集群索引设计注意事项 每次更改聚集索引键的值时,都会发生两件事情。首先,SQL Server将行移动到集群索引页链和数据文件中的不同位置。其次,它更新行id,这是聚集索引键。行id存储在所有非集群索引中,需要更新。就I/O而言,这可能很昂贵,尤其是在批量更新的情况下。此外,它还可以增加聚集索引的碎片,并且在行id大小增加的情况下,还可以增加非聚集索引的碎片。因此,最好在键值不变的情况下使用静态聚集索引。 所有非聚集索引都使用聚集索引键作为行id。太宽的聚集索引键会增加非聚集索引行的大小,并需要更多的空间来存储它们。因此,SQL Server在索引或范围扫描操作期间需要处理更多的数据页,这会降低索引的效率。 对于非惟一的非集群索引,行id也存储在非叶索引级别,这反过来减少了每页索引记录的数量,并可能导致索引中额外的中间级别。尽管非叶索引级别通常缓存在内存中,但每次SQL

神经网络机器翻译技术及应用(下)

▼魔方 西西 提交于 2019-12-12 14:20:19
何中军,百度机器翻译技术负责人。本文根据作者2018年12月在全球架构师峰会上的特邀报告整理而成。 神经网络机器翻译技术及应用(上)篇,我们为大家介绍了神经网络机器翻译的基本原理和挑战,(下)篇继续为大家讲述机器翻译的应用与未来。 前面我们讲了机器翻译的原理以及神经网络翻译的发展、以及面临的挑战,我们现在看一看,机器翻译现在有哪些应用? 机器翻译在越来越多地帮助和影响我们的生活。上图中列出了几个利用机器翻译来进行日常学习和交流的例子。左边两位是明星,一位是电影明星,利用翻译系统翻译化妆品成分,一位是公交司机,利用翻译APP学习英文,并运用到工作中去。右边是交警、售票员利用机器翻译与外国人进行交流。 这只是机器翻译应用的一个缩影。随着技术的发展和交流的需要,机器翻译已经深切地融入我们的生活。 机器翻译除了能做翻译之外还可以做一些很有意思的事情,比如说白话文和文言文的翻译,其实用的技术是类似的,从一种语言表达翻译成另外一种语言表达,或者从一个字串变换为另外一个字串,甚至是从一幅图产生文字说明,凡是这样的工作都可以用机器翻译的技术来做。 机器翻译还可以做什么,作诗。这是机器翻译写的两首诗,大家可以看一下,右边这个,“腊梅开时独自寒,幽香一缕为哪般。东风不解相思意,吹落梨花雪满天。”意境是不错的。而它的原理也是机器翻译的原理,从上一句翻译到下一句,可以认为上一句是原文,下一句是目标译文