自然语言处理

python和C++语言有何区别?哪个适合人工智能?

此生再无相见时 提交于 2020-10-07 05:20:32
 人工智能是当下非常热门的领域,随着社会的发展以及提升,人工智能技术的提升不仅为企业带来效率,也为我们带来便利的生活。现在适用于人工智能的编程语言有很多,其中python和C++最为常见,那么它们有何优缺点呢?   python语言:   由于其语言语法,简单和多功能性能,python成为开发人员最喜欢的人工智能开发语言。python最打动人心的地方就是便捷性,它可以在Linux、Windows、MAC和Unix等平台上使用,允许用户创建交互式、解释的、模块化、动态、可移植和高级代码。   Python是一种多范式编程语言,支持面向对象,过程式和功能式编程风格。由于其简单的函数库和理想的结构,Python支持神经网络和NLP解决方案的开发。   python优点:python有丰富多样的库和工具;支持算法测试,而无需实现它们;Python的面向对象设计提高了程序员的生产力;与Java等语言对比,python开发速度更快。   python缺点:使用python编写人工智能程序的程序员很难适应其他语言算法;与其他语言对比,python需要在解释器帮助下工作,会拖慢在AI开发中的编译和执行速度。   C++语言:   C++最快的计算机语言,如果你的人工智能项目对于时间特别敏感,C++是很好的选择。它提供更快的执行时间和更快的响应时间。此外C++允许广泛使用算法

文件误删秒恢复!微软又发布了一款命令行神器!

爱⌒轻易说出口 提交于 2020-10-06 08:46:31
误删文件这事相信大家都碰到过,比如不小心误删了一个重要的文件,一不留神就把自己的硬盘清空了,或者是面对已经被误删的文件手足无措......以前碰到这种情况,有实力的程序员们就靠实力恢复误删的文件,像猿妹这样没实力的,网上购买个小工具也可以帮我恢复,就是费钱。 现在好了,最近微软在 Windows 10 应用商店中上架了一款免费的数据删除恢复工具 Windows File Recovery,猿妹再也不用担心误删文件了。 Windows File Recovery基于命令行程序设计,大小仅有8.26MB,所有Windows 10用户均可免费下载使用。 无论是照片、文档、视频还是其他,Windows File Recovery都可以帮你恢复,而且它还支持机械硬盘、固态硬盘、U盘、SD卡等多种硬件类型,遗憾的是,不支持网络驱动器文件恢复。 下面还是一起来看看用法吧: 1、安装下载 首先,通过下载链接打开“Windows File Recovery”的下载界面,点击“获取”按钮安装。(下载地址: https://www.microsoft.com/zh-cn/p/windows-file-recovery/9n26s50ln705?activetab=pivot:overviewtab ) 这里需要提醒大家的是,安装Windows File Recovery操作系统要求Windows

动手学深度学习源码 & CVPR / ECCV 2020开源代码

放肆的年华 提交于 2020-10-05 13:55:21
动手学深度学习其源码分别包括Pytorch、TensorFlow、MxNet框架的代码,十分方便学习深度学习在不同框架下的实现。面向中文读者的能运行、可讨论的深度学习,它将文字、公式、图像、代码和运行结果结合在一起。全面介绍深度学习从模型构造到模型训练,以及它们在计算机视觉和自然语言处理中的应用。 每一小节都是可以运行的 Jupyter 记事本 你可以自由修改代码和超参数来获取及时反馈,从而积累深度学习的实战经验。 公式 + 图示 + 代码 我们不仅结合文字、公式和图示来阐明深度学习里常用的模型和算法,还提供代码来演示如何从零开始实现它们,并使用真实数据来提供一个交互式的学习体验。 活跃社区支持 你可以通过每个章节最后的链接来同社区的数千名小伙伴一起讨论学习。 被用作教材或参考书 北京大学 复旦大学 哈尔滨工业大学 清华大学 上海财经大学 上海交通大学 浙江大学 中国科学技术大学 Carnegie Mellon University(美国) Emory University(美国) Gazi Üniversitesi(土耳其) Georgia Institute of Technology(美国) Habib University(巴基斯坦) Hasso-Plattner-Institut(德国) Hiroshima University(日本) Imperial College

你的孤独都被AI看穿了

六月ゝ 毕业季﹏ 提交于 2020-10-05 13:47:54
     作者 | 贝爽   你真的“孤独”吗?   曾经这张火遍全宇宙的“国际孤独等级表”,让不少网友泪目,就差没做过手术了。      不过,也有网友质疑,一个人吃饭,看电影,唱K,就真的是孤独吗?也许合群才是真正的“孤独患者”。关于是否孤独这件事,AI的检测方式可能更具有权威性。   最近,美国研究人员利用AI工具分析人类的孤独指数,准确率达到了94%。   1   AI分析谈话,检测孤独指数   一位来自美国IBM Watson实验室的负责人称,    “自然语言处理(NLP)和机器学习(ML)能够通过长时间的访谈对话,对表达的情绪和微妙的语言特征进行无偏量化估计,并准确地评估人类的孤独指数。      近日,他们与加利福尼亚大学圣地亚哥分校医学院合作,开展了这项AI研究。这项研究的受试者是80位年龄在66至94岁之间的独立居住的居民,平均年龄在83岁。   研究人员对他们进行了半结构化的访谈,内容主要围绕以下三个问题:   Q1:“您是否感到孤独,多久会有一次这样的情绪?   Q2:孤独的感觉是怎么样的,心情如何?   Q3:为什么你认为别人会感到孤独?   访谈最长会持续到90分钟,结束后,研究人员对80位受访者的语音对话,通过IBM开发的NLP模型(WNLU)和ML工具进行了转录、情感分析和量化。      此外,为了进一步辅助结果的准确性,研究人员还进行了定量评估

一文看懂 Attention(本质原理+3大优点+5大类型)

ⅰ亾dé卋堺 提交于 2020-10-04 03:14:39
转自: https://zhuanlan.zhihu.com/p/91839581 Attention 正在被越来越广泛的得到应用。尤其是 BERT 火爆了之后。 Attention 到底有什么特别之处?他的原理和本质是什么?Attention都有哪些类型?本文将详细讲解Attention的方方面面。 Attention 的本质是什么 Attention(注意力)机制如果浅层的理解,跟他的名字非常匹配。他的核心逻辑就是「 从关注全部到关注重点 」。 Attention 机制很像人类看图片的逻辑,当我们看一张图片的时候,我们并没有看清图片的全部内容,而是将注意力集中在了图片的焦点上。大家看一下下面这张图: 我们一定会看清「锦江饭店」4个字,如下图: 但是我相信没人会意识到「锦江饭店」上面还有一串「电话号码」,也不会意识到「喜运来大酒家」,如下图: 所以,当我们看一张图片的时候,其实是这样的: 上面所说的,我们的视觉系统就是一种 Attention机制, 将有限的注意力集中在重点信息上,从而节省资源,快速获得最有效的信息。 AI 领域的 Attention 机制 Attention 机制最早是在计算机视觉里应用的,随后在 NLP 领域也开始应用了,真正发扬光大是在 NLP 领域,因为 2018 年 BERT 和 GPT 的效果出奇的好,进而走红。而 Transformer 和

ACL 2020:微软最佳论文,Bengio论文获时间检验奖,大陆论文量第二

天大地大妈咪最大 提交于 2020-10-03 13:22:32
  机器之心报道    参与:魔王、小舟、杜伟    在陆续放出时间检验奖、终身成就奖和杰出服务奖之后,ACL 2020 终于公布了今年的最佳论文奖。该奖项由来自微软研究院、华盛顿大学和加州大学欧文分校的研究者摘得,主题是与任务无关的 NLP 模型测试方法。      ACL 是自然语言处理领域的顶级会议,根据刚刚发布的最新版 Google Scholar Metrics,ACL 继续领跑计算语言学领域,h5 指数达到 135。   今年的 ACL 会议于本月 5 日至 10 日在线上召开。此次会议公布了最佳论文、最佳主题论文、最佳 demo 论文、时间检验奖等多个奖项。   此外,大会官方也介绍了今年的接收论文、热门研究主题等数据。   ACL 2020 共收到投稿 3429 篇,创下了 ACL 投稿数量的新纪录。此次会议共接收论文 779 篇,包括 571 篇长论文和 208 篇短论文,论文接收率为 22.7%。      接下来,我们看下 ACL 2020 的热门研究主题。      用于 NLP 的机器学习、对话与交互技术、机器翻译、信息提取和 NLP 应用是此次会议最热门的 5 个研究主题,每个都有超过 200 篇论文投稿。其中「用于 NLP 的机器学习」主题的论文投稿接近 300 篇(296)。      此外,大会公布了论文提交数量最多的 25 个国家或地区

穆迪分析借助AI支持功能增强CreditEdge™和RiskCalc™平台

回眸只為那壹抹淺笑 提交于 2020-10-03 12:32:27
纽约--(美国商业资讯)--穆迪分析(Moody’s Analytics)欣然宣布为 CreditEdge 和 RiskCalc 解决方案增添人工智能(AI)功能。这些平台现已结合穆迪分析的信用情绪评分( Credit Sentiment Score™ )工具以及AI新闻订阅源。这些工具使用自然语言处理与新闻媒体文本分析来帮助客户过滤掉市场噪音,并找出其投资组合中上市和非上市公司的信用相关新闻。 利用这些AI支持功能,客户可以识别与公司信用风险相关的新闻报道——例如包含违约、破产、债务重组、诉讼和潜在财务困境的新闻,并根据报道内容中体现的对该公司的看法来对这些报道进行评分。这些资源结合在一起,对RiskCalc和CreditEdge解决方案的定量信用风险建模功能形成补充,并为组合与风险经理提供了更多的信用恶化早期预警。 穆迪分析董事总经理Nihil Patel表示:“我们的客户希望拥有尽可能多的实时信息,以做出理据充分的业务决策并更有效地管理其投资组合,尤其是在信贷环境不断恶化的情况下。这些AI驱动的新功能通过揭示事件与公司之间的直接和间接联系,一站式地提供了以往需要耗费大量时间才能艰难获得的洞察力。” CreditEdge解决方案为度量上市公司与主权实体投资组合的信用风险提供先进的量化违约概率模型。它将穆迪分析的EDF™(预期违约频率)模型

最小熵原理系列:词向量的维度应该怎么选择?

旧街凉风 提交于 2020-10-03 11:44:40
©PaperWeekly 原创 · 作者|苏剑林 单位|追一科技 研究方向|NLP、神经网络 随着 NLP 的发展,像 Word2Vec、Glove 这样的词向量模型,正逐渐地被基于 Transformer 的 BERT 等模型代替,不过经典始终是经典,词向量模型依然在不少场景发光发热,并且仍有不少值得我们去研究的地方。本文我们来关心一个词向量模型可能有的疑惑: 词向量的维度大概多少才够? 先说结论,笔者给出的估算结果是: 更简约的话可以直接记 ,其中 N 是词表大小,n 就是词向量维度, 是自然对数。当 n 超过这个阈值时,就说明模型有足够的容量容纳这 N 个词语(当然 n 越大过拟合风险也越大)。 这样一来,当 N=100000 时,得到的 n 大约是 96,所以对于 10 万个词的词向量模型来说,维度选择 96 就足够了;如果要容纳 500 万个词,那么 n 大概就是 128。 背景 之所以想起这个问题,是因为昨天在 Arxiv 上刷到了论文 Word2vec Skip-gram Dimensionality Selection via Sequential Normalized Maximum Likelihood [1] ,遗憾的是,从这篇论文中笔者并没有找到想要的答案。顺带搜索了一下,发现也有类似文献研究同样的问题,比如 On the Dimensionality of

用 Python 详解《英雄联盟》游戏取胜的重要因素!

烂漫一生 提交于 2020-10-03 06:37:12
作者 | DeepHub IMBA 责编 | 王晓曼 介绍 在过去的几年里,电子竞技社区发展迅速,曾经只是休闲娱乐的电子竞技产业,到2022年有望创造18亿美元的收入。 虽然在这个生态系统中有很多电子游戏,但很少有游戏像《英雄联盟》那样成为社区的主要元素,该游戏在2019年世界锦标赛期间吸引了超过1亿的独立观众。 《英雄联盟》于2009年底发行,是一款免费的多人在线战斗竞技场(MOBA)视频游戏,由 Riot Games 公司开发,这款游戏在早期就产生了广泛的竞争场景,2011年的第一届世界冠军创造了约160万观众。 随着 Riot 开始了解如何改变才能使游戏更具竞争性和趣味性,这款游戏在受欢迎程度和可玩性方面都有所提高。 在《英雄联盟》的比赛中,两队各有五名玩家,每一队都控制着一个独特的角色或“冠军”,当其中一队位于其基地深处的 Nexus 被摧毁时,比赛就会结束。 在这个过程中,一个团队可以实现很多目标,比如摧毁炮塔,杀死中立的怪物,比如龙和男爵,以获得整个团队的增益,等等。 有些目标,如摧毁至少五个炮塔和一个兵营,是赢得游戏所必需的,而其他目标,如获得第一滴血,是有益的,但不是必须的。 通过这个项目,我想更好的了解这些目标中哪一个是赢得英雄联盟游戏最重要的。就此而言,我提出的问题如下: 英雄联盟最重要的获胜条件是什么? 收集数据 我首先申请了一个使用 Riot

BI工具如何选型,知道这几点避免少踩坑

拜拜、爱过 提交于 2020-10-02 15:22:32
BI工具 这个词汇近几年来频繁出现,相信大家对BI工具的含义并不陌生。但许多企业在寻找商业智能解决方案(BI)时,对实际的需求和目的并不是很明确,因此对BI工具的选型可能会出现偏差,今天小编给大家介绍一下在选择智能解决方案时应该注意的问题。 我们先从最基础的开始了解,首先什么是数据可视化?数据可视化是通过将数据转换成可视化的展示来帮助人们更直观地理解趋势、变化、业务洞察等的过程。表现形式有很多种,比如饼图、柱形图、折线图、雷达图、气泡图等。虽然所有人都希望数据可以很便捷的进行可视化,但是仅仅从公司平台上获得的数据是很难获得真正的数据洞察的。在企业需求方面,数据分析和可视化展示这两种需求区别还是很大的。可视化虽然很重要,但不能仅仅是商业智能软件的唯一组成部分。 一、数据背后是大量的准备工作 虽然仪表盘看起来很简单,但大多数用户就会想当然的以为,分析报告中用到的数据的整理、数据清洗等工作会在系统后台自动处理。实际上,如果数据质量很低或者数据分散在各个平台上,我们是需要花费大量的甚至达到80%的时间在数据处理上,数据的处理和整合仅仅是数据分析的开始。 为了进行有效的分析,我们需要将所有数据放在同一个数据库中,以获得更加全面的数据洞察,而且还希望数据可以进行修改和实时更新,然而从目前的商业环境来看,这并不是件容易的事情。由于公司的数据都分散在不同的地方,数据源有本地文件、CRM平台