自然语言处理

客服领域应用RPA的3大典型场景

坚强是说给别人听的谎言 提交于 2020-08-11 03:21:41
客服领域应用RPA的3大典型场景 一、业务流程的自动化办理 1、业务痛点: 某大型电信运营商,在流程化业务办理方面存有痛点。在流量办理、话费办理、短信办理、增加或者取消业务等领域,客户办理套餐更改非常频繁,客服在处理这些业务时需要在系统间不断切换,增加了服务时长,不仅影响客户体验,还降低了企业服务效率。 2、RPA解决方案: 基于此场景,可以通过RPA机器人进行客服操作的采集和设定,对复杂业务进行分析,利用模拟和替代人工操作的技术,从而对业务流程的办理实现自动化操作。 借助RPA技术,并利用AI技术,帮助客服进行准确的问题答复和快速的问题查询。在呼叫中心任务中,将客户希望办理的业务经过自然语言理解后,直接提供给RPA执行,这对于缓解客服的接待压力是革命性的改变。 3、实施效果: 根据实际效果,在办理流量套餐更改的业务上,原先人工受理的方式大概需要70秒左右的时间进行操作,而采用RPA技术仅仅需要5秒,对于更加复杂的业务,实际效果越明显。使用RPA机器人,平均1个坐席的工作效率等于12个传统坐席的工作效率,这不论是对于企业还是客户都将带来巨大的收益。 二、知识库的自动查询 1、业务痛点: 知识库是客服系统必备的功能,很多大型企业都有内部的知识库。客服查询相关信息时需要到企业内部知识库进行查询,但是很多企业内部的知识库并不是同一个。 比如大型IT企业有解决方案知识库、法律条规知识库

ICLR 2020 | ReClor: 一个需要逻辑推理的阅读理解数据集

倖福魔咒の 提交于 2020-08-11 00:47:53
     语言预训练模型在现有流行的阅读理解数据集上取得了惊人的效果,因此,现在是时候引入更复杂的数据集来推动该领域朝着更复杂推理的方向发展了。   新加坡国立大学冯佳时团队最近在ICLR 2020 上发表的论文《ReClor: A Reading Comprehension Dataset Requiring Logical Reasoning》,正是在这方面的工作。   文 | Weihao Yu   编 | 丛 末   这篇论文引入了一个来源于标准化考试的、需要逻辑推理的阅读理解数据集 (ReClor)。   如之前研究,人工标注的数据集通常包含偏差,模型往往能利用这些偏差来得到很好的效果。为了全面评估模型在ReClor数据集上的逻辑推理能力,作者将测试集中带有偏差的数据归为EASY集,其余归为HARD集。   实验结果表明当前预训练模型具有很强的捕获偏差的能力,它们在EASY集上表现优秀。然而,预训练模型在HARD集上却举步维艰,性能接近或稍高于随机猜测,这表明需要更多的工作来增强模型的逻辑推理能力。      论文地址:https://arxiv.org/abs/2002.04326   项目主页:http://whyu.me/reclor/   机器阅读理解(MRC)是自然语言处理中的一项基本任务,该任务需要模型根据文本和特定问题预测答案

论文笔记:A Structured Self-Attentive Sentence Embedding

ぐ巨炮叔叔 提交于 2020-08-10 22:43:12
A Structured Self-Attentive Sentence Embedding ICLR 2017 2018-08-19 14:07:29 Paper : https://arxiv.org/pdf/1703.03130.pdf Code(PyTorch) : https://github.com/kaushalshetty/Structured-Self-Attention Video Tutorial (Youtube) : Ivan Bilan: Understanding and Applying Self-Attention for NLP | PyData Berlin 2018 Blog : 1. 机器之心 2. https://www.paperweekly.site/papers/notes/148 Related Papers : Self-Attention Generative Adversarial Networks Background and Motivation : 现有的处理文本的常规流程第一步就是:Word embedding。也有一些 embedding 的方法是考虑了 phrase 和 sentences 的。这些方法大致可以分为两种: universal sentence(general 的句子)和 certain task

自然语言处理十大应用

牧云@^-^@ 提交于 2020-08-10 20:12:19
作者|ABHISHEK SHARMA 编译|VK 来源|Analytics Vidhya 介绍 自然语言处理是数据科学领域最热门的课题之一。公司在这一领域投入大量资金进行研究。每个人都在努力了解自然语言处理及其应用,并以此为生。 你知道为什么吗? 因为仅仅在短短几年的时间里,自然语言处理已经发展成为一种无人能想象的强大而有影响力的东西。 为了了解自然语言处理的力量及其对我们生活的影响,我们需要看看它的应用。因此,我列出了自然语言处理的十大应用。 那么,让我们从自然语言处理的第一个应用开始。 搜索自动更正和自动完成 每当你在谷歌上搜索某个东西,在输入2-3个字母后,它会显示可能的搜索词。或者,如果你搜索一些有错别字的东西,它会更正它们,仍然会找到适合你的相关结果。是不是很神奇? 它是每个人每天都在使用的东西,但从来没有太多的关注它。这是自然语言处理的一个很好的应用,也是一个很好的例子。它影响世界上数百万人,包括你和我。 搜索自动完成和自动更正都有助于我们更有效地找到准确的结果。现在,其他许多公司也开始在他们的网站上使用这个功能,比如Facebook和Quora。 搜索自动完成和自动更正背后的驱动引擎是语言模型。 语言翻译 你有没有用谷歌翻译来找出不同语言中的某个词或短语?它将一段文字用一种语言翻译成另一种语言的容易程度是相当惊人的,对吧?它背后的技术是机器翻译。

flask + pyecharts 搭建新冠肺炎疫情数据可视化交互分析平台:包含疫情数据获取、态势感知、预测分析、舆情监测等任务

时光怂恿深爱的人放手 提交于 2020-08-10 19:54:46
该项目是浙江大学地理空间数据库课程作业8:空间分析中,使用 flask + pyecharts 搭建的简单新冠肺炎疫情数据可视化交互分析平台,包含疫情数据获取、态势感知、预测分析、舆情监测等任务 包含完整代码和实现的github地址: https://github.com/yunwei37/COVID-19-NLP-vis 项目分析报告已部署到网页端,可点击 http://flask.yunwei123.tech/ 进行查看 交互可视化分析截图: 空间数据分析 作业要求 作业目的: 了解空间数据在日常生活中的应用,熟悉空间数据统计分析、空间数据挖掘、空间数据可视化等技术。 作业内容: 新型冠状病毒肺炎(COVID-19,简称“新冠肺炎”)疫情肆虐全球多个国家,2020年3月11日,世界卫生组织 (WHO) 正式宣布将新冠肺炎列为全球性大流行病。在全球抗击新型冠状病毒疫情的过程中,产生了前所未有的大规模疫情数据,利用大数据分析技术和方法能够协助发现病毒传染源、监测疫情发展、调配救援物资,从而更好地进行疫情防控工作。空间数据分析作为大数据分析的重要组成,将数据智能处理、直观展示和交互分析有机地结合,使机器智能和人类智慧深度融合、优势互补,为疫情防控中的分析、指挥和决策提供有效依据和指南。 作业要求以新冠疫情或其它重大公共卫生事件的相关时空数据为基础,利用数据清洗与管理、统计分析

最新校招京东、百度、头条算法面试真题分享

大兔子大兔子 提交于 2020-08-10 18:20:12
1 .京东面试经历 面试的京东的商品推荐的算法岗,在北辰大厦(奥森旁边),面试难度总体来说比较简单。 ①:到公司之后先做了一个小时的笔试题目 ,包括四个简答题和两个编程题,简答题主要是 C语言相关的。 Map和Set的插入和查找的复杂度是多少,Set是否可以存储类 递归和循环可以互相转换吗? epull和select的原理以及区别? 什么时候会调用构造函数和析构函数?父类的构造函数可以是virtual的吗? 编程题也特别简单,一道题是一个有序的数组,寻找数组的中的两个数它们的和是否等 于某 个值target,返回True或者False,要求O(n)的复杂度。 另一道题目是一个数组,两个相邻下标的数组的值的差的绝对值为1,然后在这个数组中寻找 某个值是否在这个数组中,是的话返回下标,否则返回-1。 ②:第一轮面试也特别简单 ,主要就是聊了聊自己的论文是怎么做的,实习的时候干了啥, 然后再出了一道编程题,一个无序数组,只有0,1,2,然后你要对这个数组进行排序,要求 O(n)复杂度。(荷兰国旗问题) ③:第二轮面试也是主要是聊了聊自己的论文 ,然后推导SVM的原理,然后logistic和SVM 的区别,Attention注意力机制的原理,RNN的公式等。 还有一个编程题反转链表。 面试完三天拿到了口头offer,感觉总体来说还是比较简单的。 今天收到了京东的录用函

零门槛入门AI开发,明天的这场公开课值得收藏三连

女生的网名这么多〃 提交于 2020-08-10 18:19:57
明天,就是 2020 WAIC 开发者日重磅环节了,这场即将开播的公开课值得你点赞、收藏、分享三连。 两天前, 2020 WAIC 开发者日全日程 揭晓,这是一场包含了 60 位重磅嘉宾、43 场演讲、9 大环节的盛会。其中,有一场为开发者提供三小时极致学习的公开课,值得爱学习的小伙伴们注册观看。 「开发者日百度公开课」由机器之心联合百度组织,基于百度飞桨平台,从 NLP、CV 到零门槛 AI 开发平台 EasyDL,助力学习者掌握人工智能开发技能。 不久之前的「WAVE SUMMIT 2020」深度学习开发者峰会,百度飞桨做了一系列全新发布与升级,能够极大地提升开发者的开发体验。 在这场公开课中,来自百度的四位技术专家将结合自身多年深耕 AI 开发领域的经验,分别从智能对话技术、视觉技术、EasyDL 平台三个方向做分享,也将演示如何进行实际操作,手把手带领观众学习 AI 开发。 https:// api.worldaic.com.cn/wai c-portal/shortLink/jump/19df8dfe7c134709b080fdb54f130309 (二维码自动识别) 有关「开发者日百度公开课」课程详情,可查看文章:《 3 小时极致学习 AI 开发,WAIC 开发者日有一堂必上公开课 》。 纵深布局人工智能技术十数年,开发者一直是百度极为重视的力量

后疫情时代,证券公司如何进行差异化竞争?

倾然丶 夕夏残阳落幕 提交于 2020-08-10 18:06:04
过去5年,伴随宏观经济下行和监管调控,证券行业经历了大起大落。2015年股灾以后的三年间,伴随交易和融资量的萎缩,证券行业收入年均下降23%。然而2019年以来,伴随资本市场改革加速, 股权融资大发展时代已经到来 , 市场交易和融资量大幅增长,券商收入同比增长35% 。预计到2023年,券商的业务收入将翻倍。 图1:证券行业发展现状及预测 随着科创板的超预期快速落地、外资提前放开以及再融资新政的全面解锁,中国资本市场将迎来改革的历史性时刻,未来券商将充分发挥资金配置等重要功能,更好地服务实体经济。 131家券商的整合分化进程将全面提速: 头部券商将占据更高的市场份额,精品券商也将迎来发展机遇;部分中小型全牌照券商则举步维艰,面临路径抉择与转型阵痛。 随着新冠肺炎在全球范围的蔓延,资本市场面临 高度不确定性 。反观国内证券行业发展态势, 同业兼并、混业融合和中小券商退出 已成为行业常态。未来1-3年,行业进一步整合与模式分化将成为国内证券行业的主要趋势。 “客户去低端化”、“业务去渠道化” ,券商需要凭借专业化服务能力为客户提供全周期服务,逐步打造成真正意义上的专业投资银行。 具体从以下三个方面进行差异化竞争: 1、明确差异化战略方向: 目前大多数券商都往全牌照方向发展,产品同质化严重。而在未来行业将加速分化,券商需要进行战略聚焦,在细分领域实现行业专精。 业务聚焦

跨境电商遇上ERP系统会擦出什么火花

本秂侑毒 提交于 2020-08-10 16:20:42
ERP系统将原本分散的流程整合到一个中央数据网络中,从而帮助企业更好地跟踪信息,同时收集来自各个部门的见解。 ERP软件的核心是一组“共享通用流程和数据模型的工具,涵盖了广泛而深入的端到端操作”。 一、跨境电商ERP软件的好处 跨境电商ERP软件为使用它的企业提供了广泛的好处,包括: 1、简化的操作。 ERP软件 存储和跟踪整个组织中的数据,从仓库管理到收益管理。尽管默认的ERP解决方案软件包中包含许多这些功能,但也支持许多第三方软件集成,从而将不同的应用程序整合到一个统一的系统中。 2、工作流程自动化。通过利用人工智能(AI)技术的进步(例如,机器学习,自然语言处理),ERP软件可以使日常业务流程自动化并释放人力资本以专注于更复杂的任务。 3、高级分析。与其他独立系统相比,ERP软件具有更大的分析深度,可将整个企业中的大量数据提取到详细且易于解密的分析仪表板中,从而提供全面的洞察力和粒度。 4、增强的可访问性。随着越来越多的基于云的选项和支持智能手机访问的支持物联网(IoT)的功能,ERP解决方案为企业提供了前所未有的日常运营可见性。而且所有这些信息都可以实时访问,从而使用户能够即时检索和修改数据。 二、使用跨境电商ERP软件的竞争优势 在快速发展的技术环境中,利用ERP软件简化运营的企业将获得以下好处: 1、提高运营效率。通过流程自动化和更精简的工作流管理

一文彻底搞懂BERT

北战南征 提交于 2020-08-10 15:43:17
一文彻底搞懂BERT 一、什么是 BERT? 没错下图中的小黄人就是文本的主角 Bert ,而红色的小红人你应该也听过,他就是 ELMo 。 2018 年 发布的 BERT 是一个 NLP 任务的里程碑式模型,它的发布势必会带来一个 NLP 的新时代。 BERT 是一个算法模型,它的出现打破了大量的自然语言处理任务的记录。在 BERT 的论文发布不久后, Google 的研发团队还开放了该模型的代码,并提供了一些在大量数据集上预训练好的算法模型下载方式。 Goole 开源这个模型,并提供预训练好的模型 , 这使得所有人都可以通过它来构建一个涉及 NLP 的算法模型,节约了大量训练语言模型所需的时间,精力,知识和资源。 BERT 模型的全称是: BERT( B idirectional E ncoder R epresentations from T ransformers) 。 从名字中可以看出, BERT 模型的目标是利用大规模无标注语料训练、获得文本的包含丰富语义信息的 Representation 。 二、Bert模型原理 BERT 模型简介 BERT BASE: 与OpenAI Transformer 的尺寸相当,以便比较性能。 BERT LARGE: 一个非常庞大的模型,是原文介绍的最先进的结果。 BERT的基础集成单元是 Transformer的Encoder