spectrum

谷歌开源NLP模型可视化工具LIT,模型训练不再「黑箱」

好久不见. 提交于 2020-10-11 03:59:15
深度学习模型的训练就像是「黑箱操作」,知道输入是什么、输出是什么,但中间过程就像个黑匣子,这使得研究人员可能花费大量时间找出模型运行不正常的原因。假如有一款可视化的工具,能够帮助研究人员更好地理解模型行为,这应该是件非常棒的事。 近日,Google 研究人员发布了一款语言可解释性工具 (Language Interpretability Tool, LIT),这是一个开源平台,用于可视化和理解自然语言处理模型。 论文地址:https://arxiv.org/pdf/2008.05122.pdf 项目地址:https://github.com/PAIR-code/lit LIT 重点关注模型行为的核心问题,包括:为什么模型做出这样的预测?什么时候性能不佳?在输入变化可控的情况下会发生什么?LIT 将局部解释、聚合分析和反事实生成集成到一个流线型的、基于浏览器的界面中,以实现快速探索和错误分析。 该研究支持多种自然语言处理任务,包括探索情感分析的反事实、度量共指系统中的性别偏见,以及探索文本生成中的局部行为。 此外 LIT 还支持多种模型,包括分类、seq2seq 和结构化预测模型。并且它具备高度可扩展性,可通过声明式、框架无关的 API 进行扩展。 相关 demo,参见视频: 00:00/00:00倍速 可以针对新颖的工作流程进行重新配置,并且这些组件是独立的,可移植的,且易于实现。

日本街头惊现18米巨型高达!全身24处可动,东京大学参与研发

淺唱寂寞╮ 提交于 2020-10-08 08:21:00
      大数据文摘出品    作者:刘俊寰   在吗?看看高达?   什么?被洪水冲走了??   那你可得要好好反思一下自己,对高达的爱到底是不是真的!   看看别人家的妻子, 在洪水中都要“破窗入室”,抢救丈夫的高达 ,这也让不少网友直呼,简直是“年度感动新闻”。      不过,先看看他们的高达,再看看下面这个。      在 高18米,重25吨 的巨型高达机器人面前,手上的高达模型是不是瞬间就不香了?      别急,这个巨型机器人不是拿来售卖的,再说也买不起啊(重点错)。   这个巨型高达机器人其实是在日本横滨倾心打造的 高达工厂 的一个绝对亮点,据日本知名模型制造商万代介绍方面,这部元祖高达将 拥有“有史以来最强的可动性” ,全身 可动关节多达24个 ,使用 电动机和液压机 的组合进行驱动。   是的,你没看错,这个庞然大物还能动!是不是已经热血喷张了?   根据这个项目最新披露的进度,巨型高达机器人 已于8月初建设完成 。   本来,高达工厂在10月份就可以正式营业了,但受到新冠疫情的影响, 开园时间再次往后推迟 ,但是不要紧,只要能够亲眼看到三次元高达行走在11区的大地上,我愿意等!      据了解,届时该展览场馆除了举行高达机器人外,还将包括展览中心、机器人实验室、会议设施、商店和提供 “高达餐单” 的咖啡馆等。   这其实不是第一个等身高达模型了,在

交易系统开发(八)——低延迟网络构建

非 Y 不嫁゛ 提交于 2020-10-02 17:11:03
交易系统开发(八)——低延迟网络构建 转载自《交易技术前沿》总第三十三期文章(2018年12月) 一、低延迟交易 1、低延迟交易简介 低延迟交易是算法交易的一个分支,资本市场机构对市场事件进行更快速的反应,利用极其细微的反应时差,来获得更强的交易获利能力。 2、交易延迟分类 延迟是计算机系统接收到一个事件刺激,到产生响应之间的时间间隔。对于券商而言,事件刺激可以是客户端输入订单,可以接收到市场行情数据发布,可以是接收到订单确认返回。低延迟交易要求整个交易链条上的所有环节,都尽量缩短时间间隔。从交易系统层面看,交易延迟主要包括网络延迟、协议延迟、操作系统延迟、应用延迟等。 3、网络延迟 交易系统的下单通过网络经券商柜台到达交易所交易撮合主机,中间会经过多个网络设备,包括交换机、路由器和防火墙等,因此网络会存在延迟。 网络中存在三种类型的延迟:数据序列化延迟、传输延时、排队延迟。 (1)数据序列化延迟 数据序列化延迟是网络设备将一定量的数据位(bit)输入物理介质(通常指光纤或者铜缆)所需要的时间。 (2)传输延迟 传输延时传输延时(propagation)是数据经过序列化处理进入传输介质后,在传输介质中传输所使用的时间。光在光纤中传输速度通常是在真空中传输速度的三分之二。 (3)排队延迟 当多个数据发送端通过同一条网络链路往一个接收端发送数据包时

为什么大家都在吹捧Python,大厂高薪敲门砖了解一下

放肆的年华 提交于 2020-09-28 17:51:34
2020年,Python可学吗? 答案是 可 。 近些年,Python 的火热有目共睹,作为一种功能强大的高级编程语言,在2018 年的时候它的流行程度就得到了大幅提高。 Stack Overflow网站编程语言浏览量统计数字 Python不仅在 IEEE Spectrum 编程语言排行榜中,还是在其他榜单如 TIOBE 上,它也仍位居前列。无论是 后端开发、前端开发、爬虫开发,还是人工智能、金融量化分析、大数据、物联网 等,Python应用无处不在。不仅如此,Python还含有优质的文档、丰富的AI库、机器学习库、自然语言和文本处理库。尤其是Python中的机器学习, 实现了人工智能领域中大量的需求。 同时近些年很多互联网公司不管对前端岗位、后端岗位、测试、运维、数据分析岗位都希望可以具备Python的相关的技能,更有的企业直接招聘python后端开发工程师,由此可见, Python的发展前景是不可估量的 。 IEEE Spectrum 编程语言排行榜 TOP10 网上关于Python的吹嘘千篇一律,很多人都觉得掌握了Python就掌握了人工智能,数据分析等方面的知识,就一定找的到工作,其实并非如此。 那么,如何掌握Python,并拿到大厂的高薪offer呢? 只有从基础逐步深入,再经历名企的真实实战项目的打磨,才能够提升自己实战开发能力

侦破一件谋杀案后,圣地亚哥能监控的智能路灯被告了

牧云@^-^@ 提交于 2020-08-20 06:54:20
      大数据文摘出品    来源:IEEE    编译:lin   2017年,圣地亚哥开始安装智能街灯时,城市管理人员设想他们收集的数据将有助于改善城市运营,比如为自行车道选择道路,识别需要特别注意的危险十字路口,以及找出城市需要更多停车的地方。   他们认为,这可能还能激发一些科技初创公司开发应用程序,用以引导视障人士、指引司机停车,为慢跑者推荐最安静的路线。   市政府对此非常自豪,把这视为节约成本的方式,因为LED灯比他们所取代的钠蒸汽灯的效率高得多。      然而,这个耗资3000万美元的项目却让圣地亚哥陷入了执法部门如何使用这些系统的争论中。   从最初的构想上看,这个项目很有可能让圣地亚哥一跃成为美国“最聪明”的城市之一。但随之而来的却是,这些看上去很有希望的独立应用程序未能实现价值,同时,随着能源成本下降,这项技术本身就能收回成本的想法也没有实现预期效果。   圣地亚哥的智能“CityIQ”街灯灵感来自GE Current,这家公司最初是通用电气的子公司,但去年被私募股权公司美国工业合作伙伴收购。   迄今为止,圣地亚哥的智能路灯已安装了大约3300个,已收到但尚未安装的还有1000个。作为协议的一部分,市政府与Current签约,在CityIQ平台上运行传感器数据的云分析。作为合同的一部分,云运营商,而不是城市,拥有从数据中提取的任何算法。   另外

Python已经世界第一了,听说你还不会?

被刻印的时光 ゝ 提交于 2020-08-19 13:09:37
2020年,Python可学吗? 答案是 可 。 近些年,Python 的火热有目共睹,作为一种功能强大的高级编程语言,在2018 年的时候它的流行程度就得到了大幅提高。 Stack Overflow网站编程语言浏览量统计数字 Python不仅在 IEEE Spectrum 编程语言排行榜中,还是在其他榜单如 TIOBE 上,它也仍位居前列。无论是 后端开发、前端开发、爬虫开发,还是人工智能、金融量化分析、大数据、物联网 等,Python应用无处不在。不仅如此,Python还含有优质的文档、丰富的AI库、机器学习库、自然语言和文本处理库。尤其是Python中的机器学习, 实现了人工智能领域中大量的需求。 同时近些年很多互联网公司不管对前端岗位、后端岗位、测试、运维、数据分析岗位都希望可以具备Python的相关的技能,更有的企业直接招聘python后端开发工程师,由此可见, Python的发展前景是不可估量的 。 IEEE Spectrum 编程语言排行榜 TOP10 网上关于Python的吹嘘千篇一律,很多人都觉得掌握了Python就掌握了人工智能,数据分析等方面的知识,就一定找的到工作,其实并非如此。 那么,如何掌握Python,并拿到大厂的高薪offer呢? 只有从基础逐步深入,再经历名企的真实实战项目的打磨,才能够提升自己实战开发能力

NR-based access to unlicensed spectrum之RP-192926

拟墨画扇 提交于 2020-08-17 15:16:47
3 justification 授权频谱具有的优势:通信质量远远优于非授权的 目前来看,由非授权频谱主要、授权频谱辅助的方式,甚至说完全由非授权频谱进行的操作和应用。对于提高NR5G预期提供的用例和应用程序的数据连接性越来越重要。 study item 在所有考虑的情况下,在未许可频谱中运行NR的可行性。 相对于某些监管要求而言,一些扩展被确定为使用非授权频段,这样是有必要的。 spectrum SI中重点讨论的是5KMHz和正在讨论的6kMHz未许可频段。(USA 5925-7125 MHZ, EU 5925-6426MHZ) 在FR2和above 52.6GHz将在以后的版本中考虑。 scenario 根据NR的发展和最大程度NR-unlic的适用性, SI考虑了一下几种情况: A:licence band NR(PCell)和NR-U(SCell)之间的载波聚合 (ps:NR-U可能为both UL and DL, or DL only) NR PCell 连接到 5G-CN B:licence band LTE(PCell)和NR-U(PSCell)之间的双重连接。 LTE PCell 连接到 EPC 比PCell连接到 5G-CN的优先级更高。 C:stand-alone NR-U NR-U连接到5G-CN D:A stand-alone NR-U cell in

背着相机的甲虫登上Science子刊,它拍下了昆虫界第一部Vlog

三世轮回 提交于 2020-08-17 02:37:30
  机器之心报道    编辑:蛋酱、小舟    你知道昆虫的视界是什么样的吗?      如果昆虫也成为了一名 Vlogger,作品会是什么样的?   近日,一项在甲虫背部安装相机的研究登上《Science Robotics》,为我们揭晓了这一谜题。通过了解自然界中昆虫的视觉系统并做出取舍,研究者以平衡能量、计算量和质量的方式,为昆虫规模的机器人设计出更好的视觉系统。   让身长不足三厘米的甲虫背上相机,这件事并不简单。在人类看来最微小的摄像机,也足以压垮昆虫。因而,研究者首先思考的问题是:如何打造出一款适用于昆虫搭载的可操纵摄像机?   在该研究中,研究者设计出一种完全无线、动力自动化、机械可操纵的视觉系统。该系统用足够小的形状因子模仿昆虫的头部运动,可以安装在活的甲虫或类似大小的陆地机器人背部。   对于昆虫大小的机器人来说,无线视觉提供了丰富的环境形状和纹理信息。这在大型机器人中很常见,但在资源有限的小型平台上却是一个挑战。      安装在甲虫或类似大小的机器人背上的相机基本构造。   电子设备的执行器重 248 毫克,并且可以根据智能手机的命令将相机转向 60 度。制作好的相机约为硬币大小,以每秒 1 到 5 帧(fps)将 “第一人称主视角” 以 160*120 像素的单色视频传到距离 120 米远的蓝牙无线电中。     

数据存储(1):从数据存储看人类文明-数据存储器发展历程

风流意气都作罢 提交于 2020-08-16 03:35:38
传统文本存储 泥版/钟鼎/甲骨/莎草纸/羊皮纸等文字存储 传统的考古学家和历史学家认为,楔形文字起源于美索不达米亚特殊的渔猎生活方式。这是较为通行的看法,西方的各种百科全书大都持这一观点。约在公元前3400年左右,楔形文字雏形产生,多为图像。到公元前 500 年左右, 这种文字甚至成了西亚大部分地区通用的商业交往媒介。楔形文字一直被使用到公元元年前后,使用情景如同现今的拉丁文。 有了文字后,人类有又了记录过往数据的能力。但是,都是靠手工存储。 这些历史,这里不做过多种赘述 造纸与活字印刷术 造纸术与应刷术是中国四大发明之一。 公元105年(西汉),蔡伦改进了造纸术,随后就是对造纸术的改进过程,唐朝利用竹子为原料制成的竹纸,标志着造纸技术取得了重大的突破。随后就是西方一些列的改进了。 公元1041年-1048年(北宋),毕昇发明的泥活字。标志着活字印刷术的诞生。随后也是漫长的改进,传入欧洲400以后, 1440年到1445年之间,德国人约翰内斯·古腾堡的铅活字,凸版印刷技术——维克多·雨果称印刷术为世界上最大的发明。 在中世纪初期,书是财富的象征。如果谁家有一个图书室。那实在是太富有了,因为在当时书是人们用手工辛辛苦苦抄写出来的。僧侣和抄写员经常被雇来做这项工作,当然费用相当可观。印刷机的出现改变了这一切,并在文艺复兴时期加快了知识和文化的传播。 穿孔卡带纸存储 最早期的存储媒介—

IEEE Spectrum 2020 年度编程语言排行榜:Python 为主流,上古语言 Cobol 大流行

随声附和 提交于 2020-08-15 21:34:02
领域驱动技术,技术鞭策领域。 近日,IEEE Spectrum 最新发布了 2020 年年度编程语言排行榜。IEEE Spectrum 编程语言排行榜一年发布一次,截止到今年,该排行榜已经连续发布了七年。与其他榜单有所不同,IEEE Spectrum 可以让开发者自己选择参数组合时的权重,得到多样的排序结果。 在最新的编程语言排行榜中,IEEE Spectrum 通过综合 CareerBuilder、GitHub、Google、Hacker News、IEEE、Reddit、Stack Overflow 和 Twitter 八个来源 ,分析了 55 种编程语言的流行度,发布了 2020 年度编程语言排行榜。 Python 连续四年夺冠 近几年间,Python 的火热有目共睹。不仅在 IEEE Spectrum 编程语言排行榜中,在其他榜单如 TIOBE 上,Python 也位居前列。但对于很多从业者而言,Python 的迅猛发展与自己日常的工作相关性并不强,而 Python 究竟是哪些人在使用,亦或是其排名为何在短短时间内超过了老牌编程语言,或许很多存在种种的疑问。 不过据调查发现,摒除业界一些资本的炒作,Python 成为主流并非没有原因,一方面,Python 与我们所熟知的人工智能、机器学习、数据分析与处理等领域的需求紧密相关;另一方面, IEEE Spectrum 官方在对