大数据

第6次结对作业--郑锦伟&古维城

随声附和 提交于 2021-01-26 08:22:50
第 6 次结对作业 在线英语学习平台客户端原型 1.结对成员 郑锦伟 2015034643034 古维城 2015034643033 2.原型设计工具实现-Photoshop 3.需求分析 使用NABCD模型进行需求分析 3.1 N(Need, 需求) 3.1.1具体功能和数据需求 3.1.1.1 登录注册管理 (1) 注册 用户填写基本信息进行注册,要填写的信息有(账号,密码,确认密码,邮箱,密保问题,密保问题可以设置多个,最多三个) (2) 登录 用户根据账号或者邮箱号进行登录 (3) 忘记密码 根据密保问题重置密码 3.1.1.2 英语资料数据管理 该模块的使用用户只针对管理员 (1) 查看数据 英语数据资料首先根据层次分类,不同的层次有对应的类型的不同的题目 (2) 上传数据 选择层次(英语四级,英语六级,研考级)和类型进行上传 (3) 修改数据 可修改题目的层次,类型,描述,答案等 (4) 删除数据 可批量删除和单个删除 3.1.1.3 个人中心模块管理 (1) 用户基本信息的操作 查看/修改用户的基本信息(账号名,用户昵称,性别,年龄,邮箱,密保问题,学历,毕业学校) 查看用户的荣誉信息(总积分,排名,单词学习积分,短语学习积分,句子翻译学习积分,完型填空学习积分,阅读理解学习积分,写作学习积分) 查看学习历史,查看做过的学习套卷,可查看每道题的得分情况

如何学习Ubuntu用法?linux需要学习什么

▼魔方 西西 提交于 2021-01-25 17:40:50
  Ubuntu适用于笔记本电脑、台式电脑和服务器,尤其适合桌面用户。随着CentOS系统版本的变化,越来越多的人关注Ubuntu。渐渐地,很多人开始学习Ubuntu版本。Ubuntu Linux和CentOS Linux一样,都是开源的、自由系统软件。Ubuntu的目标是让每个人都得到一个易于使用的Linux系统版本。那么如何学习Ubuntu用法?Linux发展前景如何?   如何学习Ubuntu用法?   (1)如果有其他Linux经验,可以快速上手。   (2)如果没有接触过Linux,建议系统学习Linux运维知识。   (3)学习官网的文档,但是对于初学者来说,官网的文档比较晦涩难懂。   Linux发展前景如何?   (1)从互联网到开发阶段,门户、 BAT从2000年发展到2010年。这个时候网络主要是PC。   (2)从互联网到移动互联网10年,从2010年到2020年,出现了很多移动软件应用。这时候除了PC,网络端还有更多手机、平板。   (3)而现下是物联网+人工智能的时代。人工智能的基础是大数据和机器学习、深度学习,Linux的应用也在不断发展。上网的人越来越多,市场对服务器稳定性和个性化的要求也越来越高。所以Linux作为承载数据的后端服务器非常重要,Linux运维人员的需求也在逐渐增加。   (4)目前各大企业都在从windows切换到Linux

IT168专访|DataPipeline 合伙人&CPO陈雷:我们致力于成为中国的世界级数据中间件厂商

故事扮演 提交于 2021-01-25 17:05:49
IT168 :很高兴有机会采访到您,请您介绍一下自己,所在公司及主打产品? 陈雷: 毕业之后去了方正,然后IBM11年,创业4年,一直从事数据领域的产品研发,系统交付工作。业务经验主要集中在金融、通信、能源等信息化领先行业,现在所在的公司DatePipeline是一家年轻的中国本土企业,我们致力于成为中国的世界级数据中间件厂商,产品也叫DataPipeline,是一款数据集成领域的下一代中间件产品,功能覆盖了实时数据采集、异构数据融合、实时数据处理等数据集成领域的主要场景。 IT168 :您是何时进入这个行业的?这其中有没有特别的原因或者契机? 陈雷: 中间件行业可能和互联网行业还不太一样,还是有一定门槛的,我相信从事软件行业的人大部分都和我一样,没有什么特别偶然的原因或者契机,就是从小喜欢计算机,根据兴趣选择了专业然后一路走过来,如果一定要说原因的话,我觉得可能是我们国家近几十年信息技术的高速发展为我们提供了一展拳脚的空间,没有让我们放弃自己的兴趣,这也是一个很幸福的事。 IT168 :国内的市场格局是怎样的?都有哪些玩家?DataPipeline处于怎样的位置? 陈雷: 主要分为三大类。 第一类是传统的外企,比如IBM、Oracle、Informatica等,有很成熟的产品和服务体系,但面对中国市场的新技术要求的应对稍显缓慢,比如Informatica今年宣布解散了中国公司

20张图带你到HBase的世界遨游

[亡魂溺海] 提交于 2021-01-25 15:37:51
Python实战社群 Java实战社群 长按识别下方二维码, 按需求添加 扫码关注添加客服 进Python社群▲ 扫码关注添加客服 进Java社群 ▲ 作者丨SoWhat1412 来源丨sowhat1412 1 HBase 浅析 1.1 HBase 是啥 HBase 是一款面向列存储,用于存储处理海量数据的 NoSQL 数据库。它的理论原型是 Google 的 BigTable 论文。你可以认为 HBase 是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。 HBase 的存储是基于 HDFS 的, HDFS 有着高容错性的特点,被设计用来部署在低廉的硬件上,基于 Hadoop 意味着 HBase 与生俱来的超强的 扩展性 和 吞吐量 。 HBase 采用的时 key/value 的存储方式,这意味着,即使随着数据量的增大,也几乎不会导致查询性能的下降。 HBase 又是一个 面向列 存储的数据库,当表的字段很多时,可以把其中几个字段独立出来放在一部分机器上,而另外几个字段放到另一部分机器上,充分分散了负载的压力。如此 复杂的存储结构和分布式的存储方式 ,带来的代价就是即便是 存储很少的数据,也不会很快 。 HBase 并不是足够快,只是数据量很大的时候慢的不明显。HBase主要用在以下两种情况: 单表数据量超过千万,而且并发量很大。 数据分析需求较弱,或者不需要那么实时灵活

C传统型人格的职业和专业选择@霍兰德职业兴趣测试

无人久伴 提交于 2021-01-25 11:12:26
霍兰德职业兴趣测试, 传统型 / C型的专业选择和职业选择,传统型人格,是一种非常常见的类型,很多人都属于这种特质,在霍兰德职业兴趣测试中,占比非常高,他们工作踏实,做事情勤勤恳恳,喜欢亲力亲为等,传统型人格不具备太多侵略性,更喜欢在自己的领域里安分守己,人格里面有顺从的一面。 传统型人格不在意权利和名利,更喜欢按部就班做一些自己喜欢的工作,并享受这种工作状态,善于按照规则办事,而不是创造规则。他们工作踏实,忠诚可靠,是企业里面老老实实干活的“老黄牛”。不爱表现自己,性格比较安静、内敛,一群人聚集的时候,往往是坐在角落里为大家服务的人,所以深受大家喜欢。 霍兰德职业兴趣测试 精简版 https://www.zxgj.cn/g/holland2 霍兰德职业兴趣测试 完整版 https://www.zxgj.cn/g/holland 霍兰德职业兴趣测试 探索版 https://www.zxgj.cn/g/holland3 1、传统型人格的基本特征 保守、服从、友善且正直,传统型人格的人,在工作中的表现很平淡,更喜欢有序和系统的工作,无意谋求高位。他们热爱生活,真诚待人,讲求实际,注重自身的责任感,能够合情合理地做事情,并且会尽自己最大能力完成。 在线工具网,相关职业测评: 霍兰德职业兴趣测试 、 MBTI职业性格测试 、 大五人格测试 、 GATB职业能力倾向测试 、 艾森克人格测试

大数据学习 -MYSQL进阶(第一章)

穿精又带淫゛_ 提交于 2021-01-25 10:00:50
文章目录 1 前言 1.1 数据库架构 1.2 监控信息 2 影响数据库的因素 2.1 超高的QPS和TPS 2.2 大量的并发和超高的CPU使用率 2.3 磁盘IO 2.4 网卡流量 2.5 大表 2.5.1 大表对查询的影响 2.5.2 大表对DDL操作的影响 2.5.3 如何处理数据库中的大表 2.6 大事务 2.6.1 什么是事务 2.6.2 事务的原子性(ATOMICITY) 2.6.3 事务的一致性(CONSISTENCY) 2.6.4 事务的隔离性(ISOLATION) 2.6.5 事务的持久性(DURABILITY) 2.6.7 什么是大事务 1 前言 服务器的压力来很大一部分压力来自于数据库的性能,如果没有稳定的数据库及服务器环境,那么服务器很容易出现一些故障甚至是宕机,造成的后果也是不可估量的, 因此数据库的性能优化必不可少。 1.1 数据库架构 一般的数据库架构都是一台主服务器,下面搭载着几个或十几个从服务器进行主从同步,当主服务器宕机之后,需要程序员手动选出一台数据最新的从服务器接替主服务器,然后对新的主服务器进行同步。然而有时候因为从服务器较多,导致这个过程是相当耗时的,并且在这个过程也是对网卡的容量的一个挑战。 1.2 监控信息 QPS & TPS:数值越高越好。 并发量:同一时间处理的请求的数量。 CPU使用率:越低越好。 磁盘IO:读写性能越高越好。

蚂蚁金服×西安银行 | 西安银行手机银行App的智能升级之路

浪子不回头ぞ 提交于 2021-01-25 05:06:57
小蚂蚁说: 当前,数字化信号已经逐渐深入到社会的每个角落,影响着用户的心智和行为,来到数字化时代门口的银行,需要注意到数字化信号。 西安银行通过引入蚂蚁金服移动开发平台mPaaS,对手机银行进行架构升级,实现手机银行由传统移动渠道向移动金融开放平台的转变,进行数字化转型升级。 2018年11月22日,西安银行召开新一代手机银行App发布会,全面展示数字时代的移动金融开放服务平台新样本。 通过引入 蚂蚁金服移动开发平台mPaaS ,西安银行对手机银行进行架构升级,实现手机银行由传统移动渠道向移动金融开放平台的转变,开展以 移动化、数据化、平台化、场景化、智能化的数字化银行转型实践 。 客户介绍 西安银行是具有股权多元化和市场化特征的区域性股份制商业银行,是银监会确定的国内城商行12家“领头羊”银行之一,是国内10家投贷联动试点行之一,也是西北首家即将走向A股资本市场的城商行。 2017年,西安银行曾凭借“@盾”和“西银惠付”两个具有显著特色的行业自主创新产品蝉联“十佳金融产品创新奖”和“十佳互联网金融创新奖”两项殊荣。 2018年,西安银行股份有限公司的“‘互联网+大数据’助力精准扶贫案例”获评 “中国普惠金融助力脱贫攻坚典型案例”。 西安银行是西部地区最大的城市商业银行之一,成立二十年来,西安银行坚持把科技创新作为核心竞争力的重要组成部分,持续加大科技投入

【大数据哔哔集20210123】别问,问就是Kafka最可靠

社会主义新天地 提交于 2021-01-25 03:48:32
高可靠性分析 Kafka的高可靠性的保障来源于其健壮的副本(replication)策略。通过调节其副本相关参数,可以使得Kafka在性能和可靠性之间运转的游刃有余。Kafka从0.8.x版本开始提供Partition级别的复制,replication数量可以配置文件(default.replication.refactor)中或者创建Topic的时候指定。 这里先从Kafka文件存储机制入手,从最底层了解Kafka的存储细节,进而对存储有个微观的认知。之后通过Kafka复制原理和同步方式来阐述宏观层面的概念。最后从ISR,HW,leader选举以及数据可靠性和持久性保证等等各个维度来丰富对Kafka相关知识点的认知。 Kafka文件存储机制 Kafka中消息是以Topic进行分类的,生产者通过Topic向Kafka Broker发送消息,消费者通过Topic读取数据。然而Topic在物理层面又能以Partition为分组,一个Topic可以分成若干个Partition,那么Topic以及Partition又是怎么存储的呢?Partition还可以细分为Segment,一个partition物理上由多个Segment组成,那么这些Segment又是什么呢?下面我们来一一揭晓。 为了便于说明问题,假设这里只有一个Kafka集群,且这个集群只有一个Kafka Broker

对话堵俊平:最好的开源生态模型,是亚马逊的原始森林。

北城以北 提交于 2021-01-24 20:56:10
2020 年 12 月 21 日 ~12 月 23 日,由 IT168 旗下 ITPUB 企业社区平台主办的第十一届中国数据库技术大会 (DTCC2020) 在北京隆重召开。 Denodo 大中华区总经理,全球销售副总裁 Stan Wu 进行了精彩议题分享,并接受了 IT168 小编的采访。 从 Microsoft 到 Oracle 到 Informatica ,再到目前所任职的 Denodo 。 Stan Wu 有着多年数据库和数据管理从业经验,他认为数据管理这片市场始终存在着一些历史包袱:从最初的应用软件开始数据孤岛开始陆续出现,为了解决孤岛问题,企业开始进行建设数据仓储,让数据孤岛进行汇聚,然而由于技术问题,导致数据提供报表的时效性大打折扣,甚至会存在几天的延迟。 而数据管理市场所面临的问题远不止于此, Stan Wu 认为,对于主管高层以及重量级的使用者来讲,往往会面临以下几点问题: ● 第一,数据提供缓慢:他们需要比较实时的获得结果,而不是存在几天的延迟 ; ● 第二,无法及时获悉全局状况:即便有新的工具可以使用,但出于用户使用习惯,不同的用户往往使用不同的分析工具,因而导致无法及时获取到全局状况 ; ● 第三,数据缺乏可信度:要求数据被提供出来时是可被信任、可被追溯的,要清楚数据从哪边来,要从哪些角度去看,用户经常遇到的痛点有哪些。 而对于技术或者科技部门员工来讲

数据分析也能Freestyle | 不一样的Smartbi Insight

强颜欢笑 提交于 2021-01-24 14:59:35
Freestyle(自由发挥) 上述一词最近爆火,起因是当红小鲜肉吴亦凡在某档综艺节目中,经常以标配的邪佞笑容、严肃脸,对参赛选手说,“你有freestyle吗?”根据自身个性和喜好,自由随性的发挥是freestyle的灵魂,嘻哈rappers有他们的freestyle,数据分析同样也有自己的freestyle, 这当中的重点就在于你是否选中了Smartbi大数据分析软件。 广州思迈特软件有限公司核心产品“思迈特大数据分析软件”(简称Smartbi Insight),是企业级商业智能和大数据分析平台,已经过多年的持续发展、创新和应用,凝聚了各种最佳实践经验,整合了银行、保险、证券、政府、电信、电力、教育等多个行业及大中型企业数据分析和决策支持的功能需求,充分体现和承载了数据分析发展的新四化。 Smartbi Insight产品简介 1.1. 产品定位 图:五大数据分析功能 Smartbi Insight定位于前端数据分析,具有报表报告、数据可视化、自助探索分析、移动协同、人工智能等功能,可以满足各种数据分析应用需求,如大数据分析、自助分析平台、地图分析、移动管理驾驶舱、指挥大屏幕、企业报表平台等等。 Smartbi Insight提供一整套满足用户需求的数据分析、报表、绩效监控和信息发布的解决方案。具有统一服务平台、仪表盘、大屏幕、图形可视化、地图分析、企业报表、分析报告、自助查询