ZooKeeper

Hadoop学习笔记04_Hbase

跟風遠走 提交于 2020-11-22 04:29:53
大数据开发的学习,组件还是很多的,都需要掌握并多加练习。 最好的 参考文档 当然是官方的了。 因为Hadoop生态圈组件很多,所以,在建设之初一定要检查好各版本的兼容性。避免后期麻烦。 我的练习使用Hadoop-2.7.5 以及Hbase-1.4.2 看了Hbase 手册Chapter4 兼容性没有问题。 # 行存储 优点:写入一次性完成,保持数据完整性 缺点:数据读取过程中产生冗余数据,若有少量数据可以忽略 # 列存储 优点:读取过程,不会产生冗余数据,特别适合对数据完整性要求不高的大数据领域 缺点:写入效率差,保证数据完整性方面差 # Hbase优势: 海量数据存储 快速随机访问 大量写操作的应用 # Hbase应用场景 互联网搜索引擎数据存储 海量数据写入 消息中心 内容服务系统(schema - free ) 大表复杂 & 多维度索引 大批量数据读取 # Hbase 数据模型 # 行键 时间戳 列族contens 列族ahchor 列族mime " com.cn.www " t9 anchor:cnnsi.com= " CNN " t8 anchor:my.look.cn = " CNN.com " t6 contens:html = "" mime:type= " text/html " t5 contens:html = "" t3 contens:html = ""

阿里团队的Java核心架构笔记,Github已经标星81.6K,开放下载

梦想与她 提交于 2020-11-22 02:54:43
Java 是一门纯粹的面向对象的编程语言,所以除了基础语法之外,必须得弄懂它的 oop 特性: 封装、继承、多态 。此外还有 泛型、反射 的特性, 很多框架的技术 都依赖它,比如 Spring 核心的 Ioc 和 AOP,都用到了反射,而且 Java 自身的动态代理也是利用反射实现的。 此外还有 Java 一些标准库也是非常常见,比如集合、I/O、并发,几乎在 Web 开发中无处不在,也是面试经常会被问到的,所以在面试Java后端岗位之前,不妨先打好这些核心的基础。 Github作为 程序员们的后花园 ,一直以来都是程序员最喜欢逛逛、学习的地方,小编也不例外,最近看到一份 对标阿里P8Java核心架构笔记 ,已经 标星81.6K ,很是惊讶,看了一下,觉得知识点整理的非常的详细,也不愧能获得这么多星,资料已被整理好,发放福利给朋友们! 三连+关注 ,看文末即可获得《 对标阿里P7知识点合集整理笔记 》PDF版文档资料。 一、Java基础 1.1Java 基本功 1.2Java 语法 1.3 数据类型 1.4 方法 (函数) 1.5Java 面向对象 1.6集合 1.7多线程 1.8文件与I/O流 二、并发 2.1 并发容器 总结 2.2 乐观锁 与 悲观锁 总结 2.3JUC 中的 Atomic 原子类总结 2.4AQS 原理以及 AQS 同步组件总结 三、JVM 3.1Java

拼多多四面(Java岗):多线程+算法+网络+MySQL+Redis+分布式

心已入冬 提交于 2020-11-21 12:36:38
一面 线程池由哪些组件组成,有哪些线程池,分别怎么使用,以及拒绝策略有哪些 写一题算法,层次遍历树并输出每层的层级 写一道题,二叉树的后序遍历,非递归算法。 什么时候多线程会发生死锁,写一个例子 说一说jdk1.8中,对hashMap的优化,对concurrentHashMap的优化 如何解决hash冲突的,以及如果冲突了,怎么在hash表中找到目标值 有1000个数据存在hashmap中,实际的数量是多少,考虑负载因子和扩容 常见的RPC有哪些?对应的区别和性能比较? 操作系统的用户态和核心态切换条件以及为什么要切换 线程间的通信方式,异步队列,消息延迟获取 二面 MySQL的主从复制怎么做 MySQL的索引,使用B+树索引的好处 MySQL性能查看以及如何优化 Redis是怎么做缓存的 Redis的持久化操作 如何利用redis处理热点数据 TCP三次握手的过程,如果没有第三次握手有什么问题。 分布式锁怎么实现 三面 cap了解么,分别指什么 网络编程nio和netty相关,netty的线程模型,零拷贝实现 Redis是单线程还是多线程?Redis的分布式集群怎么做? 分布式消息队列有哪些(Kafka等)?有使用过哪些?具体应用在什么场景? 负载均衡怎么做的呢,为什么这么做,了解过集群雪崩么。 谈谈高并发场景下削峰,限流的实现? 四面(HR) 为什么跳槽? 期望的薪资是多少?

50道Kafka面试题和解析(转载)

社会主义新天地 提交于 2020-11-21 12:07:48
转载: https://zhuanlan.zhihu.com/p/78912551 前言 Apache Kafka的受欢迎程度很高,Kafka拥有充足的就业机会和职业前景。此外,在这个时代拥有kafka知识是一条快速增长的道路。所以,在这篇文章中,我们收集了Apache Kafka面试中常见的问题,并提供了答案。因此,如果您希望参加Apache Kafka面试,这是一份不错的指南。这将有助于您成功参加Kafka面试。 文章有些长,每题都附带了答案解析,希望你们看了能够有所收获,同时觉得不错的朋友可以转发支持下和关注下我,以后还会有更多精选文章分享给大家! 一、最佳Apache Kafka面试问题和解答 这是Kafka最受欢迎的面试问题清单,以及任何面试官都可能问到的答案。所以,继续学习直到本文的结尾,希望对你有帮助! 问题1:什么是Apache Kafka? 答:Apache Kafka是一个发布 - 订阅开源消息代理应用程序。这个消息传递应用程序是用“scala”编码的。基本上,这个项目是由Apache软件启动的。Kafka的设计模式主要基于事务日志设计。 问题2:Kafka中有哪几个组件? 答:Kafka最重要的元素是: 主题:Kafka主题是一堆或一组消息。生产者:在Kafka,生产者发布通信以及向Kafka主题发布消息。消费者:Kafka消费者订阅了一个主题

Apache Kafka安全| Kafka的需求和组成部分

和自甴很熟 提交于 2020-11-21 06:53:42
1.目标 - 卡夫卡安全 今天,在这个Kafka教程中,我们将看到 Apache Kafka Security 的概念 。 Kafka Security教程包括我们需要安全性的原因,详细介绍加密。 有了这个,我们将讨论Kafka Security可以轻松解决的问题列表。 此外,我们将看到Kafka身份验证和授权。 此外,我们将看看ZooKeeper身份验证。 那么,让我们开始Apache Kafka Security。 Apache Kafka安全| Kafka的需求和组成部分 2.什么是Apache Kafka Security 在0.9.0.0版本中,Kafka社区中添加了许多功能。 它们的使用灵活性,如单独或一起使用,也增强了 Kafka集群的 安全性 。 Apache Kafka安全工作 因此,当前支持的安全措施列表如下: 通过使用SSL或SASL,对连接的认证 卡夫卡经纪人 从客户端,其他工具也是可能的。 它支持各种SASL机制: SASL / GSSAPI(Kerberos) - 从版本0.9.0.0开始 SASL / PLAIN - 从版本0.10.0.0开始 SASL / SCRAM-SHA-256和SASL / SCRAM-SHA-512 - 从版本0.10.2.0开始 2.此外,还提供从 代理 到 ZooKeeper 的连接的身份验证 。 3.此外,它提供了

Java自学路线图之Java系统自学

ぐ巨炮叔叔 提交于 2020-11-20 08:19:14
Java自学不是一朝一夕的事情。可以采用“懒开始”的方法,但是必须要坚持下去,才能真正自学Java掌握编程技术。那些企图学几天去包装一下找工作的,请绕道。如果你下定决心自学Java,那么这套Java自学路线图绝对是你系统性、全面自学的最佳选择! Java自学路线是螺旋上升的,需要耗费的时间和精力不比其他学科的少,但由于其稳健性的特点使其成为企业开发的刚需编程语言。从网上看到发布Java自学路线图的很多,但大部分学习路线图是很零碎的,没有系统的自学目标和自学中需要掌握的重点知识。 黑马程序员2020年最新版Java自学路线图是根据主流企业的要求不断更新的,而且各阶段的Java教程在黑马程序员视频库都能找到自学资源,这些Java自学教程收获了大量好评。相比同时自学的其他同学能少走弯路,并且保证自学到的能力也是企业在招聘中所需要的。 Java自学资源 新手该如何一步步的自学Java? (点击进入) 第一阶段 Java零基础自学路线图--Java基础自学 此阶段的学习目标: 基础语法是学习任何编程语言的第一课,学好基础语法,才能更好的学习后面的课程知识点。 此阶段的市场价值: 具备Java语言编程基础,可以实现简单的小系统程序,但达不到企业型人才的标准。 此阶段的重点知识: 掌握Java开发环境基本配置 掌握运算符、表达式、流程控制语句、数组等的使用 熟练使用IDEA开发工具

分布式全局唯一ID与自增序列

巧了我就是萌 提交于 2020-11-20 05:02:02
包含时间顺序的ID 此场景最简单的实现方案,就是采用 twitter 的 Snowflake 算法。 ID总长64位,第1位不可用,41位表示时间戳,10位表示生成机器的id,后12位表示序列号。 为什么第一位不可用?第一位为0,可以确保ID在java的long类型数据一直为正整数递增 同一时间戳即毫秒内,能产生多少个ID? 2^12 = 4096 个ID [ 0 ~ 4095 ] 唯一性?通过机器ID预先已经做了一次空间隔离,再通过时间戳做了一次时间隔离,最后通过时间戳内的计数实现了一定程度内的唯一 高性能?可以通过增加IDWorker来缓解高并发时的单机负载压力 缺点?时间受限,41位可以表示69年(不过可以减少机器位来增加时间位数) 自增序列 原理 根据key获取分布式锁,获得锁后取得序号,并偏移配置的偏移量,替换原先的序号,最后释放锁。 基于zookeeper实现 基于zookeeper可以很快实现自增序列服务,引入apache的curator封装的zookeeper客户端。 1 2 3 4 <dependency> <groupId>org.apache.curator</groupId> <artifactId>curator-recipes</artifactId> </dependency> 建立zookeeper连接,打开zkclient后,如果重复会使用

11月最新出台!阿里内部PPT涵盖研发篇、算法篇、Java后端架构、spring、微服务、分布式等

 ̄綄美尐妖づ 提交于 2020-11-19 20:22:26
我只截图不说话,PPT大全,氛围研发篇、算法篇、大数据、Java后端架构!除了大家熟悉的交易、支付场景外,支撑起阿里双十一交易1682亿元的“超级工程”其实包括以下但不限于客服、搜索、推荐、广告、库存、物流、云计算等。 Java核心技术栈:覆盖了JVM、锁、并发、Java反射、Spring原理、微服务、Zookeeper、数据库、数据结构等大量知识点。 需要免费领取阿里全部资料的朋友麻烦帮忙转发一下文章+评论+收藏+关注我,然后加小猪理VX:wjj2632646 研发篇部分截图一览,感谢大佬们的分享 算法篇部分截图一览,直接上目录 机器算法大集合 PPT内容还有很多!涵盖阿里巴巴的全部技术栈! 需要免费领取阿里全部资料的朋友麻烦帮忙转发一下文章+评论+收藏+关注我,然后加小猪理VX:wjj2632646 阿里巴巴开发手册1.4.0(终极版) 编程规约 异常日志 单元测试 安全规约 MySQL数据库 工程结构 Java核心知识PDF JVM JAVA集合 JAVA多线程并发 JAVA基础 Spring 原理 微服务 Netty与RPC 网络 日志 Zookeeper Kafka Rabbi tMQ Hbase MongoDB Cassandra 设计模式 负载均衡 数据库 一致性算法 JAVA算法 数据结构 加密算法 分布式缓存 Hadoop Spark Storm YARN

zookeeper 学习 安装

百般思念 提交于 2020-11-19 20:21:55
官方文档上这么解释zookeeper,它是一个分布式服务框架,是Apache Hadoop 的一个子项目,它主要是用来解决分布式应用中经常遇到的一些数据管理问题,如:统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等。 上面的解释有点抽象,简单来说zookeeper=文件系统+监听通知机制。 节点 命令 create /test create -e /test/sxtest create -s /test get /test get -w /test 监听节点 (一次性的) set /test xxx delete /test deleteall /test zookeeper 安装说明 https://my.oschina.net/guoenzhou/blog/4299015 https://www.iteye.com/blog/coolxing-1871009 启动server只需运行脚本: ./bin/zkServer.sh start Server启动之后, 就可以启动client连接server了, 执行脚本: ./bin/zkCli.sh -server localhost:2181 来源: oschina 链接: https://my.oschina.net/shunshun/blog/4726898

面了美团我才知道大公司的面试有多恐怖,附上我的美团5面经历,终拿offer!

微笑、不失礼 提交于 2020-11-19 13:26:49
前言 面了美团,越发让我觉得想进大厂还需要很长时间的积累,问的知识点并没有那么多那么宽,但是会比我看到的更深入一点更贴近使用场景一点,自己差的还很远,可能真的要以春招为目标了 1.自我介绍 2.简单说一下项目,项目的问题,难点 3.Mybatis的$和#的区别 4.Mysql的存储引擎有哪些 5.Myisam和Inodb的区别 6.Innodb一定要有主键嘛,原因是什么 7.主键为什么建议使用自增主键,比如是字符串可以做主键嘛 8.Innodb的锁有哪些 9.解释一下间隙锁 10.间隙锁是共享锁还是排它锁 11.共享锁和排它锁对比 12.什么情况触发表锁和行锁和间隙锁(间隙锁没答对被追问了) 13.最左匹配原则,abc,顺序也是abc,什么情况索引肯定会失效,什么情况下整个索引都失效 14.spring mvc的执行流程 15.lock的底层实现原理(忘记了,很尴尬,很急但就是想不起来了) 16.jdk的线程池有哪些,怎么选择使用哪个线程池(只记得概念,怎么选择完全说不出来) 17.核心线程数和最大线程数的数量该设计为多大 18.设计模式了解哪些,工厂模式什么情况会用到 19.哪个框架在什么地方会用到这些模式 20.有用过redis,esmq嘛(后面告诉我我的知识范围宽度广度都需要提高,这些技术还需要去学习 😭😭) 21.jvm什么情况下触发young gc和full gc