叶子结点

索引简记:B树 B+树

孤者浪人 提交于 2019-12-04 21:38:52
数据库索引演进: 1、二叉树 如上,二叉树当时算法中的鼻祖了,O(N)的复杂度也使得他应用声名大噪,hash即使脱胎于此 那么为什么hash索引很少使用呢?一是因为极端情况下二叉树会退化为一个链表失去其二叉树的优势 2、由此,B-树, 注意是B树不是B减数,就诞生了,B树可以简单理解为平衡M岔树。如下示例为3路B树 再附一张带指针的: B树:M个节点M+1个分叉,分为数据域和指针域,既存关键字,由存指针指向孩子节点,常用于文件系统索引。 B树是解决了退化的问题了,但是如上结构,在进行范围查询的时候,B树也是疲于奔命 3、由此,B+树诞生了,B+树是基于B树的拓展,示例如下: 再附一张带指针的 如此B+树就解决了范围查询的问题,且节点(空间)利用率也高过B树。常用于DB索引! B树与B+树的区别: 在B+树中,具有n个关键字的节点只含有n棵子树,即 每个关键字对应一个子树 ;而在B树中,具有n个关键字的节点只含有n+1棵子树。 在B+树中,每个结点(非根节点)关键字个数n的范围是m/2(向上取整)<=n<=m(根结点:1<=n<=m);在B树中,每个结点(非根节点)关键字个数n的范围是m/2(向上取整)-1<=n<=m-1(根结点:1<=n<=m-1)。 在B+树中, 叶结点包含信息,所有非叶子结点仅起到索引作用 ,非叶结点中的每个索引项只含有对应子树的 最大关键字

【algo&ds】【吐血整理】4.树和二叉树、完全二叉树、满二叉树、二叉查找树、平衡二叉树、堆、哈夫曼树、B树、字典树、红黑树、跳表、散列表

前提是你 提交于 2019-12-04 20:51:38
本博客内容耗时4天整理,如果需要转载,请注明出处,谢谢。 1.树 1.1树的定义 在计算机科学中,树(英语:tree)是一种抽象数据类型(ADT)或是实作这种抽象数据类型的数据结构,用来模拟具有树状结构性质的数据集合。它是由n(n>0)个有限节点组成一个具有层次关系的集合。把它叫做“树”是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。它具有以下的特点: 每个节点都只有有限个子节点或无子节点; 没有父节点的节点称为根节点; 每一个非根节点有且只有一个父节点; 除了根节点外,每个子节点可以分为多个不相交的子树; 树里面没有环路(cycle) 1.2常见术语 节点的度 :一个节点含有的 子树的个数 称为该节点的度; 树的度 :一棵树中,最大的节点度称为树的度; 叶节点 或 终端节点 :度为零的节点; 非终端节点 或 分支节点 :度不为零的节点; 父亲节点 或 父节点 :若一个节点含有子节点,则这个节点称为其子节点的父节点; 孩子节点 或 子节点 :一个节点含有的子树的根节点称为该节点的子节点; 兄弟节点 :具有相同父节点的节点互称为兄弟节点; 节点的 层次 :从根开始定义起,根为第1层,根的子节点为第2层,以此类推; 深度 :对于任意节点n,n的深度为从根到n的唯一路径长,根的深度为0; 高度 :对于任意节点n,n的高度为从n到一片树叶的最长路径长,所有树叶的高度为0;

20182306 哈夫曼编码测试

会有一股神秘感。 提交于 2019-12-04 20:42:05
20182306 哈夫曼编码测试 实验内容 设有字符集:S={a,b,c,d,e,f,g,h,i,j,k,l,m,n.o.p.q,r,s,t,u,v,w,x,y,z}。 给定一个包含26个英文字母的文件,统计每个字符出现的概率,根据计算的概率构造一颗哈夫曼树。 并完成对英文文件的编码和解码。 要求: (1)准备一个包含26个英文字母的英文文件(可以不包含标点符号等),统计各个字符的概率 (2)构造哈夫曼树 (3)对英文文件进行编码,输出一个编码后的文件 (4)对编码文件进行解码,输出一个解码后的文件 (5)撰写博客记录实验的设计和实现过程,并将源代码传到码云 (6)把实验结果截图上传到云班课 哈夫曼树的理解 哈夫曼树是二叉树中很特别的一种,也是最优二叉树,通过某种权值来构造出哈夫曼二叉树,在这个二叉树中,只有叶子节点才是有效的数据节点,其他的非叶子节点是为了构造出哈夫曼而引入的! 哈夫曼编码是一个通过哈夫曼树进行的一种编码,一般情况下,以字符:‘0’与‘1’表示。编码的实现过程很简单,只要实现哈夫曼树,通过遍历哈夫曼树,规定向左子树遍历一个节点编码为“0”,向右遍历一个节点编码为“1”,结束条件就是遍历到叶子节点。 哈夫曼编码 构造一个结点类,定义好字符、权值、左结点、右结点、哈夫曼编码。 public class HuffmanNode implements Comparable

数据结构:树和二叉树

谁说我不能喝 提交于 2019-12-04 19:55:30
一、树的定义和基本术语 把数据元素称为结点 树是n(n>=0)个结点的有限集合。n=0时称为空树。 有且仅有一个根节点。n>1时,除了根结点之外的其余结点被分成m棵 互不相交 的子树。 结点的度:某结点拥有的子树的个数。 树的度:每个结点的度的最大值 二叉树的逻辑结构 1.定义 二叉树的每个结点最多有两棵子树 二叉树是有序的 满二叉树:叶子(度为0)只能出现在最下一层、只有度为0和度为2的结点 完全二叉树:叶子结点只能出现在最下两层、最下层的叶子结点都集中在二叉树的左侧;如果有度为1的结点,只能有一个,且该结点只有左孩子。 (请查找一个图来看) 2.二叉树的基本性质 1. 二叉树的第i层上最多有2 ^i-1 个结点(1,2,4,8...) 2. 在一棵深度为k的二叉树中,最多有2^k -1 个结点,最少有k个结点。(1+2+4+8...) 3. 在一棵二叉树中,如果叶子结点的个数为n0,度为2的结点个数为n2,则:n0 = n2 + 1 4. 具有n个结点的完全二叉树的深度为log2 n (向下取整) + 1 5. 对一棵具有n个结点的完全二叉树中的结点,从1开始按层序编号,则对于任意编号i(1<=i<=n)的结点,有: 如果结点i有左孩子,左孩子为2i;如果结点i有右孩子,右孩子为2i+1;如果结点i有双亲,那么双亲编号为i/2(向下取整)。 来源: https://www

决策树(上)-ID3、C4.5、CART

你离开我真会死。 提交于 2019-12-04 16:19:17
参考资料(要是对于本文的理解不够透彻,必须将以下博客认知阅读,方可全面了解决策树): 1. https://zhuanlan.zhihu.com/p/85731206 2. https://zhuanlan.zhihu.com/p/29980400 3. https://github.com/Vay-keen/Machine-learning-learning-notes/blob/master/%E5%91%A8%E5%BF%97%E5%8D%8E%E3%80%8AMachine%20Learning%E3%80%8B%E5%AD%A6%E4%B9%A0%E7%AC%94%E8%AE%B0(5)--%E5%86%B3%E7%AD%96%E6%A0%91.md 决策树是一个非常常见并且优秀的机器学习算法,它易于理解、可解释性强,其可作为分类算法,也可用于回归模型。本文将分三篇介绍决策树, 第一篇介绍基本树(包括 ID3、C4.5、CART),第二篇介绍 Random Forest、Adaboost、GBDT,第三篇介绍 Xgboost 和 LightGBM。 在进入正题之前,先让我们了解一些有关信息论的知识! 信息论 1.信息熵 在决策树算法中,熵是一个非常非常重要的概念。 一件事发生的概率越小,我们说它所蕴含的信息量越大。 比如:我们听女人能怀孕不奇怪,如果某天听到哪个男人怀孕了

JAVA数据结构

强颜欢笑 提交于 2019-12-04 13:27:46
JAVA中的常用的数据结构、每个特定类的使用和功能适用的场合。 一、数据结构 1.逻辑结构和物理结构 逻辑结构 :反映数据元素之间的逻辑关系,其中的逻辑关系是指数据元素之间的前后件关系,而与他们在计算机中的存储位置无关。常见的逻辑结构有集合、线性结构、树形结构、图形结构。    集合 :数据结构中的元素之间除了同属一个集合”的相互关系外,别无其他关系。    线性结构 :数据结构中的元素存在一对一的相互关系。每个数据元素只有一个直接前驱和一个直接后继,线性结构有线性表,栈,队列,双队列,串,一般多维数组、广义表不是线性结构。    树形结构 :数据结构中的元素存在一对多的相互关系。且具有明显的层次关系,每一层上的数据元素可能和下一层中多个元素相关,但只能和上一层中一个元素相关。树形结构可以表示从属关系、并列关系。数据结构中各种树形状都是树形结构。    图形结构 :数据结构中的元素存在多对多的相互关系。结点之间的关系可以是任意的,任意两个数据元素之间都可能相关,图形结构常被用于描述各种复杂的数据对象。 物理结构 :指数据的逻辑结构在计算机存储空间的存放形式。包括数据元素的机内表示和关系的机内表示,数据元素的机内表示指用二进制位的位串表示数据元素,称这种位串为节点。当数据元素有若干个数据项组成时,位串中与多个数据项对应的子位串称为数据域。关系的机内表示则可以分为顺序映像和非顺序映像

20182310第九周学习总结

柔情痞子 提交于 2019-12-04 10:32:38
《数据结构与面向对象程序设计》第九周学习总结 教材学习内容总结 1.二叉查找树(binary search tree):二叉树定义的扩展,一种带有附加属性的二叉树。附加属性是什么?树中的每个节点,其左孩子都要小于其父节点,而父节点又小于或等于其右孩子。 2.堆排序 3.关于堆排序的内容: 原理:根据堆的有序属性,将列表的每一个元素添加到堆中,然后一次一个的把他们从根中删除。 堆排序是一种选择排序,整体主要由构建初始堆+交换堆顶元素和末尾元素并重建堆两部分组成。其中构建初始堆经推导复杂度为O(n),在交换并重建堆的过程中,需交换n-1次,而重建堆的过程中,根据完全二叉树的性质,[log2(n-1),log2(n-2)...1]逐步递减,近似为nlogn。所以堆排序时间复杂度一般认为就是O(nlogn)。 堆排序时间复杂度O(nlogn)。 步骤: 步骤一:构造初始堆。将给定无序序列构造成一个堆(升序采用小顶堆,降序采用大顶堆)。 步骤二:将堆顶元素与末尾元素进行交换,使末尾元素最大。然后继续调整堆,再将堆顶元素与末尾元素交换,得到第二大元素。如此反复进行交换、重建、交换。 4.删除元素(removeElement): 在二叉查找树中删除一个给定的结点p有三种情况: (1)结点p无左右子树,则直接删除该结点 (2)结点p有左子树(右子树),则把p的左子树(右子树)接到p的父节点上 (3

树链剖分不详细讲解

旧街凉风 提交于 2019-12-04 10:26:27
前置技能:线段树、DFS 当我第一次听到 “树链剖分” 这个算法的时候,感觉它一定很高大上。现在看来,它确实很高大上,不过也十分的 暴力 (个人认为,不喜勿喷) 基本概念  树链剖分,计算机术语,指一种对树进行划分的算法,它先通过轻重边剖分将树分为多条链,保证每个点属于且只属于一条链,然后再通过数据结构(树状数组、SBT、SPLAY、线段树等)来维护每一条链。  ————某度百科   百度百科对什么是树剖已经说的很明白了,接下来我们再了解一下其他的概念。 重儿子:对于每一个非叶子节点,它的儿子中子树节点最多的儿子 轻儿子:对于每一个非叶子节点,它的除重儿子以外的儿子 重边:父亲节点连向重儿子的边 轻边:父亲节点连向轻儿子的边 重链:由多条重边连成的一条树链 轻链:由多条轻边连成的一条树链 在这张图片中,带红点的就是轻儿子,其余为重儿子;加粗的边为重边,其余的为轻边; \(1 -> 14, \; 2 -> 11, \; 3 -> 7\) 的路径为重链,其余的为轻链。 前面某度已经说了,树链剖分要通过轻重边剖分将树分为多条链,那么它是怎么找出轻重边,又是怎么剖分的的呢?不要着急,我们接着讲 实现方法 先来说一说我们需要求哪些东西 变量 含义 \(f[i]\) 结点 \(i\) 的父亲 \(son[i]\) 结点 \(i\) 的重儿子(如果有 \(i\) 有两个及以上的重儿子

爱恨交织的红黑树

时光总嘲笑我的痴心妄想 提交于 2019-12-04 08:21:42
虐你千万遍,还要待她如初恋的红黑树,是否对她既欢喜又畏惧。别担心,通过本文讲解,希望你能有前所未有的感动。 红黑树也是二叉查找树,但比普通的二叉查找树多一些特性条件限制,每个结点上都存储有红色或黑色的标记。因为是二叉查找树,所以他拥有二叉查找树的所有特性。红黑树是一种自平衡二叉查找树,在极端数据条件插入时(正序或倒叙)不会退化成类链状数据,可以更高效的在O(log(n))时间内完成查找,插入,删除操作。 准备 在阅读本文之前,建议先阅读我上篇文章 《二叉查找树的解读和实现》 ,可以更好的帮助你理解红黑树。 特性 结点是红色或黑色 根结点必须为黑色 叶子结点(约定为null)一定为黑色 任一结点到叶子结点的每条路径上黑色结点数量都相等 不允许连续两个结点都为红色,也就是说父结点和子结点不能都为红色 查找 红黑树的查找方式和上篇文章所讲述的原理一样,这里就不重新讲述,以结点 [38,20,50,15,27,43,70,60,90] 为例,返回一颗红黑树。 普通操作 红黑树的插入和删除,分为多种情况,相对来说比较复杂。插入或删除新结点后的树,必须要满足上面五点特性的二叉查找树,所以要通过不同手段来调整树。但普通操作就是和普通二叉查找树操作一样。 比如普通插入中,因为每个结点只能是红色或黑色,所以我们定义新添加的非根结点默认颜色为红色。将新结点定义为红色的原因是为了满足特性4

[简单路径] Useful Decomposition

半腔热情 提交于 2019-12-04 01:58:58
Ramesses knows a lot about problems involving trees (undirected connected graphs without cycles)! He created a new useful tree decomposition, but he does not know how to construct it, so he asked you for help! The decomposition is the splitting the edges of the tree in some simple paths in such a way that each two paths have at least one common vertex. Each edge of the tree should be in exactly one path. Help Remesses, find such a decomposition of the tree or derermine that there is no such decomposition. Input The first line contains a single integer n ( 2 ≤ n ≤ 10 5 ) the number of nodes in