分区表

查看 磁盘第一个扇区的信息

匿名 (未验证) 提交于 2019-12-03 00:30:01
大家是不是经常会谈论到MBR(main boot record)。MBR是由bootloader、dpt、结尾标志组成的。简单的来说MBR=bootloader+dpt+结尾标志(55 aa)。其中bootloader即引导记录(446字节),dpt磁盘分区表(64字节) 结尾标志(2字节)。那我们怎么看这里面的内容呢,哈哈。linux有很方便的方法。请大家接着往下看: 1、[root@centos5 ~]# dd if=/dev/sda of=mbr.bin bs=1 count=512 512+0 records in 512+0 records out 512 bytes (512 B) copied, 0.001414 seconds, 362 kB/s (这里面主要是用到了dd这个工具,dd这个工具很强大。大家可以看下它的用法。) 2、[root@centos5 ~]# hexdump -C mbr.bin 00000000 eb 48 90 10 8e d0 bc 00 b0 b8 00 00 8e d8 8e c0 |.H..............| 00000010 fb be 00 7c bf 00 06 b9 00 02 f3 a4 ea 21 06 00 |...|.........!..| 00000020 00 be be 07 38 04 75 0b

HBase中建立分区表

匿名 (未验证) 提交于 2019-12-03 00:30:01
在HBase中,每个表默认时都由一个Region存储原数据,但是若当数据慢慢增加时,就会将一个Region分裂成其他若干个不同的region。但是这种无序的分裂,会让后期的表扫描,表过滤操作很不方便(特别耗时)。正是着眼于未来表的改变,于是有了为表创建分区的操作。 一个有效的提高批量导入的性能的方式,是预创建空的区域。但同时需要稍微保守一点,因为过多的区域会实实在在的降低性能。根据hbase中rowkey的分布,可以设置相应的region(分区)。这样就可以防止大数据插入时的热点问题,提高数据插入的效率。但是与此同时我们会遇到几个问题: 01.数据的rowkey是如何分布的? 02.规划一下需要分成多少region?每个region的startkey和endkey是多少? 03.该根据怎样的分区键分区? 每个分区都由一对分区键控制,如果需要创建一个分区表,那么首先得确定该表以什么键分区。一般来说,因为在ASCII码表中,最大的可打印字符是 ~ ,接着就是 | 。所以我们就可以选择这两种字符作为分区键的标识来结束。在本篇博客里,我使用 | 作为标识。设置的分区键如下: [root@littlelawson ~] # cat region_split_info.txt 0001 | 0002 | 0003 | 0004 | 0005 | 0006 | 0007 | 0008 |

Hive之――数据操作

匿名 (未验证) 提交于 2019-12-03 00:22:01
转载请注明出处:https://blog.csdn.net/l1028386804/article/details/80550762 一、Hive基本使用――查询 基本语法 select [all | distinct] select_expr, select_expr, ... from tablename [where where_condition] 二、实例 1、hive命令行执行 select * from lyz; 2、linux命令行执行 hive -e "select * from lyz" hive -S -e "select * from lyz" hive -V -e "select * from lyz" 3、执行文件中的HQL hive -f "/home/lyz.sql" 4、脚本执行HQL #!/bin/bash hive -e "select * from lyz" 三、Hive操作――变量 1、配置变量 set val = '' ${hiveconf:val} 2、环境变量 ${env:HOME},注env查看所有环境变量 四、数据加载 1、内表数据加载 1) 创建表时加载 > create table newtable as select col1, col2 from oldtable 2)创建表时是指定数据的位置 > create table

Oracle入门(十二F)之表分区

匿名 (未验证) 提交于 2019-12-03 00:22:01
转载自 一、分区表基础知识 (1) 表空间及分区表的概念 表空间:   是一个或多个数据文件的集合,所有的数据对象都存放在指定的表空间中,但主要存放的是表, 所以称作表空间。 当表中的数据量不断增大,查询数据的速度就会变慢,应用程序的性能就会下降,这时就应该考虑对表进行分区。表进行分区后,逻辑上表仍然是一张完整的表,只是将表中的数据在物理上存放到多个表空间(物理文件上),这样查询数据时,不至于每次都扫描整张表。 (2)表分区的具体作用 Oracle的表分区功能通过改善可管理性、性能和可用性,从而为各式应用程序带来了极大的好处。通常,分区可以使某些查询以及维护操作的性能大大提高。此外,分区还可以极大简化常见的管理任务,分区是构建千兆字节数据系统或超高可用性系统的关键工具。 分区功能能够将表、索引或索引组织表进一步细分为段,这些数据库对象的段叫做分区。每个分区有自己的名称,还可以选择自己的存储特性。从数据库管理员的角度来看,一个分区后的对象具有多个段,这些段既可进行集体管理,也可单独管理,这就使数据库管理员在管理分区后的对象时有相当大的灵活性。但是,从应用程序的角度来看,分区后的表与非分区表完全相同,使用 SQL DML 命令访问分区后的表时,无需任何修改。 什么时候使用分区表: 1、表的大小超过2GB。 2、表中包含历史数据,新的数据被增加都新的分区中。 1、改善查询性能

zz 计算机的启动过程(详细)

匿名 (未验证) 提交于 2019-12-03 00:19:01
https://blog.csdn.net/langeldep/article/details/8788119 【转】计算机的启动 Feb 17 th , 2013 寒假回来就要开始执行新年的计划了~首先是每周的一篇blog。 今天看了 阮一峰 最新的一篇博客 计算机是如何启动的 ,感觉写得很好,又清楚又简单。虽然自己关于计算机启动这个过程从大三OS课的时候就陆陆续续地一直有了解,但是都没有一个系统的了解,或者了解了又忘了,希望通过这次记录把这点彻底弄清楚来并且记在脑子里。另外在评论中有另外一个小哥 大磊 把他的 博客 也贴出来了,写得很详细,作为阮一峰的补充吧。 以下是转来的文章,中间加上了大磊的补充,也没有区分哪句话是谁说的,具体的还是看之前提到的两篇博客吧: 零、boot的含义 先问一个问题,”启动”用英语怎么说? 回答是boot。可是,boot原来的意思是靴子,”启动”与靴子有什么关系呢? 原来,这里的boot是bootstrap(鞋带)的缩写,它来自一句谚语: "pull oneself up by one's bootstraps" 字面意思是”拽着鞋带把自己拉起来”,这当然是不可能的事情。最早的时候,工程师们用它来比喻,计算机启动是一个很矛盾的过程:必须先运行程序,然后计算机才能启动,但是计算机不启动就无法运行程序! 早期真的是这样,必须想尽各种办法

Parted 创建 GPT 分区

匿名 (未验证) 提交于 2019-12-02 23:54:01
对于磁盘的分区表 MBR与GPT区别。 MBR:MBR分区表(即主引导记录)大家都很熟悉,是过去我们使用windows时常用的。 所支持的最大卷:2T,而且对分区有限制:最多4个主分区或3个主分区加一个扩展分区 GPT: GPT(即GUID分区表)。是源自EFI标准的一种较新的磁盘分区表结构的标准,是未来磁盘分区的主要形式。与MBR分区方式相比,具有如下优点。 突破MBR 4个主分区限制,每个磁盘最多支持128个分区。支持大于2T的分区,最大卷可达18EB。 对于 GPT 的分区,建议使用 parted 工具进行分区,fdisk 在 GPT 这块不是很好。 Parted 介绍 Parted 命令分为两种模式:命令行模式和交互模式。 命令行模式 parted [option] device [command] ,该模式可以直接在命令行下对磁盘进行分区操作,比较适合编程应用。如: 显示磁盘/dev/sdb分区。 parted /dev/sdb print 交互模式 parted [option] device 进入交互模式。尤其是对 parted 命令不是很熟悉的情况下建议使用交互模式。 parted /dev/sdb parted命令常用选项 进入 交互模式下, 输入 help 可以看到如下提示,本文基于 Parted 3.2 进行说明。 test@test01:~$ sudo

SQL SERVER-分区表

匿名 (未验证) 提交于 2019-12-02 23:49:02
--创建分区函数 CREATE PARTITION FUNCTION parfn_Date ( Date ) AS RANGE RIGHT FOR VALUES ('2019-05-01','2019-06-01') --查看分区函数 SELECT * FROM SYS.PARTITION_FUNCTIONS --创建分区架构 CREATE PARTITION SCHEME sch_parfn_Date AS PARTITION parfn_Date TO ([primary],fg1,fg2 ) --查看分区架构 SELECT * FROM SYS.PARTITION_schemes --创建分区表 CREATE TABLE shipment_header ( [CustomerID] [varchar](20) NOT NULL, [SAPSoldTo] [varchar](20) NOT NULL, [ShipmentNo] [varchar](20) NOT NULL, [Shipmark] [varchar](20) NULL, [ShipDate] Date NULL, )ON sch_parfn_Date([ShipDate]) --指定架构和分区列,分区列的数据类型要和分区函数的参数类型相同 --查看分区表数据的分布状态 select convert(varchar

GPT概述

匿名 (未验证) 提交于 2019-12-02 23:43:01
全局唯一标识分区表(GUID Partition Table,缩写:GPT)是一个实体硬盘的分区结构。它是可扩展固件接口标准的一部分,用来替代BIOS中的主引导记录分区表。 传统的主启动记录 (MBR) 磁盘分区支持最大卷为 2.2 TB (terabytes) ,每个磁盘最多有 4 个主分区(或 3 个主分区,1 个扩展分区和无限制的逻辑驱动器)。 与MBR 分区方法相比,GPT 具有更多的优点,因为它允许每个磁盘有多达 128 个分区,支持高达 18 千兆兆字节 (exabytes,1EB=10^6TB) 的卷大小,允许将主磁盘分区表和备份磁盘分区表用于冗余,还支持唯一的磁盘和分区 ID (GUID)。 与 MBR 分区的磁盘不同,GPT的分区信息是在分区中,而不象MBR一样在主引导扇区。为保护GPT不受MBR类磁盘管理软件的危害,GPT在主引导扇区建立了一个保护分区 (Protective MBR)的MBR分区表,这种分区的类型标识为0xEE,这个保护分区的大小在Windows下为128MB,Mac OS X下为200MB,在Window磁盘管理器里名为GPT保护分区,可让MBR类磁盘管理软件把GPT看成一个未知格式的分区,而不是错误地当成一个未分区的磁盘。另外,GPT 分区磁盘有多余的主要及备份分区表来提高分区数据结构的完整性。 在MBR硬盘中,分区信息直接存储于主引导记录

关于重装系统的认知更新

匿名 (未验证) 提交于 2019-12-02 23:38:02
声明:文中有部分内容参考自网络(如百度百科),仅供交流学习使用,不做商用;转载请注明来源。 -------------------------------------------------------------------------------------------------------------------------------------- 几年前在学校经常折腾装系统时,可能由于大多数都是旧电脑,再加上UEFI + GPT模式普及率可能没有现在这么高,所以都是基于BOIS + MBR方式进行系统安装,似乎也没出现过什么幺蛾子。因此,我对安装系统的认知和技术水平仍停留在了传统的BOIS + MBR组合……直到最近几天,自己想在一台配置了SSD、本机正常运行着WIN10的新电脑上再次安装一个WIN7系统时,竟然发现玩不转了,可谓跌了跟头碰了壁,前后浪费了有一天时间才弄清原委。我觉得,自己几年前的搞机知识和认知已经落后于时代了,因此绝对有必要更新一下。 一、系统启动方式 BOIS:传统的系统启动方式 BIOS是英文"Basic Input Output System"的 缩略词 ,直译过来后中文名称就是"基本输入输出系统"。在 IBM PC兼容系统上,是一种业界标准的 固件 接口 。BIOS是 个人电脑 启动时加载的第一个软件。其实,它是一组固化到 计算机 内 主板

MySql―分区表【应用场景/局限性/实现原理/使用教程/实际测试】

匿名 (未验证) 提交于 2019-12-02 22:06:11
一.概述 之所以接触到Mysql表分区,是缘由最近客户公司运营自去年,数据量曾几何暴增,导致表数据非常的庞大,一张表有上亿数据行不止。普通MySql优化,如关键字段索引,字段优化,查询语句优化也已经远远满足不了需求。前期经过开会商讨,给予的方案是:①数据库上:按月建立分表,按年建立分库;②客户端:默认显示当月数据,实现按月查询 ③服务端:按日期进行建表/查表,及相应数据的改/删。此方案基本解决了客户端用户的体验,但是对于针对个别用户要进行数据校验,就要进行从年库汇总,还要从月库汇总累加,服务端代码量的修改,及业务逻辑十分复杂。此时便萌生我们的MySql有没有为我们提供此问题的解决方案,通过了解,查到MySQL--分区表的相关知识。 二.应用场景/为什么要进行分区/优点(MySQL版本在5.1及以上) ①对于那些已经失去保存意义的数据,通常可以通过删除与那些数据有关的分区,很容易地删除那些数据。相反地,在某些 情况下,添加新数据的过程又可以通过为那些新数据专门增加一个新的分区,来很方便地实现。 ②与单个磁盘或文件系统分区相比,可以存储更多的数据。 ③一些查询可以得到极大的优化,这主要是借助于满足一个给定WHERE语句的数据可以只保存在一个或多个分区内,这样 在查找时就不用查找其他剩余的分区。因为分区可以在创建了分区表后进行修改,所以在第一次配置分区方案时还不曾这 么做时