比特

文本文件与二进制文件(原作者:mjgforever)

折月煮酒 提交于 2019-12-22 00:40:08
文本文件与二进制文件 一、文本文件与二进制文件的定义 大家都知道计算机的存储在物理上是二进制的,所以文本文件与二进制文件的区别并不是物理上的,而是逻辑上的。这两者只是在编码层次上有差异。 简单来说,文本文件是基于字符编码的文件,常见的编码有ASCII编码,UNICODE编码等等。二进制文件是基于值编码的文件,你可以根据具体应用,指定某个值是什么意思(这样一个过程,可以看作是自定义编码)。 从上面可以看出文本文件基本上是定长编码的(也有非定长的编码如UTF-8),基于字符嘛,每个字符在具体编码中是固定的,ASCII码是8个比特的编码,UNICODE一般占16个比特。而二进制文件可看成是变长编码的,因为是值编码嘛,多少个比特代表一个值,完全由你决定。大家可能对BMP文件比较熟悉,就拿它举例子吧,其头部是较为固定长度的文件头信息,前2字节用来记录文件为BMP格式,接下来的8个字节用来记录文件长度,再接下来的4字节用来记录bmp文件头的长度。。。大家可以看出来了吧,其编码是基于值的(不定长的,2、4、8字节长的值都有),所以BMP是二进制文件。 二、文本文件与二进制文件的存取 文本工具打开一个文件的过程是怎样的呢?拿记事本来说,它首先读取文件物理上所对应的二进制比特流(前面已经说了,存储都是二进制的),然后按照你所选择的解码方式来解释这个流,然后将解释结果显示出来。一般来说

文本文件与二进制文件

﹥>﹥吖頭↗ 提交于 2019-12-22 00:39:50
文本文件与二进制文件 一、文本文件与二进制文件的定义 大家都知道计算机的存储在物理上是二进制的,所以文本文件与二进制文件的区别并不是物理上的,而是逻辑上的。这两者只是在编码层次上有差异。 简单来说,文本文件是基于字符编码的文件,常见的编码有ASCII编码,UNICODE编码等等。二进制文件是基于值编码的文件,你可以根据具体应用,指定某个值是什么意思(这样一个过程,可以看作是自定义编码)。 从上面可以看出文本文件基本上是定长编码的(也有非定长的编码如UTF-8),基于字符嘛,每个字符在具体编码中是固定的,ASCII码是8个比特的编码,UNICODE一般占16个比特。而二进制文件可看成是变长编码的,因为是值编码嘛,多少个比特代表一个值,完全由你决定。大家可能对BMP文件比较熟悉,就拿它举例子吧,其头部是较为固定长度的文件头信息,前2字节用来记录文件为BMP格式,接下来的8个字节用来记录文件长度,再接下来的4字节用来记录bmp文件头的长度。。。大家可以看出来了吧,其编码是基于值的(不定长的,2、4、8字节长的值都有),所以BMP是二进制文件。 二、文本文件与二进制文件的存取 文本工具打开一个文件的过程是怎样的呢?拿记事本来说,它首先读取文件物理上所对应的二进制比特流(前面已经说了,存储都是二进制的),然后按照你所选择的解码方式来解释这个流,然后将解释结果显示出来。一般来说

文本文件与二进制文件区别

我的梦境 提交于 2019-12-22 00:38:59
一、文本文件与二进制文件的定义 大家都知道计算机的存储在物理上是二进制的,所以文本文件与二进制文件的区别并不是物理上的,而是逻辑上的。这两者只是在编码层次上有差异。简单来说,文本文件是基于字符编码的文件,常见的编码有ASCII编码,UNICODE编码等等。二进制文件是基于值编码的文件,你可以根据具体应用,指定某个值是什么意思(这样一个过程,可以看作是自定义编码。 从上面可以看出文本文件基本上是定长编码的(也有非定长的编码如UTF-8)。而二进制文件可看成是变长编码的,因为是值编码嘛,多少个比特代表一个值,完全由你决定。大家可能对BMP文件比较熟悉,就拿它举例子吧,其头部是较为固定长度的文件头信息,前2字节用来记录文件为BMP格式,接下来的8个字节用来记录文件长度,再接下来的4字节用来记录bmp文件头的长度。 二、文本文件与二进制文件的存取   文本工具打开一个文件的过程是怎样的呢?拿记事本来说,它首先读取文件物理上所对应的二进制比特流,然后按照你所选择的解码方式来解释这个流,然后将解释结果显示出来。一般来说,你选取的解码方式会是ASCII码形式(ASCII码的一个字符是8个比特),接下来,它8个比特8个比特地来解释这个文件流。例如对于这么一个文件流"01000000_01000001_01000010_01000011"(下划线''_'',为了增强可读性手动添加的),第一个8比特'

bite 比特

℡╲_俬逩灬. 提交于 2019-12-19 21:45:17
https://zhidao.baidu.com/question/576020262.html 比特(BIT,Binary digit),计算机专业术语,是信息量单位,是由英文BIT音译而来。同时也是二进制数字中的位,信息量的度量单位,为信息量的最小单位。在需要作出不同选择的情况下把备选的刺激数量减少半所必需的信息。即信号的信息量(比特数)等于信号刺激量以2为底数的对数值。L.哈特莱1928年认为对信息量选用对数单位进行度量最合适。 [1] 概念 编辑 两个概念 1) 计算机 专业术语 ,是 信息量 单位,是由英文 BIT 音译而来。 二进制数 的一位所包含的信息就是一比特,如二进制数0100就是4比特。 2) 二进制 数字中的位,信息量的 度量 单位,为信息量的最小单位。数字化音响中用电脉冲表达 音频信号 ,“1”代表有脉冲,“0”代表脉冲间隔。如果波形上每个点的信息用四位一组的代码表示,则称4比特,比特数越高,表达模拟信号就越精确,对音频信号还原能力越强。 位概念 二进制数系统中,每个0或1就是一个位(bit),位是数据存储的最小单位。其中8bit就称为一个 字节 (Byte)。计算机中的CPU位数指的是CPU一次能处理的最大位数。例如32位计算机的CPU一次最多能处理32位数据。 Bit,是Binary digit(二进制数)位的缩写,是数学家John Wilder

2019 区块链大事记

和自甴很熟 提交于 2019-12-18 02:25:45
作者 | 胡巍巍 出品 | 区块链大本营(blockchain_camp) 北京今天下雪了,再有几天就是圣诞,过了圣诞,很快就是2020年。 以史为镜,可以知兴替。冷静的岁末冬日,更适合坐下来,好好回顾下这一年间,区块链的浮浮沉沉,总结下得失、挥挥衣袖再出发。 那么,这一年,就有哪些区块链大事记呢? 一、IEO流行 1月28日,币安上币平台Binance Launchpad,上线售卖BTT(BitTorrent比特流),这次BTT的抢购,正式掀起了一阵IEO的狂风。 4月3日,交易所OKEx宣布首个应用型Token销售平台“OK Jumpstart”正式上线。 4月7日,菲律宾持政府全牌照交易所CZC,也正式上线了首个IEO项目AMTK(Amber Token)琥珀令牌。 那么,IEO是什么? IEO是Initial Exchange Offerings的缩写,意思是以交易所为核心的Token发行。 举个例子,一个项目,除了早期私募是由机构参与之外,往后的公募和上线交易,都在同一个交易所完成,这就是IEO模式。它没有融资认购的过程,上线交易所后,用户直接就能买卖。 二、Libra横空出世 2019年6月18日,当不少国人在沉浸在年中购物节的兴奋中,Facebook的扎克伯格发布Libra白皮书。 Libra,是Facebook新推出的虚拟加密货币。它是一种不追求对美元汇率稳定

布隆过滤器原理及实现

こ雲淡風輕ζ 提交于 2019-12-16 03:37:53
1.布隆过滤器的使用价值 有时候我们需要判断一个元素是否在一个集合中。比如,在字处理软件中,需要检查一个单词是否拼写正确(也就是要判断它是否在已知的字典里);在警察系统中,一个嫌疑人的名字是否出现在嫌疑名单上;在网络爬虫里,一个网址是否已经被访问过,等等。 最直接的方法就是讲集合中的元素存在计算机中,遇到一个新元素时,将它和集合中的元素直接比较即可。一般来讲,计算机中的集合是用哈希表(Hash Table)来存储的。它的好处是快速准确,缺点是耗费存储空间。 为什么说耗费存储空间呢?其根本原因是哈希表方法需要把实实在在的具有特定长度(每个Email地址对应成一个8字节的信息指纹)的元素的信息指纹存储在内存或硬盘中的哈希表中,这个存储量在实际应用中一般是相当大的。比如每存储一亿个Email地址,需要0.8G大小的数字指纹存储空间,考虑到哈希表的存储空间利用率一般只有一半,所以需要1.6G的存储空间。如果存储几十亿上百亿的Email地址,那就需要百亿字节的内存存储空间。 而布隆过滤器只需要哈希表1/8到1/4的大小就能解决同样的问题,它实际上是一个很长的二进制向量和一系列的随机映射函数。 下面以WEB页面地址的存储为例来说明布隆过滤器的工作原理。 假定存储一亿个WEB页面地址,先建立一个16亿二进制(比特),即2亿字节的向量,然后将这16亿个二进制位清零。对于每一个WEB页面地址X

计算机网络的性能指标

*爱你&永不变心* 提交于 2019-12-15 17:20:52
计算机网络的性能一般是指它的几个重要的性能指标。 但除了这些重要的性能指标外, 还有一些非性能特征(nonperformance characteristics) 也对计算机网络的性能有很大的影响。 一、计算机网络性能指标 (1)速率 比特(bit)源于binary digit,意思是一个”二进制数字“,因此一个比特就是二进制数字中的一个l或0。 网络技术中的速率指的是 数据的传送速率 , 它也称为 数据率 (data rate) 或 比特率 (bit rate)。 速率的单位是 bit/s(比特每秒) (或b/s,有时也写为bps, 即bit per second)。 当数据率较高时, 就常常在bit/s的前 面加上一个字母。 例如, k(kilo)= 103 =千, M(Mega) = 106 =兆, G(Giga) = 109 =吉, T (Tera)= 1012 =太。 (2)带宽 宽本来是指某个信号具有的频带宽度。信号的带宽是指该信号所包含的各种不同频率成分所占据的频率范围。 在计算机网络中 ,带宽 用来表示网络中某通道传送数据的能力, 因此网络带宽表示 在单位时间内网络中的某信道所能通过的 “最高数据率 ” 。带宽的单位就是 数据率的单位bit/s的, 是 “比特每秒“。一条通信链路的“带宽”越宽,其所能传输的”最高数据率“也越高。 (3)吞吐量 吞吐量

社区检测与高密子图挖掘(上)

扶醉桌前 提交于 2019-12-15 04:52:17
前面我们说过图的第二个优点是拉帮结派,在图里面是很容易形成团伙结构,近年来,研究这个问题的论文也是汗牛充栋。本章,我们就这一问题所衍生出来的两个方面:社区检测(Community Detection)和高密子图挖掘(Dense Subgraph Mining)作相关讲解。 本文,我们先讲社区检测的相关算法。社区检测的任务是什么呢?举个例子,给定如下图。 直观印象告诉我们,该图存在以下的社区结构: 像这样,从给定图中,将各节点划分到相应社团的任务称为社区检测。值得注意的一点是,一般当我们在说社区检测的时候,节点都是同态的,类型都一样。 本文会重点介绍三个最流行的社区检测算法 Louvain、Lpa、Infomap ,最后对社区检测作一些补充说明。 Louvain算法 Louvain算法是一种基于模块度的社区检测算法,由于其良好的效率与稳定性而广受欢迎。网上也有基于Spark GraphX 的开源实现版本。 模块度(Modularity) 同很多无监督的聚类算法一样,衡量指标是一个至关重要的因素,很多时候,我们只需要定义好这个指标,然后选择启发式的更新方法去不断优化这个值。一个算法的大概骨架也就出来了。当然一个好的社区衡量指标要符合基本逻辑:社区内联系紧密,社区间联系松散。在06年《Modularity and Community structure in networks 》一文中

【资讯】闪电网络将很快处理大笔比特币付款

☆樱花仙子☆ 提交于 2019-12-15 01:07:17
什么是闪电网络? 比特币闪电网络背后的想法可能听起来像这样:我们真的不需要保留区块链上每笔交易的记录。 取而代之的是,闪电网络在比特币的区块链上增加了另一层,并允许用户在该额外层上的任何两方之间创建支付渠道。这些渠道可以持续存在很长时间,而且由于是在两个人之间建立的,因此交易几乎是即时的,费用极低,甚至根本不存在。 它是如何工作的? 输入Danny和Jon。他们可能在一起工作,可能是亲戚,也可能是夫妻,关键是他们需要经常,快速且以最低费用向对方汇款。因此,他们在闪电网络上建立了一个渠道。 首先,他们需要创建一个多用途钱包,这是一个他们都可以使用各自私钥访问的钱包。然后,他们俩都在钱包中存入一定数量的比特币,例如每个3 BTC。 从那时起,他们可以在两者之间执行无限的交易。本质上,这些交易是存储在共享钱包中的资金的重新分配。例如,如果Danny要向Jon发送1个BTC,她将需要将该金额的所有权转让给他。然后,他们两个使用私钥签署更新的资产负债表。 如果比特币要成为目前现有支付系统的完全替代品,那么显然它将需要能够与之竞争。截至目前,还没有结束。要了解情况的严重性,只需将比特币每秒微不足道的7笔交易与Visa的平均24,000笔交易及其峰值容量(每秒约50,000笔交易)进行比较。 闪电网络(LN)是一种微支付协议,其本质上是为了实现即时,低成本的比特币交易而创建的

许子敬谈未来区块链

我与影子孤独终老i 提交于 2019-12-14 16:46:20
两年前,比特币和象征着区块链2.0 的以太坊汹涌而来,全世界都感受到了比特币自 2013 年后再次腾飞的疯狂,创造出单枚 2.2 万美金的历史最高价。几乎在一夜之间,区块链江湖急剧扩张,如同一场饕餮盛宴,无人愿意缺席。各类技术专家、金融翘楚、身怀梦想的创业者携海量资金入场,区块链盛宴将将开始,区块链的未来未知而遥远,也许正是这份未知,给了众多参与者无尽的遐想与勇气。自此,区块链三个字开始逐渐进入大众视野。 两年后,总书记在中央政治局的学习会上强调,将把区块链作为国家核心技术自主创新的重要突破口,加快推动区块链技术和产业创新发展。中央的战略布署掷地有声,区块链的战场再次点燃,而这次,区块链注定不会轻易离场。 许子敬 谈何为区块链 简单讲,区块链就是一个巨大的分布式的“账本”和数据库,具有去中心化、去信任、不可篡改、全程留痕、可以追溯、集体维护、公开透明等特点。比如你和小张做一笔交易,如果只有一个帐本,交易有被篡改的风险;但区块链让每一笔交易都记录在无数个小账本上,共同构成那个巨大的大账本,如此全世界都知道你俩之间这笔交易,想赖帐或篡改根本不可能。因此,区块链让任何互不了解的个体通过一定的合约机制达成信用共识,而不再需要中间方,其最大益处就是建立了互联网时代的信用机制。 数字资产从金钱到音乐或是其他产品,并不储存在中央区域,而是分散于全球的帐本之中,使用的是最高级别的密码技术