信息=能量?

可紊 提交于 2020-02-01 18:53:49

在环球科学公众号看到一篇关于信息和能量关系的推文,对于这些基本概念进行了论述。

在人类文明史上,存在一些基本的理论概念。一旦弄清这些基本概念之间的联系,科技乃至人类文明就将出现飞跃。比如爱因斯坦搞清楚了质量与能量的关系后,人类就制造出了原子弹,爱因斯坦也成为科学史上巨人。兰道尔与他的论文None在历史上,首先完整阐述信息和能量之间的关系的人是罗夫·兰道尔(Rolf Landauer)。

image

^罗夫·兰道尔(Rolf Landauer)^

原籍在德国的兰道尔出生在第一次世界大战和第二次世界大战中间的一个犹太人家庭,那年是1927年,在7岁那年他的父亲去世,跟着母亲来到美国纽约谋生。他天资聪颖,18岁就拿到了哈佛大学的毕业证,随后在美国海军服役18个月后,又返回到哈佛大学攻读博士。五年后,即1950年获得博士学位。

毕业后兰道尔找到的第一份稳定的工作就是进入IBM公司上班,之后一直没有离开过IBM。平均的上班族的生活并没有使他引起人们特别的注意,直到1961年,他在《IBM研究通讯》发表了一篇著名论文,即:《不可逆性与计算过程中的热量产生》“Irreversibility and Heat Genration in the Computing Process”。

在这篇文章中,他大胆提出一个惊人的论断“经典计算机中要改变一个经典比特信息,需要不可避免消耗掉至少KTln2的能量,变成热量消耗掉”。(k是玻尔兹曼常数,T是经典计算机所处的外接物理环境的温度。)

image

为什么会有这样的结论,兰道尔究竟如何推导出这个论断呢?这需要对信息进行进一步的讨论。

什么是信息?None信息有很多的定义。通常情况下信息,指音讯、消息、通讯系统传输和处理的对象,泛指人类社会传播的一切内容。在一切通讯和控制系统中,信息是一种普遍联系的形式。

1948年,数学家香农在题为“通讯的数学理论”的论文中指出:“信息是用来消除随机不定性的东西”。比如,告诉你今晚天空会出现狮子座的流星雨,这种小概率出现的随机事件就包含了很多的信息。

信息还可以进行度量。1948年,香农提出了“信息熵”的概念,信息熵解决了信息的度量问题。信息熵的定义如下(其中pi为每种可能性的概率):

image

这与在物理学中的热力学熵的定义很接近:

image

其中KB是玻尔兹曼常数,Ω是系统宏观状态中所包含的微观状态总数。这个公式就是“玻尔兹曼公式”,可证明它的另外 一个等价的表示就是上面的信息熵的公式,只是前面增加了一个玻尔兹曼常数项,对数的底取的是e,而不是2。

image

玻尔兹曼(Bltzmann)

我们可以用以下例子来理解信息熵:考试时,有一道选择题,你对4个选项ABCD都不确定。那么,这时每个选项正确的概率是25%。于是,这时的信息熵就可以这样用以上提到的信息熵公式来计算。

把四个p

i都等于25%代入以上那个公式,就可以算出这个时候的信息熵等于2比特。

这个时候,考场里进来一个人,这个人是你非常信任的张老师。张老师突然告诉你说:“选项A与选项B肯定不对,不用选了。”张老师说的话是给你信息了。那么,老师的话里包含了多少信息呢?

现在对你来说,选项AB可以排除,那么只剩下选项C与D了。对你来说,C与D各自正确的概率是50%。

所以,这时你把两个p

i都等于50%代入,可以得到的信息熵等于1比特。你会发现,信息熵减少了。

所以,对你来说,张老师的话包含的信息量是1比特,因为2-1=1(这里涉及到一个信任问题,如果你不相信张老师的话,那么张老师的话对你来说并不包含信息)。

信息熵到热力学熵None有了香农的信息熵以后,可以把它与物理学中的热力学熵联系起来。

在这里,需要使用高中数学中求对数的换底公式,在求对数的时候,信息熵是以2为底的,而热力学熵是以自然常数为底的,统一换成以自然常数为底,两者相差一个ln2。

所以,按照物理学的理解,3比特的信息熵,对应的热力学熵就是3kln2 。在这里K是玻尔兹曼常数,这个常数给出了信息熵与热力学熵的转化。用公式表示就是:

image

这其实也是当年香农考虑信息熵的时候的出发点,他正是通过玻尔兹曼的热力学熵来类比信息论中的熵的。只不过在信息论中不需要玻尔兹曼常数,所以他当年在定义信息熵的时候,把玻尔兹曼常数省略了。

而兰道尔要考虑的问题则更进了一步,他需要考虑一个真实的物理过程。在这个过程中如果想要用物理的手段擦除1比特的信息,需要多少能量呢?

麦克斯韦妖None兰道尔是用热力学与统计力学的思维来思考这个擦除信息的过程。他的思考本质上,就是物理学家非常熟悉的

麦克斯韦妖。

image

麦克斯韦妖是一种能够区分单个气体分子速度的假想物,并且它能够让一个容器内运动快(“热”)的分子和运动慢(“冷”)的分子分别占据不同的区域,从而使容器中不同区域的温度不同。

这个结论表面与热力学第二定律违背。因为可以把高温和低温分子集合当成两个热源,而且在它们之间放置一个热机,让热机利用温差对外做功。综合来看,由于麦克斯韦妖的引进,我们可以从单一热源吸热,并把它完全转化为对外做功。在这里出现了违反热力学第二定律的第二类永动机。

image

这个佯谬是1873年麦克斯韦提出的针对热力学第二定律的质疑,后来物理学家把它称为“麦克斯韦妖佯谬”。

这个佯谬被提出来以后,在相当长的时间内,物理学家们没有能够给出一个很满意的解释。对这个问题的一个重要的进展是1929年匈牙利物理学家Leo Szilard引入的一个单分子热机模型,这个模型实际上是一个简化了的麦克斯韦妖热机模型。

Szilard首次将信息的概念引入到热力学循环中。他直观地认为麦克斯韦妖在测量分子处于左边还是右边的过程(获取信息的过程)中会消耗能量,从而导致整体的熵的增加。如果把这个效果包含到热力学循环中来,热力学第二定律就不会被违反,麦克斯韦妖佯谬也就被解决了。

Szilard的解释在当时没有被广泛的接受,直到1961年兰道尔发表了他的著名论文,将信息理论和基本物理过程联系起来。

信息与能量联系None在物理上,能量对热力学熵(内含玻尔兹曼常数)的导数等于温度:image

兰道尔构造了一个模型,与Scilard当年的单分子热机模型类似,来解释这个问题。

首先构造一个盒子,把这个盒子分为左右两部分。然后假设有一个气体分子,如果不确定它到底是在左边还是右边,那么与本文一开始写到的做选择题的情况类似,相当于有两个选项(选左边或者右边),这时的信息熵是1比特。

image

现在,假设在箱子的右边有一个活塞,活塞可以通过等温压缩把气体分子推到左边。在这个过程结束后,我们能够确定气体分子一定处于盒子的左边,所以,气体分子的信息熵就等于0。

因此,从信息论的角度来说,在活塞运动的过程中,相当于擦除了1比特的信息。而从物理学的角度来说,活塞的运动是需要消耗能量的,在等温压缩的过程中,可以通过本小节的微分公式算出,活塞做了kT ln2 的功。

这就是兰道尔原理的基本思想:经典计算机要擦除一个经典比特,其所消耗的最小能量是kT ln2。当然兰道尔用了比较长的篇幅来论证这个能量是最小的,在这里就不展开论证了。

image

当然,这个最小能量KTln2非常小,在室温下(T=300k), KTln2=0.018eV=2.9×10^-21焦耳。至少现在的计算机工作时在处理每一个比特变化的过程中所消耗的能力远比这个能量单位大得多,但兰道尔的论文给出了信息处理的下限,一方面为人类未来开发出更加高效信息处理技术指明方向,还有很大的提高空间。

同样在另外一方面也告诉我们,未来限制信息处理能力的本质因素是能量受限。

原始论文:

https://ieeexplore.ieee.org/abstract/document/5392446/

参考链接:

http://www.sohu.com/a/224458314_100115417

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!