狂飙的算力需求,为什么量子计算成为新的方向?
ChatGPT大火之后,人工智能背后的算力问题随之凸显。仅仅是这样一个大模型,OpenAI背后的算力门槛之高令其他所有公司都看而生畏。
在布满科幻感的未来面前,计算机的算力越来越捉襟见肘,要怎么才能取得技术的大突破?
半导体集成电路时代已经发展了几十年,从7纳米到了5纳米、3纳米……然而,再小的芯片都只是在电子物理系统内的提升,下一个提升人类算力的物理系统是什么?人类的算力又该何往何从?
在算力危机下,量子计算作为一种颠覆性的计算体系,将使得我们的算力获得指数级别的增长,被看作是下一个算力时代的星辰大海。
2023年1月,混沌文理院第四期第五模块“量子力学革命”在长沙开课。清华大学副教授李铁夫老师带领同学们一起展看前沿科技。
李铁夫老师的课程分为以下四个部分:
混沌文理院为混沌旗下文理教诲品牌,今年已经第五年。我们致力于邀请国内闻名教授、学者,为学员提供涵盖哲学与世界、生物与宇宙、艺术与美学、认知与系统、政治与法律、思想与文化等板块的专业文理教诲。文理院五期正在招生。
以下为李铁夫老师的授课内容,本文选取了课程中第3讲、第4讲的小部分内容。文末还有混沌文理院同学的出色分享,受益匪浅,不容错过。
人类计算演化:
物理系统越好,算力越高
回忆人类整个的计算历程,背后核心的构思是找到好的物理系统来做计算,这是我们讨论整个算力发展的一个基本认知。
对于一个物理系统来说,它有初始状态,有末态,中间会有演化的过程。比如给空池塘放水其实就是一种物理系统。所有这些初态、末态和演化过程,就能够对应输进、输出和计算的过程。
展开全文
机械计算时代
人类怎样在熟悉世界的过程当中,找到了越来越好的物理系统,获得了越来越高的算力?
从最开始的人类发明的算盘开始,我们拥有了计算的工具,提升记账和算账的效率。它仍然存在着浩大的缺陷。
到后来17世纪英国人发明了“纳皮尔筹”的器具,纳皮尔筹是木条制造的“格子”乘法,从而进一步简化了计算。
法国数学家帕斯卡巧妙地设计了一种机械计算机的装置,能完成简单的加法运算,后来的莱布尼茨在帕斯卡加法器基础上,用齿轮改造发明了带有乘法功能的计算器。
两个世纪后,英国的科学家巴比奇制造出一台差分计算机,它已经能完成简单的微积分的计算。这时候整个计算已经从简单机械算数演化到了基于差分法则的包含齿轮、轴承的复杂机械。
但是到了这个时候,机械计算模式已经到了顶峰,如何实现更复杂通用的计算呢?需要新的思想和新的物理系统。
2.二进制和电学系统
拿今天的计算机来说,为什么一堆晶体管就能够往做运算?这是因为二进制的特殊性,它既是逻辑上的真假,又是开关的两种状态,还是数学上的0、1。
数学上的运算由于只有0和1两个数,它的运算空间是封闭的,那么它的运算就可以分解成为或简单或复杂的逻辑关系。比如带进位的加法能够分解成“与”和“异或”的逻辑关系。
而不管什么样的逻辑关系,都可以用或简单或复杂的开关网络实现。于是我们可以用一种开关网络来实现与,用另外一种开关网络来实现异或,把这两个开关网络往那儿一放,就能往做计算了。
大家假如看过《三体》的话,肯定也对人列计算机表达印象很深,这背后的逻辑无非也是开、关,开、关……
接下来我们完全可以把这样的装置陆续扩展,复制、再复制……把这些东西一拼起来,就成了一种全加器。全加器做得越来越多,慢慢就实现了计算机里面能够计算更高位数的计算路径。
这和巴贝奇在几百年前做的事是一样的,做出越来越好的精美部件,把这些部件按照一定的逻辑关系拼到一起,于是能算的位数越来越多,能算的精度越来越多。
区别在于,他当年选的机械系统不是一好种的计算系统,它的均匀性、一致性、机械运转的速度、寿命都远不如现在的电子或者电器的部件,所以机械系统过时了,它不可能超过电的计算机。
关于电的计算机,原理也非常简单,就是把开关越做越好,把越来越多的开关拼到一起。因为越来越复杂的开关网络才能表达越来越复杂的逻辑关系,才能展现出越来越复杂的计算。我们现在所说的10纳米、7纳米、5纳米的晶体管,一个CPU上的晶体管的数量越来越多,计算能力就越强。
在半导体之前,我们能找到的最好的东西就是继电器开关,它是一种机电开关。电学系统比机械系统要高级,继电器是人类第一次用电流掌握电,但不是用电直接掌握电的,中间有一个瓶颈是先用电往掌握机械系统,机械系统再来掌握电的系统。
计算是一个物理系统状态的演化,物理系统的性质决定了它的计算能力。最早人们是用简单机械到复杂系统,但机械系统它的计算能力也很快就到头了。接下来我们进进到了机电时代,再后来进进半导体晶体管集成电路时代。
3. 半导体晶体管集成电路时代
下一步就进进到了大家都耳熟能详的历史时段了,半导体晶体管加集成电路时代。1946年第一个计算机ENIAC,标志着人类进进了这一时期。
人类熟悉半导体,其中量子力学也功不可没,假如没有量子力学,人们无法把握半导体中的物理法则, 所以半导体技术是量子力学的硕果。
今天最先进的计算机已经达到了每秒钟12.54亿次的运算量,也就是开关每秒钟能开关这么多次。这种爆发式的发展是怎么来的?就是因为找对了素材,找对了开关。
毫不夸饰地说,人类历史上迄今为止没有比半导体晶体管集成电路更好的物理体系了。每两年集成度翻一番,功耗降倍,以这种方式继续了几十年,这在任何人类其他的物理体系当中都没有出现。
这种素材为什么这么好?
以前的人类做不到完全用电掌握电,只能做到电掌握机械,机械掌握电,因为当时只有导体和绝缘体两种东西。半导体这种东西一出现,就知道可以辞别以前的笨方法,可以用电来掌握电了。
什么喊半导体?它导电性不如导体,但比绝缘体好,可以掌握它的导电或者不导电。我们做的晶体管有一个绝缘层,上边有个电极喊栅极,这个电极像是一个魔术,我们在半导体上只要加一个很小的电压后,它就会把半导体里其他导电的,比如说电子,全都吸引过来,在那里形成了一座桥,形成了这座桥之后,里面的电子就会在高压、低压的驱动下过来。当一边的电一停,不再导电了,另一边的电子就散开了。
半导体晶体管最大的优势是其中没有机械的部件,其中电流的移动不是宏看的机械系统在移动,而是微看的粒子在移动,两者速度相差极大。
这种新的开关功耗低,寿命非常高,速度快得多,它是利用电场来掌握微看粒子,进而掌握电流的通断。一切也都从那个时候发生了翻天覆地的转变,人类真正走进到了电子时代。
算力突飞猛进,
人类建立起全新的世界
1.集成电路
1947年,贝尔实验室利用半导体素材制造出第一支晶体管。我们利用一个个的晶体管开关,一比一地替换之前的继电器开关,就能够实现更好的计算机。
但问题这时候也来了,我们除了需要更好的开关,还需要把越来越多的开关连接到一起。这需要非常复杂的连线,由于单个的器件越做越小,给连线带来的困难越来越大。这个也限制了计算机的规模,那么接下来应该怎么办?答案是,集成。
接下来,人们不再做分立式的计算机,而是要做集成电路,把所有的开关,所有的导线,都用相同的半导体素材做到一起。Jack Kilby就是由于发明了世界上第一款集成电路,拿到了诺贝尔奖。
后来Robert Noyce发明了一种集成电路,不再像Jack Kilby那样用半导体做出不同的器件再焊到一起,他使用的方法跟今天做集成电路的方法一模一样,摘用平面化的工艺,用光刻、刻蚀等技术,使得晶体管在底层,上层有绝缘层,再用导线把它们连接起。
2.摩尔定律登纳德定律
接下来,这几十年半导体集成电路发展的方向,其一是怎样能够把开关越做越好,10纳米、7纳米、5纳米,每两年尺寸就变小一倍,集成度提升一倍,功耗降低一倍,速度提高一倍,这就喊做摩尔定律。
摩尔定律之于集成电路,就相当于开普勒定律之于行星的运行。开普勒定律是一个描述性质,它描述了星星是怎么运行的,描述了不同的星星轨道之间的一些几何关系。但为什么它就这么运行?它回答不了,需要更底层的牛顿定律来阐明。
在这里也是一样,摩尔定律是戈登·摩尔总结提炼出的一个法则,他看到了集成电路10年的发展趋势。后来,IBM的工程师登纳德提出来了一种具体的可操作的方案,让器件和系统能够按照摩尔定律发展,其中最要害的就是等比例缩小。
接下来的几十年,人们就是用登纳德的这个等比例缩小的策略实现了摩尔定律,让器件越做越小,越做越快。
接下来我们要把这些开关,越来越多地集成到一起,这就是计算技术的另一个演化。从最初分立式的晶体管,再到后面的平面化的阶段,把它们做成集成电路。接下来我称之为系统化,集成电路里面要有越来越丰盛的功能了。最终是智能化,也就是走到今天,人工智能芯片,集成度不断提高。
单个开关的性能不断提高,集成度不断提高,这就是半导体集成电路几十年的发展。
3.芯片带来的数字世界
从另一个角度来看集成电路和芯片技术,这是人类历史上第一次发明出来的一个世界,一个全新的数字世界。
数字世界和物质世界之间唯一的接口就是芯片,不管是信息需要处理,还是往传感探测,只有能够被这个接口所转换、所接受的信息,才能够进进到数字世界里,才能够运行,才能够高速地传播。
接下来不可避免的,就是马斯克现在做的事情,把精神世界直接跟物质世界相连。未来的我们物质世界可能用一个芯片就传输到数字世界里了。
总体而言,集成电路发展到了今天,一直在说7纳米、5纳米、3纳米,再往后怎么走?基于集成电路的芯片技术还会繁华发展下往,这是最杰出的华人微电子学家胡正明说的,我们行业当中也都比较认可这个说法。
然而另一方面,计算是一个物理系统状态的演化,物理系统的性质决定了它的计算能力。
我们整天盘算着怎么能让器件从7纳米变到5纳米,变到3纳米,或者说又想到了像芯粒(Chiplet)、SIP这些不同的技术来提升,又或者我们折腾了半天的软件,这个感觉是不是有点像机械计算时代的巴贝奇——为了制造更好的差分机往拿着锉刀往磨一个个齿轮,本质上也是往足够利用物理系统的能力,提升它其性能。
当然这条路现在还可以走,而且有很大空间可以陆续提升。
全新的世界看——量子力学成为显学
假如跳出来看,人类是不是有可能尝试着往找一找更好的其他的物理系统,是不是有比今天的电子系统提供更高速运算的新选项存在?对于今天来说,量子系统已经在物理上和数学上都已经被证实了具有超过电子系统的计算能力。
量子力学是熟悉世界建立起来的一种理论,也是一种新的世界看。下一个时代,是人类如何用量子力学往改造这个世界。
量子力学其实在电子计算时代是一个隐学,它躲在底下,是半导体物理学的基础,假如没有量子力学,我们就弄不懂半导体物理学。
到了量子计算机时代,量子力学就变成了一个显学,它就凸显出来了,我们就是要利用量子力学的效应来往进行计算,量子力学系统是能够带来更好的算力提升的,优于机械系统,优于电子系统。为什么?
1.量子叠加
量子力学中,量子是叠加态的。在经典物理里,事物都有确定的状态。一个物体在一个位置,那么这个物体就不会同时处于另一个点。但在量子力学里,物体可以同时处在两个不同的点。这种状态就喊作量子叠加态。
量子叠加态,当然不限于两种,我们就为了阐明,简单看作两种。这个两种不同的状态,可以是能量的低能和高能,也可以是位置在左还是在右,也可以是自旋向上和自旋向下。只是我们在看察它的时候,只能看测到某一个状态,具体是哪个,跟概率相关。
依据量子力学的基本方程薛定谔方程,力学量取值的概率分布如何,这个分布随时间如何转变,这些问题都可以通过求解波函数的方程得到解答。
比如,人们可以靠实验来激发,让原子百分百地处在0态,或者80%在0态,20%在1态,或者70%在1态,30%在0态,进而让粒子不停地在这里振荡,这现在都是在实验上能够掌握的。
量子叠加跟我们日常生活完全不一样,它同时处在这儿,同时处在那儿。正如薛定谔的猫,猫可以同时是死的和活的。
其实对于一个宏看物体来说也是量子态的,比如说我,一定程度上可以认为我是波函数分布,我有80%的概率站在这儿,有10%的概率在机场,5%的概率在北京,2%的概率在美国,3%的概率在越南,我跟电子的概率性分布是其实是一致的。
但是由于我是一个宏看的物体,非常非常短的时间内,我构成的波函数由叠加态立刻收缩到某一个粒子态,所以你在这个地方看到我。
这其实就是量子坍塌,我一下就坍缩到这个地方,所用的时间可能是在10的-40次方秒这个量级,远超人类的看测能力了,在日常我们看不到宏看物体的叠加态。
2.量子计算
目前我们建立起来了这样一个量子理论的模型。对于计算机而言,一个经典比特(字节)只有0和1两个状态,它只能处在这两个点中的一个。但是对于一个量子比特来说,它可以在所有的地方运动,来代表信息,因为它是一个叠加态。
所以量子比特所能代表的信息量远远地大于经典比特。
对比地球而言,你本来只能在这两个点上生活,但现在你能往周游世界了。而且很遗憾,我们人类想象不出来更高维度的空间,100个比特的运算,它是一个很复杂的计算空间。
量子计算机同样也是一个从初态到末态的物理系统的演化,只要我们能够往利用这个量子系统往编码我们的问题,能受控地进行演化运算,它就是一个好的计算机,得到最终计算结果。
对于比如说3个经典比特的话,它的计算结果是2的3次方,这是8个不同的状态,但是这3个比特在这一时刻只可能处在这8个状态之一,它不能同时存在。要么你就用1个CPU,用8个时间单元往把这8种状态都算一遍,要么就用8个CPU,分别算一次,这是经典的计算机。
但对于我们量子计算机只需要用1个量子处理器,用1份的时间,它就能够把这叠加到一起的8个状态一步都计算出来。
举一个例子,这很像是走迷宫,要不1个人走8次,也可以找8个人一起走,每人走不同的路,走一次就够了。
但这样来计算要么就是消耗时间资源,要么就是消耗用人资源。除非是孙悟空,有分身的超能力,一个人同时走8条路,1次时间走到了尽头。
那对于量子体系来说,它有一个超能力,量子叠加。1个比特,有2个状态的叠加,3个比特,是8种状态叠加,随着量子比特数目的增大,能代表的信息量是一个指数增加。
我信赖大家从这个数字的转变中能够体会为什么量子计算机一旦发明出来以后,能够处理那些运算难度随着问题规模指数增大的问题。
刚才我们讲了0和1的叠加,我每次看测只能看到0或者1,这个随机性是和它的概率有关。假如我往做完了这次运算,一测量测到了它,那这是不是正确的结果呢?我不知道,但可以往测1万次、测100万次,最后找到了概率最高的结果。
但这个其实就丧失了速度的优势。所以量子计算的另外一个要点,是要让正确答案的概率凸显出来,远远地超过所有错误概率的和,这就是靠算法来填补。
算法设计得好,你往测量它,只看到了正确的结果,这是一个完全的这个量子计算的过程。
3.第二次量子革命
现在限制我们制造一个实用的量子计算机的一个最大的问题,就是量子状态非常轻易就丢掉了。我们天然都是喜欢这种有方向性的、受控的能量,不喜欢无序的能量。
所以现在限制我们人类往高效地或者是实际使用量子计算机的一个困境,是量子计算的物理实现,我们还处在一个探索的阶段。
但不管怎么样,到今天我们已经走到了第二次量子革命的时代。
第一次量子革命是熟悉世界,我们感受到了量子,奠定了量子力学理论的问题。而现在量子力学要从隐躲在底层的状态中凸显出来。我们可以把量子理论使用在计算上,形成了量子计算,使用在测量上,形成量子精美测量,或者使用在通信上,形成量子通信等等这些技术。其实整个来看就是提出量子、理解量子、使用量子,然后是操控量子的一个过程。
我坚信人类第四次科技革命是量子革命,因为从物理和数学上都能够严厉地证实这件事情,但前提是我们能够找到一个好的物理系统,能够往很好地调控它,进行演化。
混沌同学眼中的物理学——肖虓分享
我其实本科是学物理的,后来毕业以后做投资工作,看上往我做的工作和物理没什么关系,但是我自己对物理还是非常非常有感情的。我想跟大家分享两点内容,第一是我为什么学物理,第二个是物理对我现在工作的一些启发和影响。
我学物理原因也挺简单的,就是上小学的时候,家里有一套非常完全的物理的实验设备,就是带有玩具性质的工具箱,里面有电池,导线,灯泡,把这些工具连在一起就亮了,把这个灯替换成一个电风扇,风扇也会转。虽然当时我也不懂是什么原理,但是觉得非常好玩。后来再复杂一些,还组装了收音机,通过调频真的听到了电台的声音,组装一个发报机,进行远距离传输。
当时我就觉得非常有意思,直到后来高中学了物理,发现这个世界是可以阐明的,可以计算的,以前的所有的这些东西,其实你只要算好,在实验室里可以得到正确且唯一且定量的结果,这件事其实是布满美感的,给我们这不确定的世界增加了很多掌控感,这是我当时为什么学物理。
后来我本科学在北大物理学院,系统学了物理理论。但是物理学着学着,其实你会发现学成了哲学。我们在混沌文理院,其实这个理是很重要的组成部分,那物理学到最后的哲学,其实给我们人生很多别的启发。
当然我现在做投资了,从几个大的探求方式跟大家分享一下我的启发。
首先是第一性原理,第一性原理简单说就是大道至简,因为物理学的所有的公式和理论,到最后最重要的理论都是非常简洁且漂亮的,比如相对论E=mc^2,比如薛定谔方程波函数,也是非常简洁的。
那什么喊大道至简?在工作里,其实第一就是找出一个最简单且最本质的原理,第二是坚持持之以恒地往实践它。
那这件事其实假如再往下拆的话,就是在我们的生活和工作里的表象,永远不要假设某一个结论是正确的,直到你能够不断地拆解,并从根源上分析验证它。
这是很重要的一个逻辑,用这个逻辑我们可以分析很多事情。比如说大家一直有争议的很多话题,国际油价、美联储加息等等,假如仔细地拆分的话,你可以会得到非常不一样的结论。
这里给大家推举一本书,桥水基金创始人瑞·达利欧的《原则》,这本书的探求其实就是他的第一性原理,他把自己的体会总结出几十条所遵循的最基础的原理。
那回到物理学,量子力学在我们上学的时候是非常非常的难的一门课。但是其实接触量子力学以后,我对这个世界其实重新产生了兴致和热情,原因其实也很简单,因为我们学物理都是从牛顿力学开始,牛顿力学的特征是它是机械决定论的,我给定所有的物体的初态、位置、速度,你可以精确计算以后任何时间的演化。
我当时上高中的时候就在想一个问题,假如说我给定了这个宇宙所有粒子的初态、位置、速度,是不是这个宇宙以后的演化方向是可以被计算和推测和决定的?假如这个事再往下分析真是很可怕的,那是不是我们每个人的一生都是已经被决定好的?人的自由意志是不是假的?我们为什么要努力?
直到碰到量子力学之后,我发现这件事被推翻了。
然而,量子力学这件事依旧是很难被接受的,爱因斯坦就讲了上帝不掷骰子。但是最后很多的实验结果,包括量子纠缠,它其实证实了上帝是掷骰子的。那其实量子力学又把我们推回到了最原始的探求方式,就是概率的探求方式,波函数的探求方式。
其实在我们的工作里,包括投资的分析里,没有什么是绝对的,这些事到最后都是概率,到最后都是一些波函数的坍缩。
我们在工作里要做到的就是尽可能多测量,测量就是多往看察、多往分析,而波函数的坍缩就意味着我们要理解这件事的概率,以及在不同的概率之下做好应对。
举一个简单的例子,大家看到今天有很多股票是被低估的,比如说美股、港股很多有2倍PE、5倍PE的优质的公司,那它们为什么是在这个价格,肯定是有原因的,那么你往假定它发生一些什么事情股价会起飞,一定能找出5个可能性,那这5个可能性发生的概率是多少呢?
其实你可以通过大量的分析往探求,以及它发生这件事之后,它的涨幅和它的跌幅,它的收益的平衡性,其实你也可以用概念的角度往诠释。
当然物理学还有很多很多有意思的东西,我觉得可能今天物理对我来说已经不再是这些公式了,而是一些探求的方法,也期看文理学院的同学们也能够从物理的角度产生新的启发。