日立的「CMOS 退火」技术是怎样的一种技术?利用该技术的半导体计算机是否能够替代量子计算机? 背景知识: 日立制作所表示开发出了堪与“量子计算机媲美”的非冯·诺依曼型计算机用处理器。技术详情已在于美国旧金山举办的国际半导体电路技术学会“2015 IEEE International Solid-State Circuits Conference(ISSCC)”(2 月 22 日~26 日)上发布(演讲序号:24.3)。 其工作原理与加拿大 D-Wave Systems 公司推出的商用量子计算机相似。不过,D-Wave 的系统使用只能在极低温下工作、而且非常容易受噪声干扰的超导元件,而日立的系统可以利用能在室温下工作的成熟的半导体技术,因此容易实现系统的大规模化。日立已经试制出规模为 D-Wave 公司预定 2015 年投产的量子计算机约 10 倍的系统,并进行了工作演示。 知乎用户,机器学习&量子算法//好奇心是第一生产力 终于有时间写这个答案了。和我导师合作的京都大学科学家出席了这个会议,所以我联系他专门讨论了一下 CMOS 退火。 先给结论,CMOS 退火是一项非常了不起的研究。但 CMOS 退火不是量子过程,也不能替代量子计算机(没有量子过程就不可能有量子计算功能)。但 CMOS 退火对解决部分组合优化问题很管用,这原本是 Dwave 擅长的领域。 最初看到这个新闻还是在知乎上被邀请。知乎用户群对这些技术进步反应的确相当快。 我初读新闻的时候也吓了一大跳,还以为一夜之间就量子计算革命就到来了。我以为我马上就能投入业界成为第一代量子算法兼机器学习工程师了。后来发现我还是想多了…… 简单对比一下 CMOS 退火和 Dwave 计算机的优劣。 CMOS 退火有 2 万个比特;最新的 Dwave 只有 1024 个比特。 CMOS 退火室温都能运行,稳定性极好;Dwave 要屏蔽外界电磁场干扰,在 20mK(零下 273.13 摄氏度)温度下才能工作。 CMOS 退火用成熟稳定的半导体技术,第一代就做到 60nm 工业级水平;Dwave 还是只能用昂贵的超导环,需要冷却到 20mk 才能正常工作,整个系统一千五美金 1 台,还老出毛病。 CMOS 退火随机性来自 SRAM 和芯片外部环境;Dwave 随机性来自 quantum fluctuation。 CMOS 退火这种非冯·诺依曼型计算机用处理器在解决组合优化问题时,能耗比经典计算机低很多,但计算时间和经典计算机是一个量级的。Dwave 在时间和能耗上表现都好很多。 伊辛模型的哈密顿量长这样。 这是 Dwave128 比特芯片的示意图。每一个黑点就是一个超导环,电流流向决定自旋取值 +1/-1,连接 i 比特和 j 比特的黑线表示一个 Jij。 CMOS 退火的芯片和 Dwave 一样都用了伊辛模型(Ising Model),但是 CMOS 退火里比特间的耦合作用 J 只能取值 +1/0/-1 三个值,而且非常稀疏,几乎是只有相邻比特有稳定的耦合作用。所以,CMOS 退火只能解决部分简单的组合优化问题,对于机器学习和人工智能而言,CMOS 退火计算没有太多实用价值的。 Dwave 芯片的耦合要好的多,而且每一代性能都在提升,能应用的机器学习场景也越来越多。日本已经决定在东京建造世界上最强大的 Dwave 系统量子计算机。靠比 Dwave 公司更强大的人力财力和精密加工能力建造三维构造的 Dwave 芯片,比特耦合能力和量子比特数都会远超 Dwave 公司的产品。 现在的量子算法研究情况有点像很多年以前,写好了程序要到去机房预约计算机才能运行。以后的环境应该会越来越好了,越来越多的科研人员有机会亲自使用量子计算机。 前面解释了 CMOS 退火的优劣,以及为什么不能替代量子计算。 日立的“CMOS 退火”技术是怎样的一种技术? 这个问题上面的答案解释的很详细了。我在下文只做一下简单的补充。 1) 量子退火(QA,Quantum Annealing):不同于经典模拟退火算法利用热波动来搜寻问题的最优解,量子退火算法利用量子波动产生的量子隧穿效应来使算法摆脱局部最优,而实现全局优化。量子退火就逆天了,清醒的销售员在 C 城市时学会了量子隧穿,瞬移到了 B 城市去看看那边可不可能是最优解,是的话就回去走 B 路线,不是的话继续从 C 出发。 @薛矽 这个比喻有两个问题,有点太勉强了。 i)我们搜索的是路径,不是城市。 ii)量子退火是:一开始我们的销售员处于 n(~2^N)个态的叠加,是同时选择了所有路径叠加态。你可以设想这个销售员有 2^N 个分身。每一个分身都处在一个路径上,对应一个量子态。然后,系统开始幸运,高能量的分身一点点转移到低能量态(每个分身的权重系数的演化是连续的)。到最后,所有的分身都汇聚到基态上,找到了最优化的解。 我们只有波函数,没有具体的点,所以不是一个销售员在一个路上。是无数个销售员分布在每一条路上。 所谓的量子隧穿效应实际上说的是,销售员的某个态可以跃过相邻的高能量态到基态。 计算时间是:t~h/ΔE,h 是普朗克常数。 2)为什么量子计算和机器学习关联紧密? 量子理论(Quantum Theory)是概率理论。是一中与自然界量子现象契合的概率模型。 这个概率模型和统计学习理论也是契合的。 量子理论这个重要的物理学理论为统计学习理论和自然界的量子物理现象打起了桥梁。 在这个框架下,两个看起来毫不相干的领域有着深刻的联系,可以被统一描述。 现在我们能制造一台名叫 Dwave 的量子系统,这就完成了机器学习理论到物理世界的映射。 这是没有量子过程的 CMOS 退火不可能办到的。 基于量子逻辑门的量子计算机与大家熟知的计算机更为接近。 无非是经典计算机有与非门这种不可逆的逻辑门,而量子逻辑门全部都是可逆的(所以不能完成与非操作)。可逆计算带来的一大优势是接近 0 的能耗。量子计算机可以轻松突破散热和能耗给经典计算机带来的限制。 常见的量子逻辑门有:Toffoli Gate/Fredkin Gate/CNOT/... 由于量子态都是叠加态(逻辑 0 和逻辑 1 的任意叠加)。当我们有 N 个量子比特时,就能以经典计算机 2^N 倍的速度作逻辑门运算。Quantum Parallelism 就是量子计算强大能力的主要来源。 这更是 CMOS 退火办不到的。 最后,Dwave 绝热量子计算和量子逻辑门的标准量子计算是等价的。这个结论是我们最近几年才知道的。 【Aharonov D, Van Dam W, Kempe J, et al. Adiabatic quantum computation is equivalent to standard quantum computation[J]. SIAM review, 2008, 50(4): 755-787.】 附送一个量子退火理论的讲座:https://www.youtube.com/watch?v=OQ91L96YWCk&feature=youtu.be 演讲者是西森教授,量子退火算法的提出者。 查看知乎原文