近十几年时间里,机器学习快速崛起,已经成为大数据时代下的技术基石。机器学习根据已有数据进行学习策略的探索和潜在结构的发现,依据所得模型进行预测及分析。机器学习源于人工智能和统计学,其应用极其广泛。从数据挖掘到人脸识别,从自然语言处理到生物特征识别,从垃圾邮件分类到医学诊断,社会生活的各个方面都被机器学习技术所影响。
随着信息技术不断发展,信息化将各行业紧密联系起来,产业数据成爆炸式增长。这种增长不仅是数据量的增长,还包括数据种类、结构和产生速度上的增长。最近几年全球数据量的增长率接近24%。以Google为首,凭借数据服务为核心、机器学习技术为支撑的一大批IT公司占领数据挖掘与信息化的市场。他们掌握海量数据,使用机器学习技术挖掘潜在价值信息,提供数据服务,改变社会生活各个方面。数据的增长不仅带来丰厚的利润,同时也带来技术的挑战。不少传统机器学习算法已无法应对大数据时代海量数据的处理和分析,所以不得不寻找新的方法来解决问题。
最近不少研究机构及大型IT公司都将目光集中到了量子计算上,想通过量子计算的独特性质,解决传统算法的运算效率问题。
1 跳出 0 和 1 的局限
所谓经典数据和经典模型,都是相对于量子而言。现在流行的计算机被称为经典计算机,信息量的基本单位是比特,在二进制中取值不是 0 就是 1。而遵循量子力学规律打造的计算机被称为量子计算机,信息量的基本单位是量子比特,在取值前处于不确定状态,即叠加态。也就是说,量子比特可以同时处于 “0” 和 “1” 的状态。
有人做过一个比喻:经典比特是 “开关”,只有开和关两个状态(0 和 1),而量子比特是 “旋钮”,就像收音机上调频的旋钮那样,有无穷多个状态。经典计算机通过操纵经典比特进行运算,而量子计算机是操纵量子比特,本质上就是去旋转它们。量子叠加这种特性决定了在同样比特数量的情况下,量子比特能存储比经典比特更多的信息。比如,把 1 个“0”和 1 个“1”放在一起,会有 4 个组合状态:00、01、10、11。2 个经典比特只能是其中 1 种状态,而 2 个量子比特可以同时包含这 4 个状态,并且每个状态都有一定的权重。只有当人们去读取量子比特时,同时包含 4 个状态的量子比特才会变化为其中一个状态。正是由于这种叠加的特性,量子计算机具备了强大的并行计算能力。
“薛定谔的猫” 就是解释量子叠加的一个思想实验
除了叠加,量子还有个特性是“纠缠”。纠缠性可以让多个量子比特共享状态,创造出 “超级叠加” 的量子并行计算,计算能力随比特数增加呈指数级增长。
理论上,拥有 300 个量子比特的量子计算机,瞬间所能执行的并行计算次数比宇宙中的原子总数还多。对于量子计算的并行性,微软 CEO Satya Nadella 在 2017 年微软 Ignite 大会上,用找迷宫出口来比喻解释:
为了找到迷宫的出口,经典计算机先开启一条搜索路径,遇到障碍物后会沿原路返回。之后再次探寻新路,直到遇障返回或找到了正确出口。虽然最终能找到一个结果,但这种方法相当耗时。
对比之下,量子计算机解锁了神奇的并行性。它们同时探寻玉米迷宫中的每一条路。因此,量子计算机可能指数级减少解决问题的步骤。
中国科学院院士潘建伟也曾说:
如果传统计算机的速度是“自行车”,那么量子计算机的速度就是“飞机”。
这种远远超过经典计算机的计算性能,正是机器学习所需要的。众所周知,当下这次以机器学习方法为代表的人工智能浪潮,是算力、算法和数据相结合的结果。如果机器学习任务无法快速计算完成,那么经济价值就无法得到体现。当前,企业和学界普遍采用 GPU 和 FPGA 等适合并行计算的通用芯片来实现加速,但这些方法依然是基于经典计算机。速度远远超越经典计算机的量子计算机,自然而然和机器学习联系起来。
2 量子机器学习算法简介
(1)3类量子机器学习算法
目前已有的量子机器学习主要可以分为以下3类,分别是:
1) 第一类量子机器学习。该类算法将机器学习中复杂度较高的部分替换为量子版本进行计算,从而提高其整体运算效率。该类量子机器学习算法整体框架沿用原有机器学习的框架。其主体思想不变,不同点在于将复杂计算转换成量子版本运行在量子计算机上,从而得到提速。
2) 第二类量子机器学习。该类算法的特点是寻找量子系统的力学效应、动力学特性与传统机器学习处理步骤的相似点,将物理过程应用于传统机器学习问题的求解,产生出新的机器学习算法。该类算法与第一类不同,其全部过程均可在经典计算机上进行实现。在其他领域也有不少类似思路的研究,如退火算法、蚁群算法等。
3) 第三类量子机器学习。该类算法主要借助传统机器学习强大的数据分析能力,帮助物理学家更好的研究量子系统,更加有效的分析量子效应,作为物理学家对量子世界研究的有效辅助。该类算法的提出将促进我们对微观世界进一步的了解,并解释量子世界的奇特现象。
由于量子机器学习的大多数研究集中于第一类算法,第二类算法的研究还较少,第三类量子机器学习算法主要应用于物理领域 。
(2)主要的量子机器学习算法汇总
主要的量子机器学习算法
3 量子机器学习的瓶颈及未来
(1)瓶颈
虽然量子技术领域取得了很大进展,但量子比特数量有限的通用误差纠正量子计算机还远未实现。
目前还不清楚量子计算机需要多少逻辑量子才能超越经典计算机。这为QML的实现增加了难度。
量子机器学习实现的难度现在看来是非常大的。
状态准备问题,任意状态准备在离散门集合的量子比特数上是指数级的,为所有算法的性能提供了界限,并对算法初始化时的状态有限制
(2)未来发展方向
现阶段量子机器学习属于蓬勃发展的时代,而量子计算是未来发展的主要方向之一,是一个可以帮助我们提升计算力的技术,成为对这些海量数据集进行有效和有意义的分析的下一步。美国麻省理工学院(MIT)塞斯·罗伊德(Seth Lloyd)教授提出理论预言,利用量子系统在处理高维向量上的并行计算优势,可以为机器学习带来指数量级的加速,将能远远超越现有经典计算机的运算速度。
参考文献及链接:
[1]张仕斌,黄曦,昌燕,闫丽丽,程稳. 大数据环境下量子机器学习的研究进展及发展趋势[J]. 电子科技大学学报,2021,50(06):802-819.
[2]彭志勇,龙虎. 基于大数据背景的量子机器学习算法研究概论[J]. 科技经济市场,2021,(01):3-4.
[3]黄一鸣,雷航,李晓瑜. 量子机器学习算法综述[J]. 计算机学报,2018,41(01):145-163.
[4]https://www.jiqizhixin.com/graph/technologies/d16d1003-f755-4db9-91ed-e3132f153615