0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌向神经网络手写数字识别发起挑战,竟用量子计算识别

如意 ? 来源:机器之心 ? 作者:机器之心编辑部 ? 2020-08-17 17:17 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

神经网络做 MNIST 手写数字识别是机器学习小白用来练手的入门项目,业内最佳准确率已经达到了 99.84%。但最近,谷歌向这个「古老」的数据集发起了一项新的挑战:用量子计算来进行识别,看看准确率能达到多少。

MNIST 对于机器学习研究者来说再熟悉不过了,它是一个由 Yann Lecun 等人创建的手写数字图像数据集,包含训练集和测试集,训练集包含 60000 个样本,测试集包含 10000 个样本(在 2019 年又增加了 50000 个测试集样本)。

谷歌向神经网络手写数字识别发起挑战,竟用量子计算识别

在机器学习研究中,MNIST 手写数字图像数据集已经作为基准使用了二十余年,它可以说是所有机器学习研究者的入门必备。对于新兴方法的研究来说,从 MNIST 开始也是最合理的选择,2017 年 Geoffrey Hinton 提出的胶囊网络(Capsule Networks)也是这样做的。

目前,大部分深度学习模型在 MNIST 上的分类精度都超过了 95%。有时为了更直观地观察算法之间的差异,我们会使用图像内容更加复杂的 Fashion-MNIST 数据集。

在准确率已经如此之高的情况下,用神经网络向此数据集发起挑战已经没有多大意义。于是,谷歌索性换了一个思路:用量子计算技术来挑战一下,看看分类准确率能达到多少。

实验结果表明,用量子计算技术可以在 MNIST 数据集上至少实现 41.27% 的分类准确率,而之前的经典方法只能达到 21.27%。

为什么要这么做?

在现代科技中,量子力学和机器学习都发挥着重要作用,量子计算的 AI 应用这一新兴领域很有可能帮助许多学科实现重大突破。然而,目前大多数机器学习从业者对量子力学还没有透彻的了解,多数量子物理学家对机器学习的理解也非常有限。因此,找到一些二者都能理解的问题非常重要,这些问题既要包含简单且被广泛理解的机器学习思想,也要包含类似的量子力学思想。

基于以上考量,谷歌的研究者提出用简单的量子力学知识解决一种简单的机器学习问题——MNIST 手写数字分类。这有点类似于谷歌的 TensorFlow Playground。TensorFlow Playground 本质上就是一种教学辅助,目的是向大众阐明深度学习的关键概念。

研究细节

具体来说,研究者想要探究的是:在一个普通的图像分类问题中,如果你必须在通过一个 filter(可以显示来自测试集的示例图像)的第一个光量子(光子)之后做出决定,最高准确率能达到多少?在 MNIST 手写数字数据集上(28×28 像素),最佳经典方法是检测落在其中某个像素上的光子,然后使用在训练集上观察到的 per-pixel 概率(即光强度)分布来选择最有可能的数字类别。这需要将每个示例图像的亮度缩放到一个单位和(unit sum),以获得一个概率分布。在 MNIST 数据集上,上述经典方法可以实现 21.27% 的分类准确率,大大高于随机结果(10%)。每个像素最有可能的数字类别如下图 2(b)所示。

谷歌向神经网络手写数字识别发起挑战,竟用量子计算识别

如果可以将学习到的转换应用到图像和检测器之间的光子的量子态,我们就能利用量子力学实现更高的准确率。分束器和移相器等无源线性光学器件(passive linear optical element)可以用来解决这一问题,它们可以产生一种全息图式的干涉图样。接下来,根据第一个光子落在哪一个区域来进行最大似然估计。这说明了一种量子原理:单个量子的概率振幅与自身发生干涉。此处没有必要同时用许多光子照亮一个场景来产生干涉。

从概念上讲,利用干涉来增强量子实验产生所需结果的可能性是所有量子计算的基本思想。这个问题与现代量子计算之间的主要区别在于,后者试图通过控制多个「纠缠」成分的量子态来执行计算,这些「纠缠」成分通常是耦合了两种状态的量子系统(被称作「量子比特」),通过由整个量子系统量子态的一部分所控制的「量子门」来实现。

因此,构建有多个量子比特的量子计算机需要精细地控制量子比特之间的相互作用。这通常需要将温度降至 0.1 开尔文(-273.05℃)来消除热噪声。

但是,在本文研究的这个问题中,量子态之间的转换可以在室温下使用常规光学器件来完成:绿色光子的能量为 2.5 eV(电子伏特),远高于典型的室温热辐射能量 kT ‘ 25 meV。但制造一种允许多个光子像在多比特量子计算机中一样交互的设备就非常具有挑战性了。

尽管如此,Knill、Laflamme 和 Milburn 等人在 2001 年设计了一种协议,使其在理论上可行。他们通过巧妙地利用辅助光子量子比特(ancillary photon qubit)、玻色统计和测量过程避免了使用保留相干性的非线性光学器件(可能无法通过实验实现)。在所有此类应用中,基本思想都是采用相干多光子量子态进行多个量子比特的计算。

在这个问题中,研究者只用了一个光子,唯一要处理的相关信息被编码在其波函数的空间部分(即偏振无关)。因此,当前的工作类似于由 Cerf 等人在 1998 年提出的「量子逻辑的光学模拟」,其中一个 N 量子比特的系统由一个光子的 2^N 个空间模式表示。目前相关的研究有用于实现各种算法的类似「量子计算的光学模拟」,包括(小)整数分解等,但仍未与机器学习关联起来。

本研究可以被归为量子不可扩展(non-scalable)架构上的机器学习方法范畴。或者,我们也可以将其视为一项最新研究 (Khoram et al. [2019]。) 的量子模拟。

研究者表示:「从概念上说,利用干涉来提高量子实验产生所需结果的可能性是量子计算领域的基本思想。」除了为量子和机器学习专家提供一个容易理解、上手的问题之外,这对于在更易访问的环境中进行测量过程的物理学教学(通常被称为波函数的坍缩)也有一定意义。

遇事不决,量子力学

研究者说,这项工作旨在展示简单的量子力学技术如何能够为解决 AI 问题提供新的思路。

在 MNIST 上,最经典的计算可以实现的是检测落在图像像素之一上的光子,并根据光的强度分布猜测数字,光的强度的分布是通过将每个图像的亮度重新缩放为单位和而获得的。

该研究的量子力学方法采用分束器、移相器和其他光学元件来创建类似全息图的推断图。光子所降落的推断模式区域可作为信息提供给图像分类,从而说明了不必同时用多个光子照射一个场景来产生干涉。

有人预测,量子计算将大大推动人工智能和机器学习领域的发展。去年 3 月,IBM、麻省理工学院和牛津大学在《自然》杂志发表了一篇文章,称随着量子计算机变得越来越强大,它们将能够执行特征映射,也就是将数据分解为非冗余特征。如此一来,研究者将可以开发出更高效的 AI,比如去识别传统计算机无法识别的数据模式。

在那篇《自然》杂志的文章中,作者们这样写道:「机器学习和量子计算是两种技术,每一种技术都有潜力改变彼此之前无法解决的难题。量子算法所提供的计算加速的核心要素是通过可控的纠缠和干涉来利用指数级的量子态空间。」

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6233

    浏览量

    108592
  • 神经网络
    +关注

    关注

    42

    文章

    4814

    浏览量

    104507
  • 量子计算
    +关注

    关注

    4

    文章

    1155

    浏览量

    35864
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    基于LockAI视觉识别模块:手写数字识别

    : 卷积神经网络(CNN):最流行的方法之一,能够自动从图像中学习特征。适用于复杂背景和不同书写风格的手写数字识别。 支持向量机(SVM):一种传统的机器学习方法,通过提取图像的特征(
    发表于 06-30 16:45

    基于LockAI视觉识别模块:手写数字识别

    手写数字识别是一种经典的模式识别和图像处理问题,旨在通过计算机自动识别用户
    的头像 发表于 06-30 15:44 ?524次阅读
    基于LockAI视觉<b class='flag-5'>识别</b>模块:<b class='flag-5'>手写</b><b class='flag-5'>数字</b><b class='flag-5'>识别</b>

    量子计算在海绵压缩测试数据优化中的创新探索

    试验机“超算驱动” 的智能终端演进。? 一、量子算法在数据建模中的应用突破? 量子神经网络(QNN)的性能提升? 构建混合量子 - 经典
    的头像 发表于 04-22 13:05 ?415次阅读
    <b class='flag-5'>量子</b><b class='flag-5'>计算</b>在海绵压缩测试数据优化中的创新探索

    BP神经网络与卷积神经网络的比较

    多层。 每一层都由若干个神经元构成,神经元之间通过权重连接。信号在神经网络中是前传播的,而误差是反向传播的。 卷积神经网络(CNN) :
    的头像 发表于 02-12 15:53 ?829次阅读

    什么是BP神经网络的反向传播算法

    神经网络(即反向传播神经网络)的核心,它建立在梯度下降法的基础上,是一种适合于多层神经元网络的学习算法。该算法通过计算每层网络的误差,并将这
    的头像 发表于 02-12 15:18 ?901次阅读

    BP神经网络在图像识别中的应用

    BP神经网络在图像识别中发挥着重要作用,其多层结构使得网络能够学习到复杂的特征表达,适用于处理非线性问题。以下是对BP神经网络在图像识别中应
    的头像 发表于 02-12 15:12 ?796次阅读

    【正点原子STM32H7R3开发套件试用体验】手写数字、字母的识别

    【正点原子STM32H7R3开发套件试用体验】手写数字、字母的识别 本文介绍了利用正点原子提供的手写识别库,在STM32H7R3开发板上实现
    发表于 01-01 17:37

    开源项目 ! 利用边缘计算打造便携式视觉识别系统

    。 VIM3 神经网络处理器(NPU)使用方法 VIM4 神经网络处理器(NPU)使用方法 Edge2 神经网络处理器(NPU)使用方法 总结 恭喜!你刚刚构建了一个便携式的、基于边缘计算
    发表于 12-16 16:31

    AI模型部署边缘设备的奇妙之旅:如何实现手写数字识别

    (FNN):最基础的一种形式,其中数据仅沿单一方流动,从输入层经过一系列隐藏层到达输出层,不存在反馈路径。 卷积神经网络(CNN):特别擅长于图像识别任务,因其特殊的滤波器设计能够有效地捕捉图像
    发表于 12-06 17:20

    卷积神经网络与传统神经网络的比较

    在深度学习领域,神经网络模型被广泛应用于各种任务,如图像识别、自然语言处理和游戏智能等。其中,卷积神经网络(CNNs)和传统神经网络是两种常见的模型。 1. 结构差异 1.1 传统
    的头像 发表于 11-15 14:53 ?2048次阅读

    深度学习中的卷积神经网络模型

    深度学习近年来在多个领域取得了显著的进展,尤其是在图像识别、语音识别和自然语言处理等方面。卷积神经网络作为深度学习的一个分支,因其在图像处理任务中的卓越性能而受到广泛关注。 卷积神经网络
    的头像 发表于 11-15 14:52 ?940次阅读

    LSTM神经网络在语音识别中的应用实例

    语音识别技术是人工智能领域的一个重要分支,它使计算机能够理解和处理人类语言。随着深度学习技术的发展,特别是长短期记忆(LSTM)神经网络的引入,语音识别的准确性和效率得到了显著提升。
    的头像 发表于 11-13 10:03 ?1992次阅读

    关于卷积神经网络,这些概念你厘清了么~

    取特征的强大工具,例如识别音频信号或图像信号中的复杂模式就是其应用之一。 1、什么是卷积神经网络神经网络是一种由神经元组成的系统或结构,它使AI能够更好地理解数据,进而解决复杂问
    发表于 10-24 13:56

    【飞凌嵌入式OK3576-C开发板体验】RKNN神经网络-车牌识别

    LPRNet基于深层神经网络设计,通过轻量级的卷积神经网络实现车牌识别。它采用端到端的训练方式,不依赖字符分割,能够直接处理整张车牌图像,并输出最终的字符序列。这种设计提高了识别的实时
    发表于 10-10 16:40

    利用AI构建实用量子计算应用

    在实践中构建实用量子计算机的难度极高,这需要大幅提高量子计算机的规模、保真度、速度、可靠性和可编程性,才能充分发挥其优势。另外,还需要功能强大的工具以解决许多阻碍实现实
    的头像 发表于 09-09 10:24 ?927次阅读
    利用AI构建实<b class='flag-5'>用量子</b><b class='flag-5'>计算</b>应用