0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

详谈机器学习及其三大分类

如意 ? 来源:大数据DT ? 作者:小川雄太郎 ? 2020-08-14 12:24 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

01 术语整理

本节概述机器学习及其三个分类(监督学习、非监督学习和强化学习)。首先,与机器学习相关的术语有人工智能(Artificial Intelligence,AI)、机器学习(Machine Learning,ML)、强化学习、深度学习等,这里对这些术语进行简单的整理。

AI意味着人工智能,其定义因研究人员而异。从广义上讲,它指“像人类一样具有智能的系统和配备这种系统的机器人”。实现AI的方法之一是机器学习。

机器学习可以简单地描述为“向系统提供数据(称为训练数据或学习数据)并通过数据自动确定系统的参数(变量值)”。相反,基于规则的系统是非机器学习系统的一个例子。在基于规则的系统中,由人类来清楚地定义分支条件的参数,例如实现代码中所存在的if语句等。

另一方面,机器学习自动根据训练数据确定代码中的参数,以使系统运行良好。之所以称为机器学习,正是因为系统能根据训练数据计算和确定系统运行所需的参数。

强化学习是机器学习中的一种。机器学习可分为三大类:监督学习、非监督学习和强化学习。我们稍后会讨论这三个分类,这里只需要认识到强化学习是机器学习的一部分即可。

接下来是深度学习。深度学习是实现机器学习的算法之一。机器学习的算法包括逻辑回归、支持向量机(Support Vector Machine,SVM)、决策树、随机森林和神经网络等。深度学习是神经网络中的一种。

最后是深度强化学习。深度强化学习是强化学习和深度学习的结合。

02 监督学习、非监督学习、强化学习

这里对三种机器学习(监督学习、非监督学习和强化学习)分别进行介绍。

首先说明监督学习。

例如,“对邮政编码中的手写数字进行分类”是一种监督学习。邮政编码分类系统将每个数字的手写图像分类为0~9中的一个。诸如0到9的数据的分类目标被称为标签或类。这种系统被称为监督学习,因为给事先提供的训练数据预先标记出了正确的标签。换句话说,带标签的训练数据成了系统的教师。

监督学习包括学习阶段和推理阶段。我们将以图为例来解释手写数字的分类(见图1.1)。

详谈机器学习及其三大分类

▲图1.1 使用监督学习区分手写数字的示例

在学习阶段,准备许多0到9的手写数字图像数据,这些数据作为训练数据。训练数据有一个标签(0到9中的某个数值),根据标签可以找到关于手写数字图像的正确答案信息,例如“此手写数字图像为1”。在学习阶段,当将手写数字图像输入系统时,调整(学习)系统的参数以尽量将输入图像分类为正确的标签。

在应用阶段,将无标签的未知手写数字图像数据输入系统,图像被分类为0到9中的某一个输出标签并给出结果。如果已经学习到正确的结果,当输入未知的手写数字图像时,系统将输出正确的数值标签。除了手写数字的分类之外,还可使用监督学习来对图像、声音和文本数据进行分类。

此外,除了上面例子中提到的分类任务,监督学习也用于回归等任务。

接下来,介绍非监督学习。用一个词表达非监督学习就是“分组”。它将大量数据中类似的数据分为一组(称为聚类)。例如,“根据购买数据对客户进行分组的系统”是非监督学习。根据购买历史记录的特征对客户进行分组,可以为每个组实施不同的销售策略。

我们使用图来说明购买数据分析的例子(见图1.2)。假设存储了每个客户过去一年的购买数量和每次平均消费金额的数据,并对此数据进行分析。根据这些数据,客户可以分为两组。A组(左上角)是以较低频次购买高价商品的组,B组(右下角)是多次重复但每次消费金额较低的组。

详谈机器学习及其三大分类

▲图1.2 使用非监督学习根据购买数据对客户分组的示例

使用非监督学习进行分组将有助于了解每个客户所属的组,并针对每个组实施最佳销售策略(尽管部分业务还需要更详细的分析)。除了本例中提到的分组(聚类)以外,非监督学习也用于降维和推荐系统。

最后,我们讨论强化学习。强化学习是一种主要用于“时变系统控制规则构建”和“对战博弈策略构建”的方法。例如,强化学习用于机器人的步行控制和围棋对战程序。

在我们熟悉的例子中,可能更容易想象一个孩子学会骑自行车的情形。当一个孩子学习骑自行车时,并没有人去教其诸如牛顿力学等力学法则以及如何骑车的详细方法,也不必通过观看视频来学习骑自行车。事实上,自己尝试骑自行车,在多次失败的过程中找到一种骑自行车的方法。

强化学习正如学骑自行车的例子,它是一种学习方法,它在不知道控制对象的物理定律的情况下重复试错,以学习到所希望的控制方法。

强化学习中没有带标签的数据作为训练数据,但这并不意味着根本没有监督信息。系统根据强化学习程序运行,在获得所需结果时给出称为奖励的信号。例如,在机器人的步行控制中,可以走的距离就是奖励。在围棋的比赛程序中,赢或输的结果就是奖励。失败时的奖励是负值,也称为惩罚。

如果想通过监督学习来学习机器人的步行控制,就需要尽可能多的“如果腿的关节处于这个角度并且速度是某值,那么就像这样转动电动机A”这样的模式,并预先给出其正确的做法。然而,当机器人行走时,对于每个时刻变化的状态,很难预先给出控制该电动机的正确做法。

另一方面,在强化学习中,将行走距离作为奖励提供给步行控制系统,并且重复试验多次。

这样一来,强化学习系统会根据重复试验和获得的奖励自行改变控制规则,以“如果之前的试验中所做改变使我可以走得更远,则这种改变是正确的”为基础。因此,可以在不教导机器人如何行走的情况下让机器人能渐渐行走更长的距离。

即使在像围棋这样的对战游戏的策略构建中,也无须在每个阶段将强者视为教师数据来进行教导,仅通过将成功或失败作为奖励来重复试验即可。这样做,强化学习系统会一点一点地改变游戏方式并变得更强。

学到的围棋或将棋系统比设计者本人更强大,这一点通过强化学习可以很容易实现。只听这个解释,强化学习就像魔术,但在实践中却存在着种种困难。

强化学习主要适用于“时变系统控制规则构建”和“对战博弈策略构建”,本书以前者“系统控制”为目标任务,通过编写相关程序来学习强化学习。

关于作者:小川雄太郎,东京大学博士,曾在东京大学从事脑机能测量及计算论的神经科学研究。现就职于株式会社电通国际信息服务技术开发部,从事机器学习相关技术的研究开发。

本文摘编自《边做边学深度强化学习:PyTorch程序设计实践》,经出版方授权发布。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1809

    文章

    49164

    浏览量

    250744
  • 机器学习
    +关注

    关注

    66

    文章

    8510

    浏览量

    134901
  • 强化学习
    +关注

    关注

    4

    文章

    269

    浏览量

    11642
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    工业相机:机器视觉的“核心之眼”,四大分类详解

    在智能制造和自动化生产中,工业相机作为机器视觉系统的核心组件,凭借其高精度、高稳定性和快速响应能力,被广泛应用于产品质量检测、尺寸测量、定位识别等领域。它通常与工业镜头、机器视觉光源及图像处理软件协同工作,共同构成高效的视觉检测系统。
    的头像 发表于 05-13 16:30 ?654次阅读
    工业相机:<b class='flag-5'>机器</b>视觉的“核心之眼”,四<b class='flag-5'>大分类</b>详解

    机器学习模型市场前景如何

    当今,随着算法的不断优化、数据量的爆炸式增长以及计算能力的飞速提升,机器学习模型的市场前景愈发广阔。下面,AI部落小编将探讨机器学习模型市场的未来发展。
    的头像 发表于 02-13 09:39 ?396次阅读

    xgboost在图像分类中的应用

    和易用性,在各种机器学习任务中得到了广泛应用,包括分类、回归和排序问题。在图像分类领域,尽管深度学习模型(如卷积神经网络CNN)占据主导地位
    的头像 发表于 01-19 11:16 ?1062次阅读

    传统机器学习方法和应用指导

    在上一篇文章中,我们介绍了机器学习的关键概念术语。在本文中,我们会介绍传统机器学习的基础知识和多种算法特征,供各位老师选择。 01 传统机器
    的头像 发表于 12-30 09:16 ?1256次阅读
    传统<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法和应用指导

    如何选择云原生机器学习平台

    当今,云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势,逐渐成为企业构建和部署机器学习应用的首选。然而,市场上的云原生机器
    的头像 发表于 12-25 11:54 ?487次阅读

    什么是机器学习?通过机器学习方法能解决哪些问题?

    来源:Master编程树“机器学习”最初的研究动机是让计算机系统具有人的学习能力以便实现人工智能。因为没有学习能力的系统很难被认为是具有智能的。目前被广泛采用的
    的头像 发表于 11-16 01:07 ?1010次阅读
    什么是<b class='flag-5'>机器</b><b class='flag-5'>学习</b>?通过<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法能解决哪些问题?

    NPU与机器学习算法的关系

    在人工智能领域,机器学习算法是实现智能系统的核心。随着数据量的激增和算法复杂度的提升,对计算资源的需求也在不断增长。NPU作为一种专门为深度学习机器
    的头像 发表于 11-15 09:19 ?1331次阅读

    【每天学点AI】KNN算法:简单有效的机器学习分类

    过程,其实就是一个简单的分类问题,而KNN(K-NearestNeighbors)算法正是模仿这种人类决策过程的机器学习算法。|什么是KNN?KNN(K-NearestNeighbo
    的头像 发表于 10-31 14:09 ?883次阅读
    【每天学点AI】KNN算法:简单有效的<b class='flag-5'>机器</b><b class='flag-5'>学习</b><b class='flag-5'>分类</b>器

    基于深度学习维点云分类方法

    近年来,点云表示已成为计算机视觉领域的研究热点之一,并广泛应用于自动驾驶、虚拟现实、机器人等许多领域。虽然深度学习技术在处理常规结构化的二维网格图像数据方面取得了巨大成功,但在处理不规则、非结构化的点云数据方面仍面临着巨大挑战。
    的头像 发表于 10-29 09:43 ?1630次阅读
    基于深度<b class='flag-5'>学习</b>的<b class='flag-5'>三</b>维点云<b class='flag-5'>分类</b>方法

    人工智能、机器学习和深度学习存在什么区别

    人工智能指的是在某种程度上显示出类似人类智能的设备。AI有很多技术,但其中一个很大的子集是机器学习——让算法从数据中学习
    发表于 10-24 17:22 ?3048次阅读
    人工智能、<b class='flag-5'>机器</b><b class='flag-5'>学习</b>和深度<b class='flag-5'>学习</b>存在什么区别

    相电机有哪些型号?该如何分类

    相电机,也称为相交流电机,是一种常见的工业电机类型,广泛应用于各种机械设备中。相电机的型号和分类可以根据多个标准进行,以下是一些常见的分类
    的头像 发表于 10-22 09:21 ?2348次阅读

    计算机存储器的分类及其区别

    计算机存储器是计算机系统中不可或缺的重要部分,用于存放程序和数据。随着科技的进步,存储器的种类越来越多,功能和性能也日益丰富。一般来说,计算机存储器可以按照不同的分类标准进行分类,以下是详细的分类
    的头像 发表于 09-05 10:40 ?4127次阅读

    【「时间序列与机器学习」阅读体验】+ 简单建议

    这本书以其系统性的框架和深入浅出的讲解,为读者绘制了一幅时间序列分析与机器学习融合应用的宏伟蓝图。作者不仅扎实地构建了时间序列分析的基础知识,更巧妙地展示了机器学习如何在这一领域发挥巨
    发表于 08-12 11:21

    【「时间序列与机器学习」阅读体验】全书概览与时间序列概述

    的应用也很广泛,用机器学习为时间分析带来新的可能性。人们往往可以通过过往的时间序列数据来预测未来,在各行各业中都有很好的应用与发展前景。 时间序列分类: 1.单维时间序列 单维时间序列指的是一组有顺序
    发表于 08-07 23:03

    求助,关于运算放大器分类的问题求解

    LT1013AM的失调电压和失调电压温漂系数都足以满足精密运放的标准,但为什么就划分到通用运放了呢? 运放的五大分类难道不是只依据相关参数的数据来划分的吗?
    发表于 08-07 07:10