0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌研究人员发现了机器学习模型常见失败的一个主要原因

ss ? 来源:OFweek物联网 ? 作者:OFweek物联网 ? 2020-11-30 17:44 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

机器学习模型在实验室中调整和调整到近乎完美的性能,但在现实环境中往往会失败,这已经不是什么秘密了。这通常被归结为人工智能接受训练和测试的数据与它在现实中遇到的数据不匹配,这个问题被称为数据转移。例如,经过训练,能够在高质量的医学图像中发现疾病迹象的人工智能,将难以识别繁忙的诊所中廉价相机捕捉到的模糊或裁剪的图像。

现在,谷歌的7个不同团队的40名研究人员发现了机器学习模型常见失败的另一个主要原因。这被称为“不规范”,它可能是一个比数据转移更大的问题。领导这项研究的Alex D‘amour说:“我们对机器学习模型的要求比我们目前的方法所能保证的要多。”

D’amour最初的调查如同滚雪球般滚来滚去,数十名谷歌研究人员最终着眼于一系列不同的人工智能应用,从图像识别到自然语言处理(NLP)再到疾病预测。他们发现,不规范的要求是所有这些项目表现不佳的原因。问题在于机器学习模型的训练和测试方式,没有简单的解决办法。

粗略地说,建立一个机器学习模型需要在大量的例子上训练它,然后在一堆它还没有见过的类似的例子上测试它。当模型通过测试时,就完成了。

谷歌的研究人员指出,这个标准太低了。训练过程可以产生许多不同的全部通过测试的模型,但是这些模型会有一些小差异,取决于诸如在培训开始之前随机值的神经网络中的节点、训练数据、被选中或者代表的方式、培训运行的数量等等。如果这些微小的、随机的差异不影响模型在测试中的表现,它们通常会被忽视。但事实证明,在现实世界中,它们会导致巨大的表现差异。

换句话说,如今用来构建大多数机器学习模型的过程无法区分哪些模型在现实世界中可行,哪些模型不可行。

为了解决这一问题,一种选择是在培训和测试过程中设计一个额外的阶段,在这个阶段中可以同时生产多个模型,而不是只生产一个。然后,这些相互竞争的模型可以在具体的现实任务中再次进行测试,以选择最适合这项工作的模型。

那需要做很多工作。苏黎世联邦理工学院的机器学习研究员Yannic Kilcher说,但是对于像谷歌这样建造和部署大型模型的公司来说,这样做是值得的。谷歌可以提供50种不同版本的NLP模型,应用程序开发人员可以选择最适合他们的一个,他说。

D ‘Amour和他的同事们还没有解决这个问题,但正在探索改进培训过程的方法。他表示:“我们需要更好地明确我们对模型的要求。”“因为最终的结果往往是,我们只是在模型在实际应用中失败之后才发现这些要求。”

如果人工智能想要在实验室之外产生和在实验室内部一样大的影响,那么进行修复是至关重要的。在谷歌从事医疗人工智能领域工作的合著者凯瑟琳海勒(Katherine Heller)表示,当人工智能在现实世界中表现不佳时,人们就不太愿意使用它了:“在杀手级应用方面,我们已经失去了很多信任,这是我们希望重新获得的重要信任。”

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6233

    浏览量

    108562
  • AI
    AI
    +关注

    关注

    88

    文章

    35758

    浏览量

    282453
  • 机器学习
    +关注

    关注

    66

    文章

    8513

    浏览量

    135104
  • nlp
    nlp
    +关注

    关注

    1

    文章

    490

    浏览量

    22698
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.

    Neuton 是家边缘AI 公司,致力于让机器 学习模型更易于使用。它创建的模型比竞争对手的框架小10 倍,速度也快10 倍,甚至可以在最
    发表于 07-31 11:38

    sys_sem_free()传入的参数变成了NULL,引起这个现象的主要原因有哪些?

    ).sem); 此时该传入的参数在莫名的情况下变成了NULL,该问题发生在频繁建立和断开TCP连接的测试案例中。 请教下引起这个现象的主要原因有哪些?
    发表于 04-30 07:35

    研究人员开发出基于NVIDIA技术的AI模型用于检测疟疾

    疟疾曾度在委内瑞拉销声匿迹,但如今正卷土重来。研究人员已经训练出模型来帮助检测这种传染病。
    的头像 发表于 04-25 09:58 ?479次阅读

    TeleAI提出COPO对齐方法:8B模型超越Llama3-70B的表现

    新大陆。 正如人类在面对未知时展现出的探索行为,在人工智能领域,尤其在大型语言模型(LLMs)理解语言和知识中,研究人员正尝试赋予 LLM 类似的探索能力,从而突破其在给定数据集中学习的能力边界,进
    的头像 发表于 02-17 17:31 ?491次阅读
    TeleAI提出COPO对齐方法:8B<b class='flag-5'>模型</b>超越Llama3-70B的表现

    机器学习模型市场前景如何

    当今,随着算法的不断优化、数据量的爆炸式增长以及计算能力的飞速提升,机器学习模型的市场前景愈发广阔。下面,AI部落小编将探讨机器学习
    的头像 发表于 02-13 09:39 ?417次阅读

    【「具身智能机器人系统」阅读体验】+初品的体验

    《具身智能机器人系统》 书由甘鸣、俞波、万梓燊、刘少山老师共同编写,其封面如图1所示。 本书共由5部分组成,其结构和内容如图2所示。 该书可作为高校和科研机构的教材,为学生和研究人员
    发表于 12-20 19:17

    谷歌发布“深度研究”AI工具,利用Gemini模型进行网络信息检索

    据外媒最新报道,谷歌近期发布款名为“深度研究”的先进AI工具。这款工具借助其内部的Gemini大型语言模型,实现
    的头像 发表于 12-16 09:35 ?797次阅读

    NVIDIA与谷歌量子AI部门达成合作

    NVIDIA CUDA-Q 平台使谷歌量子 AI 研究人员能够为其量子计算机创建大规模的数字模型,以解决设计中面临的各种挑战
    的头像 发表于 11-20 09:39 ?795次阅读

    名单公布!【书籍评测活动NO.51】具身智能机器人系统 | 了解AI的下一个浪潮!

    ,这是机器人技术在理解和响应人类情感方面的重要步骤;谷歌的 Atlas 机器人和特斯拉的 Tesla Bot 展 示
    发表于 11-11 10:20

    AI大模型与传统机器学习的区别

    AI大模型与传统机器学习在多个方面存在显著的区别。以下是对这些区别的介绍: 模型规模与复杂度 AI大
    的头像 发表于 10-23 15:01 ?2813次阅读

    《AI for Science:人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

    偏见、伦理道德等问题。此外,如何更好地将AI与科学研究人员的传统工作模式相融合,也是亟待解决的问题。未来,随着技术的不断进步和应用场景的拓展,AI for Science有望在更多领域发挥关键作用
    发表于 10-14 09:16

    k8s容器启动失败常见原因及解决办法

    k8s容器启动失败的问题通常出现在开发者使用Kubernetes进行容器编排时,可能的原因有多种,例如:配置错误、镜像问题、资源限制、依赖问题、网络问题、节点状态异常、其他因素等,以下是对这些常见
    的头像 发表于 10-11 10:12 ?874次阅读

    华纳云:企业迁移到云端的主要原因是什么?

    企业迁移到云端的主要原因是什么?原因不止。削减成本通常被认为是主要原因——但尽管通过云迁移降低成本无疑是
    的头像 发表于 09-14 17:38 ?579次阅读

    谷歌研究人员推出革命性首个AI驱动游戏引擎

    在科技日新月异的今天,人工智能(AI)正以前所未有的速度渗透到我们生活的每一个角落,从自动驾驶汽车到智能家居,无不彰显着其巨大的潜力和无限可能。而最近,谷歌研究团队的
    的头像 发表于 08-29 17:21 ?917次阅读

    晶闸管逆变失败原因和解决方案

    晶闸管逆变失败是电力电子领域中的常见问题,它可能由多种因素引起,并可能对系统造成严重的损害。以下是对晶闸管逆变失败
    的头像 发表于 08-27 16:26 ?2853次阅读