0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习项目失败的十大原因

姚小熊27 ? 来源:企业网D1net ? 作者:企业网D1net ? 2020-11-05 13:55 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

如今人们总是能听到有关机器学习的新闻,而机器学习技术确实有更多发展潜力。调研机构Gartner公司预测,对于很多组织来说,80%的人工智能项目仍是一种难以获得成功的炼金术。根据VentureBeat公司发布的“Transform2019”研究报告,87%的人工智能项目将永远无法投入生产。

为什么会这样呢?为什么这么多项目失败?

1.没有足够的专业知识

其中一个原因是,机器学习技术对人们来说仍然是新技术。此外,大多数组织仍不熟悉软件工具和所需的硬件。

如今,从事数据分析或软件开发工作并完成了一些数据科学项目的一些人却将自己标榜为数据科学家。

事实上,组织需要经验丰富的真正数据科学家来处理大多数机器学习和人工智能项目,尤其是在定义成功标准、最终部署和模型的持续监控方面。

2.数据科学与传统软件开发之间的脱节

数据科学与传统软件开发之间的脱节是另一个主要因素。传统的软件开发往往更具可预测性和可衡量性。

数据科学研究通过多次迭代和试验而向前发展。有时,由于选择的度量标准不会驱动用户行为,因此整个项目将不得不从部署阶段返回到计划阶段。

传统的基于敏捷的项目交付可能不适用于数据科学项目。对于在常规软件开发项目的每个任务周期结束时一直在努力交付清晰结果的领导者来说,这将造成大规模的混乱。

3.数据量和质量

众所周知,数据集越大,采用人工智能系统进行的预测就越好。除了数据量增加的直接影响之外,随着数据量的增加,还会出现许多新的挑战。

在许多情况下,组织将不得不合并来自多个源的数据。一旦开始这样做,就会意识到它们同步的次数很少,这将导致很多混乱。有时,组织最终将合并不应该合并的数据,这将导致数据点具有相同的名称但含义不同。

错误的数据会带来无法采取行动或无法提供真知灼见的结果,也会导致误导性结果。

4. 标记数据

标记数据的不可用是另一个阻碍机器学习项目的挑战。《麻省理工学院斯隆管理评论》杂志指出,76%的人通过尝试自己标记和注释训练数据来应对这一挑战,而63%的人甚至尝试构建自己的标记和注释自动化技术。

这意味着数据科学家在标记过程中无法充分利用其专业知识。这是有效执行人工智能项目的主要挑战。

这就是许多公司将标记任务外包给其他公司的原因。但是,如果标记任务需要足够的领域知识,则将标记任务外包是一个挑战。如果组织需要保持数据集之间的质量和一致性,则必须投资于标记人员的标准化培训。

如果要标记的数据很复杂,则另一个选择是开发自己的数据标记工具。但是,与机器学习任务本身相比,这通常需要更多的成本。

5.组织孤立无援

数据是机器学习项目中最重要的实体。在大多数组织中,这些数据将以不同的安全约束和不同格式(例如结构化、非结构化、视频文件、音频文件、文本和图像)驻留在不同的位置。

在不同的地方以不同的格式保存这些数据本身就是一个挑战。然而,当组织孤立无援而却没有相互协作时,其挑战就会加倍。

6.缺乏合作

另一个主要挑战是不同团队之间缺乏协作,如数据科学家、数据工程师、数据管理员、商业智能(BI)专家、DevOps和工程。这对于物联网到数据科学的工程方案中的团队尤其重要,因为他们在工作方式和完成项目所使用的技术上有很多不同。

工程团队将实施机器学习模型并将其投入生产。因此,他们之间需要有适当的理解和强有力的协作。

7.技术上不可行的项目

由于机器学习项目的成本往往非常昂贵,因此大多数企业倾向于以雄心勃勃的“登月计划”为目标,这将完全改变组织或产品并带来超额回报或投资。

这样的项目将永远无法完成,并将推动数据科学团队达到极限。最终,企业领导者将对项目失去信心并停止投资。

8.技术团队和业务团队之间的协调问题

很多时候,机器学习项目在业务团队和数据科学团队之间在项目的期望、目标和成功标准上没有明确的一致性。

这些类型的项目将永远停留在研究阶段,因为他们永远不知道自己是否正在取得进展,因为至今还不清楚其目标是什么。

在这里,数据科学团队将主要专注于准确性,而业务团队将对诸如财务收益或业务洞察力之类的指标更感兴趣。最后,业务团队最终不接受数据科学团队的结果。

9.缺乏数据策略

根据《麻省理工学院斯隆管理评论》杂志的调查,员工人数超过10万名的大型组织将有50%可能采用数据策略。而组织在开始机器学习项目之前制定可靠的数据策略至关重要。

组织需要对以下内容有清晰的了解,这是数据策略的一部分:

组织拥有的全部数据是多少? 项目实际需要多少数据? 所需的人员将如何访问这些数据,以及这些人员访问这些数据的容易程度? 如何将来自不同来源的所有这些数据汇总在一起? 如何清理和转换这些数据?

大多数组织一开始没有计划,或者根本没有想到自己没有数据。

10.缺乏领导支持

很多人认为,只需要投入一些资金和技术来解决问题,其结果就会自动出现。

但是他们没有看到组织领导者提供正确的支持来确保成功所需的条件,而组织领导者有时对数据科学家开发的模型没有信心。

这可能是由于组织的领导者对人工智能缺乏了解,以及数据科学家无法向他们传达模型具有业务利益的原因。

最终,组织的领导者需要了解机器学习的工作原理以及人工智能对组织的真正意义。
责任编辑:YYX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1810

    文章

    49251

    浏览量

    252053
  • 机器学习
    +关注

    关注

    66

    文章

    8517

    浏览量

    135163
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    具身机器十大发展趋势

    在2025世界机器人大会开幕式上发布了《2025具身智能机器十大发展趋势》,以下为全文。趋势一第一,物理实践、物理模拟器与世界模型协同驱动的具身感认知。物理实践是具身智能的本质,物理模拟器可以构建
    的头像 发表于 08-12 13:22 ?884次阅读
    具身<b class='flag-5'>机器</b>人<b class='flag-5'>十大</b>发展趋势

    松盛光电荣膺2024年度中国十大光学产业技术应用类奖

    近日,2025中国十大光学产业技术颁奖典礼在此隆重举行。在众多行业专家、学者和顶尖企业代表的见证下,武汉松盛光电科技有限公司(以下简称“松盛光电”)自主研发的“激光恒温锡焊系统”凭借在光学激光技术领域突破性的创新成果从众多候选项目中脱颖而出,荣膺“2024年度中国
    的头像 发表于 05-19 16:42 ?612次阅读

    十大鲜为人知却功能强大的机器学习模型

    本文转自:QuantML当我们谈论机器学习时,线性回归、决策树和神经网络这些常见的算法往往占据了主导地位。然而,除了这些众所周知的模型之外,还存在一些鲜为人知但功能强大的算法,它们能够以惊人的效率
    的头像 发表于 04-02 14:10 ?620次阅读
    <b class='flag-5'>十大</b>鲜为人知却功能强大的<b class='flag-5'>机器</b><b class='flag-5'>学习</b>模型

    芯片流片失败都有哪些原因

    最近和某行业大佬聊天的时候聊到芯片流片失败这件事,我觉得这是一个蛮有意思的话题,遂在网上搜集了一些芯片流片失败原因,放在这里和大家一起分享。1.Design的版本拿错,这个问题比较要命,如果ROM
    的头像 发表于 03-28 10:03 ?796次阅读
    芯片流片<b class='flag-5'>失败</b>都有哪些<b class='flag-5'>原因</b>

    串口屏十大高频问题:花屏、通信失败、触控漂移全解决

    在工业控制、智能设备等领域,串口屏以其便捷的交互性、简单的通信方式,成为了信息展示与操作的重要窗口。然而,在实际使用过程中,串口屏也常出现一些问题,影响设备的正常运行与用户体验。下面将针对花屏、通信失败、触控漂移等十大高频问题,为您详细剖析
    的头像 发表于 03-27 11:51 ?782次阅读
    串口屏<b class='flag-5'>十大</b>高频问题:花屏、通信<b class='flag-5'>失败</b>、触控漂移全解决

    激光焊接十大常见缺陷及解决方法

    无所不能,有时也会因为操作或者参数设定上的原因,导致加工出现差错。只有充分了解这些缺陷并学习如何避免它们,才能更好地发挥激光焊接的价值。以下是激光焊接过程中常见的十大缺陷及其解决方法。 ?1. 焊接飞溅 ● 缺陷表现
    的头像 发表于 03-17 16:02 ?2044次阅读

    年度电解槽十大品牌+年度制氢十大供应商,稳石氢能荣获两大奖项!

    此前,2024年10月16日,由国能网与国能能源研究院联合举办的第九届新能源行业品牌盛典(GPBC)圆满召开,稳石氢能荣获2024年度·氢能行业品牌榜“年度电解槽十大品牌”与“年度制氢十大供应商”两大奖项!
    的头像 发表于 01-24 14:53 ?906次阅读

    电机振动十大原因分析及预防措施

    电动机振动的危害 电动机产生振动,会使绕组绝缘和轴承寿命缩短,影响滑动轴承的正常润滑,振动力促使绝缘缝隙扩大,使外界粉尘和水分入侵其中,造成绝缘电阻降低和泄露电流增大,甚至形成绝缘击穿等事故。另外,电动机产生振动,又容易使冷却器水管振裂,焊接点振开,同时会造成负载机械的损伤,降低工件精度,会造成所有遭到振动的机械部分的疲劳,会使地脚螺丝松动或断掉,电动机又会造成碳刷和滑环的异常磨损,甚至会出现严重刷火
    的头像 发表于 01-23 09:20 ?840次阅读

    华为发布2025智能光伏十大趋势

    华为数字能源以“融合创新,智构未来,加速光伏成为主力能源”为主题,举办2025智能光伏十大趋势发布会。华为数字能源智能光伏产品线总裁周涛发布了智能光伏十大趋势和重磅白皮书,为光储产业的高质量发展提供前瞻性支持。
    的头像 发表于 01-06 17:12 ?1012次阅读

    NPU与机器学习算法的关系

    紧密。 NPU的起源与特点 NPU的概念最早由谷歌在其TPU(Tensor Processing Unit)项目中提出,旨在为TensorFlow框架提供专用的硬件加速。NPU的设计目标是提高机器学习算法的运行效率,特别是在处理
    的头像 发表于 11-15 09:19 ?1477次阅读

    全国5G新基建智慧灯杆建设十大代表性案例

    全国5G新基建智慧灯杆建设十大代表性案例
    的头像 发表于 11-07 12:50 ?1456次阅读
    全国5G新基建智慧灯杆建设<b class='flag-5'>十大</b>代表性案例

    选择精科睿进行 PCBA 代工代料有以下十大理由

    选择精科睿进行 PCBA 代工代料有以下十大理由:
    的头像 发表于 11-06 10:21 ?578次阅读

    商汤科技入选2024年CCF十大技术公益优秀案例

    近日,在中国计算机领域最具权威性、规模最大的学术盛会——中国计算机大会(CNCC)上,公布了2024“CCF十大技术公益优秀案例”,商汤医疗大模型“大医”从近百个项目中脱颖而出,凭借在公益领域的突出贡献成功入选。
    的头像 发表于 10-30 14:51 ?717次阅读

    烧结银AS9378火爆的六大原因

    低温烧结银AS9378近年来在电子材料领域迅速崛起,其火爆程度令人瞩目。这款采用纳米技术和低温烧结工艺的高性能材料,凭借其独特的优势在众多应用中脱颖而出。以下,我们将深入探讨低温烧结银AS9378火爆的六大原因
    的头像 发表于 09-20 17:27 ?916次阅读

    晶闸管逆变失败原因和解决方案

    晶闸管逆变失败是电力电子领域中的一个常见问题,它可能由多种因素引起,并可能对系统造成严重的损害。以下是对晶闸管逆变失败原因及解决方法的详细探讨,旨在提供全面且深入的理解。
    的头像 发表于 08-27 16:26 ?2886次阅读