0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习项目中提取简单有效的checklist

汽车玩家 ? 来源:AI公园 ? 作者:datarevenue ? 2020-05-04 11:44 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

导读

这个checklist能帮助你迈出做一个成功的机器学习项目第一步。

避免混淆,用这个简单的清单来计划你的 AI 项目。

对许多人来说,机器学习仍然是一项新技术,这可能会让它难以管理。

项目经理通常不知道如何与数据科学家谈论他们的想法。

在我们规划 30 多个机器学习项目的经验中,我们提炼出了一个简单有效的checklist。

1. 项目动机

明确你的项目的更广泛的意义。

你要解决的问题是什么?What is theproblemyou want to solve?

相关联的目标策略是什么?

如果项目团队不理解你的动机,那么他们就很难提出好的建议。

有很多方法可以解决机器学习的问题。所以帮助你的团队以你最感兴趣的方式工作 —— 退一步告诉他们为什么这个项目是重要的。

2. 问题定义

你想要预测的具体输出是什么?

对于给定的输入,你的机器学习模型将理想地学会预测非常具体的输出。

所以这里你要尽可能的清楚。“预测机器故障”可能意味着很多事情 —— “告诉我,在未来 24 小时内,意外停机的风险何时增加 50%以上”更好。

你的算法有什么输入数据?

模型预测输出的唯一方法是从模型的输入因子中派生出来。所以,为了有机会做出好的预测,你必须有与输出相关的数据。数据越多越好。

什么是预测你的具体输出的最相关因素?

算法不能理解我们的世界。重要的是,你要给数据科学家一些提示,告诉他哪些数据实际上是相关的,这样他就可以用算法能够理解的方式选择和分割数据。

你能提供多少训练样本?

一个算法需要的练习比一个人要多得多。你最少需要 200 个样本。越多越好。

3. 性能度量

你怎么知道什么是好的结果?

你有一个简单的基准测试来比较你的结果吗?

有没有一种简单的方法来利用你已有的数据进行预测?也许你可以根据去年的数字预测销售额,或者通过计算客户上一次登录后的天数来评估客户离开的风险。一个简单的基准测试可以为你的团队提供有价值的问题洞察力。它给你一些东西来衡量模型。

你将如何衡量预测的准确性?

你期望的最低准确度是多少?

你希望预测的准确率平均在 5% 以内,还是更重要的是预测误差不超过 10%?你的模型可以以任何一种方式进行调优。哪种方式更好取决于什么对你来说是重要的。

一个完美的解决方案是什么样的?

即使这对你来说是显而易见的,把它写在纸上也能帮助你理清思路。

是否有参考解决方案(如研究论文)?

如果有人以前解决过类似的问题,就把他们的解决方案当作灵感。这为每个人提供了一个共同的起点,这样他们就可以看到要使用哪些数据,可能会出现哪些问题,以及要尝试哪些算法。

4. 时间线

一个性能验证项目的时间线示例。

是否有截止日期需要注意?

你什么时候需要看到第一个结果?

你想什么时候有一个完整的解决方案?

人工智能解决方案可以无限地改进。明确的最后期限有助于让团队集中精力。

5. 联系人

谁负责项目(PM)?

谁可以授权访问数据集?

谁能帮助理解当前的流程和/或简单的基准测试(领域专家)?

在一个项目的过程中会出现许多问题。明确你的工程师可以向谁求助。

6. 合作

在业务和工程团队之间建立一个双/周的更新。

每周安排一次会议来查看当前的结果,并讨论那些不需要通过电子邮件来回答的问题。

应该涉及谁?

他们应该学什么?

在学习如何管理人工智能方面,没有什么比实际项目的实践经验更有价值。如果你想让你的团队的其他成员学习,从一开始就要说清楚。

定义代码和问题的位置以及如何访问代码。

让所有的开发从一开始就透明。这样任何人都可以很容易地加入,给出提示,并检查进展。

回答这个清单上的问题,并与大家分享

世界仍在研究如何最好地运行人工智能/机器学习项目。填写这份清单将会给你所有成功的机器学习项目的要素之一:理解。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    88

    文章

    35917

    浏览量

    283172
  • 机器学习
    +关注

    关注

    66

    文章

    8517

    浏览量

    135163
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    钢厂首选,profinet转profibus在煤电项目中的协议转换解决方案

    钢厂首选,profinet转profibus在煤电项目中的协议转换解决方案
    的头像 发表于 05-06 16:37 ?247次阅读
    钢厂首选,profinet转profibus在煤电<b class='flag-5'>项目中</b>的协议转换解决方案

    【「# ROS 2智能机器人开发实践」阅读体验】+内容初识

    人应用案例:书中提供了多个机器人应用案例,帮助读者将所学的 ROS 2 知识应用到实际的机器项目中。例如,在自主移动机器人案例中,详细讲解
    发表于 04-27 11:24

    《AI Agent 应用与项目实战》阅读心得2——客服机器人、AutoGen框架 、生成式代理

    行适应性学习。生成式代理的技术实现为AI系统带来了新的发展方向。项目中的记忆架构设计特别值得关注,它不仅解决了传统AI系统中的记忆瓶颈问题,还为构建具有持续学习能力的AI系统提供了技术范本。代理的反思
    发表于 02-25 21:59

    分布式储能监控系统在某储能项目中的应用

    本文介绍了安科瑞Acrel-1000DP分布式储能监控系统在浙江嘉兴晋亿实业5MW分布式储能项目中的应用,该系统优化了企业的能源管理,可以有效降低电力成本、确保生产活动的连续性和稳定性。
    的头像 发表于 02-05 13:12 ?693次阅读
    分布式储能监控系统在某储能<b class='flag-5'>项目中</b>的应用

    《具身智能机器人系统》第10-13章阅读心得之具身智能机器人计算挑战

    阅读《具身智能机器人系统》第10-13章,我对具身智能机器人的工程实践有了全新认识。第10章从实时性角度剖析了机器人计算加速问题。机器人定位中的SLAM算法需要处理两个计算密集型任务:
    发表于 01-04 01:15

    如何选择云原生机器学习平台

    当今,云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势,逐渐成为企业构建和部署机器学习应用的首选。然而,市场上的云原生机器
    的头像 发表于 12-25 11:54 ?522次阅读

    《具身智能机器人系统》第7-9章阅读心得之具身智能机器人与大模型

    共同挑战:如何从高维噪声数据中提取有效特征?如何平衡模型复杂度和计算效率?如何保证系统在真实环境中的稳定性?书中提出的技术方案对我的工作很有启发。多模态融合策略可用于处理异构数据源,元学习
    发表于 12-24 15:03

    构建云原生机器学习平台流程

    构建云原生机器学习平台是一个复杂而系统的过程,涉及数据收集、处理、特征提取、模型训练、评估、部署和监控等多个环节。
    的头像 发表于 12-14 10:34 ?500次阅读

    傅立叶变换在机器学习中的应用 常见傅立叶变换的误区解析

    傅里叶变换在机器学习中的应用 傅里叶变换是一种将信号分解为其组成频率分量的数学运算,它在机器学习中的应用日益广泛。以下是一些主要的应用领域: 信号处理 : 音频处理:傅里叶变换有助于识
    的头像 发表于 12-06 17:06 ?1171次阅读

    自然语言处理与机器学习的关系 自然语言处理的基本概念及步骤

    Learning,简称ML)是人工智能的一个核心领域,它使计算机能够从数据中学习并做出预测或决策。自然语言处理与机器学习之间有着密切的关系,因为机器
    的头像 发表于 12-05 15:21 ?2150次阅读

    什么是机器学习?通过机器学习方法能解决哪些问题?

    来源:Master编程树“机器学习”最初的研究动机是让计算机系统具有人的学习能力以便实现人工智能。因为没有学习能力的系统很难被认为是具有智能的。目前被广泛采用的
    的头像 发表于 11-16 01:07 ?1143次阅读
    什么是<b class='flag-5'>机器</b><b class='flag-5'>学习</b>?通过<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法能解决哪些问题?

    NPU与机器学习算法的关系

    紧密。 NPU的起源与特点 NPU的概念最早由谷歌在其TPU(Tensor Processing Unit)项目中提出,旨在为TensorFlow框架提供专用的硬件加速。NPU的设计目标是提高机器学习算法的运行效率,特别是在处理
    的头像 发表于 11-15 09:19 ?1477次阅读

    eda在机器学习中的应用

    机器学习项目中,数据预处理和理解是成功构建模型的关键。探索性数据分析(EDA)是这一过程中不可或缺的一部分。 1. 数据清洗 数据清洗 是机器学习
    的头像 发表于 11-13 10:42 ?1054次阅读

    【每天学点AI】KNN算法:简单有效机器学习分类器

    过程,其实就是一个简单的分类问题,而KNN(K-NearestNeighbors)算法正是模仿这种人类决策过程的机器学习算法。|什么是KNN?KNN(K-NearestNeighbo
    的头像 发表于 10-31 14:09 ?967次阅读
    【每天学点AI】KNN算法:<b class='flag-5'>简单</b><b class='flag-5'>有效</b>的<b class='flag-5'>机器</b><b class='flag-5'>学习</b>分类器

    智能照明控制系统在体育场馆项目中的应用

    与瞄准、灯具眩光与外溢光控制;基本控制方式、区域控制、系统功能等方面,探讨了体育场馆项目中智能照明系统的应用要点。 关键词:体育场馆;智能照明;照明控制 0、引言 在体育场馆项目中应用智能照明系统,能够优化体育场馆的运行、管理与服
    的头像 发表于 09-25 14:04 ?1034次阅读
    智能照明控制系统在体育场馆<b class='flag-5'>项目中</b>的应用