0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

嵌入式AI技术漫谈:怎么为训练AI模型采集样本数据

瑞萨MCU小百科 ? 来源:瑞萨MCU小百科 ? 2025-06-11 16:30 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Q

需要为嵌入式AI模型提供多少样本数据?

我在向客户介绍如何使用AI方法设计一款客户产品时,客户理解,AI嵌入式项目的开发都是围绕数据展开的,如此,我经常会被问到这样的问题:客户的工程师需要采集多少数据,才能形成合适的样本集,进而开始训练模型呢?

此时,回答“按需提供”或者“先试试看”似乎会变成一句车轱辘话,看似回答了问题,但客户还是无从下手。

AI数据样本的三个原则

这里,我以教孩子认识苹果和鸭梨为例进行说明。假设一个小孩子不认识苹果和鸭梨,在对真正的水果和鸭梨做判断之前,我们只有一些苹果和鸭梨的图片可供孩子学习,此时可以做类比:

孩子用来记忆知识的大脑就是AI

预先准备好的图片就是样本

通过照片学习的过程就是训练

脱离照片之后真的在一推水果里能挑选出苹果和鸭梨的过程,就是推理过程。

好了,我们开始分析。

合适的AI数据集中的样本数据,需要满足如下的三个原则:

独立性。在训练的初期,尽量选择用正常的苹果鸭梨的照片给孩子用于学习,尽量避免使用各种畸形或者怪异的样本影响孩子的第一印象。如果客观存在似是而非的情况,我们甚至可以专门为这些特殊的样本设计第三个分类“不确定”,从而避免对正常样本的判断。

平衡性。在提供样本数量上,尽量让不同分类的样本平均分配,例如,如果提供100张苹果和100张鸭梨的照片,孩子能够公平地对苹果和鸭梨都建立相当的印象。但如果用100张苹果和1张鸭梨的照片提供给孩子学习,孩子对苹果的印象更加深刻而忽略掉那唯一的一张鸭梨的照片。在实际判别时,也会更倾向于将他看到的任何类似的水果判定为苹果。

显著统计性。由于样本是人工或者外力参与标定的,在反应客观规律的时候,也可能存在系统偏差,出现少量的异常,或者在信号分析的领域里称为“噪声点”。因此,在用于训练AI模型之前对数据进行预处理的环节,也会利用统计学规律对数据进行初步筛选,例如,使用正态分布的规律,对某一分类下的所有样本中,远离平均水平(明显不靠谱)的数据剔除,否则在后期训练中容易出现“过拟合”的情况,从而导致最终训练的AI模型的规模异常增大,并且也有可能偏离实际的规律。

在具体实践过程中,需要系统专家设计好标定环境,需要人工标注样本数据的分类,相当于,先为测试考核提供提供参考答案。这涉及到硬件电路系统和软件工具链的搭建工作。

然后,在满足这三个的基础上,可以根据实际情况采集少量样本。实际上,嵌入式系统的数据量通常都比较大产生速度也比较快,例如,在使用AI方法在拉弧检测的应用中,使用500KSps的ADC采样率,每秒钟就可以采集到一条包含50万个数据点的,而用于判定拉弧的采样窗口大多在1ms以内,500个采样点就可以构成一个标定为“有拉弧”或者“无拉弧”的样本,如果不考虑窗口重叠的情况,每秒钟就至少可以产生1千条样本。如此可以看出,在初期很容易获得数量相当的样本。

之后,算法工程师使用获取的样本集构建AI模型并训练,试着描述样本数据的规律,通过分析模型的训练结果(例如准确率、推理时间等性能),对进一步采集数据提供指导。

如此反复多次,直到AI模型的准确率、性能等指标达到预期,即可收敛。

通过迭代摸索数据的门道

所以,简而言之的回答,还是“先采集数据,试试看训练模型,然后逐渐摸索出门道,在循环迭代的过程中完善数据集,最终达到产品要求即可”。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 嵌入式AI
    +关注

    关注

    0

    文章

    36

    浏览量

    1185
  • AI大模型
    +关注

    关注

    0

    文章

    377

    浏览量

    650

原文标题:嵌入式AI技术漫谈——为训练AI模型采集样本数据

文章出处:【微信号:瑞萨MCU小百科,微信公众号:瑞萨MCU小百科】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Deepseek海思SD3403边缘计算AI产品系统

    海思SD3403边缘计算AI框架,提供了一套开放AI训练产品工具包,解决客户低成本AI系统,针对差异化
    发表于 04-28 11:05

    海思SD3403边缘计算AI数据训练概述

    模型,将模型转化为嵌入式AI模型模型升级AI摄像
    发表于 04-28 11:11

    为什么需要嵌入式AI

    为什么需要嵌入式AI嵌入式AI还有瓶颈半导体厂商的新商机
    发表于 01-22 06:14

    嵌入式AI平台有哪些?

    11.2.2 修剪神经网络 21.2.3 嵌入式终端优化 21.3 GPU 21.4 ARM 31.5 FPGA结构的并行计算 41.5.1 介绍 41.5.2 流水线计算 41.5.3 分布流水线计...
    发表于 10-27 06:45

    如何去使用STM32CubeMX.AI嵌入式设备呢

    STM32CubeMX.AI嵌入式设备有何特点?如何去使用STM32CubeMX.AI嵌入式设备呢?
    发表于 11-19 07:12

    嵌入式AI的相关资料下载

    一、嵌入式AI概述大部分神经网络计算都在卷积层,基本上99%都在卷积层,二、模型加速2-1.权值量化tengine量化后的准确率之下降了1.5%。2-2.网络剪枝2-3.知识蒸馏大网络是一个老师
    发表于 12-14 06:57

    如何将AI模型部署到嵌入式系统中

    本期我们分享主题是如何将 AI 模型部署到嵌入式系统中,下一期将介绍如何在 RT-Thread 操作系统上运行 Mnist Demo(手写数字识别)。 嵌入式关联 AIAI落地一直是一
    发表于 12-14 07:55

    STM32Cube.AI工具包使用初探

    嵌入式MCU上跑AI模型了,买了一块开发板来做一些尝试,做一下记录。我所使用的Nucleo开发板,MCUSTM32F767ZITCube.AI
    发表于 02-22 06:50

    嵌入式AI技术提升智能硬件应用能力

    本帖最后由 我爱方案网 于 2022-10-9 14:34 编辑 嵌入式AI的出现是最近几年的事情,但已成为市场的一个营销热点,在未来的产品市场占有率中正扮演关键角色。因此,在智能家居、智能
    发表于 10-09 14:33

    嵌入式边缘AI应用开发指南

    、针对性能和精度目标对模型进行训练和优化,以及学习使用在嵌入式边缘处理器上部署模型的专用工具。从模型选择到在处理器上部署,TI可免费提供相关
    发表于 11-03 06:53

    ST MCU边缘AI开发者云 - STM32Cube.AI

    意法半导体(ST)嵌入式AI开发人员和数据科学家扩展了面向嵌入式AI开发人员和
    发表于 02-02 09:52

    AI技术导向的嵌入式应用现在发展如何

    随着许多嵌入式系开始变得智能且自主,El-Ouazzane预计以AI导向的嵌入式系统即将爆发。
    发表于 11-22 08:36 ?1398次阅读

    嵌入式UI架构设计漫谈

    嵌入式UI架构设计漫谈
    发表于 11-03 17:36 ?15次下载
    <b class='flag-5'>嵌入式</b>UI架构设计<b class='flag-5'>漫谈</b>

    嵌入式ai应用开发

    AI算法在特定的嵌入式平台上进行部署,完成相应的任务,也就是边缘计算。 AI模型可以认为是一个非常复杂的非线性函数,暂时理论上还不能给出解析解。这个
    的头像 发表于 12-13 15:07 ?2314次阅读

    嵌入式AI技术漫谈 如何组建一个AI项目开发小组

    解决具体的问题,每个问题出的场景各有不同,难有成例,都需要投入必要的人手执行开发工作。 嵌入式AI项目当中,几乎所有的开发任务都将围绕数据展开。数据来源的差异性决定了每个
    的头像 发表于 06-11 16:34 ?705次阅读