0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI越来越推广普及,我们需注意机器模型中不断涌现的人类偏见

如意 ? 来源:360机房 ? 作者:Harris ? 2020-09-24 14:35 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着人工智能在企业和社会的应用变得越来越普遍,企业需要注意机器模型中不断涌现的人类偏见。企业可以利用人类的智慧来获取训练算法所需的各种数据和输入。

有一些方法可以避免数据集中的偏差。

在训练人工智能(AI)算法时,取决于数据的输入。在业务环境中尤其如此,在这种情况下,人工智能的目的可能是与客户互动,管理自动化系统或模仿人工决策。成果与目标相符至关重要。但是,至关重要的是,企业必须能够解决任何可能歪曲人工智能对指令或请求的响应方式的偏见。

任何新产品的设计和开发阶段都是至关重要的,因为它使企业可以运行测试、识别并消除任何缺陷。如果由于某种原因而忽略了设计缺陷或产品出现故障,则可以快速解决。可以召回有故障的设备,同时可以发布更新和补丁来修复任何软件问题。对于典型的软件版本而言,这一切都很好,但是处理人工智能算法并不是那么简单。

人工智能算法是高度复杂的系统,旨在基于机器学习(ML)执行非常具体的任务。试图消除人工智能投入运行后所产生的任何数量的偏差可能既昂贵又费时;对于“学习”的技术而言,这也违反直觉。在设计和开发阶段采用适当的流程来检测并消除偏差会更加有效。

偏见对企业不利

人工智能的基本目的和功能被引入其基础算法中。如果人工智能要发展出固有的偏差,它将对算法产生不利影响。这可能会严重影响人工智能预期提供的精度和效率,从而限制人工智能满足其商业需求的能力,所有这些都对业务不利。

尽管有开发人员的最佳意图,偏见总能找到一种渗透人工智能算法的方法。与任何学习过程一样,学生也会受到其老师的影响。认可机构的教育范围取决于其课程设置。毫不奇怪,课程越多样化,学生越开明。同样,更大、更多样化的数据集有助于产生更精确、更高效的人工智能算法,从而能够做出更明智的决策。

培训数据和测试结果

每个成功的人工智能算法都建立在训练数据的基础上。但是,采购满足业务要求的数据可能会给物流和间接费用带来巨大挑战,尤其是如果这些要求包括满足大众市场的需求时。

内部开发人员团队,软件工程师和质量保证专家通常来自相同的年龄范围,性别和背景。偏差经常发生在数据收集和数据标记过程中。因此,在构建人工智能算法时,最好不要依赖某一个人或一个小组来提供将用于训练算法的数据。为了正确地训练算法,需要不同类型的数据和输入。

使用为人工智能算法提供与最终服务的客户更接近的人员和体验的暴露能力的模型,将会更有效率。企业可以使用这一模型来训练他们的算法,以响应现实情况,检测出偏差发生的地方并减少其潜在影响。

社区构建的算法

培训数据的成功获取和实施取决于数据本身的数量、质量和多样性。企业获取和处理此数据的唯一方法是利用多样化的参与者。企业需要能够从向其提供特定人口统计信息的社区中进行选择,包括性别、种族、母语、位置、技能、地理位置以及其他适用的过滤条件。

实际上,开发有效的算法需要大量数据。大多数企业没有能力大规模地获取数据。他们需要专用资源的支持才能交付新的软件和服务。最近的一个培训用于媒体和广播服务的智能语音助手的项目需要超过10万种不同的语音。这些话语最终由972个人提供,这些人被远程组装以训练算法。令人难以置信的壮举是,尽管可以在实验室中对语音进行某种程度的模拟,但人工智能仍然需要暴露于各种真实的声音和口音中。

言语训练只是教学大纲的一方面。众包解决方案还可以帮助企业训练人工智能算法以读取手写文档。最近的另一个项目需要数千个手写样本。数量再次成为关键因素,因为该算法需要尽可能广泛的唯一样本。远程聚集了1,000多名参与者,以提供手写文档并满足对各种内容的需求。

公正的结果

删除可能会降低人工智能最终结果准确性的意外偏差很重要。它将永远不会是完美的,但是人工智能会不断学习,并且最好的机器模型是基于大量多样数据集的模型。最好的策略是从提供数量、质量和多样性的池中获取培训数据。如果训练数据没有多样性,该算法将无法识别广泛的可能性,从而使该算法无效。远程社区使企业可以访问此数据,并补充内部开发和测试功能。众包测试可用于训练人工智能算法以研究和识别语音、文本、图像和生物识别,从而为企业提供强大的输出,可满足不同客户群的需求。
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    88

    文章

    35758

    浏览量

    282426
  • 模型
    +关注

    关注

    1

    文章

    3547

    浏览量

    50732
  • 机器学习
    +关注

    关注

    66

    文章

    8513

    浏览量

    135096
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI输出“偏见”,人类能否信任它的“三观”?

    人工智能(AI)已成为我们不可分割的“伙伴”。从聊天机器人、语音助手到自动翻译,AI不断介入人与人之间的交流和理解。然而,它能做到“客观中立
    的头像 发表于 08-04 13:43 ?673次阅读
    <b class='flag-5'>AI</b>输出“<b class='flag-5'>偏见</b>”,<b class='flag-5'>人类</b>能否信任它的“三观”?

    AI的未来,属于那些既能写代码,又能焊电路的“双栖人才”

    的信号:AI真正的未来,不只属于“算法天才”,更属于那些既能写代码,又能焊电路的“双栖工程师”。无论是在AI芯片、智能终端、机器人、边缘计算还是大模型下沉的讨论
    发表于 07-30 16:15

    后摩尔时代:芯片不是越来越凉,而是越来越

    在智能手机、笔记本电脑、服务器,尤其是AI加速器芯片上,我们正在见证一个时代性的趋势:计算力不断攀升,芯片的热也随之“失控”。NVIDIA的Blackwell架构GPU芯片,整卡TDP功耗超过
    的头像 发表于 07-12 11:19 ?524次阅读
    后摩尔时代:芯片不是<b class='flag-5'>越来越</b>凉,而是<b class='flag-5'>越来越</b>烫

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    教育等领域发挥着越来越重要的作用。?针对日前前来咨询的广大客户对面向大模型智能硬件的学习需求,我们根据CSK6大模型语音视觉开发板已有功能,整理了一份适合基于本开发板进行教学活动的学习
    发表于 07-04 11:10

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    AI的演进正在逼近“终端智能涌现”的拐点,从通用模型向场景落地迁移成为关键议题。联发科以“AI随芯,应用无界”为主题召开天玑开发者大会2025(MDDC 2025),不仅聚合了全球生态
    发表于 04-13 19:52

    当我问DeepSeek:为什么传感器技术越来越重要

    为什么传感器技术越来越重要 我们一起来看看 ????DeepSeek是怎么说的 为什么传感器技术越来越重要? ? 传感器:数字世界的感官
    的头像 发表于 03-01 15:58 ?415次阅读

    智创基于 RK3588 开发板部署测试 DeepSeek 模型全攻略

    AI 技术日新月异的当下,新的模型与突破不断涌现。近期,DeepSeek(深度求索)模型以其卓越性能和亲民成本,迅速在全球开发者圈子里引发热议。作为一款强大的语言
    发表于 02-14 17:42

    科大讯飞推出大模型极速超拟人交互软硬件方案

    随着大模型技术的不断发展,大模型的应用越来越受到行业的重视。如何在智能硬件的语音交互上快速应用和普及
    的头像 发表于 01-16 11:07 ?841次阅读

    企业AI模型托管怎么做的

    当下,越来越多的企业选择将AI模型托管给专业的第三方平台,以实现高效、灵活和安全的模型运行。下面,AI部落小编为您介绍企业
    的头像 发表于 01-15 10:10 ?462次阅读

    《具身智能机器人系统》第7-9章阅读心得之具身智能机器人与大模型

    的应用。MAML算法通过二阶优化找到对任务变化敏感的模型参数,实现了快速适应。上下文学习则引入了注意力机制,使模型能够根据当前场景动态调整行为策略。在预训练-微调范式
    发表于 12-24 15:03

    智谱推出四个全新端侧模型 携英特尔按下AI普及加速键

    随着AI的发展,端侧AI模型越来越受到广大客户及厂商的关注,业界领先的大模型公司智谱于近日推出了四个全新的端侧
    的头像 发表于 12-02 17:13 ?653次阅读
    智谱推出四个全新端侧<b class='flag-5'>模型</b> 携英特尔按下<b class='flag-5'>AI</b><b class='flag-5'>普及</b>加速键

    AI模型的伦理与社会影响

    个人隐私得到保护,防止数据泄露和滥用。 对于敏感数据的处理,如生物识别信息或健康记录,需要遵循更严格的隐私和安全标准。 偏见与歧视 AI模型可能会从训练数据中继承偏见,导致对某些群体
    的头像 发表于 10-23 15:13 ?2103次阅读

    人民邮电报:“开源”到底是什么?为啥热度越来越高?

    ? ? ? 本文转载自人民邮电报 这些年,“开源”这个词越来越火,开源AI模型、开源数据库、开源框架、开源硬件等新词汇层出不穷。那么到底什么是“开源”呢,是“开源节流”的“开源”吗
    的头像 发表于 10-17 14:21 ?3934次阅读
    人民邮电报:“开源”到底是什么?为啥热度<b class='flag-5'>越来越</b>高?

    AI for Science:人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

    人工智能在科学研究的核心技术,包括机器学习、深度学习、神经网络等。这些技术构成了AI for Science的基石,使得AI能够处理和分析复杂的数据集,从而发现隐藏在数据
    发表于 10-14 09:16

    AI普及给嵌入式设计人员带来新挑战

    。 ? 从监控和访问控制到智能工厂和预测性维护,基于机器学习(ML)模型构建的人工智能(AI)在工业物联网边缘处理应用已变得无处不在。随着
    发表于 08-22 14:20 ?936次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>普及</b>给嵌入式设计人员带来新挑战