0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Seeing AI帮助盲人和弱视用户“看”世界

NVIDIA英伟达企业解决方案 ? 来源:未知 ? 作者:胡薇 ? 2018-05-15 10:44 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

导盲犬可以很好地帮助盲人或视障人士出行,但是如果想辨别出前面路口的标识,或者想知道钱包里还有多少钱,导盲犬可就办不到了。

由微软AI研究小组开发的应用程序Seeing AI为这个问题给出了解决方案。该应用程序可为盲人和弱视用户描述这个世界,使他们可以使用自己的智能手机来识别一切:包括单个物体、颜色、钞票、文档等。

自去年问世以来,这一应用程序的下载量已突破15万次,执行任务500万次,其中一些任务的服务对象还是全球知名的盲人。

“Stevie Wonder(美国知名艺人)每天都会用,这确实很令人振奋。”微软高级数据科学家Anirudh Koul在3月于圣何塞举行的GPU技术大会上发表演讲时说道。

该应用程序的现场演示就已展现出了其强大的功能。和Koul一同上台的还有他的一位同事,当他在自己的智能手机上运行应用程序,并将手机朝向他的同事时,应用程序描述他看到的是“一位31岁、有着黑头发、戴着眼镜且看起来很开心的男士”。

如果这位同事在他的联系人列表中,则有更佳的使用效果,因为Seeing AI可以与用户的联系人进行整合,并能识别出朋友的名字。

Koul还分享了几个令人叹服的使用案例:一位盲人教师将运行该应用的手机面朝教室门口,这样孩子们就不会因她是盲人而趁机偷偷进出教室;另一位用户在飓风肆虐的地区穿行时,利用这款应用程序避开了倒落的电线和其他障碍物。

Seeing AI的开发始于2014年2月,开发人员曾试图创建一个能发现并识别周围物体的卷积神经网络。但是其延迟时间达10秒,这样的速度不能及时帮助人们快速作出决策。

第二年,微软赞助了一场为期一周的黑客马拉松,活动共吸引了13000人参与,并由此引发了第二次尝试:在用户的头上配备手机。

在使用智能眼镜进行试验后,Koul的团队开始着手于应用程序本身的开发工作。网络本地训练过程在NVIDIA GPU上进行,而较为繁重的工作则交给了基于NVIDIA Tesla P100 GPU运行的Azure云实例。通过逐帧分析确定每一部分训练的发生位置。

AI调优

应用程序需要辨别不同图像,而图像属性具有不确定性,所以开发人员针对此特性对模型进行了训练。例如,如果训练应用程序识别货币,则需要向训练网络内输入不清晰和无背景的货币图片,以及货币某一极小部分放大后的图片,再让其识别出图片的真实内容。

该团队向志愿者征集,最终得到了各种类型的图片,其中包括一张猫咪玩纸币的图片,以及纸币被封在冰块中的照片。通过这些变量对模型进行训练,最终就能够计算出识别图片所需的最小参数。

Koul的团队对网络进行了调整,使其倾向于得出否定性分类或不分类的结果,而不是猜测结果(这样可能将5元钞票识别成10元),因为猜测很显然会给盲人用户造成麻烦。

随着用户人数的增多,这款应用程序也将变得越好、越准确。AI将会成为盲人和视障用户的福音。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 智能手机
    +关注

    关注

    66

    文章

    18636

    浏览量

    184460
  • AI
    AI
    +关注

    关注

    88

    文章

    35748

    浏览量

    282380

原文标题:重见光明:深度学习帮助盲人“看”到世界

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI智能体对电子企业的帮助是什么

    对企业的具体帮助,并聚焦于万达宝LAIDFU(来福)这一创新产品,展示其如何通过自定义应用场景,轻松触及传统数据难以覆盖的领域。一、AI智能体:企业转型升级的催化剂
    的头像 发表于 05-21 10:08 ?257次阅读
    <b class='flag-5'>AI</b>智能体对电子企业的<b class='flag-5'>帮助</b>是什么

    机器人和自动化的未来(2)

    本文是第二届电力电子科普征文大赛的获奖作品,来自西南交通大学黄雯珂的投稿。3机器人与自动化的未来展望随着机器人和自动化技术的不断进步,未来的世界将会是一个高度自动化的世界。智能工厂、智慧家庭
    的头像 发表于 04-26 08:33 ?369次阅读
    机器<b class='flag-5'>人和</b>自动化的未来(2)

    NVIDIA Cosmos加速机器人和自动驾驶汽车物理AI发展

    NVIDIA Cosmos 通过可预测未来世界状态的世界基础模型加速物理 AI 的发展。
    的头像 发表于 04-24 11:01 ?664次阅读
    NVIDIA Cosmos加速机器<b class='flag-5'>人和</b>自动驾驶汽车物理<b class='flag-5'>AI</b>发展

    英伟达GTC2025亮点 NVIDIA推出Cosmos世界基础模型和物理AI数据工具的重大更新

    新模型可实现物理 AI 的预测、可控世界生成和推理。 两款全新Blueprint为机器人和自动驾驶汽车后训练提供海量物理 AI 合成数据生成技术。 1X、Agility Robotic
    的头像 发表于 03-20 19:01 ?953次阅读

    Banana Pi 发布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 计算与嵌入式开发

    RZ/V2N——近期在嵌入式世界2025上新发布,为 AI 计算、嵌入式系统及工自动化提供强大支持。这款全新的计算平台旨在满足开发者和企业用户对高性能、低功耗和灵活扩展的需求。 []() 领先的计算
    发表于 03-19 17:54

    《零基础开发AI Agent——手把手教你用扣子做智能体》

    《零基础开发AI Agent——手把手教你用扣子做智能体》是一本为普通人量身打造的AI开发指南。它不仅深入浅出地讲解了Agent的概念和发展,还通过详细的工具介绍和实战案例,帮助读者快速掌握
    发表于 03-18 12:03

    中兴通讯亮相2025年世界移动通信大会

    近日,中兴通讯携全队列多形态AI终端亮相世界移动通信大会(MWC25巴塞罗那),为全球用户带来全场景AI体验。
    的头像 发表于 03-10 10:12 ?783次阅读

    AI Agent 应用与项目实战》----- 学习如何开发视频应用

    再次感谢发烧友提供的阅读体验活动。本期跟随《AI Agent 应用与项目实战》这本书学习如何构建开发一个视频应用。AI Agent是一种智能应用,能够根据用户需求和环境变化做出相应响应。通常基于深度
    发表于 03-05 19:52

    FPGA+AI王炸组合如何重塑未来世界:看看DeepSeek东方神秘力量如何预测......

    ”“大模型圈的大黑马”“硅谷震惊了”“来自中国的学霸级AI”…… 从智能手机到自动驾驶,从数据中心到物联网,FPGA 正悄然改变着我们的生活。未来,FPGA 又将如何塑造世界?DeepSeek 带你一起
    发表于 03-03 11:21

    传音深耕小语种AI语音技术 赋能新兴市场用户智慧生活

    在科技飞速发展的当下,AI已成为全球科技浪潮的弄潮儿。据移动应用分析机构SensorTower数据显示,2024年全球手机用户AI聊天机器人和AI
    的头像 发表于 02-25 11:29 ?711次阅读
    传音深耕小语种<b class='flag-5'>AI</b>语音技术 赋能新兴市场<b class='flag-5'>用户</b>智慧生活

    AI赋能边缘网关:开启智能时代的新蓝海

    在数字化转型的浪潮中,AI与边缘计算的结合正掀起一场深刻的产业变革。边缘网关作为连接物理世界与数字世界的桥梁,在AI技术的加持下,正从简单的数据采集传输节点,进化为具备智能决策能力的边
    发表于 02-15 11:41

    全球手机用户2024年为AI应用消费超12亿美元

    据最新数据显示,全球手机用户在2024年为AI应用,特别是AI聊天机器人和AI艺术生成工具的消费金额达到了惊人的12.7亿美元。这一数据由知
    的头像 发表于 02-05 16:11 ?539次阅读

    AI基础数据服务是AI产业的关键支撑

    数据、算法和算力是构建AI系统的三大核心要素,三者的协同使现代AI技术实现了从理论到应用的飞跃。算法是处理信息、提取特征、进行预测的逻辑框架;算力支持算法处理庞人和复杂的数据集,使得研究人员能够探索
    的头像 发表于 12-13 15:45 ?769次阅读
    <b class='flag-5'>AI</b>基础数据服务是<b class='flag-5'>AI</b>产业的关键支撑

    人工智能ai4s试读申请

    目前人工智能在绘画对话等大模型领域应用广阔,ai4s也是方兴未艾。但是如何有效利用ai4s工具助力科研是个需要研究的课题,本书对ai4s基本原理和原则,方法进行描诉,有利于总结经验,拟按照要求准备相关体会材料。
    发表于 09-09 15:36

    FMEA:解锁AI用户体验新境界,直击用户心坎的智能钥匙

    在复杂多变的AI系统中,FMEA不仅仅是传统制造业中预防缺陷的工具,它更是一把解锁AI用户体验新境界的钥匙。通过系统地识别、评估AI系统可能面临的失效模式及其对
    的头像 发表于 09-05 11:02 ?707次阅读