0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ChatGPT的核心算法为何如此强大?

新思科技 ? 来源:未知 ? 2023-03-17 18:10 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

ChatGPT近期成为了全球话题中心。短短两个月,ChatGPT注册用户数已经破亿,成为史上用户破亿速度最快的软件之一。它不但可以回答问题,还能写诗,写代码,提供旅游攻略…而ChatGPT的核心结构正是Transformer模型。

Transformer是一种能够同时处理所有输入数据的深度学习模型,最初是为翻译和自动问答等自然语言处理应用开发的。计算机视觉应用领域过去主要采用卷积神经网络(CNN),现在Transformer模型则更为流行,但它不会取代CNN,而是与之配合来提高视觉处理应用的准确度。

比如,当自动驾驶汽车在行驶过程中遇到障碍物,它是如何判断马路中间的是人,而不是电线杆呢?自动驾驶汽车的物体检测和防撞系统必须正确识别前方路况并给车辆发出相应的指令。在现代汽车的计算机视觉处理应用中,深度学习模型就发挥着重要作用。

除了汽车会采用AI驱动的计算机视觉技术外,摄像头如今已经在很多系统中都普及开了,手机和安防系统等大量基于摄像头的设备都已经在使用神经网络来提高图像质量和准确性了。

为何Transformer是嵌入式计算机视觉的理想选择呢?Transformer又将如何改变深度学习架构的发展方向?哪些技术可以优化这些模型来获得更出色的结果?本文将带着这些问题与大家共同探讨。

更专注的注意力机制

更好的情景感知

10多年来,CNN一直是视觉处理的首选深度学习模型。随着技术的不断发展,CNN现已能够准确地完成图像分类、物体检测、语义分割(对图像中的每个像素进行分组或标记)和全景分割(识别物体位置以及对每个物体中的每个像素进行分组和标记)。

但Transformer除了需要将语言块替换为图像块外,不需要任何其他修改就可以在准确性方面超越CNN。

2017年,Google Research将Transformer定义为一种基于自注意力机制的新型神经网络架构,特别适合用于语言理解。到2020年,Google Research的科学家们发表了一篇关于Vision Transformer(ViT)的文章,ViT是一个基于原始Transformer架构的模型。据该文章表示,当有足够的数据进行训练时,ViT表现出了优异的性能,超过了先进的CNN,而所需的计算资源却只有CNN的四分之一。这些Transformer虽然需要庞大的数据集进行训练,但确实非常擅于处理图像分类和物体检测等视觉任务。

Transformer之所以能够在视觉应用中游刃有余,其专有的注意力机制是关键,该机制让模型能够对特定情境有更深入的理解。Transformer和CNN一样都可以检测到前方道路上的物体是行人,而不是电线杆或者一棵树,但不同的是,Transformer并不会同等处理所有像素,它更多关注的是数据中微小但重要的部分,比如那个行人,而不太会去过多关注代表道路其余部分的那些不重要像素。

在处理每帧数据时,CNN通常并不会考虑该帧之前和之后的数据。而相比CNN,Transformer更擅于学习较为复杂的模式,因此所需的计算也就更多,所以在速度方面Transformer没有CNN快,但它也在努力的奋起直追了。

GPU目前可以支持这二种模型,但如果在实际应用中需要以更小的尺寸和更低的功耗来实现更高的性能,那么NPU或神经处理单元等专用AI加速器将会是更好的选择。

为了提高推理效率,视觉处理应用可同时使用CNN和Transformer。要想实现全方位视觉感知,仅靠纯视觉模型可能无法轻松获得所需的信息,而多模态学习可以提供更详尽的视觉信息。此外,Transformer等基于注意力机制的神经网络非常适合像汽车应用这种集成了多个传感器的应用。

利用NPUIP优化

Transformer和CNN的性能

Transformer包括以下几种运算:

  • 矩阵乘法

  • 逐元素加法

  • Softmax数学函数

  • L2归一化

  • 激活函数

目前大多数AI加速器都针对CNN进行了优化,但它们并非全都适合Transformer。Transformer需要庞大的计算能力来执行大量计算并支持其注意力机制。

新思科技的ARC NPX6 NPU IP就是一款能够同时处理CNN和Transformer的AI加速器。ARC NPX6 NPU IP的计算单元包括一个用于矩阵乘法(对这两种深度学习模型都非常重要)的卷积加速器,以及一个用于处理Transformer运算和激活函数的张量加速器。该IP提供高达3,500 TOPS的性能和高达30 TOPS/瓦的出色能效。

设计团队还可以使用新思科技的MetaWare MX开发工具包来加速其应用软件开发。该工具包提供了一个综合的软件编程环境,其中包括神经网络软件开发工具包和对各种虚拟模型的支持。

ChatGPT安全吗?

在ChatGPT爆火的背后,我们也要知道,ChatGPT或者其他AI软件所产出的内容或做出的决策并不是无懈可击的。这些工具提供的结果往往会和现实有所偏差,而只有人类才能基于现实去对结果进行检查和验证。

而且是否会有人利用ChatGPT编写恶意代码来进行网络攻击呢?自从人类开始编写代码以来,开发人员一直都在无意或者有意地编写出可被利用的代码。幸运的是,有很多安全测试工具可以帮助开发者们进行安全防护。无论编码者是谁,都应该使用安全工具扫描源代码发现漏洞。

总结

Transformer拥有强大的计算能力,且一直在自然语言处理应用中被广泛采用。现在,因Transformer模型基于其注意力机制的神经网络拥有更出色的情感感知能力,智能手机、安防系统、自动驾驶汽车等实时视觉处理应用也开始采用此模型。以后,各种基于摄像头的产品会越来越先进,提供的图像质量也越来越高。在深度学习中加入Transformer后,嵌入式视觉摄像头系统势必能够提供更清晰的图像和更准确的物体检测。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 新思科技
    +关注

    关注

    5

    文章

    872

    浏览量

    51658

原文标题:ChatGPT的核心算法为何如此强大?

文章出处:【微信号:Synopsys_CN,微信公众号:新思科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    三坐标测量机路径规划与补偿技术:核心算法解析

    三坐标测量的微米级精度背后,是精密的路径规划算法与实时补偿技术在保驾护航。三坐标测量机的智能避撞算法保障了测量的安全与高效;温度补偿技术消除了环境的无形干扰;点云智能处理则让海量数据蜕变为精准的工程
    的头像 发表于 08-01 14:15 ?289次阅读
    三坐标测量机路径规划与补偿技术:<b class='flag-5'>核心算法</b>解析

    shimetapi:开源RGB+EVS视觉融合相机事件相机工具链与算法

    的接口控制和算法处理。 一、shimetapi_Hybrid_vision_algo (算法层 SDK) 定位: 这是 SDK 的核心算法处理层,位于架构的中间层(黄色部分)。 核心
    的头像 发表于 06-26 13:52 ?199次阅读

    FLIR Si2x系列声学成像仪的五大优势

    在防爆行业,安全与效率是企业运营的重中之重,FLIR Si2x系列声学成像仪,凭借其卓越的性能和广泛的应用场景,成为了众多用户的佳选,那么它为何如此受欢迎呢?
    的头像 发表于 06-13 11:29 ?463次阅读

    交流电机EMC整改:电磁兼容问题为何成为核心挑战

    深圳南柯电子|交流电机EMC整改:电磁兼容问题为何成为核心挑战
    的头像 发表于 05-28 11:19 ?300次阅读
    交流电机EMC整改:电磁兼容问题<b class='flag-5'>为何</b>成为<b class='flag-5'>核心</b>挑战

    电网波动测试为何如此重要?

    电网中常会因雷击、短路故障、大功率设备启动、电网切换或负载突变等原因,可能会导致如设备停机、异常重启、医疗设备断电危及患者等严重后果,那么该如何避免呢?电网中常会因雷击、短路故障、大功率设备启动、电网切换或负载突变等原因,出现电压暂降(Dip)、短时中断(Interruption)或电压波动(Variation),可能会导致如设备停机、异常重启、医疗设备断电
    的头像 发表于 03-31 11:40 ?272次阅读
    电网波动测试<b class='flag-5'>为何如此</b>重要?

    和安信可Ai-M61模组对话?手搓一个ChatGPT 语音助手 #人工智能 #

    ChatGPT
    jf_31745078
    发布于 :2025年03月12日 15:56:59

    ChatGPT Plus 2025新功能抢先看:如何订阅与使用全攻略

    您是否想了解2025年ChatGPT Plus的强大功能以及如何轻松订阅?本文将为您深度剖析ChatGPT Plus的核心功能、独特优势,并提供详细的订阅教程。 一、基础功能再进化:更
    的头像 发表于 02-13 19:59 ?1011次阅读

    ChatGPT新增实时搜索与高级语音功能

    。OpenAI对搜索算法进行了深度优化,使得ChatGPT能够在用户提出问题后,迅速获取到分钟级别的最新信息,包括股票、新闻等。这一功能的加入,极大地满足了用户对即时数据的需求,使得ChatGPT在各类应用场景中更加得心应手。
    的头像 发表于 12-17 14:08 ?674次阅读

    OpenAI发布满血版ChatGPT Pro

    科技巨头OpenAI近期宣布了一项重大更新,正式推出了其备受期待的“满血版”ChatGPT Pro。这一新版本基于全新的推理模型o1,旨在为用户提供更为强大的处理能力和更高质量的回答。 据了解
    的头像 发表于 12-06 11:10 ?859次阅读

    OpenAI推出Windows桌面版ChatGPT应用

    Embiricos介绍,这款桌面版ChatGPT应用不仅继承了原有版本的强大功能,还新增了多项实用特性,旨在让用户在不中断当前工作流程的情况下,轻松启动新的对话或继续之前的讨论。 该应用支持语音交互和图像识别功能,用户只需通过简单的“Alt+空格”组合键,即可快速调用
    的头像 发表于 11-18 14:04 ?748次阅读

    解锁 GPT-4o!2024 ChatGPT Plus 代升级全攻略(附国内支付方法)

    ChatGPT Plus 每月 20 美元,OpenAI 承诺 Plus 用户享有更快的响应速度、优先使用新功能及最新模型,包括强大的 GPT-4o。本文将分享 2024 年 ChatGPT
    的头像 发表于 10-29 18:17 ?2591次阅读

    怎样搭建基于 ChatGPT 的聊天系统

    搭建一个基于ChatGPT的聊天系统是一个涉及多个步骤的过程,包括理解ChatGPT的API、设计用户界面、处理数据和集成ChatGPT模型。以下是一个简化的指南,用于创建一个基本的聊天系统。 1.
    的头像 发表于 10-25 16:23 ?1065次阅读

    ChatGPT 适合哪些行业

    ChatGPT 是一种基于人工智能的自然语言处理技术,它能够理解和生成人类语言。这种技术在多个行业中都有广泛的应用潜力。以下是一些ChatGPT特别适合的行业,以及它在这些行业中可能的应用方式
    的头像 发表于 10-25 16:11 ?1038次阅读

    电网中防逆流为何如此重要?

    、可再生能源的广泛接入,电力逆流现象愈发频繁,防逆流装置的重要性也愈发凸显。本文将从防逆流装置的工作原理、使用场景及其实际应用效果等方面进行详细阐述。 一、防逆流装置的工作原理 防逆流装置的核心在于其内置的电力电子元件和控制逻辑
    的头像 发表于 09-23 15:31 ?953次阅读
    电网中防逆流<b class='flag-5'>为何如此</b>重要?

    跨阻放大器的的增益单位是dbΩ,如何如何换算成db?

    跨阻放大器的的增益单位是dbΩ,如何如何换算成db?
    发表于 08-19 06:28