0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

OpenAI全新GPT-4o能力炸场!速度快/成本低,能读懂人类情绪

Carol Li ? 来源:电子发烧友 ? 作者:李弯弯 ? 2024-05-15 00:15 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/李弯弯)当地时间5月13日,OpenAI举行春季发布会,宣布将推出桌面版ChatGPT,并发布全新旗舰AI模型GPT-4o。

根据OpenAI官方网站介绍,GPT-4o中的“o”代表Omni,也就是“全能”的意思。GPT-4o文本、推理、编码能力达到GPT-4 Turbo水平,速度是上一代AI大模型GPT-4 Turbo的两倍,但成本仅为GPT-4 Turbo的一半,视频音频功能得到改善。

GPT-4o速度更快,且能感知用户情绪

根据OpenAI介绍,GPT-4o与GPT-3.5、GPT-4的语音对谈机制不同。GPT-3.5和GPT-4会先将音频转换为文本,再接收文本生成文本,最后将文本转换为音频,经历这三个过程,音频中的情感表达等信息会被折损,而GPT-4o是跨文本、视觉和音频的端到端模型,是OpenAI第一个综合了这些维度的模型,可更好进行对谈。

OpenAI技术负责人Mira Murati表示:“这是我们第一次在易用性方面真正迈出的一大步。”OpenAI研究员Mark Chen表示,新模型具有“感知情绪”的能力,能输出笑声、歌唱或表达情感,还可以处理用户打断它的情况。

GPT-4o极大地改进了OpenAI的AI聊天机器人ChatGPT的体验。在发布会上,OpenAI研究主管Mark Chen和OpenAI的后训练团队负责人Barret Zoph通过现场演示展示出了新模型GPT-4o的强大。

如在演示对话中,Mark Chen表现得有点紧张,然后开始急促地呼吸。当GPT-4o听到Chen过度呼气时,它似乎从中察觉到了他的紧张,并说到:别紧张,你喘得像个吸尘器,深呼吸,再吐气。接着GPT开始指导Chen怎么深吸慢呼平复心情。

在另一段对话演示中,Chen让GPT给Zoph讲个睡前故事哄他入睡,Chen反复打断GPT的讲述,问它能不能讲得更刺激点,最后GPT用非常迪士尼的方式唱出了一个故事。

GPT-4o还可以通过视觉识别检测人的情绪。在一个演示中,Zoph将手机举到自己面前正对着脸,要求ChatGPT告诉他自己长什么样子。GPT-4o注意到了Zoph脸上的微笑,对他说:“看起来你感觉非常快乐,喜笑颜开。”

GPT-4o也能够进行实时快速翻译,OpenAI技术负责人Mira Murati在现场对ChatGPT说起了意大利语,GPT则将她的话翻译成英语。

OpenAI首席执行官山姆·奥特曼(Sam Altman)表示,新的语音和视频模式是他用过的最好的电脑界面,感觉就像电影里的AI。达到人类水平的反应时间和表达能力是一个很大的变化。

Sam Altman谈到:“对我来说,与电脑交谈从来都不是一件很自然的事,现在它做到了。随着我们增加(可选的)个性化、访问你的信息、代表你采取行动的能力等等,我真的可以看到一个令人兴奋的未来,我们能够使用计算机做比以往任何时候都多的事情。”

GPT-4o功能未来将会进一步发展

自发布之日,GPT-4o可在ChatGPT的免费版本中使用,并提供给OpenAI的高级ChatGPT Plus和Team计划订户,具有“5倍更高”的消息限制。OpenAI指出,当用户达到速率限制时,ChatGPT将自动切换到GPT-3.5。

OpenAI称,基于GPT-4o的ChatGPT文本和图像输入功能将于本周一上线,语音和视频选项将在未来几周内推出。另外,OpenAI将在未来1个月左右向Plus用户推出基于GPT-4o改进的语音体验,目前GPT-4o的API并不包含语音功能。

OpenAI指出,在API使用方面,相比去年11月发布的GPT-4-turbo,GPT-4o价格降低一半。成本下降对于大模型的调用至关重要。OpenAI开始致力于将大模型推向市场。

另外据Murati介绍,GPT-4o的功能在未来将会进一步发展。比如,尽管目前GPT-4o可以查看不同语言的菜单照片并进行翻译,但未来,该模型可能使ChatGPT能够观看直播的体育比赛并向您解释规则。

Murati表示:“我们知道这些模型变得越来越复杂,但我们希望交互体验实际上变得更加自然、简单,您不需要关注UI,而只需专注于与ChatGPT的合作。”

对于大家一直关注的安全性问题,OpenAI也重点提及。据称,通过过滤训练数据和训练后改进模型行为等技术,GPT-4o在设计中内置了跨模式的安全性,并创建了新的安全系统,为语音输出提供护栏。

GPT-4o还与来自社会心理学、偏见和公平、错误信息等领域的70多名外部专家开展广泛的外部合作,以识别新增加的模式引入或放大的风险,提高与GPT-4o互动的安全性。

OpenAI表示,将继续减少新发现的风险。由于认识到GPT-4o的音频模式存在各种新的风险,目前公开的是文本和图像输入以及文本输出,在接下来的几周和几个月里将围绕技术基础设施、训练后的可用性、发布其他模式所需的安全性开展工作,例如音频输出将仅限于选定的预设声音,并将遵守现有安全政策。

写在最后

可以看到,大模型技术正在快速发展,而OpenAI新模型GPT-4o无疑又将大模型技术和应用推向了一个新高度。目前全球科技厂商都在积极角逐,微软、谷歌等头部企业都纷纷召开发布会,密集推出大模型产品,苹果传言也已与OpenAI达成协议,在 iPhone使用其技术。不难看到,接下来大模型无论是在技术升级还是应用落地上都将会呈现一番新景象。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • GPT
    GPT
    +关注

    关注

    0

    文章

    368

    浏览量

    16346
  • OpenAI
    +关注

    关注

    9

    文章

    1220

    浏览量

    9116
  • ChatGPT
    +关注

    关注

    29

    文章

    1591

    浏览量

    9265
  • AI大模型
    +关注

    关注

    0

    文章

    384

    浏览量

    715
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    OpenAI发布o1大模型,数理化水平比肩人类博士,国产云端推理芯片的新蓝海?

    时间思考后再做出回答,而传统大模型是直接给出回答,但往往这个回答并不准确。 ? OpenAI介绍称,OpenAI o1模型解决了很多传统模型,包括目前最强大模型OpenAI
    发表于 09-14 00:04 ?1895次阅读
    <b class='flag-5'>OpenAI</b>发布<b class='flag-5'>o</b>1大模型,数理化水平比肩<b class='flag-5'>人类</b>博士,国产云端推理芯片的新蓝海?

    从性能到商业,Grok3、GPT-4o、DeepSeek如何重塑AI版图?

    2025年2月,AI领域仿佛上演了一激烈的“诸神之战”,马斯克旗下xAI发布的Grok3、OpenAI推出的GPT-4o以及持续凭借R1模型大放异彩的DeepSeek,三大巨头强势登场,让AI
    的头像 发表于 02-19 18:14 ?1183次阅读
    从性能到商业,Grok3、<b class='flag-5'>GPT-4o</b>、DeepSeek如何重塑AI版图?

    马斯克发布Grok 3大模型,超越GPT-4o

    多项benchmark测试中,Grok 3取得了比DeepSeek-v3、GPT-4o以及Gemini-2 pro更优的效果。这一成绩无疑彰显了Grok 3在人工智能领域的卓越实力。 值得一提的是,Grok 3已经在xAI内部运行了两周时间,经过了初步的测试和验证。马斯克在发布预告时,曾称其为“地球上最
    的头像 发表于 02-19 13:50 ?504次阅读

    OpenAI宣布GPT 4o升智计划

    近日,全球领先的人工智能公司OpenAI迎来了一项重要宣布。OpenAI的首席执行官Sam Altman正式揭晓了GPT 4o的升智计划,这一消息立即引起了业界的广泛关注。 据Sam
    的头像 发表于 02-17 14:24 ?665次阅读

    OpenAI即将推出GPT-5模型

    OpenAI首席执行官奥尔特曼近日宣布了一项重要消息:OpenAI将在今年未来几个月内推出全新GPT-5模型。这一消息引起了业界的广泛关注和期待。 据了解,
    的头像 发表于 02-13 11:21 ?696次阅读

    OpenAI报告GPT-4o4o-mini模型性能下降,正紧急调查

    近日,全球领先的AI研究机构OpenAI发布了一份事故报告,引起了业界的广泛关注。报告中指出,OpenAI目前正面临GPT-4o4o-mini这两款重要模型性能下降的问题。 据
    的头像 发表于 01-23 10:22 ?934次阅读

    赶紧在本地运行与OpenAI-o1能力近似的DeepSeek-R1模型

    类似GPT4-V的能力:MiniCPM-V 2.6 》。本文将分享在本地运行能与OpenAI-o1 能力相媲美的 DeepSeek-R1? 模型。 [编者注]:
    的头像 发表于 01-21 14:29 ?3955次阅读
    赶紧在本地运行与<b class='flag-5'>OpenAI-o</b>1<b class='flag-5'>能力</b>近似的DeepSeek-R1模型

    OpenAIGPT-4o4o-mini模型性能下降,正展开调查

    近期,OpenAI发布了一份事故报告,指出其GPT-4o4o-mini模型遭遇了性能下降的问题。这一消息引起了业界的广泛关注和讨论。 据OpenAI官方透露,他们目前正在积极调查这一
    的头像 发表于 01-21 10:34 ?724次阅读

    OpenAI GPT-5开发滞后:训练成本高昂

    近日,据最新消息,OpenAI在推进其备受期待的下一代旗舰模型GPT-5的开发进程上遇到了困难。由于计算成本高昂且高质量训练数据稀缺,GPT-5的开发已经落后于原定计划半年之久。 据悉
    的头像 发表于 12-23 11:04 ?1084次阅读

    OpenAI发布o1模型API,成本大幅下降60%

    下降。 据OpenAI介绍,o1模型API的思考成本相较于预览版本降低了60%,同时附带了高级视觉功能,为用户提供了更加丰富和多样化的使用体验。此外,GPT-4o的音频
    的头像 发表于 12-19 10:31 ?749次阅读

    OpenAI正式推出Canvas:写作编码新平台,支持Python

    近日,OpenAI在连续发布新功能的节奏中,正式向全体ChatGPT用户开放了全新交互界面Canvas。这款工具基于OpenAI最新的GPT-4o模型,旨在为用户提供一个强大的写作和编
    的头像 发表于 12-12 10:06 ?784次阅读

    解锁 GPT-4o!2024 ChatGPT Plus 代升级全攻略(附国内支付方法)

    ChatGPT Plus 每月 20 美元,OpenAI 承诺 Plus 用户享有更快的响应速度、优先使用新功能及最新模型,包括强大的 GPT-4o。本文将分享 2024 年 ChatGPT
    的头像 发表于 10-29 18:17 ?2740次阅读

    科大讯飞发布讯飞星火4.0 Turbo:七大能力GPT-4 Turbo

    超过GPT-4 Turbo,数学能力和代码能力更是超过了Open AI最新一代GPT模型GPT-4o。此外,其效率相对提升50%。
    的头像 发表于 10-24 11:39 ?1181次阅读

    内存储器的特点是速度快成本低容量小对吗

    内存储器,通常指的是计算机系统中的随机存取存储器(RAM),是计算机硬件的重要组成部分。它负责存储计算机运行时的数据和程序,以便处理器快速访问。内存储器的特点包括速度快、容量相对较小,但成本并不是
    的头像 发表于 10-14 10:05 ?1722次阅读

    OpenAI解锁GPT-4o定制功能,助力企业精准优化AI应用

    在8月21日的最新动态中,OpenAI 宣布了一项革命性的新功能,正式向企业用户开放其顶尖AI模型GPT-4o的定制能力。这一举措标志着OpenAI在激烈的企业级AI应用市场中迈出了重
    的头像 发表于 08-21 16:06 ?823次阅读