【导读】2022年有哪些人工智能的突破?今天,李飞飞高徒Jim Fan盘点了年度十大AI亮点。
人工智能的爆炸正在扭曲我们的时间感。
你能相信Stable Diffusion只有4个月大,而ChatGPT的出现还不到一个月吗?
打个形象的比喻,只要眨一下眼,你就会错过一个全新的行业。2022年的AI领域,大规模的生成模型像雨后春笋一样地冒出,改变了整个AI界的格局。
而且,这些模型正在迅速走出实验室,在现实中被应用。
比如,LLM技术就启发了两个新兴的领域——决策代理(游戏、机器人等等)和 AI4Science。
李飞飞高徒Jim Fan为我们总结了2022年的十大AI高光时刻。让我们把时间倒转,看看2022年都有哪些令人惊叹的AI突破。
DALLE-2是第一个可以从任意标题生成逼真的高分辨率图像的大规模扩散模型。
它启动了AI的艺术革命,催生了许多新的应用程序、初创公司和思维方式。

但 DALLE-2被保护在OpenAI的围墙后面,并没有开源。
在OpenAI之后,LMU的StabilityAI和runwayml迈出了英勇的一步,基于「潜在扩散」算法训练了他们自己的互联网规模的text2image模型。他们称该模型为「稳定扩散」,并开源了代码和权值(weighs)。

另外,今年还有来自GoogleAI的两个image2text模型。GoogleAI既没有发布模型也没有发布API,但从论文中,我们仍然可以看到不少有趣的见解。
Imagen
https://imagen.research.google
Parti
https://parti.research.google。它是一个没有diffusion的Transformer模型。

ChatGPT和GPT-3.5都使用了一种叫做RLHF(「从人类反馈中强化学习」)的新技术。
这也就意味着,提示工程或许很快就会消失了。
ChatGPT的流行,已经催生了一波新的创业公司和竞争者,比如Jasper Chat、YouChat、Replit的Ghostwriter chat,以及perplexity_ai。
这些竞争者提供了如此直观的搜索方式,连谷歌的高管们都开始出汗了! 三、文本- 机器人模型如何给GPT提供胳膊和腿,让它们能打扫你混乱的厨房?与NLP不同,机器人模型需要与物理世界互动。
在今年,大的预训练Transformer终于开始解决机器人领域最难的问题了!VIMA
10月,我和同事创建了一个 「机器人GPT 」——名为VIMA的tranformer。它可以接收任何混合的文本、图像和视频作为prompt,并输出机器人手臂的控制。我们的模型被称为VIMA(「VisuoMotor Attention」),已经完全开源了。现在,单个智能体已经能够解决视觉目标、视频的一次性模仿、新概念基础、视觉约束等,具有了模型容量和数据的强大扩展性。
RT-1
沿着与VIMA类似的路径,来自GoogleAI的研究人员发布了RT-1,这是一种在700项任务和130K的人类演示上训练的机器人transformer。
这些数据是由13个机器人在17个月内收集的,是字面意义上的钢铁部队!
如果我们可以做text2image,那为什么不在里面加上时间轴,来获得额外的乐趣呢?
目前,文本 - 视频领域有3个重大的工作,但没有一个是开源的。Make-A-Video
首先是Meta AI的Make-A-Video:不需要成对的文本-视频数据,就可以得到文本-视频的生成。
您可以在此处注册试用访问权限:https://makeavevideo.studio

Imagen Video
Google AI的Imagen Video:它能使用扩散模型生成高清视频,基于Imagen静态图像生成器。
演示:http://imagen.research.google/video/


Phenaki
来自谷歌AI的Phenaki: 从开放领域的文本描述中生成可变长度的视频。
演示:https://phenaki.video

DreamFusion
首先登场的,是Google AI研究团队与UC Berkeley联合开发的DreamFusion。

该模型使用二维文本到图像的扩散模型来执行文本到三维的合成。
基于NeRF算法,DreamFusion可以通过给定文本生成3D模型。
Magic3D
第二项成果,是英伟达AI团队的两个项目,名为GET3D和Magic3D。


Magic3D论文链接:https://arxiv.org/pdf/2211.10440.pdf
GET3D仅使用二维图像进行训练,可生成具有高保真纹理和复杂几何细节的三维图形。
该模型允许用户立即将其形体导入3D渲染器和游戏引擎,以便进行后续编辑。
Magic3D与DreamFusion类似,使用文本到图像模型生成2D图像,然后优化为体积NeRF(神经辐射场)数据,将低分辨率生成的粗略模型优化为高分辨率的精细模型。
Point-E
继年初推出的DALL-E 2用天才画笔惊艳所有人之后,周二OpenAI发布了最新的图像生成模型「POINT-E」,它可通过文本直接生成3D模型。

论文链接:https://arxiv.org/pdf/2212.08751.pdf
相比竞争对手们(如谷歌的DreamFusion)需要几个GPU工作数个小时,POINT-E只需单个GPU便可在几分钟内生成3D图像。
《我的世界》是一款测试AI通用智能的绝佳游戏。首先,它是一款无限开放的沙盒游戏,极度体现玩家的创造力。
其次,该游戏有1.4亿的玩家群体,是英国总人口的两倍。用户基础如此庞大,供AI学习的游戏数据可谓是源源不绝。
那么,AI能否和人类一样尽情挥洒想象力呢?
Jim Fan和同事合作开发了第一个玩《我的世界》的AI「MineDojo」,它可以在自然语言提示下解决许多任务。

论文链接:https://arxiv.org/pdf/2206.08853.pdf
Fan的最终目标是建立一个「具身的ChatGPT」。目前,MineDojo平台已经完全开源。
与此同时,Jeff Clune的团队宣布了一个名为视频预训练(VPT)的模型,该模型可以直接输出键盘和鼠标的动作。

论文链接:https://arxiv.org/pdf/2206.11795.pdf
VPT拥有更广阔的视野,但不受语言条件的限制。在这点上,MineDojo和VPT恰好相辅相成。 七、AI外交官Meta AI推出的CICERO是第一个在《外交》游戏中实现人类水平表现的人工智能智能体。
论文链接:https://arxiv.org/pdf/2212.04356.pdf
Whisper经过了来自网络的680,000小时音频数据的训练。Open AI强调,Whisper的语音识别能力已达到人类水准。
论文链接:https://www.nature.com/articles/s41586-021-04301-9
同样在本月,美国能源部宣布了一项巨大的突破:人类首次实现了核聚变反应的净能量增益!
7月,DeepMind宣布了「蛋白质宇宙」——将AlphaFold的蛋白质数据库扩展到2亿个结构!
此外,英伟达AI研究团队还拓展了BioNeMo大型语言模型的框架,以帮助生物技术公司和研究人员生成、预测和理解生物分子数据。
视频讲解:https://www.youtube.com/watch?v=PWcNlRI00jo&t=4399s
以上便是Jim Fan对2022年十大AI亮点的盘点。当然,Fan也表示,还有无数令人兴奋的作品为人工智能的进步做出了贡献。每篇论文都是AI大厦里的一砖一瓦,所有的努力都应该庆祝。
不过,Fan在最后也强调,随着人工智能系统变得越来越强大,我们必须意识到潜在的危险和风险,并采取措施减轻它们。
无论是通过仔细的培训设计、适当的监督还是全新的保障方法,人工智能的安全与伦理成为越来越的AI专家所讨论的议程。
毫无疑问,2022年是充满奇迹的一年,也是令人惊叹的一年。未来一年又会有什么震惊世界的突破?我们与你一起关注。参考资料:
https://twitter.com/drjimfan/status/1607746957753057280?s=46&t=OVM_4zdRW2rQwqLohMdPpw
END
欢迎加入Imagination GPU与人工智能交流2群
(添加请备注公司名和职称)
推荐阅读 对话Imagination中国区董事长:以GPU为支点加强软硬件协同,助力数字化转型ICCAD 2022圆满落幕,Imagination异构计算引领“芯”未来

原文标题:李飞飞高徒盘点年度十大AI亮点:核聚变、ChatGPT、AlphaFold上榜
文章出处:【微信公众号:Imagination Tech】欢迎添加关注!文章转载请注明出处。
-
imagination
+关注
关注
1文章
603浏览量
62398 -
ChatGPT
+关注
关注
29文章
1591浏览量
9255
原文标题:李飞飞高徒盘点年度十大AI亮点:核聚变、ChatGPT、AlphaFold上榜
文章出处:【微信号:Imgtec,微信公众号:Imagination Tech】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
2024年存储行业十大事件盘点

松盛光电荣膺2024年度中国十大光学产业技术应用类奖
人造太阳再升级!中国核聚变实现「双亿度」突破

核聚变商用加速丨电源控制系统国产化解决方案

托卡马克装置:探索可控核聚变的前沿利器
托卡马克装置:探索可控核聚变的前沿利器

兆芯KX-7000荣获2024年度十大信创CPU产品
年度电解槽十大品牌+年度制氢十大供应商,稳石氢能荣获两大奖项!
东软三家客户入选2024年度推进医改服务百姓健康十大新举措
比亚迪海豹荣获日本年度风云车十大最佳车型奖
敦泰荣获车载显示年度十大知名品牌
全国产PSM高压电源控制系统,助力核聚变技术发展

可控核聚变解决方案
解决方案丨持续注能人造太阳装置,助力我国可控核聚变技术研究

解决方案丨持续注能人造太阳装置,助力我国可控核聚变技术研究

评论