最近来自马克斯?普朗克计算机科学研究所、MIT CSAIL和谷歌的研究者们研究了一种控制GAN的新方法DragGAN,这项技术的特点是,用户只要点击拖拽,就可以“改变汽车的尺寸或者将人物的笑容变成皱眉”。
其中演示的案例包括增加山峰的高度、改变模特的姿势和衣服的长度以及形状、张开或闭合狮子的嘴巴、将一个人的表情从平淡变成微笑等。
DragGAN是一个直观的图像编辑工具PM系统,用户只需要控制图像中的像素点和方向,就可以快速调整照片主体的位置、姿态、表情、大小和角度等。
而根据他们的说法,他们的方法是基于GAN的操作中优于SOTA,并为图像编辑开辟了新方向。
这种工具的潜力主要表现在,从文本生成图像的人工智能并不总是能输出你想要的结果,同时用户还可以在生成图像之后再进行重新编辑,而且不用重新生成新的图像。
以上源自互联网,版权归原作所有
审核编辑黄宇
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
AI
+关注
关注
88文章
35758浏览量
282462
发布评论请先 登录
相关推荐
热点推荐
任正非说 AI已经确定是第四次工业革命 那么如何从容地加入进来呢?
实践。
为开源项目贡献代码或者文档。比如,帮助完善一个机器学习数据集的加载模块的代码,或者撰写某个AI算法的使用说明文档。这不仅可以提升自己的技术能力,还能在AI社区中建立自己的声誉。
发表于 07-08 17:44
迅为RK3568开发板Dev-Eco studio 的界面布局-导航栏-代码编辑区
前显示行号 +- 按钮可以按照模块折叠代码。
ctrl+鼠标滚轮放大或者缩小代码字体。
按住鼠标左键,拖动文件,可以分屏展示。
发表于 06-20 11:12
首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手
模型库的限制,联发科还首发了开源弹性架构。区别于过往的开放接口,只能部署特定架构模型,开放弹性架构允许开发者直接调整平台源代码,无需等待芯片厂商的支持,即可完成目标或其他自研大模型轻松部署。让AI
发表于 04-13 19:52
开源的AI MPU
1. 基于RISC-V的开源AI MPU/加速器 ? ?**(1) SiFive Intelligence系列**? ? 特点 ?:SiFive提供开源的RISC-V IP核,支持AI
声云AI语音鼠标开启智能办公新时代
在数字化飞速发展的当下,人们对输入设备的效率和便捷性有了更高的追求。传统鼠标只能实现基本的指针控制,在文字输入场景下,键盘输入速度受限且在特殊环境中使用不便。而声云 AI 语音鼠标方案的问世,正是为了满足用户对高效、便捷输入的迫
Banana Pi 与瑞萨电子携手共同推动开源创新:BPI-AI2N
对技术创新的共同追求,也为开源硬件行业的发展带来了更多可能性。BPI-AI2N & BPI-AI2N Carrier 将在 2025年3月11日-13日德国纽伦堡嵌入式世界展会
发表于 03-12 09:43
AI潮流下的办公“神器”选择,沸蛇AI语音鼠标真正实现效率翻倍
年终临近,各种考核、汇报、总结也随之而来,忙上天的白领们不得闲暇。事实上,许多流程化、模板化的工作并非困难模式,只是处理起来比较费时,这个时候AI就可以帮上忙。沸蛇AI语音鼠标就是一款能够帮助办公

字节发布SeedEdit图像编辑模型
,SeedEdit模型凭借其强大的技术实力,支持用户通过一句简单的自然语言描述,即可轻松实现对图像的多种编辑操作。无论是修图、换装、美化,还是转化风格、在指定区域添加或删除元素等复杂任
Llama 3 与开源AI模型的关系
在人工智能(AI)的快速发展中,开源AI模型扮演着越来越重要的角色。它们不仅推动了技术的创新,还促进了全球开发者社区的合作。Llama 3,作为一个新兴的
Freepik携手Magnific AI推出AI图像生成器
近日,设计资源巨头Freepik携手Magnific AI,共同推出了革命性的AI图像生成器——Freepik Mystic,这一里程碑式的发布标志着AI
评论