0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

4种用于视频生成的尖端AI技术

倩倩 ? 来源:互联网分析沙龙 ? 2020-04-11 10:00 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

我们研究视频到视频的合成问题,其目的是学习从输入源视频(例如,一系列语义分割掩码)到精确描述源视频内容的输出真实感视频的映射功能。

虽然它的图像对应物(图像到图像合成问题)是一个受欢迎的话题,但是视频到视频合成问题在文献中很少探讨。在不了解时间动态的情况下,将现有的图像合成方法直接应用于输入视频通常会导致视觉质量低下的时间不连贯视频。

在本文中,我们提出了一种在生成对抗性学习框架下的新颖的视频合成方法。通过精心设计的生成器和鉴别器架构以及时空对抗目标,我们可以通过多种输入格式(包括分割蒙版,草图和姿势)获得高分辨率,逼真的,时间上连贯的视频结果。在多个基准上进行的实验表明,与强基准相比,我们的方法具有优势。

尤其是,我们的模型能够合成长达30秒的街道场景的2K分辨率视频,从而大大提高了视频合成的最新水平。最后,我们将我们的方法应用于未来的视频预测,其性能超过了几个最先进的竞争系统。

我们的模型能够合成长达30秒的街道场景的2K分辨率视频,从而大大提高了视频合成的最新水平。最后,我们将我们的方法应用于未来的视频预测,其性能超过了几个最先进的竞争系统。

我们的模型能够合成长达30秒的街道场景的2K分辨率视频,从而大大提高了视频合成的最新水平。最后,我们将我们的方法应用于未来的视频预测,其性能超过了几个最先进的竞争系统。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 视频
    +关注

    关注

    6

    文章

    1977

    浏览量

    74124
  • 模型
    +关注

    关注

    1

    文章

    3547

    浏览量

    50737
  • 生成器
    +关注

    关注

    7

    文章

    322

    浏览量

    22058
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    生成AI 重塑自动驾驶仿真:4D 场景生成技术的突破与实践

    生成AI驱动的4D场景技术正解决传统方法效率低、覆盖不足等痛点,如何通过NeRF、3D高斯泼溅等技术实现高保真动态建模?高效
    的头像 发表于 08-06 11:20 ?3504次阅读
    <b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 重塑自动驾驶仿真:<b class='flag-5'>4</b>D 场景<b class='flag-5'>生成</b><b class='flag-5'>技术</b>的突破与实践

    4K、多模态、长视频AI视频生成的下一个战场,谁在领跑?

    电子发烧友网报道(文/李弯弯) 6月11日,豆包App上线视频生成模型豆包Seedance 1.0 pro。这是字节跳动最新视频模型,支持文字与图片输入,可生成多镜头无缝切换的1080P高品质
    的头像 发表于 06-16 00:13 ?6550次阅读

    AI Agent 应用与项目实战》----- 学习如何开发视频应用

    ,也可以是自定义的模型。 配置视频生成的参数,如视频分辨率、帧率、时长等。同时,设置输入和输出的格式,确保AI助手能够正确地接收和处理视频生成请求。 设计并实现一个用户友好的前端界面,
    发表于 03-05 19:52

    字节跳动即将推出多模态视频生成模型OmniHuman

    字节跳动旗下一站式AI创作平台即梦AI即将迎来重大更新,全新多模态视频生成模型OmniHuman即将上线。这款模型是字节跳动自研的闭源模型,其强大的功能令人瞩目:仅需一张图片与一段音频,便能自动
    的头像 发表于 02-08 10:53 ?842次阅读

    阿里云通义万相2.1视频生成模型震撼发布

    近日,阿里云旗下的通义万相迎来了重要升级,正式推出了全新的万相2.1视频生成模型。这一创新成果标志着阿里云在视频生成技术领域的又一次重大突破。 据悉,万相2.1视频生成模型在多个方面实
    的头像 发表于 01-13 10:00 ?887次阅读

    华为云 Flexus 云服务器 X 实例 Windows 系统部署一键短视频生成 AI 工具 moneyprinter

    在追求创新与效率并重的今天,我们公司迎难而上,决定自主搭建一款短视频生成 AI 工具——MoneyPrinter,旨在为市场带来前所未有的创意风暴。面对服务器选择的难题,我们经过深思熟虑与多方比较
    的头像 发表于 12-30 09:10 ?706次阅读
    华为云 Flexus 云服务器 X 实例 Windows 系统部署一键短<b class='flag-5'>视频生成</b> <b class='flag-5'>AI</b> 工具 moneyprinter

    OpenAI暂不推出Sora视频生成模型API

    OpenAI近日宣布,目前暂无推出其视频生成模型Sora的应用程序接口(API)的计划。Sora模型能够基于文本和图像生成视频,引发了广泛关注。然而,由于访问量远超预期,OpenAI此前不得不紧急
    的头像 发表于 12-20 14:23 ?601次阅读

    中国电信发布自研视频生成大模型

    ,中国电信隆重发布了首个由央企全自研的视频生成大模型。该模型采用了创新的“VAST(Video As Storyboard from Text)二阶段视频生成技术”,实现了从文本描述到视频
    的头像 发表于 12-13 15:40 ?616次阅读

    OpenAI推出AI视频生成模型Sora

    近日,备受期待的OpenAI再次推出了其创新之作——AI视频生成模型Sora。这一新品的发布,无疑为AI技术注入了新的活力。 据悉,Sora与OpenAI旗下的
    的头像 发表于 12-12 09:40 ?794次阅读

    OpenAI开放Sora视频生成模型

    OpenAI近日宣布,其倾力打造的人工智能视频生成系统Sora已正式向美国及其他市场的ChatGPT Plus订阅用户开放。自去年首次公开预览以来,Sora历经约10个月的精心研发与优化,现已全面
    的头像 发表于 12-10 11:16 ?806次阅读

    字节跳动自研视频生成模型Seaweed开放

    近日,字节跳动旗下的AI内容平台即梦AI传来新消息,宣布自研的视频生成模型Seaweed即日起正式面向平台用户开放使用。这一举措标志着字节跳动在AI
    的头像 发表于 11-11 14:31 ?781次阅读

    智谱视频生成大模型清影升级,开启有声电影新时代

    近日,智谱公司的视频生成大模型产品——清影,迎来了重要升级。此次升级后,清影能够支持生成10秒、4K分辨率、60帧的超高清视频,并且极大地提升了人物表演的细节表现。这一
    的头像 发表于 11-11 11:40 ?817次阅读

    今日看点丨Vishay裁员800人,关闭上海等三家工厂;字节跳动发布两款视频生成大模型

    企业市场开启邀测。 ? 火山引擎介绍,豆包视频生成模型基于DiT架构,通过高效的DiT融合计算单元,能更充分地压缩编码视频与文本,让视频在大动态与运镜中自由切换,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力。此外,豆包
    发表于 09-25 15:48 ?987次阅读

    火山引擎推出豆包·视频生成模型

    在近期举办的2024火山引擎AI创新巡展上,火山引擎总裁谭待隆重推出了豆包·视频生成模型,这一举措标志着火山引擎在视频内容生成领域迈出了重要一步。豆包模型凭借其独特的
    的头像 发表于 09-25 14:11 ?697次阅读

    阿里通义将发布视频生成大模型

    在即将召开的云栖大会上,阿里通义将震撼发布其自主研发的视频生成大模型。目前,用户已可通过通义App频道及通义万相PC端预约体验这一创新功能,尽管具体使用尚未开放。
    的头像 发表于 09-19 17:01 ?659次阅读