0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一个令人惊艳的ChatGPT项目,开源了!

CodeSheep ? 来源:CodeSheep ? 2023-03-31 11:00 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

最近在GitHub上发现了一个爆火的开源项目,star数一顿暴增。

好家伙,凑近一看,居然还是由微软开源,并且和最近炙手可热的ChatGPT息息相关。

项目的名字叫做:Visual ChatGPT。

https://github.com/microsoft/visual-chatgpt

fe346fe4-cf69-11ed-bfe3-dac502259ad0.png

https://github.com/microsoft/visual-chatgpt

这个项目最早是3月上旬微软开源的,项目宣布开源后仅用了短短一周,就斩获了2w+ star。

fe3c0cd6-cf69-11ed-bfe3-dac502259ad0.png

截止到目前,距离当初项目开源仅仅过去了3周多,仓库star数则来到了27k+,亦可谓是火箭式上涨。

众所周知,ChatGPT自2022年11月推出以来,持续走红。

fe62158e-cf69-11ed-bfe3-dac502259ad0.jpg

ChatGPT具备强大的会话能力,可以理解文字、聊天、写小说、解答问题、编写代码... 但是目前还并不能直接处理或生成图像。

而Visual ChatGPT这个项目则可以把ChatGPT和一系列视觉基础模型(VFM,Visual Foundation Model)给联系起来,以便实现在ChatGPT聊天的过程中来发送和接收图像,也使得ChatGPT能够处理更为复杂的视觉任务。

fe73407a-cf69-11ed-bfe3-dac502259ad0.gif

讲白了,就是通过Visual ChatGPT,可以把一系列视觉基础模型给接入ChatGPT,使得ChatGPT能胜任更为复杂的视觉处理任务。

fe90c992-cf69-11ed-bfe3-dac502259ad0.jpg

Visual ChatGPT的整体技术架构图如上所示,我们可以清楚地看到ChatGPT和视觉基础模型(VFM,Visual Foundation Model)分别位于其中的位置。

一方面,ChatGPT(或LLM)作为一个通用接口,继续发挥它本身的优势,提供对不同话题的智能理解。

另一方面,基础视觉模型VFM则通过提供特定领域的深入知识来充当领域专家,它们通过交互管理模块(Prompt Manger)进行连接和适配。

这样聊可能比较抽象,我们可以拿官方给的一个例子来进行说明:

feb5352a-cf69-11ed-bfe3-dac502259ad0.png

1、首先是用户:输入一张黄色的向日葵图片,并且要求ChatGPT根据该图像预测深度来生成一朵红花,然后再一步一步将其做成卡通画。

2、接着是交互管理模块(Prompt Manger)发挥作用,在它的协调和控制下,VFM模块开始发挥作用:

首先需要运用深度估计模型来预测并生成图像的深度信息;

然后需要运用深度图像模型来生成对应空间深度的红花图像;

最后运用Stable Diffusion的风格迁移模型来完成图像风格的变换。

3、最后Visual ChatGPT系统再将最终结果返回给用户,完成本次对话。

说到这里,有兴趣的小伙伴可以可以看看微软给出的一篇有关Visual ChatGPT的论文:https://arxiv.org/pdf/2303.04671.pdf

fed2f54c-cf69-11ed-bfe3-dac502259ad0.png

https://arxiv.org/pdf/2303.04671.pdf

里面关于这部分的流程解释得非常详细,而且还给出了多轮对话的案例、以及实验结果,有兴趣的小伙伴可以看看。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    3755

    浏览量

    43992
  • 视觉
    +关注

    关注

    1

    文章

    163

    浏览量

    24412
  • ChatGPT
    +关注

    关注

    29

    文章

    1590

    浏览量

    9177

原文标题:一个令人惊艳的ChatGPT项目,开源了!

文章出处:【微信号:CodeSheep,微信公众号:CodeSheep】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    开放原子开源基金会发布150余开源项目应用案例

    近日,在2025开放原子开源生态大会开幕式上,开放原子开源基金会发布150余开源项目应用案例
    的头像 发表于 07-28 17:10 ?351次阅读

    开放原子开源基金会与新开源项目完成捐赠签约

    近日,在2025开放原子开源生态大会开幕式上,开放原子开源基金会与新开源项目完成捐赠签约,涵盖人工智能、具身智能、基础软件、区块链等多个
    的头像 发表于 07-28 17:04 ?330次阅读

    普华基础软件荣膺优秀开源项目

    近日,2025上海开源创新菁英奖评选结果正式揭晓。普华基础软件开源安全车控操作系统小满EasyXMen凭借在开源技术创新与产业应用实践方面的突出表现,荣获“优秀开源
    的头像 发表于 07-28 16:48 ?316次阅读

    Amazing Hand:开源的3D打印仿真机械手项目

    “ ?本文介绍款名为 Amazing Hand 的开源仿人机械手项目。该项目旨在解决市面上机器人手普遍昂贵且表现力不足的问题,提供
    的头像 发表于 07-21 11:22 ?912次阅读
    Amazing Hand:<b class='flag-5'>一</b><b class='flag-5'>个</b><b class='flag-5'>开源</b>的3D打印仿真机械手<b class='flag-5'>项目</b>

    开源项目!Open Echo:开源的声纳项目

    “ 这是还在迭代中的项目开源的回声测深仪/水深测量仪/声呐系统,适用于水文测绘及科研用途。基于Arduino平台开发并具备良好兼容性 ” Open Echo 概览 作为持续迭代
    发表于 03-20 13:37

    Open Echo:开源的声纳项目

    “ ?这是还在迭代中的项目开源的回声测深仪/水深测量仪/声呐系统,适用于水文测绘及科研用途。基于Arduino平台开发并具备良好兼容性? ” ? Open Echo 概览 作为持
    的头像 发表于 03-20 11:14 ?1141次阅读
    Open Echo:<b class='flag-5'>一</b><b class='flag-5'>个</b><b class='flag-5'>开源</b>的声纳<b class='flag-5'>项目</b>

    和安信可Ai-M61模组对话?手搓ChatGPT 语音助手 #人工智能 #

    ChatGPT
    jf_31745078
    发布于 :2025年03月12日 15:56:59

    能和Ai-M61模组对话?手搓ChatGPT 语音助手

    也争先恐后, 安信可的英文名是Ai-Thinker, 我们也直在思考 人工智能+安信可模组=? 经过数周的努力, Ai-M61-32S是我们尝试的第一个模组, 实现通过语音接入 ChatG
    的头像 发表于 03-12 11:57 ?2568次阅读
    能和Ai-M61模组对话<b class='flag-5'>了</b>?手搓<b class='flag-5'>一</b><b class='flag-5'>个</b><b class='flag-5'>ChatGPT</b> 语音助手

    开源项目!教你如何制作开源教育机械臂

    128x64实时反馈。 经过多次失败的测试和设计迭代,Pedro 2.0终于在2024年发布,具有改进的功能,经过彻底的测试和验证。 Pedro 2.0是完全开源项目,旨在让
    发表于 03-10 11:22

    ElfBoard开源项目|智能消防车项目

    项目——利用ELF 1开发板打造的智慧消防车。该项目展现物联网、数据处理等前沿技术在消防领域的应用潜力,下面就和各位小伙伴展示下这个开源
    的头像 发表于 01-04 16:43 ?741次阅读
    ElfBoard<b class='flag-5'>开源</b><b class='flag-5'>项目</b>|智能消防车<b class='flag-5'>项目</b>

    开放原子开源基金会与三开源项目举行捐赠签约仪式

    近日,在2024开放原子开发者大会暨首届开源技术学术大会开幕式上,开放原子开源基金会秘书长助理李博与openKylin、EasyAda、KWDB开源项目捐赠方代表共同签约。
    的头像 发表于 12-23 11:29 ?770次阅读

    SensiML开源Analytics Studio AutoML引擎

    我们很高兴地宣布,我们的AutoML服务器应用程序Analytics Studio将很快在开源许可下提供。我们还将推出新的开源项目网站,
    的头像 发表于 11-06 09:36 ?854次阅读
    SensiML<b class='flag-5'>开源</b><b class='flag-5'>了</b>Analytics Studio AutoML引擎

    怎样搭建基于 ChatGPT 的聊天系统

    理解ChatGPT和API ChatGPT是由OpenAI开发的种先进的自然语言处理模型,它能够理解和生成自然语言文本。要使用ChatGPT,你需要访问其API。OpenAI提供
    的头像 发表于 10-25 16:23 ?1065次阅读

    真格基金宣布捐赠开源AI项目vLLM

    通用人工智能项目,Hugging Face 上有超过 40 万模型。每周,有超过 100 万行代码在开源 AI 领域中创建,开发者
    的头像 发表于 09-24 16:13 ?825次阅读

    OpenAI称ChatGPT周活跃用户突破2亿

    OpenAI近日宣布令人瞩目的成就:其明星产品ChatGPT的周活跃用户量已突破2亿大关,仅用年时间便实现
    的头像 发表于 09-02 16:29 ?860次阅读