0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里巴巴、智源研究院、清华大学联合发布全新AI模型,提升AI理解能力

工程师邓生 ? 来源:雷锋网 ? 作者:雷锋网 ? 2021-01-12 17:25 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

1月12日,阿里巴巴、智源研究院、清华大学等联合研究团队发布面向认知的超大规模新型预训练模型“文汇”。该模型不仅能提升AI的理解能力,还可基于常识实现AI创作,未来将应用于文本理解、人机交互、视觉问答等场景。

与传统AI训练需要人工标注数据不同,面向认知的预训练语言模型提供了一种全新的学习思路,即AI首先自动学习大量语言文字和图像数据,记忆和理解其中的信息以及人类语言表述的规律后,再进一步学习专业领域知识,从而让AI同时掌握常识和专业知识。

此次发布的“文汇”是目前国内规模最大的预训练模型,参数量级达113亿,采用阿里自研的统一多种并行策略的高性能分布式框架,使用模型并行、流水并行、数据并行训练进行分布式训练。“文汇”突破了多模态理解与多模态生成两大难题,可轻松理解文本图像信息,并能完成创造性任务。例如,仅需输入诗歌题目、朝代以及作者,“文汇”即可自动生成仿古诗词。目前,“文汇”已支持基于认知推理的多种自然语言及跨模态应用任务,部分应用即将上线。

模型可根据诗歌题目、朝代以及作者自动生成诗歌

达摩院2020十大科技趋势曾提到:AI已经在“听、说、看”等感知智能领域达到或超越了人类水准,但其逻辑推理能力依旧处于初级阶段,多模态预训练模型是实现感知智能向认知智能跨越的关键基础。达摩院智能计算实验室负责人周靖人表示,“预训练语言模型是过去70多年以来最具创新的自然语言模型之一,其模型设计难度也远高于传统模型,达摩院研究团队将持续攻克算法及系统工程难题,加速人工智能走向认知智能。”

作为国内最早投入认知智能研究的科技公司之一,阿里巴巴已有30多个研究成果被国际顶级会议收录,获得世界人工智能大会最高奖项—SAIL奖,与清华大学联合获得国家科学技术进步奖二等奖,旗下图神经网络框架Graph Learn已面向全球开源,可减少模型的算力、存储资源消耗,同时缩短算法开发上线周期。

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    88

    文章

    35758

    浏览量

    282451
  • 阿里巴巴
    +关注

    关注

    7

    文章

    1639

    浏览量

    48331
  • 清华大学
    +关注

    关注

    2

    文章

    71

    浏览量

    18207
  • 理解
    +关注

    关注

    0

    文章

    4

    浏览量

    8104
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    全球首个胃癌影像筛查AI模型发布

    浙江省肿瘤医院联合阿里巴巴达摩发布了全球首个胃癌影像筛查AI模型DAMO GRAPE,首次利
    的头像 发表于 06-30 14:37 ?2657次阅读

    导远科技与清华大学无锡应用技术研究院达成合作

    近日,导远科技与清华大学无锡应用技术研究院(以下简称:研究院)达成合作。导远科技将提供高精度定位产品及解决方案,以支持研究院在L4级自动驾驶和人形机器人领域的技术研发及转化落地。
    的头像 发表于 06-12 16:34 ?509次阅读

    2025年开放原子校清华大学站成功举办

    近日,由开放原子开源基金会、清华大学计算机科学与技术系、清华大学软件学院主办的开放原子“校行”(清华站)在清华大学成功举办。
    的头像 发表于 04-22 16:46 ?470次阅读

    普华基础软件莅临阿里巴巴达摩调研交流

    近日, 普华基础软件股份有限公司(以下简称普华基础软件)董事、总经理刘宏倩一行前往阿里巴巴达摩(杭州)科技有限公司(以下简称达摩)调研交流,阿里巴巴集团高层及达摩
    的头像 发表于 04-08 10:10 ?675次阅读

    清华大学与华为启动“卓越中心”专项合作

    、中国工程院士郑纬民教授、清华大学计算机系主任尹霞教授、清华大学科研副院长李水清教授,以及华为常务董事汪涛、华为北京研究所所长姜向中、华
    的头像 发表于 02-18 14:11 ?799次阅读

    阿里巴巴Qwen大模型助力开发低成本DeepSeek替代方案

    近日,阿里巴巴的开源Qwen2.5模型AI领域再次展现其强大实力,为斯坦福大学与伯克利大学研究
    的头像 发表于 02-12 13:42 ?1043次阅读

    Qwen大模型助力开发低成本AI推理方案

    阿里巴巴的开源Qwen2.5模型近期在AI领域引发了广泛关注。这一大模型的推出,为斯坦福大学与伯克利大学
    的头像 发表于 02-12 09:19 ?800次阅读

    浪潮信息与智研究院携手共建大模型多元算力生态

    近日,浪潮信息与北京智人工智能研究院正式签署战略合作协议,双方将紧密合作,共同构建大模型多元算力开源创新生态。 此次合作旨在提升模型创新
    的头像 发表于 12-31 11:49 ?676次阅读

    看点:阿里发布模型报告 苹果股价连续四日再创新高 传阿里巴巴与韩国易买得合并

    给大家带来一些行业资讯: 阿里发布模型报告 日前阿里巴巴集团携手中国电子技术标准化研究院联合发布
    的头像 发表于 12-27 16:04 ?879次阅读

    安谋科技与智研究院达成战略合作,共建开源AI“芯”生态

    12月25日,安谋科技(中国)有限公司(以下简称“安谋科技”)与北京智人工智能研究院(以下简称“智研究院”)正式签署战略合作协议,双方将面向多元
    发表于 12-26 17:06 ?459次阅读
    安谋科技与智<b class='flag-5'>源</b><b class='flag-5'>研究院</b>达成战略合作,共建开源<b class='flag-5'>AI</b>“芯”生态

    阿里巴巴将在美国推出AI电商工具PIC COPILOT

    人工智能领域的一次重要尝试,旨在利用先进的AI技术为美国电商市场提供更加智能化、便捷化的服务。该工具将深度融合阿里巴巴在大数据、云计算以及电子商务领域的深厚积累,通过智能算法和数据分析,帮助商家更加精准地把握市场需求,提升运营效
    的头像 发表于 12-06 10:52 ?1133次阅读

    博世与清华大学续签人工智能研究合作协议

    近日,博世与清华大学宣布,双方续签人工智能领域的研究合作协议,为期五年。在此期间,博世将投入5000万元人民币。基于2020年成立的清华大学—博世机器学习联合
    的头像 发表于 11-20 11:37 ?819次阅读

    阿里巴巴国际站首推全流程AI产品

    近日,阿里巴巴国际站正式推出了其首个全流程AI产品——AI生意助手2.0。这一创新产品的问世,标志着阿里巴巴在助力中小企业外贸经营方面迈出了重要一步。
    的头像 发表于 10-30 16:12 ?835次阅读

    字节跳动与清华AIR成立联合研究中心

    近日,清华大学智能产业研究院(AIR)与字节跳动共同宣布成立“可扩展大模型智能技术联合研究中心”(SIA Lab),并在
    的头像 发表于 10-12 15:24 ?862次阅读

    深圳云芯晨半导体科技有限公司荣幸地宣布与深圳清华大学研究院携手合作

    深圳云芯晨半导体科技有限公司荣幸地宣布我们与深圳清华大学研究院携手合作, 在2004年3月共同开发出了与英伟达网卡交换机匹配的高速率光模块, 800G OSFP SR8,400G OSFP SR4。
    的头像 发表于 08-30 15:55 ?959次阅读