0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

对话机器人之LaMDA

深度学习自然语言处理 ? 来源:NLP日志 ? 2023-01-04 14:49 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

来自:NLP日志

提纲1 简介 2 LaMDA 3 总结

1 简介

LaMDA是在DeepMind的Sparrow跟openai的instructGPT之前由谷歌提出的对话机器人,全称Language Models for Dialog Applications,是一个在海量对话跟web数据上进行预训练再在人工标注数据上做进一步微调后得到的参数量高达137B的大模型。LaMDA除了在生成文本质量有所提升外,通过在人工标注数据上做进一步finetune以及让模型学会检索利用外部知识源的能力,使得模型在安全性以及事实性这两个关键问题上获得明显提升。

安全性指的是模型的回复应该满足一系列人为价值观,例如没有歧视跟偏见,不会生成伤害性建议。事实性指的模型的回复应该符合事实,跟外部知识源保持一致,而不是一本正经的胡说八道。???????

83dd799a-884f-11ed-bfe3-dac502259ad0.png

图1: LaMDA在生成文本在多个指标下有明显提升

2 LaMDA

Pre-training

LaMDA采用的是纯decoder的结构,类似于GPT,使用了46层Transformer,模型参数量高达130B,是Meena的50倍。预训练的任务是预测文本中的下一个token,解码策略跟Meenay一致,都是从top-40结果采样得到16个候选回复,再基于候选回复的对数似然得分跟长度选择最优的回复。不同于此前的对话模型只在对话数据上训练,LaMDA的预训练数据集包括对话数据(1.12B)和其他web文档数据(2.97B)。

83ffe962-884f-11ed-bfe3-dac502259ad0.png

图2: LaMDA预训练任务????

Finetune

LaMDA的finetune包括两部分,一部分是针对生成文本质量跟安全性,另一部分则是学习如何利用外部的信息检索系统。其中质量(SS I)可以从三方面评估,分别是sensibleness(文本是否合理,跟历史对话是否有冲突),Specificity(对于前文是否有针对性,避免笼统回复,例如用户提问“I love Eurovision”,模型生成一个笼统回复“Me too”就不符合预期),Interestingness(文本是否能引起某人注意或者好奇,是否是超出期待的巧妙回复)。而安全性(Safety)的目标则是要符合谷歌AI的基本原则,避免生成会造成伤害的不符合预期的结果,或者带有偏见跟歧视。

a)Finetuning for quality and safety

这部分的finetune既包括给定上文生成回复的生成任务,也包括评估回复质量跟安全性的判别式任务。对于生成任务,训练样本格式由“”(上文,哨兵,回复)三部分拼接而成,损失只计算其中response相关那部分,也就是在给定历史上文条件下,只计算模型生成回复跟期望回复之间的损失。而对于判别任务,训练样本则是“” (上文,哨兵,回复,属性,得分)五部分拼接得到,损失只计算属性对应的rating得分损失,也就是在给定历史上文跟模型回复条件下,计算特定属性下的模型得分跟人工标注结果之间的损失。这种LaMDA同时用于生成跟判别的设计能够实现一个更佳高效的流程,在生成回复后,使用判别模型打分时需要对应指标的概率P(|),而生成模型已经处理过了,所以只需要在额外处理少量的跟attribute-name相关的token即可。

Finetune过程先对LaMDA的判别任务进行优化,使得模型可以预测候选回复的质量得分跟安全性得分,然后过滤掉安全性得分低于阈值的候选回复,再根据质量得分对候选回复进行排序(3*P(sensibleness)+P(specificity)+P(interestingness)),选择其中得分最高的回复作为模型生成的结果。再利用已经训练后LaMDA的打分模型,筛选出高质量的训练数据,用于LaMDA的生成任务的finetune,使得模型可以生成高质量的回复。根据下图也可以看到利用高质量数据进行的finetune让模型在各方面都有了明显的提升。

841e2864-884f-11ed-bfe3-dac502259ad0.png

图3: finetune模型在多个指标上的提升

b)Finetuning to learn to call an external information retrieval system

这部分也称为Groundedness,针对语言模型的可能生成看起来可信,但是违背事实的幻视问题,LaMDA通过学习使用利用外部知识源去缓解这个问题。LaMDA构建一个包含信息检索系统,计算模块,翻译模块的工具(简称TS),这部分的finetune也包括两个子任务,第一个是将历史上文跟模型回复一起输入到模型中,生成对应的检索query。第二个子任务是将历史上文+模型回复+检索结果一同输入到模型中,让模型决定是生成新的检索query或者生成最终回复(根据生成的第一个字符串决定,如果是TS,则继续检索,如果是User则返回对应结果)

8461f1d4-884f-11ed-bfe3-dac502259ad0.png

图4: LaMDA Search流程?

在具体推理流程中,只用一个LaMDA模型,但是做了多个子任务,具体过程中该执行哪个子任务,则由当前输入的prompt决定,例如当前输入prompt是LaMDA to user就对应自动生成回复,如果当前prompt是LaMDA-Base to LaMDA-Research就对应生成检索query。

3 总结

从LaMDA跟后续的Sparrow,我们也可以看到一些共同点。1)可以使用一个强大的模型同时处理多个不同任务。????2)finetune阶段高质量数据对于模型的最终性能影响颇大,为了得到这些高质量的数据,LaMDA跟Sparrow在搜集finetune数据有一套严格的方法论。3) 让模型学习检索利用外部知识源,可以缓解模型幻视的问题,让模型生成结果更佳有理可依,也让模型可以回答与时俱进的问题。?????????????4)为生成文本的安全性设计额外的子任务,从而缓解敏感性的问题。LaMDA的成功,依旧贯彻着大力出奇迹的思路,不仅模型的参数量庞大,预训练的语料庞大,连finetune阶段的人工标注数据也不是一般人可以承受的。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    29941

    浏览量

    214465
  • 模型
    +关注

    关注

    1

    文章

    3547

    浏览量

    50741

原文标题:对话机器人之LaMDA

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    工业机器人的特点

    0.3%的年化生产力提升。因此,发展工业机器人推动国内自动化水平,提高产出是目前的不二选。 ** 适用范围广** 机器人相对于工人的优势还体现在应用范围广。机器人可以运用在危险、恶劣
    发表于 07-26 11:22

    对话:人形机器人连接器与线缆有何攻关点?

    与线缆技术突破成为破局关键。然而,机器人高频传输与空间压缩的技术矛盾、百万次弯折寿命的可靠性挑战,以及行业标准缺失引发的产业链协同困境,正成为制约机器人产业发展的核心瓶颈。 《国际线缆与连接》通过深度对话TE Connectiv
    的头像 发表于 07-11 15:13 ?265次阅读
    <b class='flag-5'>对话</b>:人形<b class='flag-5'>机器人</b>连接器与线缆有何攻关点?

    明远智睿SSD2351开发板:语音机器人领域的变革力量

    连续的长句语音识别,还是复杂口音的处理,都能快速响应,保证语音机器人与用户之间流畅的对话体验。 其丰富的接口为语音机器人的功能拓展提供了可能。USB接口可以连接高灵敏度的麦克风阵列,实现精准的语音采集
    发表于 05-28 11:36

    盘点#机器人开发平台

    地瓜机器人RDK X5开发套件地瓜机器人RDK X5开发套件产品介绍 旭日5芯片10TOPs算力-电子发烧友网机器人开发套件 Kria KR260机器人开发套件 Kria KR260-
    发表于 05-13 15:02

    【「# ROS 2智能机器人开发实践」阅读体验】机器人入门的引路书

    ROS的全称:Robot Operating System 机器人操作系统 ROS的 目的 :ROS支持通用库,是通信总线,协调多个传感器 为了解决机器人里各厂商模块不通用的问题,让机器人快速开发
    发表于 04-30 01:05

    【「# ROS 2智能机器人开发实践」阅读体验】+内容初识

    《ROS 2智能机器人开发实践》内容阅读初体验 《ROS 2 智能机器人开发实践》是一本针对 ROS 2(Robot Operating System 2)这一先进机器人开发框架的实用指南。随着
    发表于 04-27 11:24

    什么是机器人?追踪机器人技术的发展和未来

    什么是机器人? 我们都知道“机器人”这个词,并在日常对话中随意使用它。但我们知道它真正的含义吗?让我们花点时间来深入研究机器人的定义。它是像看起来那么简单,还是挑战了我们的理解? 在其
    的头像 发表于 04-24 19:21 ?1423次阅读

    海康机器人布局关节机器人业务

    关节机器人领域迎来一位实力选手。继布局移动机器人机器视觉业务后,海康机器人正在拓展新的产品线。
    的头像 发表于 03-20 10:47 ?827次阅读

    AI智能电话机器人对电子行业的影响是什么

    一、AI 智能电话机器人的基本概念 AI 智能电话机器人是融合人工智能技术,模拟人类与客户进行电话沟通交流的自动化程序系统。它借助先进的语音识别、自然语言处理和对话管理等技术,能够自动拨打
    的头像 发表于 01-23 09:45 ?541次阅读

    【「具身智能机器人系统」阅读体验】2.具身智能机器人的基础模块

    具身智能机器人的基础模块,这个是本书的第二部分内容,主要分为四个部分:机器人计算系统,自主机器人的感知系统,自主机器人的定位系统,自主机器人
    发表于 01-04 19:22

    《具身智能机器人系统》第10-13章阅读心得具身智能机器人计算挑战

    阅读《具身智能机器人系统》第10-13章,我对具身智能机器人的工程实践有了全新认识。第10章从实时性角度剖析了机器人计算加速问题。机器人定位中的SLAM算法需要处理两个计算密集型任务:
    发表于 01-04 01:15

    【「具身智能机器人系统」阅读体验】+两本互为支持的书

    最近在阅读《具身智能机器人系统》这本书的同时,还读了 《计算机视觉PyTorch数字图像处理》一书,这两本书完全可以视为是互为依托的姊妹篇。《计算机视觉PyTorch数字图像处理》是介绍
    发表于 01-01 15:50

    【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型

    近年来,人工智能领域的大模型技术在多个方向上取得了突破性的进展,特别是在机器人控制领域展现出了巨大的潜力。在“具身智能机器人大模型”部分,作者研究并探讨了大模型如何提升机器人的能力,大模型存在
    发表于 12-29 23:04

    《具身智能机器人系统》第1-6章阅读心得具身智能机器人系统背景知识与基础模块

    要给AI这个聪明的“头脑”装上一副“身体”。这个“身体”可以是一部手机,可以是一台自动驾驶汽车。而人形机器人则是集各类核心尖端技术于一体的载体,是具身智能的代表产品。与传统的软件智能体不同,具身智能
    发表于 12-19 22:26

    鸿蒙机器人与鸿蒙开发板联动演示

    鸿蒙机器人与鸿蒙开发板联动演示,机器人的角色为迎宾机器人,开发板负责人宾客出现监听
    发表于 12-02 14:55