0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

开学咯!跟着解小放一起来学习企业级AIGC应用如何落地

中软国际 ? 来源:未知 ? 2023-09-08 17:15 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群


近日,星策开源社区 LLMOps meetup V3直播活动顺利举行,由星策开源和CSDN等多个平台同时播出,共吸引来14000+观众观看。中软国际AIGC研究院执行院长、解放号副总裁韩鹏受邀参加并分享当前业界最为关注的大模型在企业场景中实际落地的案例和实践,还演示了基于JointPilot平台构建AIGC企业应用的典型模式、方法、工具和关键技术,小编整理了一下,为广大开发者带来超实用的AIGC应用落地干货。

















01
企业级AIGC应用导入LLM的典型落地模式和技术路线
大模型落地的技术路线有六种,企业要综合考虑门槛高低、训练周期长短、算力数据成本要求等问题。经过多方研究和验证测试后,中软国际AIGC研究院最终选择了“意图模型+DKG+Plugin”作为企业级AIGC应用导入LLM的典型落地模式和技术路线。这种模式有了能够本地部署的意图理解模型做为应用调度的中枢,通过DKG做模型的前后约束,并集成Plugin的能力,更适合于面向对数据安全、业务逻辑规则要求比较严格的政企行业应用场景。


















02
一起来看看大模型赋能应用的运转机制是怎样的?

韩鹏以销售助手为例介绍了大模型赋能应用的运转机制。在传统工作场景下,销售在拜访客户前需要进行客户背调、项目收集及谈资等准备工作,在拜访客户后还需要详细整理内容形成拜访记录和工作总结,工作繁杂且耗时耗力。

销售助手AI应用通过大语言模型赋能之后,生成一套运转的流程和机制,用大语言模型去完成意图理解,理解了用户的意图之后对用户指令进行任务拆分,分别调用不同的微应用去执行任务。最后输出时,销售助手也做了安全性的矫正,保障输出的结果是准确合规的。

在思维链加持下大模型可以进行意图识别和任务拆解,通过长思维链的技术方式增强大模型的规划和推理能力,根据任务调微应用执行,同时使用内部沉淀及外部抓取的数据,集成各类通用及定制的能力,共同构建了以问答为基本交互形式的销售助手。销售助手帮助销售人员完成了客户拜访前的谈资和话术准备,让工作更高效精准。
















03
怎么利用JointPilot Studio编排一个AI应用呢?
JointPilot平台在应用开发方面提供一款新型增强的开发工具Studio和一种全新的应用组装方法。一个普通的业务人员可以使用开发者工具进行微应用编排。

平台支持多种非结构化数据接入,支持各类文档导入,比如上传文档,通过向量数据库和大模型进行知识重构,构建采购政策、项目方案知识库;还可以调用模型的能力自动生成问答对在平台上预置,便于开发者快速调取;也支持行业专用词典的知识接入,帮助大模型理解专用术语。

当然,在实际场景还会有一些结构化的数据需要接入到知识库,比如CRM系统的客户拜访记录数据,本地数据集、数据表的导入,各种Excel文件导入等等,这些结构化数据让大模型能够更懂企业场景私有的领域知识。大家可以使用JointPilot平台自动化的工具,快速实现百万级条目数据导入,大大减轻了手工导入数据和知识费时费力的烦恼。

在微应用编排过程中,大模型需要访问各类数据库,包括关系数据库查询、数据集查询、文档知识库查询等,比如查询客户历史拜访记录,平台提供NL2SQL生成器等工具,方便用户通过Prompt工程让大模型生成SQL查询语句。



同时还要让大模型会用工具,通过自动化配置请求链接、接口参数等轻松实现API的调用,从而大幅降低用户应用生成的门槛。

在对话场景中,我们需要通过角色设定来让大模型能够更好的理解特定身份的任务,比如销售助手中大模型在拜访前辅助销售人员进行准备工作梳理并提供鼓励,可以通过配置好的Prompt模板,来实现角色扮演的任务。

那么,大模型是怎样像人一样会用大脑去思考用户提出的问题,怎样自动分发应用,自动化编排、自动化组装?这就需要训练出一个意图识别大模型作为应用调度的中枢,通过大模型来识别提取需求要素,作为数据服务参数,传递给要调取的应用。

















04
揭秘怎样“炼制”更符合企业场景需要的模型
想要“炼制”更符合企业场景需要的模型,首先要选择一个基座模型,要准备数据集,还要有一套合适的训练方案。目前用的比较多的是SFT监督微调、LoRA 微调、P-tuning v2 微调方法。最后要对模型优化效果进行评估。整个训练过程会使用工具把很多脚本执行的碎片化过程,通过可视化界面实现全过程管理。数据集的选取、封装,以及具体参数的调整,都通过工具来完成。


解放号总结出了一套训练大模型的心得,分享给各位开发者:

1、鉴于每个模型的表现不太一样,选择一个合适的基座模型最重要。训练command模型最终选用百川大模型,它的优势是基于LLAMA做中文训练,在中文的表现很好。大模型尺寸选择会影响模型推理能力。


2、数据集质量特别关键。尤其是在企业场景里,需要跟大量业务部门和业务人员一起做监督学习和数据标注,也可借用大模型来扩展增强数据集,使用instruction、input、output方式来整理。如果模型泛化能力弱,就需要增强训练数据多样性。


3、精调的方案选择和场景相关度非常高。建议通过做多种方案对比测试看实际效果。可以用5%-20%的数据集作为测试数据来测试精调的任务,建议测试数据和训练数据要分开用,通过测试后再去跑全量的数据。当训练结果大量返回重复字符时,就需要调整数据集和训练参数,再重新做训练。


4、尽可能训练小尺寸模型,这对部署成本控制非常关键。一般情况4-8个节点才能满足真正生产环境中使用的要求,所以在部署前尽可能做量化压缩优化,确保不损失太多性能的技术上降低资源的需求。


这一期干货分享就到这了,相信小伙伴们还会有很多的问题想要交流,敬请继续关注我们。中软国际解放号将在JointPilot平台的加持下,携手广大开发者,加速应用创新,共赢企业级AIGC应用未来!



原文标题:开学咯!跟着解小放一起来学习企业级AIGC应用如何落地

文章出处:【微信公众号:中软国际】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 中软国际
    +关注

    关注

    0

    文章

    674

    浏览量

    7682

原文标题:开学咯!跟着解小放一起来学习企业级AIGC应用如何落地

文章出处:【微信号:CSI00354,微信公众号:中软国际】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    国内企业级SSD厂商加速崛起

    ? 电子发烧友网报道(文/黄晶晶)国际数据公司(IDC)发布最新报告显示,中国企业级固态硬盘市场在2024年得到修复,市场规模达到62.5亿美元,与2023年相比增长187.9%。IDC预计
    的头像 发表于 06-09 07:54 ?8976次阅读
    国内<b class='flag-5'>企业级</b>SSD厂商加速崛起

    100%开源!行业首个企业级智能体

    近日,京东云正式开源JoyAgent智能体。作为行业首个100%开源的企业级智能体,实现了产品级开源,包括前端、后端、框架、引擎和核心子智能体。开源产品历经京东内部大规模场景锤炼,与平台完全
    的头像 发表于 07-26 09:26 ?514次阅读

    企业级Linux磁盘维护的完整流程

    企业级Linux环境中,磁盘故障是导致系统宕机和数据丢失的主要原因之。据统计,超过70%的企业级服务器故障与存储系统相关。作为运维工程师,掌握完整的磁盘维护流程不仅能预防故障,更能在关键时刻拯救整个业务系统。
    的头像 发表于 07-23 16:59 ?257次阅读

    企业级智能体是什么?有什么作用?

    在人工智能技术飞速发展的今天,企业级智能体正成为推动组织数字化转型的重要力量。这种新型的企业智能化解决方案,正在重塑企业的运营模式和管理方式,为商业发展注入全新动能。
    的头像 发表于 07-21 15:44 ?191次阅读
    <b class='flag-5'>企业级</b>智能体是什么?有什么作用?

    企业级SSD的核心技术与市场趋势

    电子发烧友网综合报道,企业级SSD由固态电子存储芯片阵列制成,核心部件包括主控芯片、固件和存储介质(NAND Flash、DRAM),其中主控芯片和固件直接决定企业级SSD的性能和可靠性等产品表现
    的头像 发表于 07-06 05:34 ?5676次阅读
    <b class='flag-5'>企业级</b>SSD的核心技术与市场趋势

    DeepSeek企业级部署RakSmart裸机云环境准备指南

    RakSmart裸机云环境中部署DeepSeek的企业级环境准备指南,内容涵盖关键步骤和注意事项,主机推荐小编为您整理发布DeepSeek企业级RakSmart裸机云部署指南。
    的头像 发表于 03-24 10:07 ?454次阅读

    企业级Claude API应用方案!完整调用攻略来袭:带你解锁Claude 3.5/3.7大模型

    企业级Claude API大模型应用开发,完整调用攻略来袭,带你解锁Claude 3.5/3.7大模型,满足企业级生产!无需魔法,无需外币充值,无需担心封号问题
    的头像 发表于 03-19 19:55 ?1074次阅读
    <b class='flag-5'>企业级</b>Claude API应用方案!完整调用攻略来袭:带你解锁Claude 3.5/3.7大模型

    DeepSeek企业级部署实战指南:以Raksmart企业服务器为例

    随着人工智能技术的快速发展,DeepSeek作为款强大的AI工具,正在成为企业智能化转型的重要驱动力。本文将结合Raksmart企业服务器的实际案例,详细解析DeepSeek的企业级
    的头像 发表于 03-12 11:33 ?695次阅读

    用友BIP+DeepSeek催生超级智能体:10分钟构建企业级智能助理

    企业10分钟随需构建企业级智能体。随着智能体技术日益成熟,企业服务领域正迎来场深刻的变革。智能体是AI在
    的头像 发表于 02-18 16:21 ?704次阅读
    用友BIP+DeepSeek催生超级智能体:10分钟构建<b class='flag-5'>一</b>个<b class='flag-5'>企业级</b>智能助理

    慧荣科技企业级主控芯片SM8366为企业级SSD存储芯片注入新动力

    慧荣科技凭借其深厚的技术积累和创新精神,推出了企业级主控芯片SM8366,这举动无疑为企业级SSD存储芯片市场注入了新的活力,慧荣科技此次推出的企业级主控芯片SM8366,在性能提升
    的头像 发表于 02-07 13:28 ?682次阅读
    慧荣科技<b class='flag-5'>企业级</b>主控芯片SM8366为<b class='flag-5'>企业级</b>SSD存储芯片注入新动力

    #新年新气象,大家新年快乐!#AIGC入门及鸿蒙入门

    ,参加知名的AIGC比赛也是提升技能和展示才华的好机会。鸿蒙系统作为华为推出的分布式操作系统,具有广泛的应用前景和开发潜力。通过学习鸿蒙系统的基础知识和开发实践,开发者可以掌握这前沿技术,并参与到鸿蒙生态的建设中
    发表于 01-13 10:46

    AIGC入门及鸿蒙入门

    ,参加知名的AIGC比赛也是提升技能和展示才华的好机会。鸿蒙系统作为华为推出的分布式操作系统,具有广泛的应用前景和开发潜力。通过学习鸿蒙系统的基础知识和开发实践,开发者可以掌握这前沿技术,并参与到鸿蒙生态的建设中
    发表于 01-13 10:32

    emc企业级存储系统的特点

    在当今这个数据驱动的时代,企业对于数据存储的需求日益增长。EMC,作为全球领先的数据存储解决方案提供商,其企业级存储系统以其卓越的性能、可靠性和创新技术,为企业提供了个强大的数据管理
    的头像 发表于 11-01 15:24 ?1133次阅读

    用THS3091做功率放大,在运的带宽内放大倍数平坦度怎么样?

    板子没画好还是放大器自身的问题。 从手册上的频率响应图可以看出在100M内很稳定。 这是我的原理图,原理图上的RM是用来做阻抗匹配的,这个我不知道怎么算,我是直接按手册上的大小接的。 这是PCB,各位工程师帮我看看这样布局有些什么问题,希望大家可以一起来讨论。
    发表于 09-05 08:26

    封装在一起的双运或四运参数比较接近,是否可以设计电路经过两或更多级将失调电压抵消掉?

    封装在一起的双运或四运参数比较接近,是否可以设计电路经过两或更多级将失调电压抵消掉?
    发表于 09-04 08:27