0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一套开源的大型语言模型(LLM)—— StableLM

OSC开源社区 ? 来源:OSC开源社区 ? 2023-04-24 10:07 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Stability AI 是 Stable Diffusion 图像生成工具背后的公司,如今他们不再局限于开发图像 / 视频生成方面的 AI,于今天正式发布了一套开源的大型语言模型(LLM)—— StableLM,首次涉足目前由 OpenAI、Meta 和 Google 等科技公司主导的语言模型领域。

StableLM 跟 ChatGPT、Bard 这些一样,被设计用来生成文本和代码。它是通过使用开源数据集 the Pile 训练而来的,这个数据集包含的数据来源就有维基百科、Stack Exchange 和 PubMed。不过,Stability AI 在 the Pile 的基础上进行了扩展,所使用的数据集大小是标准 the Pile 的 3 倍。

Stability AI 现在已经将这个 StableLM 模型发布到了 GitHub 上,开发者可以使用或经过调整后再使用。StableLM 模型还处于 Alpha 阶段,它的参数也比较少,只有 30 亿和 70 亿个参数,之后他们还会推出有 150 亿到 650 亿参数的模型。

e9cfbea8-df9c-11ed-bfe3-dac502259ad0.png

对于 AI 可能会产生的风险,Stability AI 也给出了提醒:

对于任何没有额外微调和强化学习的预训练大型语言模型来说,用户得到的回应质量可能参差不齐,并且可能包括冒犯性的语言和观点。这有望随着规模、更好的数据、社区反馈和优化而得到改善。

e9ff4f24-df9c-11ed-bfe3-dac502259ad0.jpg

除了将代码托管在 GitHub 上,Stability AI 还在 Hugging Face 上发布了一个演示版本,经过测试 StableLM 会说中文,但只会一点点(回复内容对应不上,语句也不通顺)。

ea1836ba-df9c-11ed-bfe3-dac502259ad0.png

在 Stable Diffusion 发布后,Stability AI 遭到了很多艺术家的投诉和起诉,指控它通过使用网络抓取的受版权保护的图像开发 AI 图像生成工具,侵犯了艺术家们的权利。在之前的纠纷还没解决的情况下,如今推出 StableLM 不知道是否还会引发更多的诉讼。

Stability AI 在去年 10 月融资了 1 亿美元,公司估值也超过了 10 亿美元。但 AI 是一个投入非常高,可能短期也很难产生收益的领域,也不知道这 1 亿美金现在还剩多少,为了在这个领域持续发展,Stability AI 会不会继续融资,亦或是投入某个大型公司的怀抱呢?

项目地址:https://github.com/Stability-AI/StableLM

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语言模型
    +关注

    关注

    0

    文章

    563

    浏览量

    10842
  • 数据集
    +关注

    关注

    4

    文章

    1224

    浏览量

    25541
  • GitHub
    +关注

    关注

    3

    文章

    483

    浏览量

    17780
  • LLM
    LLM
    +关注

    关注

    1

    文章

    328

    浏览量

    891

原文标题:AI作画鼻祖Stability AI推出大型语言模型,会一点点中文

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    小白学大模型:从零实现 LLM语言模型

    在当今人工智能领域,大型语言模型LLM)的开发已经成为个热门话题。这些模型通过学习大量的文本
    的头像 发表于 04-30 18:34 ?616次阅读
    小白学大<b class='flag-5'>模型</b>:从零实现 <b class='flag-5'>LLM</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>

    详解 LLM 推理模型的现状

    2025年,如何提升大型语言模型LLM)的推理能力成了最热门的话题之,大量优化推理能力的新策略开始出现,包括扩展推理时间计算、运用强化学
    的头像 发表于 04-03 12:09 ?574次阅读
    详解 <b class='flag-5'>LLM</b> 推理<b class='flag-5'>模型</b>的现状

    无法在OVMS上运行来自Meta的大型语言模型LLM),为什么?

    无法在 OVMS 上运行来自 Meta 的大型语言模型LLM),例如 LLaMa2。 从 OVMS GitHub* 存储库运行 llama_chat Python* Demo 时
    发表于 03-05 08:07

    新品| LLM630 Compute Kit,AI 大语言模型推理开发平台

    LLM630LLM推理,视觉识别,可开发,灵活扩展···LLM630ComputeKit是款AI大语言模型推理开发平台,专为边缘计算和智能
    的头像 发表于 01-17 18:48 ?758次阅读
    新品| <b class='flag-5'>LLM</b>630 Compute Kit,AI 大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>推理开发平台

    在NVIDIA TensorRT-LLM中启用ReDrafter的些变化

    Recurrent Drafting (简称 ReDrafter) 是苹果公司为大语言模型 (LLM) 推理开发并开源种新型推测解码技术
    的头像 发表于 12-25 17:31 ?803次阅读
    在NVIDIA TensorRT-<b class='flag-5'>LLM</b>中启用ReDrafter的<b class='flag-5'>一</b>些变化

    什么是LLMLLM在自然语言处理中的应用

    随着人工智能技术的飞速发展,自然语言处理(NLP)领域迎来了革命性的进步。其中,大型语言模型LLM)的出现,标志着我们对
    的头像 发表于 11-19 15:32 ?3763次阅读

    从零开始训练个大语言模型需要投资多少钱?

    ,前言 ? 在AI领域,训练大型语言模型LLM)是
    的头像 发表于 11-08 14:15 ?818次阅读
    从零开始训练<b class='flag-5'>一</b>个大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>需要投资多少钱?

    如何训练自己的LLM模型

    训练自己的大型语言模型LLM)是个复杂且资源密集的过程,涉及到大量的数据、计算资源和专业知识。以下是训练
    的头像 发表于 11-08 09:30 ?1593次阅读

    LLM技术对人工智能发展的影响

    随着人工智能技术的飞速发展,大型语言模型LLM)技术已经成为推动AI领域进步的关键力量。LLM技术通过深度学习和自然
    的头像 发表于 11-08 09:28 ?1913次阅读

    使用LLM进行自然语言处理的优缺点

    自然语言处理(NLP)是人工智能和语言学领域的个分支,它致力于使计算机能够理解、解释和生成人类语言大型
    的头像 发表于 11-08 09:27 ?2550次阅读

    LLM和传统机器学习的区别

    在人工智能领域,LLM(Large Language Models,大型语言模型)和传统机器学习是两种不同的技术路径,它们在处理数据、模型
    的头像 发表于 11-08 09:25 ?1998次阅读

    新品|LLM Module,离线大语言模型模块

    LLM,全称大语言模型(LargeLanguageModel)。是种基于深度学习的人工智能模型。它通过大量文本数据进行训练,从而能够进行对
    的头像 发表于 11-02 08:08 ?1094次阅读
    新品|<b class='flag-5'>LLM</b> Module,离线大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>模块

    理解LLM中的模型量化

    在本文中,我们将探讨种广泛采用的技术,用于减小大型语言模型LLM)的大小和计算需求,以便将这些模型
    的头像 发表于 10-25 11:26 ?758次阅读
    理解<b class='flag-5'>LLM</b>中的<b class='flag-5'>模型</b>量化

    开放原子开源大赛助力轻量级大语言模型应用落地

    “Intel借助开源大赛在全国的影响力,吸引更多开发者加入大语言模型及其在人工智能领域的创新应用。”负责BigDL-LLM赛题运营的Intel工作人员表示。
    的头像 发表于 09-24 10:38 ?1059次阅读

    2024 年 19 种最佳大型语言模型

    大型语言模型是2023年生成式人工智能热潮背后的推动力。然而,它们已经存在了段时间了。LLM是黑盒AI系统,它使用深度学习对超大数据集进行
    的头像 发表于 08-30 12:56 ?1024次阅读
    2024 年 19 种最佳<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>