0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大模型卷价格,向量数据库“卷”什么?

脑极体 ? 来源:脑极体 ? 作者:脑极体 ? 2024-05-23 09:24 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

“不是我不明白,这世界变化快”,崔健在20世纪写下的这句歌词,放在公有云市场也同样适用。技术风向的变化之快,让不少人感到惊讶。

2023年初大模型、生成式 AI的起飞,也带来了向量数据库的爆火。投融资项目爆发式增长,头部公有云厂商都推出了AI向量数据库的相关产品。

然而一年狂飙之后,市场逐渐退潮,全球最著名的 AI 项目之一AutoGPT在2024年初宣布,不再使用向量数据库。因此有人质疑,向量数据库又凉了?

不过,随着5月份公有云厂商们掀起价格战,接连调低大模型API的价格,高性价比的大模型+向量数据库,在行业应用、企业市场又显现出了一定的商业价值。

向量数据库这一年的潮起潮落,究竟是火了还是凉了?大模型正在卷价格,向量数据库又该卷什么?公有云厂商又在这一市场发挥了什么作用?今天我们就来聊聊这些问题。

向量数据库,刚刚开始

新技术的火爆,必然会伴随炒作和泡沫,但向量作为大模型理解世界的数据形式,向量数据库作为AI革命重要基建的位置,长期来看是不会动摇的。

为什么这么说?

向量数据库并不是一种特别新的数据库技术,在AI领域已经应用了七八年,谷歌在2015年就宣布使用RankBrain语义检索来处理搜索任务。如果说数据库是数据的“硬盘”,那么,向量数据库就是更适合AI体质的“硬盘”。

其“AI原生”的体质,具体表现在几个方面:

1.更高的效率。AI算法,要从图像、音频和文本等海量的非结构化数据中学习,提取出以向量为表示形式的“特征”,以便模型能够理解和处理。因此,向量数据库比传统基于索引的数据库有明显优势。

2.更低的成本。大模型要从一种新技术转化为产业价值,必须达到合理的投入产出比,而向量数据库可以有效减少存储和计算成本。一个公开数据是,通过腾讯云向量数据库,QQ音乐人均听歌时长提升3.2%、腾讯视频有效曝光人均时长提升1.74%、QQ浏览器成本降低37.9%,就在于检索效率、运行稳定性、运营效率、推荐算法等,有了较大的提升。

3.更强的数据安全。有企业直言:“沉淀了几十年的内部数据是我的核心竞争力,让我无偿去公开给大模型做训练,我肯定不愿意。”想做大模型,还要确保数据的隐私安全,就必须与数据库产品做好配合,这给向量数据库的本地部署带来了广阔的需求。

4.更大的扩展性。随着大模型走向行业应用,垂直领域的AI用例不断增多,汹涌的数据洪潮和存算任务,会带来大量向量搜索的需求。而向量数据库嵌入向量的长度不受限制,具有良好的扩展性,可以根据AI用例和模型而变化,更好地处理大规模数据集。

从大模型技术标杆的OpenAI发布的GPT-4o和即将发布的GPT-5消息来看,以及国内外商业化大模型的进展来看,大模型的技术路线还没有发生颠覆性的变革,因此落地应用还是需要向量检索和向量数据库。

由此可以肯定,向量数据库市场必然还会迎来一轮增长。趋于冷静,只是2023年热情过度高涨的适当回调。

两大新势力,云是方向

据东北证券预测,到2030年,全球向量数据库市场规模有望达到 500 亿美元,国内向量数据库市场规模有望超过600亿人民币。向量数据库市场吸引了“群雄逐鹿”,从引爆到饱和,进展迅猛,

传统数据库厂商不必多说,既有相应的能力建设,也有一定的客户基础,推出相关产品是必然。一些在AI领域积淀已久的科技大厂,如谷歌、微软、Meta、百度等大厂,都有向量数据库的技术积累,也都可以向外输出相关能力和产品。

除了这些常规面孔,向量数据库市场也吸引了新的参与者。

作为这一轮大模型投资热和创业热的主要目标之一,向量数据库领域诞生了不少创新创业公司。比如AI创业新秀Pinecone就是闭源的领跑者,凭借良好的开箱即用的产品体验,获得了非常大的增长,B轮估值达到7.5亿美元。其他竞争者大多建立在开源项目的基础上。

wKgaomZN6zqASh3_AAEdKosVPYA445.jpg

不过,作为创业公司,长期盈利能力还有待验证。一个主要原因,是客户大多是尝鲜、实验性质。

企业需要先将非结构化的私密数据,进行一个小的模型,进行向量化,产生一个向量的矩阵,再存储到向量数据库里,来供大模型学习和检索。这个过程涉及大量的工程化,会耗费企业许多开发人员、时间成本,一开始可能会因为AI大模型很火而对向量数据库产生兴趣,但能否真正在业务中落地还是个未知数。因此,长期付费意愿还有较大的不确定性。

另一股积极参与的新势力,就是公有云厂商。

不是所有企业都有能力自建大模型所需要的基础设施,通过MaaS(模型即服务)业务来训练应用大模型,是更灵活的选择。此外,很多政企客户往往会选择公有云或行业云来满足其业务需求,对云数据库的关注度和接受度上升,而这些用户在探索大模型时,会倾向于以整体解决方案的形式来交付,这就给了云厂商参与游戏的机会,同时也要求云厂商提供向量数据库的全栈支持。

如今头部云厂商基本建立了全生命周期AI化的向量数据库。有数据显示,企业原先接入一个大模型需要花1个月左右时间,使用某公有云的向量数据库后,3天时间即可完成,极大降低了企业的接入成本。

更何况,前不久火山引擎、阿里云、百度智能云等都围绕大模型API价格,打起了互相抄底的“价格战”,意味着AI创新门槛的降低,而AI应用市场的用户规模扩大,也会带动向量数据库的使用需求。

综上,整个云AI市场的格局还在快速变化之中,风物长宜放眼量,AI Native的向量数据库,前景仍然值得期待。

接下来,向量数据库卷什么?

有人可能会问了,大模型开始卷价格,那向量数据库市场正在卷什么?

需要注意的是,大模型降价是以云厂商为主,而零一万物等创业公司已经明确表示会以技术创新为竞争力,而不会(与云厂商)对标价格。云厂商在AI基础设施、商业生态、市场规模效应上的既定优势,确实也会表现在向量数据库市场。

目前来看,公有云厂商有几重特殊优势,或许会让向量数据库加速走向商业成功:

  1. 多元化部署。垂直行业大模型,数据都是私有机密的,客户一般不愿意放到公有云上,这对一部分支持混合多云的云厂商是一大利好,通过私有部署、分布式、混合云等多种方案,打消行业客户将数据放到云端的现实疑虑。

2.一体化AI能力。向量数据库的火爆,本质是由AI驱动的,而AI Native时代的数据工程,还有许多复杂问题尚待解决,比如检索效率,在处理大规模数据的并行任务时,保持快速响应时间是一个挑战,需要优化索引结构和搜索算法;高负载下的系统稳定性,需要确保数据库系统具备高可用性和容错能力,防止服务中断;存储海量的向量数据,成本效益比要进一步优化……目前来看,云厂商具备从底层算力集群、Maas模型平台到全栈工具链的AI能力,有望通过技术协同创新,持续优化向量数据库的性能和成本。

3.产业服务能力。各行业对AI与业务的结合热情高涨,但大多还处于尝试探索期,需要结合自身场景、AI应用、IT设施等多种因素试错并迭代。这个过程中,随叫随到、帮助客户及时解决问题的ToB服务能力,也是非常看重的。深耕产业的公有云,有望降低很多企业在AI技术革命中的机会成本。

有人说,AI云市场越来越卷了,随着大模型性能边际效益不断走低,云厂商不得不用低价换规模。但有句话:“东方不亮西方亮,黑了南方有北方。”只要公有云厂商在AI领域的产品阵营足够庞大,用多元化综合优势锁定用户,那么即使大模型收益下降,在商业回报上也不愁没有回旋的余地。

从这个角度看,或许公有云市场下一个卷起来的,就是向量大模型。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据库
    +关注

    关注

    7

    文章

    3939

    浏览量

    66558
  • 向量
    +关注

    关注

    0

    文章

    55

    浏览量

    11906
  • 大模型
    +关注

    关注

    2

    文章

    3191

    浏览量

    4147
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    数据库数据恢复—服务器异常断电导致Oracle数据库故障的数据恢复案例

    Oracle数据库故障: 某公司一台服务器上部署Oracle数据库。服务器意外断电导致数据库报错,报错内容为“system01.dbf需要更多的恢复来保持一致性”。该Oracle数据库
    的头像 发表于 07-24 11:12 ?154次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—服务器异常断电导致Oracle<b class='flag-5'>数据库</b>故障的<b class='flag-5'>数据</b>恢复案例

    milvus向量数据库的主要特性和应用场景

    Milvus 是一个开源的向量数据库,专门为处理和分析大规模向量数据而设计。它适用于需要高效存储、检索和管理向量
    的头像 发表于 07-04 11:36 ?254次阅读
    milvus<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>的主要特性和应用场景

    布机数据采集远程监控系统方案

    低下。人工巡检无法做到实时监测,常常导致故障发现滞后。 对此,物通博联提供基于工业数采网关的布机PLC数据采集远程监控系统方案。它支持通过串口/网口接入布机的PLC,实时采集布机
    的头像 发表于 06-26 17:35 ?220次阅读
    <b class='flag-5'>卷</b>布机<b class='flag-5'>数据</b>采集远程监控系统方案

    数据库数据恢复—SQL Server数据库被加密如何恢复数据

    SQL Server数据库故障: SQL Server数据库被加密,无法使用。 数据库MDF、LDF、log日志文件名字被篡改。
    的头像 发表于 06-25 13:54 ?189次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—SQL Server<b class='flag-5'>数据库</b>被加密如何恢复<b class='flag-5'>数据</b>?

    物联网模块开启“小而美”革命:体积,更性能与效率!

    随着Semtech公司LoRa应用方案的推出,长距离、低功耗的物联网应用难题得到了有效缓解。然而,物联网行业的竞争焦点正悄然转变,从距离、功耗迈向了体积的新阶段。在追求设备小型化、高度集成化的浪潮中,如何在有限的空间内实现
    的头像 发表于 06-23 16:15 ?699次阅读
    物联网模块开启“小而美”革命:<b class='flag-5'>卷</b>体积,更<b class='flag-5'>卷</b>性能与效率!

    MySQL数据库是什么

    开发、企业应用和大数据场景。以下是其核心特性和应用场景的详细说明: 核心特性 关系型数据库模型 数据以 表(Table) 形式组织,表由行(记录)和列(字段)构成。 通过 主键、外键
    的头像 发表于 05-23 09:18 ?511次阅读

    模型进化论:AI产业落地将向何方?

    模型进化论:AI产业落地将向何方?
    的头像 发表于 01-24 09:28 ?368次阅读

    数据库是哪种数据库类型?

    数据库是一种部署在虚拟计算环境中的数据库,它融合了云计算的弹性和可扩展性,为用户提供高效、灵活的数据库服务。云数据库主要分为两大类:关系型数据库
    的头像 发表于 01-07 10:22 ?532次阅读

    张力控制变频收程序方案

    张力控制变频收程序方案
    发表于 12-24 14:36 ?0次下载

    数据库数据恢复—Mysql数据库表记录丢失的数据恢复流程

    Mysql数据库故障: Mysql数据库表记录丢失。 Mysql数据库故障表现: 1、Mysql数据库表中无任何数据或只有部分
    的头像 发表于 12-16 11:05 ?668次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—Mysql<b class='flag-5'>数据库</b>表记录丢失的<b class='flag-5'>数据</b>恢复流程

    创建一个5G的逻辑

    要求创建一个5G的逻辑 思路: 1. 物理的设备 2. 将物理设备做成物理 3. 创建组并将物理加入其中 4. 创建逻辑 5. 格
    的头像 发表于 12-04 10:31 ?470次阅读

    数据库数据恢复—通过拼接数据库碎片恢复SQLserver数据库

    一个运行在存储上的SQLServer数据库,有1000多个文件,大小几十TB。数据库每10天生成一个NDF文件,每个NDF几百GB大小。数据库包含两个LDF文件。 存储损坏,数据库
    的头像 发表于 10-31 13:21 ?738次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—通过拼接<b class='flag-5'>数据库</b>碎片恢复SQLserver<b class='flag-5'>数据库</b>

    科技云报到:大模型时代下,向量数据库的野望

    科技云报到:大模型时代下,向量数据库的野望
    的头像 发表于 10-14 17:18 ?559次阅读

    数据库价格贵吗?云数据库租用价格

    不同的云服务提供商会提供多样化的云数据库产品,以满足不同规模和类型的企业需求。这些产品通常包括基础型、标准型、高性能型等多个档次,每个档次的价格都会有所不同。
    的头像 发表于 10-10 11:12 ?463次阅读
    云<b class='flag-5'>数据库</b><b class='flag-5'>价格</b>贵吗?云<b class='flag-5'>数据库</b>租用<b class='flag-5'>价格</b>表

    数据库数据恢复—SQL Server数据库出现823错误的数据恢复案例

    SQL Server数据库故障: SQL Server附加数据库出现错误823,附加数据库失败。数据库没有备份,无法通过备份恢复数据库
    的头像 发表于 09-20 11:46 ?729次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—SQL Server<b class='flag-5'>数据库</b>出现823错误的<b class='flag-5'>数据</b>恢复案例