0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器视觉公司在玩一局玩不起的游戏

脑极体 ? 来源:脑极体 ? 作者:脑极体 ? 2023-04-15 17:53 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

有个著名咨询公司曾经预测过:未来只有两种公司,有人工智能的和不赚钱的。

它可能没想到,还有第三种——不赚钱的AI公司。

去年我们报道过“正在消失的机器视觉公司”,昔日的“AI四小龙”( 商汤、旷视、云从、依图),在商业化盈利上各有各的不顺。不过,随着GPT系列产品又掀起一股“大炼模型”的热潮,这些AI公司又支棱起来了。

商汤科技此前曾披露,下一步的发展战略是通用人工智能(AGI),继续推进“大装置+大模型”,并发布了1800亿参数的中文语言大模型 “商量”。

pYYBAGQ6dCKALPTEAAAmRJovWXg781.jpg

旷视科技也表态,会坚定投入生成式大模型的研发,保持核心技术能力长期领先。

云从科技公开的定增预案中,为云从“行业精灵”大模型研发项目,募集资金不超过36.35亿元。

依图科技没有公开消息,但在此前的融资中曾因AI大模型和***等被看好。

poYBAGQ6dCOAatDjAAD-LOmfh0k649.jpg

无论是上一轮,以BERT、GPT-3为代表的“预训练+精调”大模型,还是此刻正红火的,以ChatGPT、GPT-4、文心一言等为代表的“预训练+精调+提示+RLHF(人类反馈)”的大语言模型,已经成为各大头部科技公司“秀肌肉”、相互竞争的重要工具。

谷歌、百度等大厂跑着入场,各路大模型“神仙斗法”。这场狂欢派对,成了机器视觉公司不得不玩、又玩不起的游戏。

尴尬的“长衫”

最近,CV公司参与到大模型这局游戏中,出现了这样的画风:语气一会儿大,一会儿怂。

在公开信息中,都表示自己会加大投入,去解决基础技术、基础问题。云从的管理者说要“投一二十亿解决算力问题”“我们是技术公司,研发投入不会低”;商汤的有关人士称,要做“统一化标准化的大模型”“加速构建通用人工智能的核心能力”;旷视也对标OpenAI,要“做影响物理世界的 AI 技术创新”。

谈到大模型技术和产品本身,底气又不足了。

这个说“基础大模型要有长期布局,NLP难点很多,短期内与境外领先企业会存在较大差距”,那个说“中国AI公司有商业化的压力,不能像OpenAI那样不计代价的创新”。

“预期管理”算是被你们玩明白了。

年轻人流行说自己是“脱不下长衫的孔乙己”,CV公司对于大模型这种不尴不尬的处境,其实也和“孔乙己”有相似之处。

CV公司在底层技术、基础设施、人才、资金、生态等领域的积累,不如头部科技企业优势显著。所以,自然也不可能真的跟谷歌、OpenAI、BATH(百度、阿里、腾讯、华为)正面打擂台,烧钱去做通用的基础大模型(foundation model)。

新一轮大语言模型,完整技术栈、工程实现能力、算力成本、数据积累等都有极高的门槛,AI公司自研大语言模型的难度前所未有。 OpenAI 在2022年就花掉了5.44亿美元,收入只有3600万美元,这是国内CV公司不具备的家底儿。

当然,外界也不应该过度放大CV公司的责任,非要将巨头才能承担的创新压力放在CV公司身上。

但是,CV公司又有着“AI-native原生企业”的光环,也确实积累了很多技术储备, 所以也不能直接躺平,像ISV集成商、软件公司一样依附大厂,欢欣鼓舞地等着集成或调用API就好。

昔日的“AI四小龙”还是要撑起“技术自立”的架子,努力融入这波炼大模型的热潮里,于是,又将模型数量和参数规模的比拼,拉升到了新的竞争水平。

比如云从有NLP、视觉领域的预训练模型,商汤在“AI大装置SenseCore”的基础上,构建的日日新大模型体系就包含了通用视觉模型、中文语言模型、图片生成模型……其中,仅“商量”大模型的参数规模,就和GPT-3差不多。

今天大家都感慨,孔乙己脱下长衫不容易,换个角度,“大模型”这件长衫,CV公司是不是有必要穿上呢?

玩不起的游戏

从2018年的预训练大模型到2023年的大语言模型,大模型走过了一个从萌芽到繁荣的小周期,种类、功能也丰富起来,我们已经见过很多AI企业、高校和科研机构、行业公司所打造的各种各样的大模型。

问题来了:

第一,大模型的“智能涌现”,需要在超大规模的数据和充分的训练才能出现,只有不计投入的基础模型能做到。

很多面向行业的预训练大模型,由于数据和训练不足,无法达到“智能涌现”的临界点,这也是为什么此前预训练大模型那么多,却只有ChatGPT的到来,才证实了“通用人工智能”的可行性。

在基础模型的鲁棒性、泛化性极大提升的今天,一味盲目地“训大模型”,结果就是“大小班同上”,基础大模型和行业大模型一起,消耗本就不充沛的算力,进一步推高计算成本,让AI企业背上更重的负担。

第二,大模型的商业化路径,标准化API是比较基础的一种,而基础模型API有虹吸效应。

简单来说,通过API接入AI能力,技术是决定性因素,基础模型的能力强、受众广泛,很容易通过API经济完成商业化,而行业大模型面对的领域较窄,很难通过“规模效应”来摊薄研发成本。

随着一个又一个大模型被推向市场,大家恍然发现:原来我们并不缺大模型,缺的是商业化路径。

目前,大模型的商业化还比较有限,C端通用产品贴成本定价,B端盈利前景不明朗,根据 A16Z 对美国 LLM 创业调研,纯模型厂商只能拿走0-10%的价值,并且要长期对标OpenAI的定价策略,会面临很大的商业化压力。

通用基础模型和行业大模型一起面向市场和客户,结果就是,在商业价值分配上产生博弈。AI巨头“神仙斗法”,打造出的通用基础大模型会吸引产业和用户的最多关注。

而大量行业大模型,要么在训完后无人问津,浪费了前期投入;要么无法满足产业需求,商业化前景受限;或者跟通用基础大模型的能力有冲突,导致商业化达不到预期。

同为AI创业型公司的出门问问创始人李志飞,就在一次采访中直言:“不是所有人都要去做通用大模型,贸然进入,难度很大,商业竞争很激烈,想不清商业模式到最后会很痛苦。”

所以,大炼模型,可能是CV公司目前玩不起的一局游戏。

轻装上阵的路

你可能会问,现在大模型这么火,不训大模型怎么能吃到这波红利,在新一轮AI热潮里建立优势呢?

CV公司要轻装上阵,可能要尝试这样几条路,去探索大模型热潮中的机会:

1.跟基础大模型平台建立更紧密地联系。

自己开发大模型难度太大,训练成本、存算成本过高,社区生态支持也不够充足。可以站在巨人的肩膀上,接入基础模型的能力打造小模型,与基础模型的商业模式形成差异。

此前CV公司盈利难的一个挑战是:机器视觉要进入腰尾市场,存在着海量的碎片化需求,客户体量比较小、数量多,项目规模不大,这对CV公司的开发效率提出了很高的要求。

通用的成熟型算法,无法满足细分需求,但全靠算法工程师来定制开发不现实,也不够经济划算。基础大模型,将算法开发推进到工业化阶段,减少了编程工作量,提高了开发效率,定制化算法的性价比提高,也就更容易为企业所接受。

对于CV公司来说,算法进入工业化大生产阶段,将碎片化需求全面覆盖、规模化复用,整体营收能力自然也就上来了。

2.深入到具体行业中去,构筑能产生差异化的应用产品。

基础模型要走向产业,必须进一步精调,CV公司就有相应的优势。

很多高度专业化或复杂的工作,比如金融、建筑设计、编程、办公、客服等,需要精准的垂类知识;一些特定领域,比如医疗、司法,非结构化数据比较稀缺。没有足够的语料来“投喂”,基础模型在这些场景就会欠缺一些“常识”,比如GPT-4就写不好中文诗。

据说,GPT-3.5的训练数据集全部为私有数据集,其中关键的SFT训练集,有89.3%的数据是定制的。

CV公司大多有自己聚焦的垂直领域,比如依图的智能医疗,旷视的物联网,云从的智慧园区,商汤的智慧城市、智慧出行等,可以结合在相关领域沉淀的差异化数据集,利用精调或prompt的方式,打造出更加精确、可靠的小模型,更容易部署,为AI应用加速AI的快速落地。

3.建立更具韧性的生态合作护城河。

CV公司在大模型技术上的积累,就会变成AI 2.0时代的底牌,也可以作为与AI巨头、算力提供商的生态合作筹码。

比如这一轮大模型,对提示学习、人类反馈的强化学习RLHF等提出了很高的要求,让模型在人类的引导下,发现知识的使用方式,理解人类的偏好,这在国内都属于很新的领域,提示师、专业标注师很少。有媒体报道,OpenAI的标注员,本科学历52.6%,硕士学历36.8%,这就不能全部靠众包模式来进行数据标注,必须拥有自己的垂直领域的标注团队。

比如医疗领域,医学图像还没有建立起自然图像那么大级别的数据库,而对医学图像的标注是很难的,不像自然图像标注,普通人一看就知道是什么,医学图像的数据标注涉及到器官、癌变等专业知识,就需要针对性地积累。

这样的高水平技术人员,恰恰是CV公司这种AI-native原生企业的重要资源,可以与产业链上下游开展更紧密地合作,从而保障产品和服务的竞争力和可持续性,吸引客户更多地将数据放入自己的产品中,形成马太效应。

大模型开辟了一条蕴藏着极大价值和可能性的新路,被寄托了太多期待和野心。要有大模型能力,不代表要自己训大模型。

重复建设的热潮终会褪去,届时,大模型商业化的考验才刚刚开始。

对于CV公司来说,脱下“大模型”的长衫,是为了留住商业化的“底裤”。集体弄潮只是只是一时热闹,保存实力才能在AI江湖中走得更远。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器视觉
    +关注

    关注

    163

    文章

    4620

    浏览量

    123347
  • AI
    AI
    +关注

    关注

    88

    文章

    35758

    浏览量

    282453
  • nlp
    nlp
    +关注

    关注

    1

    文章

    490

    浏览量

    22698
  • ChatGPT
    +关注

    关注

    29

    文章

    1591

    浏览量

    9248
  • 大模型
    +关注

    关注

    2

    文章

    3231

    浏览量

    4226
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【VisionFive 2单板计算机试用体验】2、打造复古游戏机(Batocera镜像+FBNeo虚拟机, 多款游戏ROM分享)

    界面,游戏设置里点击下更新游戏列表。 然后就可以看到拳皇97,恐龙快打,三国志,合金弹头,龙与地下城等等小时候想玩而不能畅
    发表于 07-17 21:58

    三合一局放监测装置的功能应用

    三合一局放监测装置是种集成超声波放监测、暂态地电压监测以及特高频监测这三种监测功能的体化装置,其目的是实现对高压电气设备局部放电的全面检测与诊断。通过实时监测高压电力设备的
    的头像 发表于 07-17 09:32 ?131次阅读
    三合<b class='flag-5'>一局</b>放监测装置的功能应用

    京东已确认!入AI潮,或成下个风口?

    近日,京东确认其智能品牌JoyInside已与十余家头部机器人品牌达成战略合作,引发广泛关注,这标志着京东AI潮领域迈出实质性布局的关键步。 JoyInside依托京东自主研发的
    的头像 发表于 07-04 17:00 ?311次阅读

    移远通信 × 奥飞娱乐,共同打造AI潮2.0时代

    上海——当童年记忆中的“喜羊羊”不再只是屏幕里的动画角色,而是化身能倾听心声、感知情绪的智能伙伴,场由AI技术驱动的潮革命已悄然来临。 ? 作为全球领先的物联网整体解决方案供应商,移远通信凭借
    发表于 06-30 17:31 ?1373次阅读
    移远通信 × 奥飞娱乐,共同打造AI潮<b class='flag-5'>玩</b>2.0时代

    移远通信 × 奥飞娱乐,共同打造AI潮2.0时代

    当童年记忆中的“喜羊羊”不再只是屏幕里的动画角色,而是化身能倾听心声、感知情绪的智能伙伴,场由AI技术驱动的潮革命已悄然来临。作为全球领先的物联网整体解决方案供应商,移远通信凭借前瞻性的AI
    的头像 发表于 06-30 17:02 ?616次阅读
    移远通信 × 奥飞娱乐,共同打造AI潮<b class='flag-5'>玩</b>2.0时代

    云里物里电子价签显示方案助力潮行业数字化升级

    从“小众收藏”到“大众消费”,潮行业正在粉丝藏品转变为大众消费品。据市场调研数据显示,中国潮市场规模已突破千亿元,消费者对产品信息更新速度、互动体验及个性化展示的需求日益增长。
    的头像 发表于 04-23 09:10 ?436次阅读

    树莓派上PS3游戏:现实还是幻想?

    尽管模拟器通常被视为游戏领域的个小众子集,但它具有诸多优势,包括平台独立性、游戏保存以及将QoL模组融入您最喜爱的独占主机游戏的能力。尽管老式的超任(SNES)、GameBoy和雅达
    的头像 发表于 03-25 09:31 ?375次阅读
    <b class='flag-5'>在</b>树莓派上<b class='flag-5'>玩</b>PS3<b class='flag-5'>游戏</b>:现实还是幻想?

    树莓派复古游戏机:用科技重现经典,让童年永不落幕!

    复古游戏机是种能让你玩经典游戏机上的视频游戏的设备。有了复古游戏机,你可以来自Atari的《
    的头像 发表于 03-25 09:28 ?621次阅读
    树莓派复古<b class='flag-5'>游戏</b>机:用科技重现经典,让童年永不落幕!

    如何安装模拟器nes小游戏-基于米尔瑞芯微RK3576开发板

    本篇源自:优秀创作者 小手凉凉本文将介绍基于米尔电子MYD-LR3576开发板(米尔基于瑞芯微 RK3576开发板)的安装模拟器nes小游戏方案测试。 核心板系统 操作系统镜像文件说明
    发表于 02-08 12:10

    Share Boom第12期:云终端2.0时代-无影随行,且好赢沙龙圆满落幕

    近日Share Boom第12期主题沙龙分享活动福州市鼓楼区AI算力运营加速中心圆满落幕。这场以“云终端2.0时代-无影随行,且好赢”为主题活动,吸引了大量互联网企业家以及游戏发烧友的关注,现场
    的头像 发表于 12-02 16:11 ?520次阅读

    适用于机器视觉应用的智能机器视觉控制平台

    工控机机器视觉系统设计中是不可或缺的核心组件,机器视觉中发挥着至关重要的作用,其强大的计算能
    的头像 发表于 11-23 01:08 ?616次阅读
    适用于<b class='flag-5'>机器</b><b class='flag-5'>视觉</b>应用的智能<b class='flag-5'>机器</b><b class='flag-5'>视觉</b>控制平台

    算能 SG2042 / Milk-V Pioneer 的含金量还在不断提升:RISC-V 生态逐步完善,大型游戏已经不远了!

    近期,Box64开源二进制模拟器项目对于RISC-V架构的支持和优化得到了进步提升,已经可以《Hades》这样的游戏神作。Box64项目创始人PtitSub搭载了算能(SOPHG
    的头像 发表于 11-01 08:10 ?1009次阅读
    算能 SG2042 / Milk-V Pioneer 的含金量还在不断提升:RISC-V 生态逐步完善,<b class='flag-5'>玩</b>大型<b class='flag-5'>游戏</b>已经不远了!

    机器视觉运动控制体机DELTA并联机械手视觉上下料应用

    机器视觉运动控制体机DELTA并联机械手视觉上下料的应用
    的头像 发表于 10-24 09:02 ?1138次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>视觉</b>运动控制<b class='flag-5'>一</b>体机<b class='flag-5'>在</b>DELTA并联机械手<b class='flag-5'>视觉</b>上下料应用

    《黑神话:悟空》,除了“官配”硬件还需要注意这些......

    《黑神话:悟空》,除了“官配”硬件还需要注意这些......
    的头像 发表于 08-30 14:58 ?974次阅读
    畅<b class='flag-5'>玩</b>《黑神话:悟空》,除了“官配”硬件还需要注意这些......

    远程控制技术的应用 游戏玩家都在关注黑神话 探讨远程怎么“悟空”3A游戏

    :悟空》Steam上已售出超过300万份,加上wegame、epic和ps平台,目前总销量超过450万份,总销售额超过15亿元。 ? 本期主要主要从两个方面来探讨:是通过远程串流技术非本地设备上
    的头像 发表于 08-21 15:53 ?644次阅读