人工智能产业在经历了60多年酝酿后终于达到了目前的爆发期。然而,与强劲的发展势头和旺盛的行业需求相对应的,是巨大的数据缺口。
作为人工智能三大要素的首要因素,数据是人工智能持续进化的动力原料。处于大数据背景下的人工智能,每一项技术在具体场景的落地应用,背后都离不开海量数据的支持。随着以深度学习为代表的算法在诸多领域被逐渐应用,对优质数据、尤其是优质一手数据的需求量快速增长。
但是,这些“有价值”的数据往往很难依靠市场上的“公开数据”获取。数据的采集、清洗、标注,一方面需要耗费大量人力、时间,另一方面,如果数据不规范,量不够大,难以满足专业化的应用需求,这就为专门做数据服务的公司提供了新的市场机遇。在人工智能产业链中,专业化的数据服务商越来越受到重视,也成为当前的投资热点。
2019年1-7月数据服务企业融资情况
据<电子发烧友>不完全统计,截止2019年7月31日,中国市场数据服务商完成融资的有38家。根据事件中披露具体融资信息的企业来看,成长期、成熟期企业更受机构青睐。融资规模Top8事件中,仅一起为A轮,其余均为B轮及以后。其中:Top1明略数据,D轮20亿人民币;Top2睿智科技,A轮6.5亿人民币;Top3城云,C轮3亿人民币;Top4森亿智能,C轮2.5亿人民币;Top5瑞驰信息,B轮2.4亿人民币;Top6 Kyligence,C轮2500万美元;Top7并列为中科闻歌和热云数据,分别是B轮1亿人民币,B+轮1亿人民币;Top8巅峰云智,B轮8000万人民币。
以下是<电子发烧友>整理的2019年1-7月国内数据服务商融资名单:
什么样的数据服务企业受资本青睐?
抽取上述融资事件中规模排名前三的企业以及一家典型企业做如下分析,不难发现:商业模式清晰,成熟技术易形成场景规模化应用,在某一或某几个领域有独到优势的数据服务商更受资本青睐和追捧。明略数据被称为是大数据与人工智能领域的独角兽企业,覆盖安防、工业、数字城市、金融四大垂直领域。创立了“符号主义和深度学习有效结合”的人工智能顶层设计方式,打通感知与认知智能。并在各个行业领域推进知识驱动和数据驱动模型相结合的应用。在安防领域,由公安部第一研究所牵头、明略联合编写的《公安知识图谱标准与白皮书》于去年9月发布,基于这一公安知识图谱的系统已部署到60多个部、省、地市和区县级公安部门;在金融领域,完成了银行业全行级知识图谱数据库,并为中国人民银行、交通银行、光大银行等多位行业标杆客户构建了基于不同业务场景下的应用系统,提升风控效率的同时完善了客户整体风险管理能力;在数字城市领域,实现了车辆全生命周期数据管理的智能化平台,通过帮助轨交运营单位提高工作效率,将安全风险和运营成本等指标综合下降10%。
不同于明略数据多领域的覆盖,睿智科技主要为广大金融机构提供风控、获客、服务、平台。产品体系包括信贷风险管理、智能催收、一站式智能决策云和智能导流等产品。该公司在解决金融信息非对称方面形成了独到优势,并构建了大规模产业化的应用场景。凭借在大数据洞察力及人工智能领域打造的清晰的发展图景,该公司曾在2018年7月完成了1亿元规模的Pre-A轮融资,并在不到一年内完成A轮6.5亿融资。
城云定位于城市互联网运营商,完成了绿地控股的C轮3亿元融资。该公司将大数据技术与传统数据存储系统相结合,充分利用行业积累的经验及客户源,集成公司内部、政府企业客户的可公开数据、互联网数据搜集等多种渠道的数据资源,提供大数据消费平台,为客户积累数据资产、提升运营效率,创造经济价值。主要服务对象是城市客户、小镇园区客户和产业级企业客户。应用场景包括交通、安防、城管、政府、公共事业等。截止今年5月,城云的业务已覆盖了20个省份的100多个城市,服务了1000多家行业客户和超过10万家中小企业客户。过去一年,公司先后进入了浙江省数字经济一号工程和5个杭州城市大脑专班,城市管理业务深入覆盖了7个省份,打造了数字经济领域主赛道的10个样板。
九次方大数据是唯一一家在两个月内获得两轮战略融资的企业,该公司专注于服务全国各级政府政务数据开发应用。该公司与政府合作开发数据的方式,是通过为相关数据方提供数据处理工具,从而在保证数据本身不被泄露的前提下,得到有价值的数据分析结果。正如该公司创始人所说,他们仅提供数据管道,将政府部门的数据价值发掘出来,输送和传递出去,而不是用一个水桶,将数据本身带走。我国80%以上的数据资源由政府掌握,该公司敏锐地捕捉到了政务数据的主流价值,以数据资产运营为模式,对政府数据进行合法开发利用,打造数字经济增长。
数据缺口面前是AI基础方法论瓶颈所在
互联网时代积累的大量数据和云计算带来的算力的大幅提升,极大地释放了深度学习算法(深层的神经网络)的潜力,因而也让人工智能时代全面爆发。但是,有业内专家认为,AI的发展现状仅相当于“互联网在上世纪90年代初期的阶段”,主要方法论仍是基于大数据、大计算模式,需要海量数据去“喂养”。人工智能并不会像人类那样推断出结论,而是需要大量的数据来教授和培训,进行不断地试验和错误学习。
清华大学人工智能学院院长张钹院士曾在公开演讲中表示,数据量的大小并不是当前的根本问题所在,传统的人工智能三要素将不能带来真正的智能。这主要因为现在的人工智能基本方法有缺陷,只有走向具有理解能力的人工智能,才是真正的人工智能。
理论上看,深度学习是机器学习中一种基于对数据进行表征学习的方法。表征学习的目的,是通过从大规模数据中进行学习,不断追求更好的表示方法,即通常所说的模型。人工智能产品精准的识别度需要大量的数据样本支持其计算机进行深度学习、训练,也就是说,精准的数据是现阶段人工智能产品研发结果的核心要素。
张钹院士认为,深度学习之所以能够极大地促进人工智能的发展,技术上的关键在于人们能够将获取的标量数据转变为向量,从而用到机器上。但至今为止,将行为(特征向量)和数据(符号向量)结合起来使用始终是科研的难点,而这就限制了机器变得更“智能”。
不仅如此,从安全层面来看,纯数据驱动的系统也存在很大问题——鲁棒性很差,易受到很大的干扰。即使在大量样本的训练下,系统仍会犯重大的错误。哪怕训练出的系统模型准确率高达99%,但在实际应用中,系统仍然会犯很多“弱智”的错误。
不可否认,深度学习比一般的数据统计和机器学习方法都要更高级。但随着产业应用的成熟,以及大家对真正“智能”的渴求,让深度学习算法本身的局限性显露无疑。
Google 人工智能研究人员 Francois Chollet 提出,深度学习的成果是建立在极其苛刻的前提条件之上,需要大量的数据进行支撑。数据质量如果不稳定,带来的就是:不可靠、不准确。此外,还有最大的风险:不安全。
「生成对抗式网络」(GAN)的发明人 Ian Goodfellow就曾提醒我们:现在的神经网络可以很容易被不轨之徒操纵。例如他们可以通过肉眼无法识别的方式,篡改图片,让机器错误地辨识这个图片。这种恶意篡改人工智能系统的做法,会带来极大的危害,尤其是被篡改的图片和最初的图片在我们看来完全是一回事。比如说无人驾驶就会受到威胁。
正如Francois Chollet所说:“你不可能就以今时今日的技术研发成果作为基础,就能实现某种一般意义上的智能。”
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
AI
+关注
关注
88文章
35758浏览量
282453 -
数据服务
+关注
关注
0文章
41浏览量
10152 -
人工智能
+关注
关注
1810文章
49221浏览量
251538 -
融资
+关注
关注
0文章
195浏览量
22096 -
大数据
+关注
关注
64文章
8966浏览量
140843 -
深度学习
+关注
关注
73文章
5569浏览量
123088
发布评论请先 登录
相关推荐
热点推荐
挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器
应用场景。从数据采集,到模型推理,都能完整且自如地参与,轻松解锁人工智能全流程实训,让你深度体验AI技术的魅力 。
四、九门课程全覆盖,满足多元学习需求
对于高校教学或者技术学习来说,课程覆盖的广度
发表于 08-07 14:30
挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!
应用场景。从数据采集,到模型推理,都能完整且自如地参与,轻松解锁人工智能全流程实训,让你深度体验AI技术的魅力 。
四、九门课程全覆盖,满足多元学习需求
对于高校教学或者技术学习来说,课程覆盖的广度
发表于 08-07 14:23
广电计量亮相2025年广州市人工智能与企业数据治理研讨会
近日,由广州市工业和信息化局主办,广州市人工智能产业发展促进会与广电计量承办的“千模智赋百业”2025年广州市人工智能与企业数据治理研讨会在
依托新的全球数据集识别人工智能领域新一轮涌现的杰出女性
总部位于英国的人才数据和分析公司Zeki Data今日宣布推出一款新的数据洞察产品Talent Multiplier,该产品能精准识别那些
AI数据服务在智能驾驶训练中的应用实例
标贝科技深耕AI数据服务多年,在无人驾驶、自动驾驶等智能驾驶领域拥有丰富的合作案例。多次采用点云标注以及3D&2D融合等标注方式为智能驾驶领域客户提供环境感知、决策策划、车道线标注、障碍物监测、道路标志牌标注等标注
Infosys与谷歌云加强合作,推动企业人工智能创新,建立卓越中心
利用Infosys Topaz和谷歌云技术,卓越中心将促进共同创新,提供变革性的人工智能解决方案? 印度班加罗尔2024年12月19日 /美通社/ -- 下一代数字服务和咨询领域的全球
标贝科技:AI基础数据服务,人工智能行业发展的底层支撑
随着不同大模型在语言理解及生成等领域的出色表现,大模型别后的规模规律不断强化数据在要提升AI性能上的关键作用,AI数据服务可加速高质量数据的获取与标注,推动AI算法的创新与持续优化,是AI产业发展的基础。加速高质量

嵌入式和人工智能究竟是什么关系?
对人工智能应用的实时响应。与此同时,嵌入式系统在边缘计算和物联网领域,也为人工智能的应用提供了广阔的空间。
在边缘计算中,嵌入式系统能够将人工智能算法部署到设备端,实现对数据的即时处
发表于 11-14 16:39
《AI for Science:人工智能驱动科学创新》第6章人AI与能源科学读后感
、优化等方面的应用有了更清晰的认识。特别是书中提到的基于大数据和机器学习的能源管理系统,通过实时监测和分析能源数据,实现了能源的高效利用和智能化管理。
其次,第6章通过多个案例展示了
发表于 10-14 09:27
AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感
阅读这一章后,我深感人工智能与生命科学的结合正引领着一场前所未有的科学革命,以下是我个人的读后感:
1. 技术革新与生命科学进步
这一章详细阐述了人工智能如何通过其强大的数据处理和
发表于 10-14 09:21
《AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得
. 人工智能:科学研究的加速器
第一章清晰地阐述了人工智能作为科学研究工具的强大功能。通过机器学习、深度学习等先进技术,AI能够处理和分析海量数据,发现传统方法难以捕捉的模式和规律。这
发表于 10-14 09:12
risc-v在人工智能图像处理应用前景分析
RISC-V在人工智能图像处理领域的应用前景十分广阔,这主要得益于其开源性、灵活性和低功耗等特点。以下是对RISC-V在人工智能图像处理应用前景的详细分析:
一、RISC-V的基本特点
RISC-V
发表于 09-28 11:00
名单公布!【书籍评测活动NO.44】AI for Science:人工智能驱动科学创新
活的世界?
编辑推荐
《AI for Science:人工智能驱动科学创新》聚焦于人工智能与材料科学、生命科学、电子科学、能源科学、环境科学五大领域的交叉融合,通过深入浅出的语言和诸多实际应用案例,介绍了
发表于 09-09 13:54
报名开启!深圳(国际)通用人工智能大会将启幕,国内外大咖齐聚话AI
,得到了华为、腾讯、优必选、中煤科工、中国联通、云天励飞、考拉悠然、智航、力维智联等国内人工智能企业的深度参与和大力支持。
报名后即可到现场领取礼品,总计5000份,先到先选!
点击报名:https://bbs.elecfans.com/jishu_2447254_
发表于 08-22 15:00
评论