数据挖掘的任务有哪些
1、关联分析(associationanalysis)
关联分析挖掘是由RakeshApwal等人首先提出的。两个或两个以上变量取向价值之间存在某种规律性发掘称之为关联。数据关联是数据库中存在的一类重要的、可被发现的知识。关联分为简单关联、时序关联和因果关联。关联分析的目的是找出数据库中隐藏的大量关联网。一般用支持度和可信度两个阀值来度量获取关联规则的相关性,还有兴趣度、相关性等参数,使得所挖掘的规则更符合实质需求。
2、聚类分析(clustering)
聚类是把数据按照相似性归纳成若干类别分类出来,同一类中的数据彼此相似,不同类中的数据则相异。聚类分析可以建立宏观的概念,发布数据的分布模式,以及可能性的数据属性之间的相互关系。
3、分类(classification)
分类其实就是找出一个类别的概念描述,代表了数据的整体信息,分类的内涵描述,并用描述来构造模型,一般用作于规则或决策树模式表示出来。分类是利用训练数据集中通过一定的算法而求得分类规则。分类可被用于规则描述和数据预测。
4、预测(predication)
通过预测利用历史数据找出变化规律,建立模型并由该模型对未来数据的种类及特征进行预测。预测关心的是精确度和不确定性因素,通常用预测方差来度量较为适合。
通过时间序列搜索出的重复发生概率比较高的模式。与回归一样,它也是用己知的数据预测未来的数据值,但这些数据的区别是变量所处时间的不同而已。
6、偏差分析(deviation)
在偏差中包括很多有用的知识,数据库中的数据存在很多异常情况,发现数据库中数据存在的异常情况是非常重要的。偏差检验的基本方法就是寻找观察结果与参照之间的差别。
-
数据挖掘
+关注
关注
1文章
406浏览量
24753
发布评论请先 登录
用树莓派挖掘5种顶级加密货币!

物联网数据中台哪家好用?有什么推荐?
物联网感知数据挖掘:赋能万物智联的核心引擎
向FreeRTOS的任务中发送事件队列是有什么限制吗?
iMX8DXL有什么方法可以使所有与SPI相关的任务在单核中工作?
使用串口dma环形接收+空闲中断,触发空闲中断后进入任务中拷贝数据发现拷贝的数据全为0,怎么处理?
三一挖掘机一键启动开关易坏的原因及更换注意事项
易华录智慧交管大模型实现交通数据价值的深度挖掘与应用
Linux计划任务cron详解

什么是大屏数据可视化?特点有哪些?
Linux计划任务介绍
精准定位隧道挖掘通讯难题:虹科PCAN卡如何满足专业通讯需求?

评论