0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大学课程 数据分析 实战之主成分分析(1)

通信工程师专辑 ? 来源:未知 ? 2023-02-12 15:25 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

本系列文章会先简单介绍主成分分析(PCA)的基本原理,然后用实例介绍分析的过程以及算法代码。PCA主要用于数据降维。由一系列特征组成的多维向量,其中某些元素本身没有区分性,比如某个元素在所有的样本中都相等,或者彼此差距不大,那么这个元素本身就没有区分性,如果用它做特征来区分,贡献会非常小。我们的目的是找到那些变化大的元素,即方差大的维,而去除掉那些变化不大的维。使用PCA的好处在于可以对新求出的“主元”向量的重要性进行排序。根据需要取前面最重要的部分,将后面的维数省去,从而达到降维、简化模型或对数据进行压缩的效果。同时最大程度地保持了原有数据的信息,较低的维数意味着运算量的减少,在数据较多的情况带来的性能提高更明显。

PCA通过将主成分分析的问题转化为求解协方差矩阵的特征值和特征向量来计算。其目标是寻找r(r小于原先的个数n)个新变量,使它们反映事物的主要特征,压缩原有数据矩阵的规模,每个新变量是原有变量的线性组合,体现原有变量的综合效果,这r个新变量称为“主成分”,它们可以在很大程度上反映原来n个变量的影响,并且这些新变量是互不相关的,也是正交的。主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。可以使用自带函数来完成,也可以使用自编函数来实现!这些内容都在本文中得到体现!

7f221c72-aaa4-11ed-bfe3-dac502259ad0.gif

PCA自带函数!!!

MATLAB 2021a版本里面有主成分分析的函数pca。先看语法,然后在程序中使用看看效果!预先提示:计算相关系数的方式有些特别,居然用到了SVD算法,新奇!

7f2f2228-aaa4-11ed-bfe3-dac502259ad0.png

由于主成分分析(principile component analysis,PCA)这个概念在不同领域(统计学、数学等)的解释差异较大,所以,本文通过示例使用对该函数做一点儿解释。

语法:

coeff =pca(X)

coeff =pca(X,Name,Value)

[coeff,score,latent] =pca(___)

[coeff,score,latent,tsquared] =pca(___)

[coeff,score,latent,tsquared,explained,mu] =pca(___)

[coeff,score,latent] =pca(___)还在score中返回主成分分数,在latent中返回主成分方差。您可以使用上述语法中的任何输入参数。主成分分数是X在主成分空间中的表示。score的行对应于观测值,列对应于成分。主成分方差是X的协方差矩阵的特征值。

原文标题:大学课程 数据分析 实战之主成分分析(1)

文章出处:【微信公众号:通信工程师专辑】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 通信网络
    +关注

    关注

    22

    文章

    2078

    浏览量

    53119

原文标题:大学课程 数据分析 实战之主成分分析(1)

文章出处:【微信号:gh_30373fc74387,微信公众号:通信工程师专辑】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI数据分析仪设计原理图:RapidIO信号接入 平板AI数据分析

    AI数据分析仪, 平板数据分析仪, 数据分析仪, AI边缘计算, 高带宽数据输入
    的头像 发表于 07-17 09:20 ?152次阅读
    AI<b class='flag-5'>数据分析</b>仪设计原理图:RapidIO信号接入 平板AI<b class='flag-5'>数据分析</b>仪

    高光谱相机在生物医学中的应用:病理分析、智慧中医与成分分析

    企业,深圳市中达瑞和科技有限公司依托自主研发的高光谱相机与光谱云平台,在生物医学领域实现了多项突破性应用。本文聚焦其在病理分析、病毒检测及成分分析中的核心价值与实践成果。 一、病理分析:精准诊断与效率提升 高光谱相机通过非侵入式
    的头像 发表于 04-24 11:25 ?265次阅读

    Mathematica 在数据分析中的应用

    ,在数据分析领域发挥着重要作用。 1. 数据导入 在进行数据分析之前,首先需要将数据导入到Mathematica中。Mathematica支
    的头像 发表于 12-26 15:41 ?763次阅读

    数据可视化与数据分析的关系

    在当今这个信息爆炸的时代,数据无处不在。无论是企业运营、科学研究还是个人决策,我们都需要从海量的数据中提取有价值的信息。数据分析数据可视化作为两个关键的工具,它们帮助我们理解、解释和
    的头像 发表于 12-06 17:09 ?1012次阅读

    LLM在数据分析中的作用

    的游戏规则。 1. 数据预处理 数据预处理是数据分析的第一步,也是至关重要的一步。LLM在这一阶段可以发挥重要作用。 文本清洗 :LLM可以帮助识别和纠正文本
    的头像 发表于 11-19 15:35 ?1218次阅读

    eda与传统数据分析的区别

    EDA(Exploratory Data Analysis,探索性数据分析)与传统数据分析之间存在显著的差异。以下是两者的主要区别: 一、分析目的和方法论 EDA 目的 :EDA的主要目的是对
    的头像 发表于 11-13 10:52 ?938次阅读

    为什么选择eda进行数据分析

    数据科学领域,数据分析是一个复杂且多步骤的过程,它涉及到数据的收集、清洗、探索、建模和解释。在这些步骤中,探索性数据分析(EDA)扮演着至关重要的角色。
    的头像 发表于 11-13 10:41 ?797次阅读

    raid 在大数据分析中的应用

    RAID(Redundant Array of Independent Disks,独立磁盘冗余阵列)在大数据分析中的应用主要体现在提高存储系统的性能、可靠性和容量上。以下是RAID在大数据分析
    的头像 发表于 11-12 09:44 ?779次阅读

    SUMIF函数在数据分析中的应用

    在商业和科学研究中,数据分析是一项基本且关键的技能。Excel作为最常用的数据分析工具之一,提供了多种函数来帮助用户处理和分析数据。SUMIF函数就是其中之一,它允许用户根据特定的条件
    的头像 发表于 11-11 09:14 ?933次阅读

    什么是成分分析

    解析成分分析技术成分分析技术涵盖了多种科学方法,用于精确地鉴定和测量产品或样本中的组成成分,包括它们的定性与定量分析。金鉴实验室拥有先进的成分分析
    的头像 发表于 11-08 12:29 ?1308次阅读
    什么是<b class='flag-5'>成分分析</b>?

    智能制造中的数据分析应用

    随着工业4.0的推进,智能制造已经成为制造业转型升级的关键。数据分析作为智能制造的核心驱动力,正逐步改变传统的生产方式,为企业带来更高的效率和更大的竞争力。 一、数据分析在智能制造中的重要性 提高
    的头像 发表于 11-07 09:56 ?936次阅读

    数据分析在数字化中的作用

    在当今这个信息爆炸的时代,数据无处不在。从个人的日常活动到企业的商业决策,数据都在发挥着越来越重要的作用。数字化转型,作为企业适应这一变化的关键策略,正逐渐成为各行各业的共识。 1. 数据分析
    的头像 发表于 10-27 17:35 ?1199次阅读

    云计算在大数据分析中的应用

    云计算在大数据分析中的应用广泛且深入,它为用户提供了存储、计算、分析和预测的强大能力。以下是对云计算在大数据分析中应用的介绍: 一、存储和处理海量数据 云计算提供了强大的存储和计算能力
    的头像 发表于 10-24 09:18 ?1170次阅读

    使用AI大模型进行数据分析的技巧

    使用AI大模型进行数据分析的技巧涉及多个方面,以下是一些关键的步骤和注意事项: 一、明确任务目标和需求 在使用AI大模型之前,首先要明确数据分析的任务目标,这将直接影响模型的选择、数据收集和处理方式
    的头像 发表于 10-23 15:14 ?2870次阅读

    IP 地址大数据分析如何进行网络优化?

    一、大数据分析在网络优化中的作用 1.流量分析数据分析可以对网络中的流量进行实时监测和分析,了解网络的使用情况和流量趋势。通过对流量
    的头像 发表于 10-09 15:32 ?609次阅读
    IP 地址大<b class='flag-5'>数据分析</b>如何进行网络优化?