Pandas是Python中非常常用的数据处理工具,使用起来非常方便。由于建立在NumPy数组结构之上,所以它的很多操作通过NumPy或者Pandas自带的扩展模块编写,这些模块用Cython编写并编译到C,并且在C上执行,因此也保证了处理速度。不过我们今天的重点不在于它的处理速度,而是它和matplotlib合作产生的强大且方便的绘图功能。
到底有多强呢?让我们来体会一下。
1.创建数据
使用pandas可以很方便地进行数据创建,现在让我们创建一个5列1000行的pandas DataFrame:
- a1和a2:从正态(高斯)分布中抽取的随机样本。
- a3:0到4中的随机整数。
- y1:0到1的对数刻度均匀分布。
- y2:0到1中的随机整数。
生成如下所示的数据,这些数据将会用到后续的实验上哦:
2.绘制图像
Pandas 绘图函数返回一个matplotlib的坐标轴(Axes),所以我们可以在上面自定义绘制我们所需要的内容。比如说画一条垂线和平行线。这将非常有利于我们:
1.绘制平均线
2.标记重点的点
我们还可以自定义一张图上显示多少个表:
3.绘制直方图
Pandas能够让我们用非常简单的方式获得两个图形的形状对比:
还能允许多图绘制:
当然,折线图也不在话下:
4.线性拟合
你以为这就结束了吗?不!Pandas还能用于拟合,让我们用pandas找出一条与下图最接近的直线:
最小二乘法计算和该直线最短距离:
根据最小二乘的结果绘制y并拟合出直线:
-
数据处理
+关注
关注
0文章
629浏览量
29390 -
编译
+关注
关注
0文章
680浏览量
34309 -
python
+关注
关注
56文章
4832浏览量
87757
发布评论请先 登录
python数据分析的类库
Python机器学习入门之pandas的使用提示
pandas是什么?
使用Pandas的定制功能来帮助我们自定义内容的显示方式
详解Python中的Pandas和Numpy库
Python Pandas如何来管理结构化数据

如何使用Python和pandas库读取、写入文件
如何利用Python和pandas来处理json数据

评论