搜索历史

清空

搜索热词

0

聊天消息
系统消息
评论与回复

查看更多

查看更多

查看更多

VIP于到期续费

登录后你可以

下载海量资料
学习在线课程
观看技术视频
写文章/发帖/加入社区

会员中心

创作中心

发布

创作活动

完善资料让更多小伙伴认识你，还能领取20积分哦，立即完善>

3天内不再提示

实例：如何建立一个线性分类器并进行优化

之前，论智曾在TOP 10：初学者需要掌握的10大机器学习（ML）算法介绍了一些基础算法及其思路，为了与该帖联动，我们特从机器学习热门课程HSE的Introduction to Deep Learning和吴恩达的Neural Networks and Deep Learning中挑选了一些题目，演示Python、TensorFlow和Keras在深度学习中的实战应用.

如何建立一个线性分类器并进行优化.

在这个任务中，我们将实现一个线性分类器，并用numpy和随机梯度下降算法对它进行训练。

二元分类

为了更直观，我们用人造数据（synthetic data）解决二元分类问题。

上图中有红、蓝两类数据，从分布上看它们不是线性可分的。所以为了分类，我们应该在里面添加特征或使用非线性模型。请注意，图中两类数据的决策边缘都呈圆形，这意味着我们能通过建立二元特征来使它们线性分离，具体思路如下图所示：

用expand函数添加二次函数后，我们得到了这样的测试结果：

# 简单的随机数测试
dummy_X = np.array([
[0,0],
[1,0],
[2.61,-1.28],
[-0.59,2.1]
])
# 调用expand函数
dummy_expanded = expand(dummy_X)
# 它应该返回这些值: x0 x1 x0^2 x1^2 x0*x1 1
dummy_expanded_ans = np.array([[0. , 0. , 0. , 0. , 0. , 1. ],
[1. , 0. , 1. , 0. , 0. , 1. ],
[2.61, -1.28, 6.8121, 1.6384, -3.3408, 1. ],
[-0.59, 2.1 , 0.3481, 4.41, -1.239, 1. ]])

logistic回归

曾经我们提到过，logistic回归非常适合二元分类问题。为了分类对象，我们需要预测对象表示为1（默认类）的概率，这就需要用到线性模型和逻辑函数的输出：

defprobability(X, w):
"""
对输入赋值特征和权值
根据上式，返回输入x后y==1的预测概率，P(y=1|x)
:参数 X: feature matrix X of shape [n_samples,6] (expanded) →特征矩阵X
:参数 w: weight vector w of shape [6] for each of the expanded features →权值向量w
:返回值: 范围在 [0,1] 之间的一系列概率.
"""
return1./ (1+ np.exp(-np.dot(X, w)))

在logistic回归中，我们能通过最小化交叉熵发现最优参数w：

实例：如何建立一个线性分类器并进行优化

defcompute_loss(X, y, w):
"""
将特征矩阵X [n_samples,6], 目标向量 [n_samples] of 1/0,
以及权值向量 w [6]代入上述公式, 计算标量的损失函数.
"""
return-np.mean(y*np.log(probability(X, w)) + (1-y)*np.log(1-probability(X, w)))

由于用了梯度下降算法训练模型，我们还需要计算梯度，具体来说，就是要对每个权值的损失函数求导：

以下是具体的数学计算过程（也可点击https://math.stackexchange.com/questions/477207/derivative-of-cost-function-for-logistic-regression/2539508#2539508查看）：

实例：如何建立一个线性分类器并进行优化

defcompute_grad(X, y, w):
"""
将特征矩阵X [n_samples,6], 目标向量 [n_samples] of 1/0,
以及权值向量 w [6]代入上述公式, 计算每个权值的导数vector [6].
"""
returnnp.dot((probability(X, w) - y), X) / X.shape[0]

训练

现在我们已经建立了函数，接下来就该用随机梯度下降训练分类器了。我们将试着调试超参数，如batch size、学习率等，来获得最佳设置。

Mini-batch SGD

不同于满梯度下降，随机梯度下降在每次迭代中只需要一个随机样本来计算其损失的梯度，并进入下一个步骤：

w = np.array([0,0,0,0,0,1])# 初始化
eta =0.05# 学习率
n_iter =100
batch_size =4
loss = np.zeros(n_iter)
foriinrange(n_iter):
ind = np.random.choice(X_expanded.shape[0], batch_size)
loss[i] = compute_loss(X_expanded, y, w)
dw = compute_grad(X_expanded[ind, :], y[ind], w)
w = w - eta*dw

下图展示了当batch size=4时，决策面（decision surface）和交叉熵损失函数如何随着不同batch的SGD发生变化。

实例：如何建立一个线性分类器并进行优化

左：决策面；右：损失函数

用Momentum优化SGD

Momentum是模拟物理里动量的概念，如下图所示，它能在相关方向加速SGD，抑制振荡，从而加快收敛。从计算角度说，就是对上一步骤更新向量和当前更新向量做加权平均，将其用于当前计算。

实例：如何建立一个线性分类器并进行优化

eta =0.05# 学习率
alpha =0.9# momentum
nu = np.zeros_like(w)
n_iter =100
batch_size =4
loss = np.zeros(n_iter)
foriinrange(n_iter):
ind = np.random.choice(X_expanded.shape[0], batch_size)
loss[i] = compute_loss(X_expanded, y, w)
dw = compute_grad(X_expanded[ind, :], y[ind], w)
nu = alpha*nu + eta*dw
w = w - nu

下图展示了引入Momentum后，当batch size=4时相应决策面和交叉熵损失函数随不同batch SGD+momentum发生的变化。可以看出，损失函数下降速度明显加快，更快收敛。

实例：如何建立一个线性分类器并进行优化

左：决策面；右：损失函数

RMSprop

加快收敛速度后，之后我们要做的是调整超参数学习率，这里我们介绍Hinton老爷子的RMSprop。这是一种十分高效的算法，利用梯度的平方来调整学习率：

eta =0.05# 学习率
alpha =0.9# momentum
G = np.zeros_like(w)
eps =1e-8
n_iter =100
batch_size =4
loss = np.zeros(n_iter)
foriinrange(n_iter):
ind = np.random.choice(X_expanded.shape[0], batch_size)
loss[i] = compute_loss(X_expanded, y, w)
dw = compute_grad(X_expanded[ind, :], y[ind], w)
G = alpha*G + (1-alpha)*dw**2
w = w - eta*dw / np.sqrt(G + eps)

下图是使用了SGD + RMSProp后决策面和损失函数的变化情况，较之之前，函数下降更快，收敛也更快。

实例：如何建立一个线性分类器并进行优化

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

ML

ML

+关注

关注
0

文章
153

浏览量
35163
线性分类器

线性分类器

+关注

关注
0

文章
3

浏览量
1511

原文标题：课后作业（一）：如何建立一个线性分类器并进行优化

文章出处：【微信号：jqr_AI，微信公众号：论智】欢迎添加关注！文章转载请注明出处。

评论

精选推荐
更多

文章

资料

帖子

电机的极数什么意思？2极，4极，6极，8极的区别是什么？

其利天下技术
1天前

840 阅读

基于MCUXpresso和FRDM-MCXA346的RT-Thread Nano移植 | 技术集结

RT-Thread官方账号
1天前

839 阅读

先进Interposer与基板技术解析

深圳市赛姆烯金科技有限公司
1天前

1056 阅读

解读NVIDIA Cosmos世界基础模型的最新功能

NVIDIA英伟达企业解决方案
1天前

984 阅读

NVIDIA Omniverse Extension开发秘籍

丽台科技
1天前

1101 阅读

CCNA路由交换视频教程（11-20）

klysa
65800

5积分

38下载

TD-SCDMA基站子系统原理教材

159520
3.48 MB

免费

341下载

Paz持续部署产品环境

恩可口
0.08 MB

2积分

2下载

ROCBOSS开源微社区解决方案

吴湛
9.65 MB

2积分

1下载

三相车载充电器（OBC） PFC-LLC平台SEC-3PH-11-OBC-EVB数据手册

13.70 MB

免费

15下载

图解环路设计及控制技术探讨

yuu_cool
2天前

720 阅读

【嘉楠堪智K230开发板试用体验】高校竞赛-图传基于micropython

jf_22581457
2天前

912 阅读

【Milk-V Duo S 开发板免费体验】DuoS 超声波测距 OLED 显示

gtbestom
2天前

1071 阅读

【Milk-V Duo S 开发板免费体验】DuoS 驱动 OLED 显示屏

gtbestom
2天前

1064 阅读

一起来玩转CW32L011无刷直流电机驱动开发板

jf_27499261
3天前

1026 阅读

推荐专栏
更多

企业产品

资料

方案
更多

abg欧博（原“华强聚丰”）：

电子发烧友

abg欧博开发

abg欧博电路(原"华强PCB")

abg欧博商城(原"华强芯城")

abg欧博智造

My ElecFans

APP
网站地图

设计技术

可编程逻辑

电源/新能源

MEMS/传感技术

测量仪表

嵌入式技术

制造/封装

模拟技术

RF/无线

接口/总线/驱动

处理器/DSP

EDA/IC设计

存储技术

光电显示

EMC/EMI设计

连接器

行业应用

LEDs

汽车电子

音视频及家电

通信网络

医疗电子

人工智能

虚拟现实

可穿戴设备

机器人

安全设备/系统

军用/航空电子

移动通信

工业控制

便携设备

触控感测

物联网

智能电网

区块链

新科技

特色内容

专栏推荐

学院

设计资源

设计技术

电子百科

电子视频

元器件知识

工具箱

VIP会员

最新技术文章

产品地图

品牌地图

社区

小组

论坛

问答

评测试用

企业服务

产品

资料

文章

方案

企业

供应链服务

硬件开发

abg欧博电路

abg欧博商城

abg欧博智造

nextPCB

BOM配单

媒体服务

网站广告

在线研讨会

活动策划

新闻发布

新品发布

小测验

设计大赛

abg欧博

关于我们

投资关系

新闻动态

加入我们

联系我们

举报投诉

社交网络

微博

移动端

发烧友APP

硬声APP

WAP

联系我们

广告合作

王婉珠：wangwanzhu@elecfans.com

内容合作

黄晶晶：huangjingjing@elecfans.com

内容合作（海外）

张迎辉：mikezhang@elecfans.com

供应链服务 PCB/IC/PCBA

江良华：lanhu@huaqiu.com

投资合作

曾海银：zenghaiyin@huaqiu.com

社区合作

刘勇：liuyong@huaqiu.com

关注我们的微信

下载发烧友APP

电子发烧友观察

电子工程师社区

1-32层PCB打样·中小批量

元器件现货·全球代购·SmartBOM

SMT贴片·PCBA加工

PCB Manufacturer

abg欧博简介

企业动态

联系我们

企业文化

企业宣传片

加入我们

版权所有 ? 湖南abg欧博数字科技有限公司

长沙市望城经济技术开发区航空路6号手机智能终端产业园2号厂房3层（0731-88081133）
电子发烧友 （电路图） 湘公网安备43011202000918 工商网监湘ICP备2023018690号-1