机器学习的特征归一化Normalization

电玩女神 2023-10-04 22:17 83阅读 0赞

文章目录

为什么需要做归一化？
两种常用的归一化方法
批归⼀化（Batch Normalization）
- 局部响应归⼀化
- 批归⼀化（Batch Normalization）
- 批归一化的适用场景及优点

为什么需要做归一化？

为了消除数据特征之间的量纲影响，就需要对特征进行归一化处理，使得不同指标之间具有可比性。对特征归一化可以将所有特征都统一到一个大致相同的数值区间内。

为了后⾯数据处理的⽅便，归⼀化可以避免⼀些不必要的数值问题。
为了程序运⾏时收敛加快。
统一量纲。
保证输出数据中数值⼩的不被吞⾷。
避免神经元饱和。

在这里插入图片描述

两种常用的归一化方法

线性归⼀化（最大最小归一化，Min-Max Scaling）
标准差标准化（零均值归一化，Z-Score Scaling）

经过处理的数据符合标准正态分布，即均值为 0，标准差为 1。

批归⼀化（Batch Normalization）

局部响应归⼀化

局部响应归⼀化（Local Response Normalization ，LRN）是AlexNet中首次引入的归一化方法。

使用LRN的原因是为了鼓励横向抑制。

横向抑制：这是神经生物学中的一个概念，是指神经元减少其邻居活动的能力。在深度神经网络中，这种横向抑制的目的是进行局部对比度增强，以便使局部最大像素值用作下一层的激励。

批归⼀化（Batch Normalization）

以前在神经⽹络训练中，只是对输⼊层数据进⾏归⼀化处理，却没有在中间层进⾏归⼀化处理。要知道，虽然我们对输⼊数据进⾏了归⼀化处理，但是输⼊数据运算之后，其数据分布很可能被改变，⽽随着深度⽹络的多层运算之后，数据分布的变化将越来越⼤。

这种在神经⽹络中间层也进行归⼀化处理，使训练效果更好的方法，就是批归⼀化。

批归一化的算法流程：

输⼊：上⼀层输出结果X = {x1, x2, …, xm}

计算上⼀层输出数据的均值:
计算上⼀层输出数据的标准差
归一化
重构
γ和β为可学习的参数。

批归一化的适用场景及优点

在CNN中，批归一化应作⽤在⾮线性映射前。在神经⽹络训练时遇到收敛速度很慢，或梯度爆炸等⽆法训练的状况时可以尝试BN来解决。

当BatchSize比较大，数据分布比较接近，并在训练前对数据充分shuffle。
批归一化不适⽤于动态的⽹络结构和RNN⽹络。

使用批归一化具有以下优点：

减少了人为选择参数。
减少了对学习率的要求。
破坏原来的数据分布，⼀定程度上缓解过拟合。
减少梯度消失，加快收敛速度，提⾼训练精度。

发表评论取消回复

表情：

评论列表（有 0 条评论，83人围观）

还没有评论，来说两句吧...

相关阅读

相关【机器学习】特征工程：特征预处理，归一化、标准化、处理缺失值

特征预处理采用的是特定的统计方法（数学方法）将数据转化为算法要求的数字 1. 数值型数据归一化，将原始数据变换到\[0,1\]之间标准化，数据转化到均值为0，方差

淩亂°似流年/ 2024年02月18日 11:32/ 0 赞/ 151 阅读

相关【机器学习】特征工程：特征预处理，归一化、标准化、处理缺失值

特征预处理采用的是特定的统计方法（数学方法）将数据转化为算法要求的数字 1. 数值型数据归一化，将原始数据变换到\[0,1\]之间标准化，数据转化到均值为0，方差

朱雀/ 2024年02月17日 08:44/ 0 赞/ 168 阅读

相关机器学习的特征归一化Normalization

文章目录为什么需要做归一化？两种常用的归一化方法批归⼀化（Batch Normalization）局部响应归⼀化批归

电玩女神/ 2023年10月04日 22:17/ 0 赞/ 84 阅读

相关归一化：Layer Normalization、Batch Normalization

Normalization 有很多种，但是它们都有一个共同的目的，那就是把输入转化成均值为 0 方差为 1 的数据。我们在把数据送入激活函数之前进行 normalization

柔光的暖阳◎/ 2023年10月01日 19:37/ 0 赞/ 46 阅读

相关【机器学习】为什么需要对数值型的特征做归一化(Normalization)？

目录：为什么需要对数值型的特征做归一化？一、概念定义二、标准化、归一化的原因、用途 2.1 原因三、数据归一化的影响四、常用的

缺乏、安全感/ 2023年09月27日 14:45/ 0 赞/ 19 阅读

相关数据标准化/归一化normalization

http://[blog.csdn.net/pipisorry/article/details/52247379][blog.csdn.net_pipisorry_articl

超、凢脫俗/ 2022年09月25日 10:16/ 0 赞/ 255 阅读

相关数据标准化/归一化normalization

这里主要讲连续型特征归一化的常用方法。离散参考\[[数据预处理：独热编码（One-Hot Encoding）][One-Hot Encoding]\]。基础知识参考：

妖狐艹你老母/ 2022年06月11日 01:43/ 0 赞/ 496 阅读

相关机器学习之归一化（Normalization）

一、定义数据标准化（Normalization），也称为归一化，归一化就是将你需要处理的数据在通过某种算法经过处理后，限制将其限定在你需要的一定的范围内。数据标准化处理

╰+哭是因爲堅強的太久メ/ 2022年06月07日 06:18/ 0 赞/ 345 阅读

相关数据标准化/归一化normalization

http://[blog.csdn.net/pipisorry/article/details/52247379][blog.csdn.net_pipisorry_articl

以你之姓@/ 2022年05月20日 01:15/ 0 赞/ 840 阅读

相关深度学习：批归一化和层归一化Batch Normalization、Layer Normalization

深度神经网络模型训练难，其中一个重要的现象就是 Internal Covariate Shift. Batch Norm 自 2015 年由Google 提出之

分手后的思念是犯贱/ 2021年12月09日 19:37/ 0 赞/ 1594 阅读