1，引言

1.1，意义

对高分辨率遥感影像的语义分割仍面临着很多挑战：

一是高分辨率遥感影像上存在 “ 同物异谱 ” 与 “ 异物同谱 ” 等固有现象。
二是在实际场景中目标以多尺度存在，并同时有光照、白云、阴影、遮挡等复杂场景；这些是运用传统方法进行语义分割时精度较低的主要原因。

1.2，现状

传统图像分割方法：

阈值分割法：是一种最原始的分割方法，比较适合用于背景和目标是处于不同灰度级别的图像。
边缘检测法：是指通过检测确定出区域的边缘，它检测的前提是不同区域的边缘上的像素灰度值变化比较大。
区域分割法：是依据一定的像素范围将相似的像素点集合成一个区域。

图像语义分割

基于区域的图像语义分割
基于卷积神经网络的图像语义分割
- 全卷积神经网络实现端到端的语义分割过程，但损失了边缘信息，Unet，SegNet就是针对这个问题设计的编码-解码结构。

2，基础理论与相关技术

2.1，卷积层

局部连接
权重共享：一个卷积核窗口在特征图上进行滑动时，其卷积核参数是相同的。

2.2，池化层

属于下采样层的一种,常见的有最大池化，平均池化。

$$ W' = \frac{W-k}{Stride}+1 $$

2.3，激活层

Sigmoid：$$\delta(x) = \frac{1}{1+e^{-x}}$$ (0,0.5)
- 图：
Tanh：$$Tanh(x) = 2\delta(x)-1 = \frac{e^2-e^{-x}}{e^2+e^{-x}}$$
- 图：
Relu：
- $$ f(x)=\begin{cases} 0,& x \le 0 \\ x,& x \gt 0 \end{cases} $$
- 图

2.4，全连接层

2.5，Dropout层

2.6，批量标准化

转换为正态分布，减弱梯度消失，加快收敛,，据说也考虑了以提高泛化能力
$$ E(B) = \frac{1}{m} \mathop{\sum} \limits_{i=1}^{m}x_i \\ S^2 = \frac{1}{m} \mathop{\sum} \limits_{i=1}^{m}(x-E(B))^2 \\x^{'}_i = \frac{x_i-E(B)}{\sqrt{S^2+\varepsilon}} $$
上述是标准差标准化，均值0，方差1，还有其他标准化：log函数，atan函数，min-max等
标准化会减弱特征表达能力：使用科学习参数实现特征值的平移与缩放，以此回复表达能力。
- $$ y_i = \gamma x_i'+\beta =BN_{\gamma,\beta}(x_i) $$
注：
- 归一化：变为（0,1）之间的数，方便比较处理，可加快收敛，
- 标准化：方便下一步处理，例如0-1标准化后，可使用正态分布性质
- 正则化：正则化而是利用先验知识，在处理过程中引入正则化因子(regulator)，增加引导约束的作用，比如在逻辑回归中使用正则化，可有效降低过拟合的现象。

2.7，卷积网络训练方法

前向传播
反向传播
优化方法
- 批量梯度下降：每次全部数据
- 随机梯度下降：每次一个数据
- 小批量随机梯度下降：批量数据
- 动量梯度下降算法
- 学习率自适应梯度下降算法
例：小批量随机梯度下降算法
- AdaGrad
- RMSProp
- Adam

2.8，典型卷积网络模型

VGGNet
GoogleNet
ResNet

3，建立数据集

3.1，数据集

航天遥感影像
三波段，8bit，tiff文件
5类别，建筑物，背景，树木，草坪，汽车

3.2，重叠切割

3.3，数据增广

翻转变换
随机旋转
大小缩放
上下左右平移
随机裁切
对比度变换

4，基于DenseNet的特征金字塔语义分割网络

4.1，全卷积网络剖析（FCN)

全卷积化
增加上采样
边缘优化：由于上采样不能恢复边缘信息，通过跳跃拼接FCN32s，FCN16是，FCN8s
全卷积神经网络
- 特征提取
- 多级特征融合：在多层级融合部分， FNC32s 只有一个层级的特征，FCN16s 和 FNC8s通过跳跃结构分别实现了两个和三个层级的特征拼接融合，精度得到了一定的提升。但是不同层级的特征图的数量是不一样的，简单的拼接融合操作使得各个层级的特征利用度不同，没有充分的利用各层级的特征。

4.2，DenseFPN设计

DenseNet取代VGGNet,增强提取能力
特征金字塔融合模块使用设计的优化单元使得各层级特征的利用度相同
图4-3

4.3，迁移学习

在深度学习的方法中，会遇到两个问题：一是会因为训练的数据过少而导致过拟合；二是网络在从随机初始阶段开始训练收敛速度非常慢。在现实场景中，训练数据的获取代价非常大，那么怎么在有限的数据情况下，充分利用现有的数据和加快网络的收敛速度是必要的。迁移学习能很好解决这两问题，迁移学习是指在已有的数据集上将训练好的网络参数作为新的网络的初始化参数，称为预训练模型。预训练模型可以在有限的训练集的情况下一定程度上防止过拟合，提高准确性，还可以加快网络的收敛速度。

基深度学习的高分辨率遥感影像语义分割的研究与应用

1，引言

2，基础理论与相关技术

3，建立数据集

4，基于DenseNet的特征金字塔语义分割网络

评论已关闭

分类

其它