遥感数字图像处理-09-图像分类

2020-12-02
作者 Tsumugi Wenders

1. 分类原理
2. 相似性度量
3. 监督分类
4. 非监督分类
5. 其他分类方法
6. 分类后处理
7. 精度分析
8. 分类方法总结

分类原理

基本原理

同类地物在相同的条件下（光照、地形等）应该具有相同或相似的光谱信息和空间信息特征。不同类的地物之间具有差异

图像分类

不同类的地物之间具有差异。根据这种差异，将图像中的所有像素按其性质分为若干个类别（Class）的过程，称为图像的分类

分类过程

根据图像分类目的选取特定区域的遥感数字图像，需考虑图像的空间分辨率、光谱分辨率、成像时间、图像质量等。
根据研究区域，收集与分析地面参考信息与有关数据。
根据分类要求和图像数据的特征，选择合适的图像分类方法和算法。制定分类系统，确定分类类别。
找出代表这些类别的统计特征
为了测定总体特征，在监督分类中可选择具有代表性的训练场地进行采样，测定其特征。在非监督分类中，可用聚类等方法对特征相似的像素进行归类，测定其特征。
对遥感图像中各像素进行分类。
分类精度检查。
对判别分析的结果进行统计检验。

分类方法

方法

利用像素的灰度值之间的关系，综合考虑矢量数据，考虑属性数据。对像素的进行分类
以随机变量的统计分析为基础

非监督和监督分类

事先没有类别的先验知识，对未知类别的样本进行分类的方法称之为非监督分类（Unsupervised Classification

事先已经知道类别的部分信息（即类别的先验知识），对未知类别的样本进行分类的方法称之为监督分类（Supervised Classification）

硬分类和软分析

图像上的一个像素只能被分到一个类的分类方法称为硬分类（hard classification）

图像上的每一个像素可以同时被分到两个或两个以上的类的分类方法，称为软分类（soft classification）
典型的软分类的一个典型方法就是模糊分类或模糊聚类

分类特点和原则

特点:

多变量的图像分类
分类在一定的比例尺上进行
原则:
多变量综合考虑
在特征空间的位置可以用均值表示，离散程度可以用方差表示
分类的实质是将特征空间分为若干子区域，每个子区域为一类

指标和统计量

指标（特征）:波段,其他属性,地形特征,调查数据

统计量:均值,方差,距离度量,离差平方和

指标及其确定的原则

可区别性：属于不同类别的对象，其指标值应具有明显的差异。

可靠性：同类对象指标值应比较相近

独立性：所用的各指标之间应彼此不相关

数量少：复杂度随系统的维数(特征的个数)迅速增长。增加带噪声的指标或与现存指标相关性高的指标实际上会使分类器的分类能力下降，特别是在训练集大小有限的情况下

遥感图像常用的指标

波段

波段的组合或单个波段
不一定是全部的波段

注意

波段提供的信息总是有限的

工作流程

分类准备工作

确定分类系统
确定范围
多源图像几何配准
噪声处理
辐射校正
几何精纠正
多图像融合

图像判读

图像判读是确定分类使用的特征，进行信息提取的必要手段。进行图像判读时，图像中目标物的大小、形状、阴影、色调、颜色、纹理、图案、位置及与周围的关系称为判读的八要素。

特征选择

遥感图像分类的基础是图像特征。图像的特征包括多种，如光谱特征、植被指数、变换后的图像、纹理或上下文信息、多时相图像、多传感器图像，以及辅助数据等。在图像分类中，虽然可以笼统地说特征变量多、维数高，有利于分类精度的提高，但是，因为地表覆盖的可分离性不同，太多的变量和太高的维数，不仅增加了分类算法的复杂性与计算量，而且变量之间往往有较高的相关性，在分类判决过程中会造成更多的混淆与不确定性，反而会降低分类精度。所以在进行分类之前，既要考虑增加新的特征，又要从己经形成的多维特征变量中进行正确选择，选出一些有良好分类效果的特征变量，才能有效地提高分类精度。

总的原则是：尽可能选取数量适当有助于增加同类地物类聚性（即类内个体间离散性小）、能扩大地物类别之间差异性的特征。在实践中，往往需要反复试验才能确定最优特征。

图像分类

根据特征与分类对象的实际情况选择适当的分类方法和分类器。一般来说，非监督分类方法简单，不需要先验知识，当光谱与地物类别对应较好时比较适用。如果地物类别之间光谱关系比较复杂时，监督分类方法比较好。

如果图像中地物复杂且难以直接区分，建议使用神经网络分类器或支撑向量机分类器。
对于高光谱图像分类，建议使用光谱角分类器。
对于高空间分辨率图像的分类，建议使用面向对象的分类。

分类后处理

图像分类过程是按像素逐个进行的，分类结果图像中成片的地物类别分布区内往往会出现零星的异类像素，其中许多是不合理的。因此，要根据分类和制图要求进行分类后处理

结果评价

分类完成后，需要对分类的精度与可靠性进行评价。进入传感器的信息受传感器空间分辨力和光谱分辨力的限制，常常是混合的地物信息。有时地物本身就是混合在一起的，如植被下面是土壤，因此不存在理想的分类器。

相似性度量

距离是常用的相似性度量的概念

根据距离的分类是以地物光谱特征在特征空间中以点群方式分布为前提的。

绝对距离

像素到类中心的直接距离 $d_{i k}=\sum_{j=1}^{p}\left|x_{i j}-M_{j k}\right|$

$d_{i k}$ 为当前像素i到类k的距离， p为波段数， $x_{i j}$ 为像素i在j波段的像素值， $M_{j k}$ 为类k在波段j的均值

欧式距离

该距离是平面上两点之间的直线距离 $d_{i k}=\sqrt{\sum_{j}^{p}\left(x_{i j}-M_{j k}\right)^{2}}$

马氏距离

马氏距离是一种加权的欧氏距离，它通过协方差矩阵来考虑变量的相关性

如图所示，尽管K点距MA的距离DA比距MB的距离DB小，即DA小于DB，但由于B点群比A点群离散得的多，因而把K点划入B类更合理。加权可以这样理解，计算的距离与各当点群的方差有关。方差愈大，计算的距离就愈短。如果各个点群具有相同的方差，则马氏距离矩阵是欧氏矩阵距离的平方。

小结

特征参数的量纲
具有不同量纲的特征放在一起进行比较常常是无意义的
特征参数间的相关性
特征参数间通常（未经正交变换）是相关的。
若大部分特征相关性较强，而个别的相关性不大，则一般来说相关的特征和不相关的特征在距离中的权应是不一致的，但在上述公式中的权是相同的，这是个缺点。下面的马氏距离解决了这个问题。

监督分类

利用已有的知识，按照概率准则进行分类
优点：结果的可靠性大
缺点：计算速度慢，需要对研究地区有一定的了解

监督分类的前提是己知遥感图像上样本区内地物的类别，该样本区又称为训练区。
监督分类的基本过程是：首先根据己知的样本类别和类别的先验知识确定判别准则，计算判别函数，然后将未知类别的样本值代入判别函数，依据判别准则对该样本所属的类别进行判定。在这个过程中，利用己知类别样本的数据求解判别函数的过程称为学习或训练。
监督分类与非监督分类不同。非监督分类是根据图像特征的相似性按照特定的规则产生的，结果可能与实际的地物类一致，也可能不一致。监督分类是根据地物类型划分的要求进行的，先确定地物的分类系统，然后确定各个类别对应的解译标志和典型区域，最后提取和选择图像特征，使用分类器进行分类。

训练区

根据预定义的分类系统和图例，选择设定对应的训练区。训练区是分类系统中各个类别的代表性的典型区域，其重点是其代表性和典型性。

训练区的选择

根据分类系统的要求，结合实地调查，在遥感图像上勾绘各类典型地物的分布范围，即训练区

选择训练区时应注意

训练区必须具有典型性和代表性
使用的图件时间和空间上要保持一致性
训练区的选取方式有按坐标输入式和人机对话式两类
训练样本的数目（至少需要K+1个样本，K是多光谱空间的维数或经过选择的特征数）

训练区的调整

对初选的训练样区进行统计分析，剔除那些离散性过大的样本
检查各类样本的聚类中心分布状况，如果各类别的聚类中心较分散，而同类样本都聚
集在该类中心周围，表明这些样本都比较纯，代表性高。如果情况相反，那些混入别类分布
区的样本必然导致错分误判，应该剔除。剔除后如果某些类别样本不够，应该补选。
训练样区经过初步调整优化后，进行样区分类检验，对某些分类精度不高的样本应做进一步的调整优化，直至错分率明显降低为止
对于异物同谱和近谱导致的误分，如果这些异物各有一定的地理分布规律，可以采用地理控制法来纠正

平行管道分类

平行管道法是一种最简单的分类器。

使用简单的分类规则进行多光谱遥感图像的分类。
决策线在n维光谱空间中是一个平行的管道。
管道的直径根据距离平均值的标准差确定。
如果某个像元落在某一类的平行管道的阈值范围内，则划分到该类别中。
如果落在多个类中，ENVI则将这格像元划分到最后匹配的类别。
落不到任何管道中，则标识为未分类像元。

最小距离法

按照最小距离来归并像元
计算未知像元距离各个类别均值向量的欧氏距离，将该像元划分到距离最小的类别中。如果没有没有确定最大的标准差和距离阈值，则所有的像元都会分类。

最小距离方法与前面介绍的非监督分类方法在统计量和分类原理是一致的，不同的是，监督分类是通过事先训练样本的方式确定类别数和类别中心，然后再进行分类。分类的精度取决于训练样本的准确与否。

最大似然分类

最大似然分类器是基于贝叶斯准则的分类错误概率最小的一种非线性分类器，应用比较广泛、成熟。如果各个类别训练区的特征服从正态分布，最大似然分类具有最好的分类结果。

假设条件：数据符合多维正态分布。如果不符合，分类的精度将下降。
计算每个像元属于各个类别的似然度（likelihood）,该像元分到似然度最大的类别中。
似然度是像元数据X 属于类别k 的后验概率。
如果类别k中X的条件概率为P(x/k), 则似然度 Lk的计算公式为：

L_{k}=P(k / x)=P(k) \times P(x / k) / \sum_{i} P(i) \times(x / i)

光谱角分类方法

每个样本看作是一个 n 维空间内的一个向量，第i个向量和第j个向量之间的存在一个夹角，定义交角的余弦作为两个向量之间的相似性度量。

\cos \theta i_{j}=\frac{\sum_{k-1}^{n} X_{i k} X_{j k}}{\sum_{k=1}^{n} X_{i k .} \sum_{k-1}^{n} X^{2} j k}

光谱角分类的工作步骤与其他监督分类方法一样，首先选择训练样本，然后比较训练样本与每一像素之间的相似系数，越高表明越接近训练样本的类型。因此，分类时还要选取阈值，大于阈值的像素与训练样本属同一地物类型，反之则不属于。

光谱角分类方法的原理是：把光谱作为向量投影到N维空间上，其维数为选取的所有波段数。N维空间中，像素值被看做有方向和长度的向量，不同像素值之间形成的夹角叫做光谱角。光谱角分类考虑的是光谱向量的方向而非光谱向量的长度，使用余弦距离作为地物类的相似性测度。

小结

对比表明，平行管道法分类效果最差，多数区域被错分为道路。使用马氏距离的最小距离方法要优于使用欧氏距离的最小距离的方法。除光谱角法外，其余方法对道路的分类结果均偏多，而且错误较多。光谱角法较好地区分了林地与农田，对于图像中左下角的江心洲部分，也只有光谱角方法的分类结果比较合理。除平行管道法外，其余方法均较好地区分开了三种水体。秦淮河水误分比较大，长江（包括长江大桥）在一些方法中均被误分为河水。

非监督分类

自动分类,利用图解法或统计分析

参阅：方开泰《聚类分析》

非监督分类是指人们事先对分类过程不加入任何的先验知识，而仅凭遥感图像中地物的光谱特征
主要采用聚类分析的方法，把像素按照相似性归成若干类别
非监督分类算法的关键是初始类别参数的选定
非监督分类有多种分类器，其中，K-均值方法和ISODATA方法效果较好、使用最多。
在图像分类的初始阶段，可用非监督分类方法来探索数据的本来结构及其自然点群的分布情况。

非监督分类主要流程如下：

确定初始类别参数，即确定最初类别数和类别中心（点群中心）。
计算每个像素对应的特征向量到各点群中心的距离。
选取距离最短的类别作为这一向量的所属类别。
计算新的类别均值向量。
比较新的类别均值与初始类别均值，如果发生了改变，则以新的类别均值作为聚类中心，再从第2步开始进行迭代。
如果点群中心不再变化，计算停止。

K-均值分类器

K-均值(K-Means)算法的聚类准则是使每一分类中，像素点到该类别中心的距离的平方和最小。
基本思想是：通过迭代，逐次移动各类的中心，直到满足如下收敛条件为止。
收敛条件：对于图像中互不相交的任意一个类，使得每个像素与其类中心的欧几里得距离的平方和最小化。

K-均值方法的优点是实现简单，速度快，便于处理大数据；缺点是仅能获得局部最优解，过分依赖初始类中心的位置，指定的类别数影响着聚类的结果，难以自动获得最优类别数量，对图像中的噪声敏感。

任意选取K个像素表达向量作为初始聚类中心 Z1, Z2,…, Zk
反复迭代计算
如果||X-Zj(l)||< ||X-Zi(l)||(i=1,2,…,K,i!=j)，则将X所代表的像素归于第j类。按照上述办法处理所有的像素；
经过上述处理，聚类可能发生变化，因此需要重新计算K个新聚类中心：

Z_{j}(l+1)=\frac{1}{N_{j}} \sum_{X \in f_{j}(l)} X

对于所有的聚类中心，如果Zj(l+1)=Zj(l)(j=1,2,…,K)，则迭代结束，得到最后的聚类结果；否则继续进行迭代计算。

ISODATA分类器

ISODATA简称迭代法，是一个最常用的非监督分类算法。

ISODATA算法与K-均值算法有两点不同：第一，它不是每调整一个样本的类别就重新计算一次各类样本的均值，而是在把所有样本都调整完毕之后才重新计算，前者称为逐个样本修正法，后者称为成批样本修正法；第二，ISODATA算法不仅可以通过调整样本所属类别完成样本的聚类分析，而且可以自动地进行类别“合并”和“分裂”，从而得到类数比较合理的结果。

非监督分类小结

需要较少的人工参与
不适合同谱异物的数据
计算速度慢
分类结果
- 不依赖于统计参数
- 对于非正态分布的数据可以得到较好的结果
- 稳定性较低
- 可以作为监督分类的参考

其他分类方法

人工神经网络方法

基于神经网络元理论
分类结果极大的依赖于已知条件。

方框内为神经元，或称为节点。

Bi是分类使用的图像的波段和特征；
W称为激活函数，常用的是Sigmoid函数；
H是隐含层，用来模拟输入数据的非线性模式；网络可以有多个隐含层，每层的节点可以不同，节点数少可能低估，过多可能会过度拟合，实际应用中，一般隐含层为2个，每层的节点不多于3个；
Cj是训练区的地物类别标记。

神经网络方法的优缺点

神经网络方法是非线性的，同传统分类方法相比较，它可以处理复杂的数据集，识别精细的模式。
神经网络方法能够利用多源数据，将潜在的信息提取出来。多源数据在量纲，单位，数据类型以及数据结构方面的不兼容，以及传统分类方法对数据条件的假设和限制，使得多源数据的综合分析及分类精度受到影响。
目前对神经网络方法的使用效果还没有获得一致认识。有的研究报告精度提高，也有一些研究指出它的分类结果不确定。
神经网络的参数设置要经过大量的实验，使之成为一个很难使用的方法。

决策树方法

首先计算所有类别之间的距离，合并距离最近的两类形成一个新类，然后计算新类与其它类别之间的距离，重复前面的工作，直到最终所有类别都合并为一大类，形成整个树结构的根部。

专家系统分类方法

专家系统是通过计算机模拟专家的思维、推理、判断和决策过程解决某一具体问题
遥感图像解译专家系统是模式识别与人工智能技术相结合的产物

分类后处理

碎斑处理

某一类的比较均匀的图斑上散乱地分布着一个、两个或多个孤立的其他类的像素，“天女散花” 式
通常要进行滤波处理。实际是去掉分类图中过于孤立的那些类的像素，或把它们归并到包围相邻的较连续分布的那些类。
在ENVI系统中叫做多数/少数分析、聚块和筛除，在ERDAS系统中叫做聚块、筛除和合并等等。其思路是给每个类规定一个应保留的最小连片像素数，然后将小于此数的孤立像素合并到与其相邻的或包围它的较大的连片像素类中。
调整的原理按照“少数”服从“多数”的原则
类别合并：非监督分类前不知道实际有多少地物类，在策略上总是先分出较多的类，然后对照实地情况或根据己有知识，确定最后需要的类别，因此，需要将某些光谱上不同的类（光谱类）合并为一个地物类。监督分类虽然知道实际有哪些地物类，但同物异谱现象会产生错误的分类结果。

分类结果统计

分类结果统计包括各类在各波段的平均值、标准差、最低值、最高值、协方差矩阵、相关系数矩阵、特征值、各类的像素数和占总像素数的百分比、精度检验等。

分类统计是非常重要的信息，各类面积百分比是分类的要求。类的各项统计值，特别是它们在各波段中的平均值和标准差，是确定各类地物光谱特征的重要依据。根据这些统计参数可以绘制各类的光谱曲线，计算相应的植被指数等，有助于进一步确定分类结果的可靠性，或重新进行分类。

类间可分离性分析

类间可分离性可用各类之间的距离矩阵来表示。因为距离是类间相似性的一个重要量度，所以通过该矩阵可确定最相似的类。如果某类的地物性质比较模糊，可借助与它最相似的己知地物类来进一步明确。

遥感图像的非监督分类结果中，各类之间的关系是平行关系，不具有统计学中系统聚类结果那样的层次性。监督分类结果中的各类可以是平行关系，处于相同的级别；也可以是不平行的，处于不同的分类级别（此时，使用决策树分类器更为合适）。利用距离矩阵进行系统聚类，可以帮助确定各类之间的关系，完善分类系统。此外，距离矩阵还可以作为筛选监督分类训练样本的一个手段或作为选择图像特征的参考。

精度分析

遥感图像分类精度分析通常把分类图与标准数据（图件或地面实测调查）进行比较，然后用正确分类的百分比来表示分类精度

遥感图像分类精度分为非位置精度和位置精度。
非位置精度以一个简单的数值，如面积、像素数目等表示分类精度，由于未考虑位置因素，类别之间的错分结果彼此平衡，在一定程度上抵消了分类误差，使分类精度偏高。我国早期分类工作中的精度评价多是非位置精度评价。
位置精度分析将分类的类别与其所在的空间位置进行统一检查。目前普遍采用混淆矩阵的方法，并以Kappa系数评价整个分类图的精度，以条件Kappa系数评价单一类别的精度。应用混淆矩阵的Kappa系数进行分类精度的检验，是遥感分类的主要精度评价方法。

检验数据

检验数据主要来自于地面实况的调查或更高空间分辨率的航空图像的目视解译结果，但根据航空影像解译结果往往产生保守的精度。

采样方法

目前常用5种采样方法来生成混淆矩阵

①简单随机采样（Simple Random Sampling）
②分层随机采样（Stratified Simple Random Sampling）
③聚类采样（Cluster Sampling）
④系统采样（System Sampling）
⑤分层系统采样（Stratified System Sampling）
除了聚类采样以块以外，其余4种方法都以像元为基本单位。

检验样本的采样方法是影响精度评价结果的重要因素。

已有土地覆盖分类研究中，分别采用了①②⑤三种采样方法进行精度评价，得到的精度由大到小依次为：简单随机采样 > 分层随机采样 > 分层系统采样

混淆矩阵

对于类别X：
运行误差（Commit Error）=(E+F)/G
用户精度（User’s Accuracy）：=A/G =100%-运行误差
结果误差（Omission Error）= (B+C)/D
生产者精度（Producer’s Accuracy）= A/D =100%-结果误差

运行误差：又称错分误差，是图像的某一类的地物被错分到其他类别的百分比。
用户精度：表示从分类结果图中任取一个随机样本，其所具有的类型与地面实际类型相同的条件概率，表示分类结果中各类别的可信度，即这幅图的可靠性。
结果误差：又称漏分误差，是实际的某一类地物被错误地分到其他类别的百分比。
生产者精度：又称制图精度，表示实际的任意一个随机样本与分类图上同一地点的分类结果相一致的条件概率，用于比较各分类方法的好坏。

Kappa统计

总体精度并不能排除偶然一致性，因此一些研究人员推荐使用Cohen（1960）提出的kappa统计评价方法，测定两幅图之间吻合度或精度的指标。kappa统计也是根据混淆矩阵来计算。

\hat{k}=\frac{N \sum_{i=1}^{m} X_{i i}-\sum_{i=1}^{m} X_{i+} X+i}{N^{2}-\sum_{i=1}^{m} X_{i+} X_{+i}}

其中m为类别数， $X_{i i}$ 为对角线样本的数目， $X_{i+}$ ， $X_{+i}$ 分别是i行i列上样本数目的总和，N为样本数目。

Kappa统计用到了混淆矩阵中每一个元素，用来度量实际吻合（Actual Agreement）和变化吻合（Change Agreement），比只计算总体精度要合理些。它在评价不同分类器的分类精度上更具有统计意义上的辨析能力。

Kappa统计的意义是：如果Kappa统计为0.7，则表示所用的分类方法比随机赋予各点某一类别的方法优越70%。目前kappa统计也成为评价分类结果的一个标准参数。

精度提高分类精度的基本对策

多种信息的综合利用

遥感图像的计算机分类方法，大多是以遥感图像的光谱特征为基础的
在实践中，由于各种内在和外在因素的影响，都会降低常规的计算机分类效果
多种信息（包括多种遥感信息和非遥感信息）的复合分类已成为基本的提高分类精度的方法

混合像素的分解处理

线性关系分解
模糊分解法

分层分类与专家系统的应用

分层分类就是模拟目视解译，对复杂图像进行多层次的分析判断，先把容易识别确定的地物提取出来，再针对彼此混淆的地类采用不同的判据进行区分
先易后难，由表及里，分层处理，逐步推进

制约分类精度的因素

遥感图像反映的主要是地球表层系统的二维空间信息
遥感信息传输过程中包括许多信息衰减或增益的过程
遥感图像的空间分辨率变化也在下同程度上给分类造成一些麻烦
分类依靠的主要是光谱信息，而遥感图像的空间信息、结构信息未得到充分利用
分类面临同物异谱及同谱异物现象

分类中应该特别关注:

训练区的选择
- 均匀分布
- 数目适中
- 面积适中
- 具有代表性
指标的选择
- 具有不相关性
算法的选择和使用

分类方法总结

不能认为一个算法总是比另外一个算法更优越，因为最终的分类结果与使用的数据有很大的关系。如果类别之间分离的很开，那么几乎所有的分类器都能得到很好的分类结果。

在分类和模式识别问题上，有个“没有免费的午餐”的定理指明：脱离具体的问题，空泛的谈论什么算法最好是毫无意义的。若要考虑所有的潜在的问题，则所有的算法都一样好。要谈论算法的优劣，必须针对具体的问题；某些问题上表现好的算法，在另外的一些问题上可能不尽如人意。算法与问题是否相匹配往往起着决定性的作用。

Meow

分类原理

基本原理

图像分类

分类过程

分类方法

非监督和监督分类

硬分类和软分析

分类特点和原则

指标和统计量

指标及其确定的原则

遥感图像常用的指标

工作流程

分类准备工作

图像判读

特征选择

图像分类

分类后处理

结果评价

相似性度量

绝对距离

欧式距离

马氏距离

小结

监督分类

训练区

训练区的选择

训练区的调整

平行管道分类

最小距离法

最大似然分类

光谱角分类方法

小结

非监督分类

K-均值分类器

ISODATA分类器

非监督分类小结

其他分类方法

人工神经网络方法

决策树方法

专家系统分类方法

分类后处理

碎斑处理

分类结果统计

类间可分离性分析

精度分析

检验数据

采样方法

混淆矩阵

Kappa统计

精度提高分类精度的基本对策

多种信息的综合利用

混合像素的分解处理

分层分类与专家系统的应用

制约分类精度的因素

分类方法总结

本作品采用 知识共享署名-相同方式共享 4.0 国际许可协议 进行许可

本作品采用知识共享署名-相同方式共享 4.0 国际许可协议进行许可