Reader
[toc]
6. Quality Assesment
该章节详细介绍了遥感数据质量评估的理论基础和实践方法,内容涵盖了处理链中的质量评估阶段和具体的方法。
遥感数据质量评估概述
遥感数据质量评估是数据处理和应用中的关键步骤。尽管许多数据集质量较高,但仍可能因为以下原因出现误差和噪声:
- 环境因素:如大气散射,会导致信号失真。
- 传感器故障:硬件问题可能引发系统性误差,如条带效应(striping)。
- 数据处理不当:在预处理或后续分析中引入的错误。
为了确保数据的可靠性,需要通过计算特定的质量参数,并与既定标准进行比较来量化数据质量。
质量评估方法
文中提到三种主要的评估方法:
- 视觉评估:通过观察图像亮度值等特征来检测异常。
- 统计分析:计算直方图等统计量以了解数据分布并识别异常。
- 文档评估:参考质量评估文档(如MODIS数据质量报告)了解数据特性和局限性。
遥感处理链中的评估阶段
质量评估贯穿于遥感数据处理的多个阶段:
- 原始数据分析:数据采集后,分析其潜在问题,决定所需的预处理步骤。
- 预处理评估:对比预处理前后的数据,评估质量提升程度,并检查残留错误。
- 衍生产品验证:验证叶面积指数(LAI)或生物量等衍生产品的质量。这通常通过与独立的实地测量数据进行比较来实现,其精度可通过均方根误差(RMSE)计算: $$ \text{RMSE} = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2} $$ 其中,(y_i) 是实测值,(\hat{y}_i) 是估算值,(n) 是样本数量。
理解物理过程的重要性
需要注意的是,遥感数据不仅是抽象的“数据”,而是物理过程的体现。太阳辐射、大气交互以及传感器的行为都会影响数据的生成。忽视这些物理过程可能导致处理效果不佳。
通过数据模型连接物理与算法
数据模型在物理现象与图像处理算法之间搭建了桥梁。这些模型描述了数据在空间、光谱和时间上的组织方式,有助于更有效地进行质量评估。
- 辐射模型:表示太阳或热辐射与大气和地表的交互。
- 场景模型:描述不同地物类型的辐射反射或发射特性。
- 传感器模型:模拟传感器如何捕获辐射并将其转化为数字数据。
如图6.2所示,这些模型的结合提高了遥感产品的解释能力和质量。
总结
遥感数据质量评估涵盖从原始数据到最终产品的多个阶段,结合视觉检查、统计分析和物理理解。通过认识底层物理过程并应用数据模型,分析人员可以优化数据处理,确保遥感应用的可靠性。
1. 视觉评估
这一部分关于视觉评估的内容强调了评估遥感数据质量的历史与现代方法,具体如下:
历史背景
- 早期遥感依赖于航空照片,通过影像解译进行分析。
- 分析人员凭借经验识别关键特征(如河流、地质结构、植被)和异常情况,例如:
- 云层(最简单的异常)。
- 几何误差(如本应直线的道路出现弯曲)。
- 辐射误差(如亮度不一致)。
现代视觉评估
- 现代方法处理多光谱或高光谱数据集,这些数据具有更高的光谱维度。
- 尽管高级图像处理工具(如Erdas Imagine、ENVI)已普遍使用,但视觉检查仍是关键的第一步,需要结合:
- 物理过程知识。
- 地面实测信息。
视觉检查方法
视觉检查包括以下两个维度:
空间域(图像空间):
- 使用灰度图像或图像合成(将三个波段组合成RGB图像)。
- 关注点:
- 纹理:重复特征(如图像中的条纹)。
- 形状:几何异常(如弯曲的道路)。
- 热点特征:异常亮度区域(非常亮或非常暗)。
示例:图6.3展示了由于辐射误差引起的重复图案。
光谱域(特征空间):
- 通过光谱曲线评估光谱中的亮度值。
- 识别异常:
- 饱和效应:过高的亮度,例如0.78至1.0 µm之间。
- 辐射噪声:高频变化,例如2.0至2.5 µm之间。
- 无效数据值:例如-99的占位符。
示例:图6.3中的光谱曲线显示了饱和和噪声相关的偏差。
物理过程知识
- 理解引起异常的物理过程有助于识别误差来源。
- 例如:
- 饱和可能由强烈的阳光反射引起。
- 噪声可能由于传感器校准问题。
- 这种知识指导预处理步骤,如噪声减少或屏蔽无效数据。
自动化和局限性
- 挑战:随着数据量的增加,人工视觉检查变得不切实际。
- 解决方案:采用标准化算法,例如:
- 云检测技术:自动识别并屏蔽云层。
- 这些方法具有可扩展性,并确保大规模数据的一致处理。
总结
视觉评估仍然是遥感专家必备的重要技能,用于早期发现错误。然而,随着数据量的增加,自动化算法的引入变得至关重要。通过将关键数据集的人工检查与大规模数据的自动化方法结合,可以实现高效且可靠的质量评估。
2. 统计方法
这部分介绍了基于统计方法的遥感数据质量分析方法,包括单变量统计、多变量统计以及图像质量的统计衡量指标。以下是详细讲解:
单变量统计分析
单变量统计方法适用于单个波段的影像数据,通过计算和分析统计参数评估影像质量:
直方图:描述影像像素在每个数字编号(DN)上的分布情况。
- 计算方式:统计每个DN区间内的像素数量,并除以总像素数。
- 特性:直方图可以是单峰(通常有长尾)、双峰或多峰。双峰或多峰可能反映不同地物类型,也可能暗示错误值。
- 示例:图6.4展示了Landsat TM第4波段(近红外)的多峰直方图,其峰值对应水体、湿地植被和城市高地等主要地物类型。
统计参数:可以计算均值、中位数、标准差、方差、众数、偏度(分布的不对称性)和峰度(相对正态分布的峰尖锐度)。这些参数用于:
- 评估影像质量是否符合预期。
- 检测异常值或位置。
- 比较处理前后的影像差异。
多变量统计分析
多变量统计方法扩展到包含多个波段的数据:
散点图(特征空间图):常用于可视化两维或三维数据(多波段向量)。
- 每个点表示具有特定多光谱值的像素。
- 点的颜色或灰度表示具有相同多光谱值的像素数量。
- 示例:图6.4中,湿地植被在红波段(低反射率)和近红外波段(高反射率)中的高密度点表明其光谱特性。
信息提取:
- 从散点图中的点分布模式推导波段间的相关系数。
- 高相关性表现为线性分布,低相关性则分散分布。
- 相关系数信息可用于特征降维和分类等影像分析步骤(图6.5)。
图像质量的统计衡量
信噪比(SNR):衡量信号相对于噪声的强度。
- 定义:信号是测量中的信息部分;噪声是干扰部分。
- 公式: $$ \text{SNR} = \frac{C_{\text{signal}}}{C_{\text{noise}}} $$ 其中,(C) 可以表示整个影像某波段的标准差。
- 意义:噪声较高时,SNR较低;信号占主导时,SNR较高。SNR越高,影像质量越好。
SNR的估计:
- 噪声水平可从影像中假设无信号内容的均匀区域提取,例如光谱反射率低的深水体(波段范围0.35到2.5 µm)。
- 图6.6:展示了使用HyMap传感器获取的SNR曲线,通过水体作为噪声参考。
高级统计方法
- 噪声模型:分析并减少传感器引起的噪声类型。
- 空间统计(地统计学):分析影像域中的空间模式,包括噪声分布。
总结
统计方法在遥感数据质量评估中提供了丰富的工具,单变量方法着眼于单波段特性,多变量方法通过光谱相关性和特征分布揭示多波段之间的关系。信噪比等指标为影像质量提供了直观的量化标准,而高级方法进一步提升了噪声分析和处理的精度。结合这些技术,可以有效检测并提高遥感数据的质量。