高分对地观测比赛水体赛道-实现方案分享
本文最后更新于 2026年1月17日 晚上
基于深度学习的南漪湖水质参数反演研究
摘 要: 本研究采用多层感知器(MLP)神经网络模型、k 折交叉验证和遗传算法优化神经网络的方法,对水质参数进行反演,并生成了水质参数反演产品。实验结果表明,该方法在非线性拟合能力和泛化能力方面表现良好。
关键词: 水质参数反演;多层感知器;k 折交叉验证;遗传算法
1 引言
叶绿素是水体中的重要生物标志物,可以提供有关水体健康状态和环境变化的关键信息。因此,准确测量和反演叶绿素浓度对于环境监测、水质评估以及生态系统管理至关重要。在过去的几十年中,许多传统的光谱分析方法被广泛应用于叶绿素浓度反演。然而,这些方法通常依赖于复杂的光学模型和经验参数化,且对于光谱数据的处理和解释存在一定的局限性。
近年来,深度学习作为一种强大的机器学习方法,逐渐在遥感数据处理领域展现出巨大的潜力。深度学习算法可以自动学习数据中的复杂特征和模式,无需依赖传统手动设计的特征提取方法。这为叶绿素浓度反演提供了一种新的可能性,通过光谱数据学习光谱特征与叶绿素浓度之间的关系。
本文旨在基于深度学习方法探索光谱数据与叶绿素浓度之间的关系,并实现高精度的叶绿素浓度反演。针对该问题,本文提出了一种基于深度学习的反演模型,通过捕捉光谱数据中的潜在特征并建立与水质参数之间的映射关系,并对反演结果进行分析以验证其有效性。
2 数据处理
2.1 实测数据处理
采用高斯核回归平滑和等效反射率转换来处理实测光谱数据。具体步骤如下:将实测光谱数据进行高斯核回归平滑,以去除噪声和杂波。使用光谱响应函数将实测光谱数据转换为等效反射率数据。
2.2 影像数据处理
影像数据处理主要包括辐射定标和大气校正以及正射校正等步骤。对影像数据进行辐射定标,将原始影像数据转换为辐射亮度数据。使用大气校正方法,消除大气吸收和散射对影像的影响。进行正射校正,以消除地形和倾斜度对影像的影响。使得影像数据更加准确和可靠,方便后续的处理和分析。
2.3 水体提取
水体提取是水质参数反演的前提步骤,本文使用 EIseg 高精度分割模型进行水体提取。使用马尔可夫优化方法对分割结果进行进一步的优化和精细化处理,以提高水体提取的准确性。
2.4 水面遥感反射率估算方法
FLAASH 处理后的地表反射率,需要去除天空光的影响,才能获得遥感反射率。
$$
R_{\mathrm{rs}}^c(\lambda)=\frac{\rho(\lambda)-\min(\rho_{\mathrm{NIR}},\rho_{\mathrm{SWIR}})}{\pi}
$$
其中,$R_{\mathrm{rs}}^c(\lambda)$ 代表图像上近似估计的遥感反射率,$\rho(\lambda)$ 表示地表反射率,$\min(\rho_{\mathrm{NIR}},\rho_{\mathrm{SWIR}})$ 表示近红外和短波红外地表反射率的较小值。考虑到高分一号数据的特性,本文将地表反射率值除以 $\pi$ 近似估计为遥感反射率。
2.5 经验线性校正
高分一号与哨兵二号的波段设置接近,且哨兵二号影像时空分辨率较高,使用与实测数据同步的哨兵二号影像建立经验线性模型来校正哨兵二号的反射率值,以校正之后的哨兵二号影像为基准,对高分一号影像进行相对辐射归一化校正,得到校正之后的高分一号反射率值用于后续模型训练与推理。
综上所述,本文对实测数据和影像数据进行了预处理,为后续的水质参数反演提供了可靠的数据基础。
3 研究方法
3.1 MLP 神经网络原理
多层感知器(MLP)神经网络是一种前向反馈神经网络,由输入层、隐藏层和输出层组成。每一层都包括多个神经元,神经元之间通过权重进行连接,通过激活函数将输入信号转换为输出信号。
在 MLP 神经网络中,输入层接收输入数据,隐藏层进行特征提取和抽象,输出层进行结果输出。通过不断调整权重和偏置,使得神经网络能够学习输入数据的特征和规律,实现对复杂问题的建模和预测。
3.2 k 折交叉验证
k 折交叉验证是一种常用的评估方法,用于评估机器学习模型的泛化能力和预测精度。通过将数据集分为 k 个子集,每次用其中 k-1 个子集作为训练集,剩余一个子集作为测试集,进行模型训练和评估。重复 k 次,每次选取不同的测试集,最终得到平均交叉验证误差,以评估模型的泛化能力和预测精度。
3.3 遗传算法原理
遗传算法是一种基于自然选择和遗传机制的优化算法,常用于求解复杂问题的全局最优解。遗传算法模拟生物进化的过程,通过选择、交叉和变异等操作,不断优化和进化种群中的优秀个体,最终得到全局最优解。
3.4 遗传算法优化神经网络
在本文中,使用遗传算法对神经网络的超参数进行优化,以提高模型的泛化能力和反演精度。将神经网络隐藏层的神经元个数作为染色体,通过选择、交叉和变异等操作,优化神经网络隐藏层神经元个数。
3.5 技术路线

4 结果与分析
4.1 模型训练与精度评估
采用了 k 折交叉验证的方法对 MLP 神经网络模型进行训练和评估。同时,采用遗传算法对神经网络的超参数进行优化,以提高模型的泛化能力和反演精度。
经过不断调整参数和优化模型,得到了反演精度较高的模型。并在测试集上进行了精度评估,使用均方误差和平均绝对误差作为评价指标来评估反演结果的精度和准确性。
4.2 反演产品生成
将影像数据转为模型可接受的数据格式输入到模型中进行推理,并将推理结果写入 tiff 生成了水质参数反演产品,如图 1、2 所示。反演产品能够直观地反映水质参数的空间分布和变化趋势,为水质监测和管理提供重要的参考和支持。
图 1 叶绿素浓度分布图
图 2 悬浮物浓度分布图
综上所述,本文基于 MLP 神经网络模型反演了水质参数,并生成了水质参数反演产品。这一方法具有一定的反演精度和可靠性,能够为水质监测和管理提供重要的参考和支持。
5 结论
本文采用了基于 MLP 神经网络模型、k 折交叉验证和遗传算法优化神经网络的方法,对水质参数进行反演,并生成了水质参数反演产品。
在 MLP 神经网络模型中,采用了多层结构,隐藏层数目通过遗传算法确定。使用 LeakyReLU 激活函数和 Adam 优化算法,对神经网络进行训练和优化。在评估函数方面,使用了均方误差和平均绝对误差作为反演精度的评价指标。
通过对 MLP 神经网络模型的训练和调优,得到了反演精度较好的结果。根据反演结果生成了水质参数反演产品,能够直观地反映水质参数的空间分布和变化趋势。
在本文的研究过程中还存在一些不足之处。由于数据量和监测点分布的限制,反演结果存在一定的不确定性和局限性。水面遥感反射率的计算使用的是一种经验线性估计算法,和实测值之间存在一定的偏差,反演结果很大程度上由数据的精度决定,应该构建具有物理意义的模型来校正 FLAASH 大气校正的结果。使用的是基于 MLP 神经网络的反演模型,对于较为复杂的水质参数反演问题,可能需要采用更加高级的模型和算法。最后,生成的反演结果仅仅是一种预测结果,需要进一步结合实际监测数据和情况进行分析和验证。
综上所述,本文采用了基于 MLP 神经网络的反演模型和 k 折交叉验证、遗传算法的评估方法,对水质参数进行反演,并生成了水质参数反演产品。这一方法具有较强的非线性拟合能力和泛化能力,能够有效提高水质参数反演的精度和可靠性。同时,研究存在一些不足和局限性,需要进一步完善和优化。
参考文献
[1] 徐逸, 董轩妍, 王俊杰. 4 种机器学习模型反演太湖叶绿素 a 浓度的比较[J]. 水生态学杂志, 2019, 40(04): 48-57.
[2] 董舜丹. 基于深度学习的南海近海海域叶绿素a浓度反演研究[D]. 桂林理工大学, 2022
[3] 熊远康, 范冬林, 何宏昌, 等. 基于Landsat 8影像的Himawari-8叶绿素a空间降尺度研究[J]. 中国环境科学, 2022, 42(11): 5341-5350.
[4] 于博文. 基于深度学习的VIIRS卫星全球海洋叶绿素a浓度反演[D]. 中国地质大学(北京), 2019
[5] 孙茜童. 基于深度学习的叶绿素浓度反演研究[D]. 长春理工大学, 2022
[6] 卢雪梅, 苏华. 基于OLCI数据的福建近海悬浮物浓度遥感反演[J]. 环境科学学报, 2020, 40(08): 2819-2827.
[7] 谢婷婷, 陈芸芝, 卢文芳, 等. 面向GF-1 WFV数据的闽江下游叶绿素a反演模型研究[J]. 环境科学学报, 2019, 39(12): 4276-4283.
[8] 王林, 王祥, 王新新, 等. 基于Sentinel-3 OLCI影像的秦皇岛海域悬浮物浓度遥感反演[J]. 中国环境科学, 2022, 42(08): 3867-3875.
结语
这时候刚开始接触定量遥感,很多东西都是摸索着做的,这里的方案现在看来全是漏洞。不过,先完成在完善吧。🤣