深度学习:原理及遥感地学分析

如何高效地将地学知识融合到深度学习中,提高地球大数据挖掘及知识提取的效率,《深度学习:原理及遥感地学分析》为此提供了相应的基本原理及典型方法,并给出了遥感地学分析中的典型案例。
在地球大数据时代,我们拥有由卫星遥感、无人机等平台所搭载的各类传感器采集的海量时空数据。高级人工智能技术的发展顺应大数据处理需求,但其作为最核心的深度学习技术,主要源于计算机视觉及自然语言处理等领域,对地球大数据的处理及知识的智能提取存在一定的学科及知识壁垒。例如,不同领域数据特征存在差异,应用目标也存在差异;深度学习基于数据驱动,缺乏地学背景知识嵌入机制,如何融合二者是应用深度学习的重要考量。地学多尺度变换引起的空间相关性及分异性变化也可能导致深度学习预测的偏差及不适用性,地学中的标注数据的大量缺乏则限制需大量样本训练的深度学习的应用。因此,想要应用深度学习方法从海量地球大数据中高效提取有意义及有价值的信息,就需要打通学科间的壁垒,克服方法差异,加强知识及数据的融合,提高模型的可解译性。
基于此,《深度学习:原理及遥感地学分析》(李连发著. 北京:科学出版社,2022.10)一书从机器学习及深度学习原理入手,系统总结主要方法,提出遥感地学大数据分析背景下的建模系统框架及关键技术,并展示深度学习技术在遥感地学分析中的典型应用,为推动深度学习方法高效应用于遥感地学分析提供重要参考。
图片
▲ 融合深度学习与地球系统科学的研究路线
机器学习及深度学习本质上是基于统计学习的,本书首先介绍基本数学原理;然后介绍主要方法;最后给出系统的深度学习遥感地学分析的建模架构及典型应用。
全书分为基础、方法及遥感地学分析三部分。
基础篇
深度学习:原理及遥感地学分析
主要深入浅出地介绍数学及机器学习基础,包括概率论、线性代数、马尔可夫链蒙特卡罗、变分优化及机器学习基础。本部分着眼于基本原理及其深层机制,为深度学习在地学中灵活应用奠定理论基础。
机器及深度学习本质上是统计学习方法,所以第1 章介绍了概率论的基本知识;
而深度学习涉及大量的矩阵运算,所以第2 章介绍了线性代数的基本知识,包括求导,主成分分析及奇异值分解等;
考虑到实际应用中样本的缺乏等问题,第3 章介绍了马尔可夫链蒙特卡罗(Markov chain Monte Carlo,MCMC)随机模拟法,作为重要的基于采样的统计计算方法;
而作为现代机器学习基础之一的变分优化法,可以在没有解析解情况下较好地获得优化解,这在第4 章重点进行了介绍;
第5 章则是系统地介绍了现代机器学习的基本方法,包括监督及非监督方法、评价标准、学习流程等。
图片
▲ 采用PCA 对蒙娜丽莎图片保留不同主成分的压缩结果
方法篇
深度学习:原理及遥感地学分析
关于深度学习方法的系统介绍,包括前馈神经网络、模型训练及优化、卷积神经网络、循环神经网络、图网络及注意力机制等经典方法。本部分着眼于方法系统学习,包括方法特点、优缺点及应用前提的介绍,以让读者对这些方法的本质有深入理解。
方法篇的第一部分即第6 章介绍了前馈神经网络(feedforward neural network,FNN)的基本知识,重点介绍了现代深度学习中自微分方法,及其作为反向传播算法的基本原理;
而第7 章系统介绍了深度学习中关键的模型训练及优化技术,包括正则化、限制性优化、数据增强、迁移学习(transferring learning)、多任务及参数学习、集成学习、Dropout、批梯度下降法、参数初始化及优化算法等;
第8 章则介绍了卷积神经网络(convolutional neural network,CNN)的基础,包括感受野、卷积运算及其基本结构等;
第9 章则介绍了循环神经网络(recurrent neural network,RNN),包括基本的网络结构、基本类型及应用等;
第10 章则介绍其他的深度学习方法,包括反卷积、自动编码器(Autoencoder)、t-SNE(t-distributed stochastic neighbor embedding)、变分自动编码器(variational auto-encoders,VAE)、生成对抗网络(generative adversarial networks,GAN)、深度信任网络(deep belief network,DBN)、注意力机制(attention mechanism)、图网络及自然语言建模网络等。
图片
▲ 采用高斯混合网络训练模拟复杂路径图
遥感地学分析篇
深度学习:原理及遥感地学分析
本篇系统分析深度学习在遥感地学中面临的问题,包括应用领域的局限、标记数据的缺陷及域知识的嵌入、多尺度变化及黑箱模型等,提出相应建模框架及解决方案,展示了土地利用、建筑物识别、气象及地表参数反演、遥感数据缺值插补、空气污染评估等典型应用。
本篇共包括7 章,其中
第11 章是问题的系统总结及剖析,提出了基于深度学习的遥感地学分析的系统建模框架及建议;
第12 章重点描述了土地利用的遥感图像分割的典型应用,包括存在的问题,以及采用残差U-Net 网络解决案例;
第13 章侧重挑战性较高的建筑物识别,包括将形态融入及残差学习的重要性;
第14 章是气象参数的预测总结,给出了较难预测风险的应用案例,说明了深度学习方法在提高气象参数预测的可行性;
第15 章针对遥感地学中由云层等导致的大量数据缺失的问题,提出了基于深度学习的高效地表气溶胶卫星参数的缺值插补方法,同其他方法相比,在典型区域的应用中取得了优异的插补效果;
第16 章是地表参数反演的典型案例,根据领域知识设计了计算图,实现了遥感参数的优化反演,提高了气溶胶到地面系数转化的效果;
第17 章则是大气污染物浓度即PM2.5 预测的典型案例,采用聚集引导的深度学习方法,提高了预测效果,并估计了不确定性。
图片
▲ 融合域知识的多尺度深度地学遥感分析的系统框架图
当前随着大量地球时空大数据累积,如何从这些数据里高效挖掘知识成为地球系统科学研究难点及重点,常规统计及机器学习方法有诸多局限。本书从地球科学及遥感的背景与视角出发,阐述了深度学习基本原理,并将其纳入地球系统科学问题框架,为合理地采用深度学习方法来解决遥感地学分析的问题,奠定了相应的学科基础,提供了典型实例。与国内外已出版的同类书比较,本书的特点及独到之处在于从基本原理入手,内容涵盖的方法全面,深入浅出地分析问题,并结合典型案例,视角全面且深入。本书在有的重要章节中加入了启发式提问,由于答案并不固定,为促进读者独立思考相关问题,相关答案书中并不提供,但将在开源代码网站GitHub(https://github.com/lspatial/deeplearning_geoscience)发布。
图片
▲ DSTL 数据集中三个图像样本及其相应的地面真值掩模和预测掩模
本文摘编自《深度学习:原理及遥感地学分析》(李连发著. 北京:科学出版社,2022.10)一书“前言”,有删减修改,标题为编者所加。
ISBN 978-7-03-070051-3
责任编辑:陈 静
随着卫星遥感、无人机、物联网等技术的发展,地球时空大数据不断累积,如何从地球大数据中高效挖掘知识、模式及规则,成为地球系统科学研究的难点及重点。常规统计及机器学习方法存在诸多局限,本书将深度学习纳入地学系统科学问题框架,从地球及遥感科学的背景及视角系统阐述深度学习的基本原理,并提供了典型的应用实例。通过阅读本书,期待读者在面对影响因素繁杂的地学领域的过程演化、地表参数反演、地物对象识别等实际问题时,能够化繁为简,找到合适的原理及解决方法。本书适合信息科学、数据科学、地学及遥感等相关专业的学生和研究人员阅读与参考。
(本文编辑:刘四旦)
一起阅读科学!
专业品质  学术价值
原创好读  科学品味