近日,我校大气物理学院2019级大气探测专业本科生陈奕林同学以第一作者在大气探测领域国际权威期刊《Atmospheric Measurement Techniques》上发表了基于机器学习(Machine Learning, ML)的粤港澳大湾区台风影响下空气质量预测与评估模型研究成果,通讯作者为其导师杨元建教授。
粤港澳大湾区作为我国城市化程度最高、工业最密集的地区之一,其空气质量对区域居民的身体健康、生态系统交通安全和天气-气候都有重大影响。除了大量污染物的排放,空气质量受天气环流类型的影响也很大,夏季台风对该地区的天气背景场会产生显著影响,继而改变地区空气质量。相关研究表明,由于粤港澳大湾区的地形特征和气候条件,其边界层受到来自海洋的偏南暖湿气流、偏北风干冷空气的相对强弱以及是否存在下沉气流控制,夏季当台风位于特定区域时,台风的外围环流会在大湾区造成大范围的下沉气流、静小风和高温天气,在这样的静稳天气条件下,大气污染物的生成和输送都会受到影响,继而在粤港澳大湾区造成持续时间长、污染强度大的空气污染事件。因此对该地区的台风相关空气质量变化进行定量分析和预报,对于优化地区人居环境、提高人民生活质量和健康水平具有重要的意义。
图1研究区域图(2014-2020年台风路径,以及粤港澳大湾区39座空气质量监测站点数据)
机器学习算法能够对于非线性性较强的过程进行精准预报,且对算力的要求低于数值模式,对于台风过程中的空气质量变化的预测这一问题具有较大的应用价值。随机森林(Random Forest, RF)算法是一种基于决策树的集成机器学习算法,对于非线性问题有较好的健壮性,同时其能够基于不纯度计算输入特征的重要性,继而揭示台风过程中的各污染物的主导气象因素。本研究基于2014-2020年的粤港澳大湾区39座空气质量监测站点数据、结合台风最佳路径数据集和ERA5再分析气象资料,建立大湾区AQI、PM2.5、PM10、SO2、NO2和O3的预测模型,结果表明RF模型的测试集中的AQI、PM2.5、PM10、SO2、NO2和O3的预测值和实际观测值的相关系数R(均方根误差RMSE)为0.843(14.88)、0.859(10.31 µg/m3)、0.837(17.03 µg/m3)、0.510(8.13 µg/m3)、0.799(13.64 µg/m3)和0.894(22.43 µg/m3),显示出该预报模型对台风影响大湾区空气质量有较高的预测精度。同时,本研究还建立了非台风天的空气质量预测模型,通过模型输出的特征重要性,揭示了在台风天和非台风天两种情景下气象因素作用的不同,即在台风天,污染物的本地源排放和生成起主导作用,而在非台风天,污染物跨区域输送和海风的清洁作用起主导。本文为台风日和非台风日下的空气污染控制提出了两种不同的策略。
图2研究技术路线图
论文资讯及链接:https://amt.copernicus.org/articles/16/1279/2023/