2013年全国研究生数学建模大赛D组试题作者:顾高翔、石莹、马晓哲
参赛密码 (由组委会填写)
第十届华为杯全国研究生数学建模竞赛
学 校 中国科学院大学
参赛队号 80001008
1.顾高翔
队员姓名 2.石 莹
3.马晓哲
2013年全国研究生数学建模大赛D组试题作者:顾高翔、石莹、马晓哲
参赛密码 (由组委会填写)
第十届华为杯全国研究生数学建模竞赛
题 目 D: PM2.5问题的建模及研究
摘 要
自2010年以来,PM2.5已经成为我国主要的环境灾害,因此,研究PM2.5的形成原因,扩散规律,以及在爆发PM2.5环境问题时如何采取应急措施,制定合理有效的治理方案,具有重要的理论价值和现实意义。本文从定性定量的角度出发,使用多种数学方法,构建了2组3个数学模型,在模型的基础上进行分析,得到了一系列研究结论,并给出了合理的PM2.5治理方案。
PM2.5相关因素分析。首先使用灰色预测法补全原始数据中的缺损数值;其次对不同污染物之间浓度,做相关性分析,得到了与PM2.5浓度关系最密切的污染物;然后使用灰色关联方法,得到了构成PM2.5的主要污染物成分。研究发现PM10 和CO的浓度大小对于PM2.5具有最大的关联度,其相关系数也最高。
西安市PM2.5时空分布规律及分区污染评价。使用西安市2013年1月1日-4月26日的13个观测站数据为基础,从时间和空间的尺度上分别探讨了西安市13个环境监测站空气指数的时空分布规律,并对西安市各区的空气质量现状进行评估。
构建以天为单位的西安市PM2.5发生演变的回归模型(VD)。根据观测站的环境监测数据,使用一种改进的VAR模型,建立了每个站点的PM2.5值与其他站点的PM2.5值以及风力和温度之间的关系模型,得到了每个站点的PM2.5值的发展变化规律和趋势。
建立以小时为单位的西安市PM2.5发生演变的回归模型(VH)。使用三次样条插值,将原始的以天为单位的环境监测数据扩充到以小时为单位;在GIS平台下使用空间样条插值,根据13个节点的PM2.5值得到了空间上任意点的PM2.5数值;进一步扩展了VD模型,使用插值得到的以小时为单位的各站点PM2.5数据经过改进VAR模型的回归,得到了在小时单位下每个站点的PM2.5值与其
2013年全国研究生数学建模大赛D组试题作者:顾高翔、石莹、马晓哲
他站点的PM2.5值以及温度之间的关系模型,以及每个站点每小时PM2.5值的发展变化规律和趋势;最后在这个模型的基础上,我们设定PM2.5灾害集中爆发的情景,研究了PM2.5的扩散速度与范围,预测了各地在之后8小时内 PM2.5的浓度值变化情况,划分了PM2.5集中爆发后的重灾区和可能的安全区。研究认为兴庆小区和小寨为重污染地区,而阎良区和临潼区是可能的安全地区。
一般均衡框架下武汉市PM2.5治理的最优控制模型。引入了一个两区域单部门的一般均衡经济模型。我们在这个模型中添加污染物排放控制模块,包括污染物排放总量核算方程,污染物排放约束方程,以及其对经济发展的反作用方程。在此基础上,我们构建了一个最优控制的模型来研究武汉市PM2.5治理的最优方案。我们以累积的GDP拉姆齐量作为最优目标,以PM2.5的控制目标作为模型的约束条件,分别对无专项经费投入和有专项经费投入情况下武汉市PM2.5治理的最优方案进行了研究,并在有专项经费投入情况下分情景给出了不同速度的碳排放强度自然下降率下武汉市PM2.5治理的最优方案,并讨论了各情景之间的差别。研究发现,在不采取专项经费治理的情况下,若要达到PM2.5浓度的降低,将势必引起经济发展的停滞和衰退,这对于地区经济的增长是不利的;而采取专项经费治理之后,武汉市可以在付出经济增长率略微下降的条件下达到PM2.5的浓度控制。在2030年情景下,武汉市为PM2.5治理的费用累计3.55亿。而随着碳排放强度自然下降率的增加,武汉市为达到PM2.5的浓度所付出的代价就越小。
2013年全国研究生数学建模大赛D组试题作者:顾高翔、石莹、马晓哲
目录
1. 前言............................................................................................................................................. 4
1.1 问题的重述 ........................................................................................................................ 4
1.2 问题的分析 ........................................................................................................................ 4
2. 问题一——PM2.5相关因素分析 .................................................................................................. 5
2.1数据预处理 ......................................................................................................................... 5
2.2 AQI中6个基本指标相关性分析 ..................................................................................... 7
2.3 PM2.5形成的灰色关联度分析 ........................................................................................... 8
3. 问题二——PM2.5的分布与演变及应急处理研究 ................................................................... 10
3.1西安市PM2.5的时空分布规律和分区污染评估 ............................................................ 10
3.2西安市PM2.5发生演变的回归模型构建——VD版 ..................................................... 12
3.3时间插值 ........................................................................................................................... 18
3.4空间插值 ........................................................................................................................... 20
3.5西安市PM2.5发生演变的回归模型构建——VH版 ..................................................... 23
3.6突然应急情况的污染扩散与评估 ................................................................................... 24
3.7模型检验 ........................................................................................................................... 26
4. 问题三——空气质量控制管理研究 ........................................................................................ 29
4.1 基础一般均衡经济模型的构建 ....................................................................................... 30
4.2 基础模型的简化 ............................................................................................................... 33
4.3一般均衡框架下的最优控制模型的构建 ....................................................................... 34
4.4 数据来源 ........................................................................................................................... 36
4.5 无专项经费投入情况下武汉市PM2.5治理的最优控制方法研究 ................................ 37
4.6专项经费投入情况下武汉市PM2.5治理的最优控制方法研究 .................................... 39
5. 模型的评价与推广 .................................................................................................................... 42
参考文献......................................................................................................................................... 43
2013年全国研究生数学建模大赛D组试题作者:顾高翔、石莹、马晓哲
1. 前言
1.1 问题的重述
大气为地球上生命的繁衍与人类的发展提供了理想的环境。它的状态和变化,直接影响着人类的生产、生活和生存。空气质量问题始终是政府、环境保护部门和全国人民关注的热点问题。2013年7月12日《中国新闻网》报道:“2013年初以来,中国发生大范围持续雾霾天气。据统计,受影响雾霾区域包括华北平原、黄淮、江淮、江汉、江南、华南北部等地区,受影响面积约占国土面积的1/4,受影响人口约6亿人”。
对空气质量监测,预报和控制等问题,国家和地方政府均制定了相应政策、法规和管理办法,并将分期分地域逐步实施,2016年1月1日将在全国实施新标准。2012年2月29日,环境保护部公布了新修订的《环境空气质量标准》 (GB3095—2012),与新标准同步还实施了《环境空气质量指数(AQI)技术规定(试行)》(HJ633—2012)。上述规定中,启用空气质量指数AQI作为空气质量监测指标。 AQI是无量纲指数,它的分项监测指标为6个基本监测指标(二氧化硫SO2、二氧化氮NO2、可吸入颗粒物PM10、细颗粒物PM2.5、臭氧O3和一氧化碳CO等6 项)。 新标准首次将产生灰霾的主要因素——对人类健康危害极大的细颗粒物PM2.5的浓度指标作为空气质量监测指标。
由于细颗粒物PM2.5进入公众视线的时间还很短,在学术界也是新课题,尤其是对细颗粒物PM2.5及相关的因素的统计数据还太少,对细颗粒物PM2.5的客观规律也了解得很不够。本文希望解决与细颗粒物PM2.5相关的问题,通过建立数学模型的方法探讨细颗粒物PM2.5的相关因素及规律,所建立的每个模型力求科学、系统、深入,结论和观点有较多的数据支撑,同时具有较强的说服力和实际应用价值。在本文中,我们将利用附录中提供的数据建立与细颗粒物PM2.5相关的数学模型,主要包括:
1、PM2.5的相关因素分析
2、PM2.5的分布与演变及应急处理
3、空气质量的控制管理
1.2 问题的分析
空气质量对人体健康、大气能见度等产生直接的影响,进而影响到人类的生产、生活和生存,因此空气质量问题始终是政府、环境保护部门和全国人民关注的热点问题。近几年,我国区域性灰霾天气日益加剧,天空呈现灰蒙蒙的浑浊状态,大气严重污染。从2011年10月初开始,一场突如其来的连续多日的浓密烟雾,笼罩北京市,PM2.5是导致灰霾天气的罪魁祸首。美国驻华大使馆于2011年10月18日-25日,每日上午9点自测的PM2.5指数,多次达到“严重危害健康”和“危险水平”,由此PM2.5成为公众关注的热点,也成为政府和科研领域广泛关注的一种大气污染物[1]。PM2.5主要包括有机碳、碳黑、粉尘、硫酸铵(亚硫酸铵)、硝酸铵等五类物质,其主要来源为汽车尾气排放、锅炉燃烧、道路交通、工农业生产中的扬尘、燃油机动车和化肥生产等。PM2.5对大气的能见度产生影
2013年全国研究生数学建模大赛D组试题作者:顾高翔、石莹、马晓哲
响,进入大气的灰霾降低能见度,对地面交通安全和飞机的起飞、降落,都构成巨大威胁。另外,PM2.5对人体的健康造成,环境中PM2.5浓度每增加10μm/m3,因心血管疾病死亡的风险增加12%[2]。
基于此,明确PM2.5的相关因素及规律,了解其扩散和衰减的机制,将会将会对空气质量的监测,改善生存环境起到重要的作用。本文以武汉市和西安市环境监测数据为基础,以PM2.5为研究对象,建立相关因素分析模型、灰色关联模型、一般均衡模型,定量研究PM2.5的相关影响因素、时空分布规律和扩散衰减机理,为PM2.5的控制管理、突发事件的应急提供支持,另外,也为控制污染的成本提供了数据基础,为相关部门制定政策提供依据。本文将从以下问题入手展开分析与建模:
(1)PM2.5的相关因素分析
PM2.5产生的影响因素很多,它们之间的关系较为复杂。对相关影响因素进行定量判断和分析,判定各要素对PM2.5产生的影响程度,是建立数学模型的基础。为此,本文首先对现有数据进行预处理,利用灰色预测法中的GM(1,1)模型,对现有观测数据中的残缺数据进行补充,并对该方法的合理性进行了检验。在此基础上,进一步利用灰色关联和相关性分析的方法,分析了PM2.5与其他AQI指标之间的关系,探讨各指标与对空气中PM2.5浓度的影响大小。
(2)PM2.5的分布与演变及应急处理
首先,以观测数据为基础,从时间和空间的尺度上分别探讨了西安市和13个环境监测站空气指数的时空分布规律,并对西安市各区的空气质量现状进行评估。在相关因素和时空分布规律分析的基础上,考虑天气及季节因素,利用西安市2013年1月1日至4月26号的13个监测站数据,通过回归分析建立以天为时间单位的PM2.5扩散和衰减的数学模型,除了能反映PM2.5的演变和衰减,也能体现出13个监测站之间的相互影响程度。为了应对PM2.5激增的突发事件,需要进一步将模型细化到以小时为单位,因此本文利用样条函数进行插值,构建了基于某一个监测站的污染物扩散预测模型。通过以上的模型,本文预测和评估了PM2.5在数个小时内的污染和扩散状况,并通过样条函数法将扩散状况在地图上进行表达,给出时空分布状况,评估了重度污染和可能安全区域。
(3)空气质量的控制管理
基于前两部分的研究,本文从经济增长和污染物气体排放的角度出发,研究武汉市PM2.5治理的可行方案,采用一个简化后的两区域一般均衡经济模型,将中国分为两部分:武汉市和全国其他地区,构建了一个两地区单部门的经济体模型。然后通过区域的碳排放量计算估算出目标地区的PM2.5浓度值,给出年终平均治理目标。最终采用最优化控制方法,研究在达到PM2.5降低标准的前提下,所应采取的减排措施;并通过情景分析,研究在不同的化石燃料使用下降率情景下,PM2.5治理的最优方案,给出不同情景下的经费投入计划,并对方案的合理性进行论证。
2. 问题一——PM2.5相关因素分析
2.1数据预处理
本研究采用的数据包括武汉市2013年1月到8月的环境监测数据和西安市2010年1月到2013年5月的环境监测数据。但是原始数据并不完全,很多记录
2013年全国研究生数学建模大赛D组试题作者:顾高翔、石莹、马晓哲
为空值,这会对本文后面将要进行的回归拟合等工作造成巨大的困难。因此,本研究最首要的工作就是采取可靠的算法将残缺的数值补充上。
本研究采取的数据处理方法为灰色预测法中的GM(1,1)模型[4]。灰色预测模型自开创以来一直深受许多学者的重视,它建模不需要太多的样本,不要求样本有较好的分布规律,计算量少而且有较强的适应性,灰色模型广泛运用于各种领域并取得了辉煌的成就。而目前使用最广泛的灰色预测模型就是基于数列预测的一个变量、一阶微分的GM(1,1)模型。GM(1,1)模型是基于随机的原始时间序列,经按时间累加后所形成的新的时间序列呈现的规律可用一阶线性微分方程的解来逼近。经证明,经一阶线性微分方程的解逼近所揭示的原始时间数列呈指数变化规律。因此,当原始时间序列隐含着指数变化规律时,灰色模型GM(1,1)的预测将是非常成功的。
首先,设x(0) (x(0)(1),x(0)(2), ,x(0)(n))为原始数列,其1次累加生成数列为x(1) (x(1)(1),x(1)(2), ,x(1)(n))。
定义x的灰导数为d(k) x(0)(k) x(1)(k) x(1)(k 1)
令z(1) (x(1)(2),x(1)(3), ,x(1)(n))为数列x(1)的邻值生成数列: (1)
z(1)(k) x(1)(k) (1 )x(1)(k 1)
定义GM(1,1)的微分方程模型为x(0)(k) az(1)(k) b,主要可构建矩阵:
x(0)(2) az(1)(2) b (0)(1) x(3) az(3) b
(0)(1) x(n) az(n) b
x(0)(2) z(1)(2) (0) (1)ax(3) ,u z(3)B 引入矩阵向量记号:Y , b (0) (1) x(n) z(n)1 1 , 1
现在问题归结为求a,b的值。用一元线性回归,即最小二乘法求它们的估计
a (BTB) 1BTY。 值为u b
bb (1)(k 1) (x(0)(1) )e a(k) ,k 1,2,...,n。 最后得到xaa
由于篇幅有限,我们无法将所有数据都在文中显示。为此我们截取一段数据进行算法的展示。我们使用的数据为西安市高压开关厂测站2013年4月6日-2013年4月26日臭氧的1小时平均值,需要估计4月4日和4月5日的数值。具体数据如下:
2013年全国研究生数学建模大赛D组试题作者:顾高翔、石莹、马晓哲
表2.1 西安市高压开关厂测站2013年4月8日-2013年4月15日臭氧的1
小时平均值
4月15日 4月14日 4月13日 4月12日
49 49 41 44
4月11日 4月10日 4月9日 4月8日
41 38 42 35
求解得到a=0.04, b=49.4459。得出预测模型:
(1)(k 1) -1187.15e-0.04k 1236.148。 x
模型检验
(1)残差检验:绝对残差序列与相对残差序列,其中平均相对残差为0.0027 绝对残差 0
0 -2.45128 -0.05003 3.723518 0.090818 -1.03012 -0.02341 0.28501 0.006951 1.666202 0.043847 -3.88913 -0.0926 1.616519 0.046186
(2)关联度检验:得到max( 0(K))=3.7235,min( 0(K))=-3.8891。
计算关联系数 (k) min (k) max (k) ,得到: (k) max (k)-1.08896 3.439013 -0.36299 -2.43779 -0.94438 -0.57466
1 -0.58287
1n
计算关联度Ri i(k) 0.9408,不满足R 0.6的相关性要求。 nk 1
(3)后验差检验
残差的均值和均方差分X(0)序列的均值和均方差分别为42.4375和4.58087,
别为-0.0099和2.2784,由此得到C=0.497378,属于均方差比合格模型。
计算小残差S0=3.09392,得到小概率残差P ei S0 =0.875,属于小残差率合格模型。
(1)(k 1) -1187.15e-0.04k 1236.148检验。 因此,模型通过x
计算得到的下两个时间节点的PM2.5值为:2013年4月7日为35.18,2013年4月6日为33.80。
根据上述方法,我们补充完整了所需的相关数据。
2.2 AQI中6个基本指标相关性分析
本节研究采用武汉市一个环境监测点从2013年1月1日到2013年8月26日的空气质量检测数据,采用相关性分析研究了AQI中6项基本指标:SO2、NO2、可吸入颗粒物(PM10)、CO、O3和PM2.5之间的相关性。使用的相关性计
2013年全国研究生数学建模大赛D组试题作者:顾高翔、石莹、马晓哲
算公式为
rAB (A )(B ) 得到的结果如表2.2所示:
表2.2 AQI中6项基本指标相关系数
SO2
NO2
PM10
CO
O3
PM2.5 SO2 1 0.805142 0.677883 0.657013 -0.18153 0.724105 0.727461 0.624522 -0.06458 0.732391 NO2 1 0.585986 -0.0685 0.778732 PM10 1 -0.38304 0.821646 CO 1 -0.35488 O3 1 1 PM2.5
从表2.2中可以看到,与PM2.5相关系数最高的指标为CO,达到0.8216,这也是所有6个指标两两之间最高的,其次是PM10,达到了0.7787,然后是SO2和NO2,都达到了0.72左右。而O3和PM2.5的呈负相关的态势,其相关系数只有-0.35488。此外,SO2和NO2的相关系数达到0.8051,其相关性比较明显。而O3和其他5个指标的相关系数都小于0,且其绝对值较小,因此我们可以认为,PM2.5的浓度与PM10和CO具有较高的相关性,SO2和NO2具有较高的相关性,CO除了和PM2.5具有较高相关性外,与其他4个指标的相关性都较弱,而O3和其他5个指标基本不相关或弱负相关。
2.3 PM2.5形成的灰色关联度分析
在相关性分析的基础上,为了进一步研究PM2.5指标与其他AQI指标之间的关系,探讨各指标与对空气中PM2.5浓度所起的影响的大小,我们对PM2.5和其他AQI指标做了灰色关联度分析。灰色关联分析是灰色系统理论的一个分支,应用灰色关联分析方法对受多种因素影响的事物和现象从整体观念出发进行综合评价是一个被广为接受的方法。尽管在相关性分析中我们已经得到O3与PM2.5不相关的结论,因此在本节中我们继续保留了O3指标,与相关性分析的结果进行对照检验。
由于传统的灰色关联分析具有很大的缺陷,主要体现在最后计算得到的关联值与分辨系数有关,不唯一;灰色关联不存在保序性,即不同的分辨系数下,子序列之间的关联度可能发生变化;关联度不具有规范性,即对完全相关的子因素与母因素的时间序列,其关联值不等于1;不能体现负相关;默认的分辨系数导致计算得到的关联性始终大于1/3等。
因此,在本文中我们使用一种改进的灰色关联计算方法。
首先,将PM2.5的时间序列XPM2.5 (xPM2.5(1),xPM2.5(2) xPM2.5(t))作为母序列,在下文中简写为X0,将XSO2、XNO、XPM10和XCO作为子序列,在下文简写为Xi。
然后对母序列和子序列做一次累减,即
2013年全国研究生数学建模大赛D组试题作者:顾高翔、石莹、马晓哲
a(1)(x0(t)) x0(t 1) x0(t) t 1,2,...,n 1
a(1)(x1(t)) x1(t 1) x1(t) t 1,2,...,n 1
计算子序列与母序列的标准差:
1n
0 x0(t)
nt 1
x0 1n
i xi(t)
nt 1
xi 计算t时刻子序列和母序列之间的相关系数:
1
1 a(x0(k))(1) (x0(t),xi(k)) sign(a(1)(x0(k))a(1)(xi(k)))
x a(xi(k))(1) 0 xi
其中,i 1,2,3,4
1,当x 0, signx 0,当x 0,
1,当x 0,
最后得到母序列x0(t)与子序列xi(t)的灰色关联度
n 11 R (x0(k),xi(k)) in 1k 1
上述改进的灰关联度具有唯一性和规范性。
通过上述计算过程,我们得到了SO2、NO2、PM10、CO、O3与PM2.5之间的灰色关联度,如表2.3所示:
表2.3 SO2、NO2、PM10和CO与PM2.5的灰色关联性
SO2 NO2 PM10 CO O3
与PM2.5的灰色关联度 0.164728 0.228648 0.581443 0.467819 0.051176
从表2.3中可以看到,与相关性分析的结果一致,PM10与PM2.5的灰色关联度最高,达到0.5814,其次是CO,达到0.4678。而O3与PM2.5之间的灰色关联度最低,只有0.0512。
2013年全国研究生数学建模大赛D组试题作者:顾高翔、石莹、马晓哲
RPM10 RCO RNO2 RSO2 RO3
据此,我们得到结论,PM2.5的生成与空气中PM10和CO的含量具有较大的关系,可以认为PM10和CO对于PM2.5的产生起着最为重要的作用。SO2和NO2对于空气中PM2.5的含量大小的关联度比较小,其影响要远小于PM10,和CO。而O3指标与PM2.5几乎不存在相关度,而且对空气中PM2.5的含量没有任何明显的影响。
3. 问题二——PM2.5的分布与演变及应急处理研究
3.1西安市PM2.5的时空分布规律和分区污染评估
汇总2013年1月1日至4月26日的气象数据可以看出,四个月中西安市的主导风向是东北风,但二月份无持续风向的日子偏多。白天和夜间的风力基本上维持在低于或等于三级的水平,以微风为主;进入春季后,少数日子风力有所提高。气温在整体上呈现上升的趋势,三月和四月的气温有明显的提升,最高温和最低温分别维持在20℃和10℃左右。一月份和二月份以多云和阴天为主,偶尔出现小雪和雨夹雪的天气。三月份和四月份以晴天和多云为主,降水的日子比前两个月增多,且有在夜晚出现了浮尘的天气情况。
结合气象数据,对全市及13个监测站春季和冬季的PM2.5指数进行了分析,如图3.1所示,PM2.5指数因季节而异,冬季(一月、二月)和春季(三月、四月)全市平均的PM2.5指数分别为245.8和140.2,冬季明显高于春季,而13个观测点的PM2.5指数与全市平均的趋势相同,冬季值均高于春季,结合该时间段的气象数据分析得知,这是因为冬季气温较低,最高温和最低温分别集中在5℃和0℃左右,风力较弱,以多云的天气为主,不利于污染物的扩散和衰减。进入春季后,气温有明显的提升,最高温和最低温分别维持在20℃和10℃左右,昼夜温差加大,风力有所提高,以晴天为主,污染物比在冬季更容易扩散,因此春季PM2.5指数低于冬季。
图3.1 监测站春节和冬季PM2.5指数
2013年全国研究生数学建模大赛D组试题作者:顾高翔、石莹、马晓哲
如图3.1所示,春季时,相对于其他观测站,高压开关厂观测站的AQI指数最大(161.6),临潼区的指数最小为122.8;冬季时AQI指数最大的观测站为草滩(273.1),临潼区的指数仍然最小(226.1)。高压开关厂、市人民体育场、高新西区、广运潭和草滩5个监测站冬春两季的PM2.5指数均高于当季的平均值,临潼区、长安区、曲江文化集团和小寨观测站的指数相对较小,均低于当季的全市平均值。这主要受风向、风力和所处地理位置的影响。阎良区和临潼区监测站离市中心相对较远,位于西安市的东北角上,另一方面这四个月中西安市的主导风向是东北风,不会受风向上游污染源的影响,因此这两个监测站PM2.5的污染程度较低。长安区位于13个观测站的最南端,草滩位于最西端,大部分监测站位于草滩、临潼区和长安区组成的三角面内,集中分布在西安市区内,位于人口和商业集聚区,因此污染物不易扩散和衰减,PM2.5指数相对较高。市人民体育场位于市中心,人口密度大,交通繁忙,商业集中,受这些因素的影响,PM2.5指数在冬季和春季均相对较高。高压开关厂、高新区和草滩监测站位于西安市工业较为集中的地方,受工业排放的影响,空气污染相对较高。其中,高压开关厂和高新区监测站位于城区的西部,东北风将带来更多的空气污染物,且风力较小不易扩散,这也是这两个观测站PM2.5较高的原因之一。
对2013年1月至2013年4月13个观测站提供的PM2.5指数进行分析,如图
3.2所示。整体上可以看出,一月份和二月份的PM2.5指数比较接近,全市一月和二月的平均值为286.4和289.5,这与一月和二月的气温变化不大、以多云为主的天气有关;三月份全市平均为166.4,较一月和二月份有明显的下降;四月份随着气温的升高,风力有所提高,全市平均指数达到这四个月的最低值138.4。一月份时,PM2.5最高值和最低值分别位于草滩和长安区观测站,分别为286.4和213.4,各监测站的数据差异较大,主要受地理位置的影响;二月份时,市人民体育场的PM2.5最高,达到289.5,曲江文化集团监测站的值最低(196);三月份时,13个监测站的PM2.5较前两个月均有显著的下降,最高值(181)位于高压开关厂监测站,最低值(139.9)位于小寨监测站;随着气温的升高,白天夜晚温差加大,四月份的PM2.5较前三个月,有大幅的下降,该月的最高值位于高压开关厂(138.4),最低值位于长安区(98.4),13个监测点的差异较小。
图3.2 观测站一月至四月PM2.5指数
2013年全国研究生数学建模大赛D组试题作者:顾高翔、石莹、马晓哲
对2013年1月至2013年4月13个观测站每天的空气质量指数类别进行分析发现,一月至四月份,全市111天的空气质量类别数据中,轻度污染天数最多(30天),其次是重度和中度污染,分别达到22天和20天,空气质量为良的天数为20,空气质量优的天数最少,仅为1天。每个站点各类空气质量类别天数占该站点总天数的比重如图3.3所示。
高压开关厂监测站所在地空气质量严重污染天数最多(27天),所占比重最大;其次是重度污染和轻度污染,均为26天,空气质量良的天数为12,只有1天空气质量优,另外该地区的PM2.5指数较高,因此该区污染严重。
与高压开关厂监测数据相似,广运潭、市人民体育场和高新西区的严重污染天数所占比重最大,天数最多,分别为28天、25天和26天,空气质量优的天数仅为1天、0天和2天,空气质量良的天数在15天左右,另外这三个监测站的PM2.5指数偏高,因此也是严重污染区域。
兴庆小区、纺织城、小寨、经开区、曲江文化集团和长安区六个监测站的空气质量以轻度污染为主,轻度污染所占天数的比重在25-33%之间,天数在30天左右;空气质量良的天数比严重污染地区有所提高,维持在23天左右,因此这些监测站所在区域空气质量为轻度污染。
阎良区和草滩的空气质量以重度污染为主,分别达到28天和29天,所占比重为25.2%和25.9%,空气质量良分别为20天和13天,空气质量优的天数极少,因此它们是重度污染地区。与其他检测站不同,临潼区监测点的空气质量以良为主,占总天数的27%,达到27天,严重污染和重度污染天数所占比重在16%和19%之间,因此该区空气质量良好。
图3.3 空气质量类别比重
3.2西安市PM2.5发生演变的回归模型构建——VD版
在第二章中,我们研究了PM2.5的成因及其与其他各种污染物之间的内在关系。而在本章的3.2节中我们构建了PM2.5的发生与演变的数学模型,探讨了PM2.5浓度变化的时空分布规律。因此,为简化模型,本节不再考虑PM2.5的形成因素,而将着重考虑PM2.5浓度在空间上分布差异、演变趋势及其扩散机制。
从各站点的地理位置分布可以看到,小寨位于市中心偏南的位置,高新西区
2013年全国研究生数学建模大赛D组试题作者:顾高翔、石莹、马晓哲
位于市区西面,广运潭位于市区东偏北,经开区位于市区西北角,曲江集团位于市区南面,而草滩、阎良、临潼、长安等站点则远离市中心。
图3.4 西安市13个监测站点示意图
模型的构建:根据2.1节中的时空分布规律,我们设计了一个改进的VAR模型[4]。这个模型以天为单位模拟西安市PM2.5的发生和演化规律,因此简称为VD版。传统的VAR模型只考虑对模型内生变量的滞后值进行回归,而在本文模型中,我们既考虑了滞后值对内生变量的影响,同时认为内生变量的当期值对于其自身的影响,最后采取解联立方程式的方法求解内生变量的值。据此,我们构建了西安市的PM2.5浓度变化模型。我们假设该地某一地区的PM2.5演变由以下三方面决定,并相互独立。
1. 由自身性质决定:我们认为某一点的PM2.5浓度受到该点前一时刻影响,具有后效性质。设自身影响因子为 ;
2. 受外部条件影响:我们认为某一点的PM2.5浓度值还会受到其他点的PM2.5值的影响。由于PM2.5值的变化具有一定的连续性,因此我们认为某一点的PM2.5值是受同时刻其他点PM2.5值的影响,即全市除该地区的PM2.5平均水平对该地区PM2.5值的带动作用。设带动因子为 ;
3. 受外在自然因素的影响:即天气气温、风力对该地区的扩散与衰减作用。设温度的影响因子为 ,风力的影响因子为 。
根据上述假设,t时刻i地区的PM2.5值Pi,t的差分变化模型可描述为:
Pi,t iPi,t 1 iPexi,t iTt iWindt ci (3.1)
其中,Tt,Windt分别为t时刻日平均气温、风力,ci为常数项。定义Pexi,t为
2013年全国研究生数学建模大赛D组试题作者:顾高翔、石莹、马晓哲
该市除i地区的PM2.5平均值, 为各地区对除i地区外的PM2.5平均值贡献的权重:
Pex,i,t 1P1,t 2P2,t ... i 1Pi 1,t i 1Pi 1,t ... 13P13,t (3.2)
由于我们只有全市的平均PM2.5数据,无法得到除去某个观测点之后的平均PM2.5数值,因此我们采取一种类似加权求平均的算法,首先通过线性回归方法拟合13个站点对于全市平均PM2.5值的回归方程,然后通过删除节点估计出除去某一点外的平均PM2.5值。假设13个站点对于全市平均PM2.5值的回归方程为:
1Pt 1P P ... P P iii,tn iniPi,t (3.3) 1,t22,tnn,t
则除掉某一个节点(j)外的平均PM2.5值为:
Pex,j,t 1 niPi,t n 1i j (3.4)
数据来源:我们以西安市13个站点从2013年1月1日到2013年4月26日 共116天的PM2.5观测数据以及天气数据为基础,进行回归计算。观测数据中缺损的数值已由第一章所述的灰色预测方法补齐。另外,我们根据风的等级将风力大小进行量化,规定风力“≤3级”对应的数值为“3”,“3-4级”对应的数值为“4”,“5-6级”对应的数值为“6”。13个观测站点的名称及其代号分别为:草滩(cao)、长安区(chang)、纺织城(fang)、高新西区(gaoxin)、高压开关厂(gaoya)、广运潭(guang)、经开区(jin)、临潼区(lin)、曲江文化集团(qu)、市人民体育场(shi)、小寨(xiao)、兴庆小区(xin)、阎良区(yan)。补齐缺损数据之后,西安市13个站点的PM2.5浓度变化趋势如图3.5所示.
2013年全国研究生数学建模大赛D组试题作者:顾高翔、石莹、马晓哲
图3.5 2013.1.1-2013.4.26 西安市各区PM2.5值演化图
在此数据的基础上,我们利用最小二乘法,计算得到了13个监测站的参数估值,如表3.1所示。从表3.1中可以看到,各个站点拟合得到的 值和 值都大于0,这表示每个观测点的PM2.5值与其上一期的数值和周围环境的影响都是正相关的。各个站点之间的 值的差距和 值的差距都不大, 值集中在0.04-0.41之间,均值约为0.12。前一期的影响对于当期的影响由于各地区的性质,后效性存在差异,但影响不超过0.41。影响最小的为高新西区0.04,影响最大的为小寨0.41。 的波动位于0.53-1.0之间,均值为0.83,其中,小寨受到外区的影响最小,广运潭受到外区的影响最大。另外,各个站点的 值和 值具有反向特征,即 值大的站点一般 值较小。我们假设 值较大的站点处于PM2.5形成区域,其PM2.5值主要受到自身值变化的影响,而 值大的站点处于PM2.5的扩散区域,主要受其他站点的影响。 值较大的站点包括草滩、长安区、经开区、临潼区、体育场、小寨。其中,阎良区和临潼区由于离市区较远,相对独立。
自然因素由于各区地理位置的固定性,参数值对于各小区波动较大,天气与风力对各区的影响陈现出不同的正效应或负效应。其中,广运潭、草滩和高压开